制裁最狠的那年,昇腾市占率从0飙到39.8%,却仍被逼上二次创业。
大模型训练现场,华为工程师把CUDA代码塞进翻译器,跑完一遍只报错三次。
百度伙伴当场松口气,连夜把PyTorch迁移任务改到华为服务器上。
昇腾910C不是普通芯片,它藏着三组密码:
384颗芯片连出一个超节点,峰值算力把GB200甩开70%,
一张卡能跑1万亿参数,耗电量却比同档GPU省出一整层楼电费。
以前最怕缺软件,现在华为干脆让老代码继续用。
把CUDA指令翻译成自家指令,一行都不用改,编译时间从几十小时缩到十分钟,
百度、讯飞、字节三家人已经拿到驻场团队,两周内跑通50万行祖传代码。
有人担心这只是过渡,可华为把整条GPU流水线拉了出来:
自己做EDA,美国依赖砍到15%不到;自己做高速互联,单机带宽拉到TB级。
一张图显示,2019年华为买Synopsys授权一年烧12亿人民币,现在降到1.8亿。
专用芯片的痛点只有做AI的人清楚:
