
最近AI芯片圈的新闻看得人眼花缭乱:美国一会儿禁售英伟达H20芯片,一会儿又放开却要收15%的“抽成”,没过多久英伟达又宣布停产H20;国内这边,DeepSeek发布V3.1模型专门适配下一代国产芯片,华为384超节点刷屏科技圈,寒武纪股价更是一路飙升超越茅台。
普通人难免犯嘀咕:
中美这来回拉扯到底在争什么?被美国反复拿捏的AI芯片,咱们国产的到底行不行?
今天就用最通俗的话,按时间线捋清这场科技博弈的来龙去脉,揭开国产芯片的真实水平。
01.
展开剩余91%这颗芯片看似普通,却是中美科技角力的“晴雨表”,它的每一次命运转折,都对应着双方的实力比拼和利益交换。
早在2022年,拜登政府就盯上了AI芯片,担心高端技术流入中国,于是出台禁令限制英伟达旗舰芯片H100对华出口。
就像AI芯片里的“顶配跑车”,不管是训练ChatGPT这样的大模型,还是做高精度推理,性能都堪称全球顶尖。
为了不丢掉中国这个大市场,英伟达2023年10月专门推出了“特供版”芯片H20。
这款芯片说白了就是H100的“阉割版”:采用旧的Hopper架构,FP16算力只有148TFLOPS,还不到H100的15%,内存带宽和互连带宽也大幅缩水。
打个比方,H100是能跑高速的跑车,H20就是只能在市区代步的家用车,虽然能用,但干不了重活。
当时美国的算盘很精:既用减配芯片卡住中国高端算力,又能通过卖“阉割版”赚走真金白银。
而国内市场因为暂时没有足够的替代选项,对H20的需求一度很旺盛,2024年它占了国内AI芯片销量的三分之一,服务器价格从100万炒到140万,还“一天一个价”。
2024年4月,特朗普政府突然加码限制,宣布H20芯片出口中国必须拿许可证,相当于直接禁售。
这步棋下得很冒险,因为中美在芯片和稀土上早就形成了“互相牵制”的局面:美国卡中国的芯片,中国则掌控全球绝大多数稀土供应——而稀土是制造芯片、导弹等高科技产品的关键原料。
英伟达首当其冲受影响,光是2025年第一季度就因为H20的库存和订单问题减记了55亿美元费用,损失惨重。
禁售风波持续两个月后,2024年6月中美在日内瓦达成初步框架:中国放开民用稀土的临时许可,美国则松口允许H20出口。
7月黄仁勋访华时确认了这个消息,看起来像是特朗普“说话算数”,但仔细琢磨全是算计。
网友调侃这是“做中国生意的保护费”,但本质上是美国想“两头占便宜”——既通过卖芯片赚中国的钱,又用抽成卡住英伟达的利润,防止它过度依赖中国市场。
可美国没想到,这时候的中国已经不是“没得选”了。
H20本身是老款减配芯片,英伟达2024年已经推出了更先进的Blackwall架构,旗下B200芯片性能比H20强好几倍,还组合出了GB200高端产品。
2025年8月,英伟达正式宣布暂停H20生产,通知供应商停止相关工作。消息一出,英伟达美股夜盘还跌了0.75%。
很多人以为是美国又搞限制,其实真相是“中国不买了”。随着国产芯片性能跟上,H20的市场需求大幅萎缩,英伟达留着这条生产线只会继续亏损。
从禁售到解禁再到停产,H20的“过山车”命运,恰恰说明中美AI芯片博弈的主动权正在悄悄转移——美国再也不能靠“减配芯片”拿捏中国了。
02.
聊完博弈,最关键的问题来了:国产AI芯片到底行不行?和英伟达比差多少?其实不能简单用“行”或“不行”概括,真实水平藏在“单颗性能”和“集群能力”的差异里。
公允地讲,目前国产量产的AI芯片,单颗性能确实赶不上英伟达最顶尖的产品。
比如华为最新的昇腾芯片,黄仁勋2024年5月承认它性能接近H200(比H100更强),但和英伟达2024年推出的Blackwall架构芯片比,还是有差距。
这是因为芯片制造依赖先进制程和封装技术,美国通过限制光刻机、先进工艺,确实给国产芯片的“单打独斗”设了坎。
但是现在训练万亿参数的大模型,需要成百上千颗芯片组成集群,这时候“通信效率”比单颗性能更重要——就像一群人干活,互相传话花的时间比干活还多,效率肯定高不了。
国产芯片的聪明之处,就是避开“单挑”短板,在“团战”上做文章。
“384”指的是这个超节点由384颗昇腾芯片组成,但厉害的不是数量多,而是华为的“通信黑科技”。
英伟达的B200集群最多支持72颗芯片高效通信,再多就会出现“通信耗算力”的问题;而华为用光纤构建了高速光网络,搭配自研的XCCL通信库,能让384颗芯片像“无缝衔接的团队”一样协作。
具体怎么实现的?华为用了“拆积木”的思路:把DeepSeekV3这样的大模型拆成Attention、FFN、Expert三个微模块,分给不同芯片同步处理,再用微秒级通信技术拼回去。
测试数据显示,在50ms时延约束下,华为384超节点的单卡Decode吞吐能达到1920Tokens/s,比普通节点提升3倍多。
任正非说过一句话很形象:“中国单芯片还落后美国一代,但用群计算补单芯片,结果上也能达到实用状况”。这就像打架,单挑打不过,但排兵布阵厉害,能组织几百人高效配合,照样能打赢“群架”。
AI芯片不止是“硬件”,更要靠“生态”——就像手机不光要硬件好,还得有适配的APP才能用。过去英伟达的CUDA生态是“护城河”,国内大模型、软件都围着它开发,但现在这个局面正在被打破。
2025年8月,DeepSeek发布V3.1模型,专门采用“UE8M0FP8”参数精度格式,还在评论区明确说这是“针对下一代国产芯片设计的”。
这可不是小事,意味着国产大模型开始主动适配国产芯片,而不是反过来依赖英伟达。
华为做得更彻底,已经把昇腾芯片在MoE模型推理部署的技术报告公开,还计划开源核心代码。
03.
2025年8月,寒武纪股价一度超越贵州茅台,上半年营收同比暴涨4347.82%,从亏损5.3亿变成盈利10.38亿。
不是它单颗芯片比英伟达强,而是市场看到了国产芯片的“替代潜力”——高盛甚至把它的目标股价调到1835元,看好它成为国产AI芯片的“领头羊”。
国产芯片的“团战模式”也有缺点:华为384超节点体积很大,放着像堵墙,而且功耗不低。但这些问题在国内不算“硬伤”。
中国有庞大的智算中心建设需求,很多数据中心本身就建在能源充足的西部,电力成本低,也有足够的空间容纳大型设备。比起“被卡脖子”,费电、占地都是可以接受的代价。
看到这里,你应该能明白中美AI芯片博弈的核心了:美国想靠“硬件封锁”遏制中国AI发展,中国则通过“集群创新+生态建设”破局。这场较量不是“零和游戏”,而是“发展速度的比拼”。
如今美国的“小院高墙”策略正在失效——2024年全球AI芯片销售额570亿美元,其中国产芯片占了160亿美元,市场份额从29%涨到42%,增速是国外芯片的3倍。
中国的底气来自“需求+创新”的双轮驱动:一方面,国内大模型、智算中心的需求爆发,给国产芯片提供了“试错和迭代的土壤”;另一方面,华为的通信创新、寒武纪的性能追赶、DeepSeek的生态适配,形成了“硬件+软件”的协同效应。
就像《金融时报》说的,这可能是意义重大的“DeepSeek时刻”——靠生态协作弥补硬件不足。
黄仁勋曾说“中国AI芯片进步速度超出想象”,这句话里有警惕,更有认可。现在的国产芯片,虽然不是全球“单挑最强”,但已经能满足国内90%以上的AI需求;虽然生态还没英伟达完善,但正在加速追赶。
结尾:
回到普通人最关心的问题:国产AI芯片能撑起中国的AI未来吗?答案是“能”,但不是靠“一夜超越”,而是靠“步步为营”。
中美AI芯片博弈不是“百米冲刺”,而是“马拉松”。美国靠技术积累领先在前,但中国靠市场需求和协同创新在加速追赶。
从H20的停产退场,到华为384超节点的落地,再到寒武纪的股价暴涨,这些信号都说明:中国再也不是“只能买减配芯片”的被动方了。
对于我们普通人来说,不用太纠结“国产芯片比英伟达差多少”,更该关注“进步有多快”。
毕竟在科技竞争里,从来没有“永远的第一”,只有“不停的追赶”。
而现在的中国AI芯片,正在用自己的节奏,跑出属于自己的速度。
发布于:安徽省创牛配资提示:文章来自网络,不代表本站观点。