新闻动态
英伟达H20频繁销售与停售,美国究竟在对中国施加何种策略?
最近中美AI芯片圈的事情,热闹程度比电视剧还高,这边DeepSeek刚推出了V3.1模型,评论区里随意提了一句:“训练的方法就是为下一代国产芯片量身定制的。”
这边英伟达和特朗普那边一直在“翻云覆雨”,4月刚宣布不允许H20芯片出口到中国,到了7月又说可以卖了,但得抽15%的“分子钱”,没多久黄仁勋又突然跑出来说“H20不干了”。
很多人看到这些消息总觉得像在猜谜,一会儿禁一会儿放,美国人到底在玩啥呢?其实这场热闹的背后啊,不是搞得一团乱,而是经过深思熟虑的精准布局。
美方“反复横跳”
要搞懂美方的动作,得先弄明白H20的真实身份,别被“英伟达芯片”这个名头迷惑。它既不是高端货,也不是2022年推出的老款,而是2023年10月英伟达为了应对美国最新的芯片出口限制,专门为中国市场量身打造的“定制版”减配机。
从表现来看,这颗芯片的“水”可不少,它采用的是老旧的Hopper架构,FP16密集计算能力只有148TFLOPS,差不多只有英伟达旗舰H100的15%左右,比之前说的“20%”还低不少,连2024年主流AI训练的基础需求都有点捉襟肘见。
更要说的是,到了2024年3月,英伟达早已推出了Blackwell新架构,比如B200、GB200芯片的训练和推理速度都涨了几倍,H20这款技术上早就变成“落后一辈”的产品啦。
美方在这颗旧芯片上反复折腾,主要也就两块算盘,一是想从中国市场里捞到钱,二是有不愿让那些核心技术被泄露出去。
4月份的禁售,其实就是把H20当作“谈判筹码”罢了。那时候,中美两边正陷在“稀土和芯片”的博弈中。中国垄断了全球九成以上的稀土加工能力,而像镝、钕这些元素,都是芯片磁性元件和封装材料的重要原料。美国则掌握着高端AI芯片的出口权,双方拼得挺激烈。
7月那次松口,看起来更像是“变相收租”,允许出口的同时,还要求英伟达把对华销售收入的15%上交给美国政府。
H20已经算是旧款了,就算出口到中国,也不会影响英伟达新架构的技术优势。从行业数据看,2024年前半年,H20在国内中高端AI芯片市场还占有不少份额。
不过到了年末,随着国产芯片开始大批量投产,它的市场份额明显减少。显然,美方在这颗芯片“退役”前,想再多赚点钱。
至于黄仁勋宣布停产H20这事,其实背后还有两个没说得很明白的原因。一是2025年7月,国家网信办因为“H20存在漏洞与后门风险”约谈了英伟达,要求他们给个交代,结果国内用户对它的信任一下子跌了不少。二是英伟达还得为新一代芯片B30A腾空间,把库存清理一下。
归根结底,美方的“反复”其实并不是决策出了差错,而是一种精准的利益算计。既想继续赚老芯片的利润,又要稳固高端技术的壁垒,将它们统筹得妥妥当当。
国内的破局路
面对美方的技术封锁,我们国内的AI芯片行业倒没太慌,反倒是选了一条更走心、更靠实地破解路子,没有陷入那种“只看性能”的焦虑。
说到AI大模型的训练,嘛,从来不是“单个芯片比拼”,而是“多台设备齐心协力”,而国内的公司恰巧在“团队配合”这块儿找到了一条突破的路线。
华为的384超节点技术就是个典型例子,不可否认,早期国产芯片的性能确实比不过H20,但现在已经不是以前那样了。拿华为昇腾910C来说,它的FP16算力高达640TFLOPS,比H20强出不少,差不多也接近H100的60%性能。
而且呢,大模型训练的关键难点一直都不是单个芯片的性能,而是“芯片之间的数据传输速度”这个事儿。
行业里搞集群架构的工程师都明白,训练那种万亿参数级别的大模型,得靠上百甚至上千块芯片一块儿合作。可问题是,这时候超过一半的算力都花在芯片之间的数据交换上。虽然单个芯片的性能可以很牛,但只要数据传输不顺畅,整体效率就会大打折扣。
可以这么形象比喻,英伟达的集群就像“100个人靠喊话互相配合”,而华为的则像“384个人同时在双车道高速上同步,既扩大了规模,又保证了合作的效率”。
说实话,这“芯海战术”也不是没有缺点,设备占地挺大,耗电量也不低,堆在一起就像一面墙那么高。
不过就咱国内产业的需求来看,这些短板跟“被卡脖子”那种风险相比,还不算特别紧要,只要保证技术自主,像占地面积和耗电量啥的,都能通过配套设施的调整和优化来搞定啦。
另一个值得一提的信号是DeepSeekV3.1模型的“有针对性地设计”,它采用了UE8M0FP8的量化技术,特别强调“训练方法专门为下一代国产芯片量身定做”。
而且,还对华为昇腾910B、海光DCU这些国产芯片进行了深度调试,推理效率比之前适配的时候提升了40%。
这可是国产AI生态迈出的关键一步,以前国内大部分AI模型都依托英伟达CUDA架构来开发,一旦美国那边断供,模型就变得“无硬件可用”了。现在,模型厂商开始主动适配国产芯片,这等于在底层打通了“硬件-软件”的合作链路,让国产芯片的算力真正落到实处,能用得上。
有人就问过:“为啥不直接冲单芯的性能呢?”这事儿其实是技术限制的事儿:想要提升单个芯片的性能得靠2nm、3nm这些尖端工艺,但这些先进制程的核心设备,比如EUV光刻机,现在出口受限,没法顺利引进,所以也就难以做到一步到位。
比起在别人掌握的领域死磕,不如先在“集群架构”“生态适配”这些自主可控的方向上闯一闯,这种“扬长避短”其实不是妥协,而是符合国内产业现状的明智选择。
比性能更重要
最近寒武纪股价一路飙升,虽然市场气氛火热起到了推动作用,但背后真正的驱动力在于,行业对国产AI芯片“生态稳固性”的期待在逐渐增强。
对于我国的AI行业来说,拥有“不给别人卡住脖子的安全感”,比起单纯追求性能指标,显得更为重要,也更具有长远战略意义。
之前在国内,对英伟达的依赖不光体现在芯片硬件上,实际上还涉及它背后的CUDA生态圈,从开发工具、算法框架到应用实例,基本上形成了“唯一垄断”。
很多创业公司负责人都说,去年美方禁售政策实施之后,一些企业手里的大模型,因缺少能用的芯片,不得不搁置了。就算有备用芯片,也因为没有相应的软件配套,最后只能放在一边闲置。
现在这个局面开始发生变化:华为构建了昇腾生态,寒武纪推出了思元生态,再加上DeepSeek等模型厂商积极适配,芯片-框架-模型-应用的自主生产链正在逐步打通。
说实话,生态的打造没有快车道,有团队曾公开讲过,专门针对国产芯片优化大模型的时候,仅仅调整算法思路、优化数据传输路径就花了三十多天,最后才达到推理效率提升40%的目标。
要让国产AI生态逐渐成熟,得靠芯片制造商、模型开发者和应用企业一道共同努力,逐步磨合、不断累积经验。
最重要的是,国内AI芯片的追求从来不是去“复制一个英伟达”,而是要“满足我们自身产业的需要”。
在自动驾驶、工业AI、智慧城市这些主流应用领域,没必要非得用最顶尖的旗舰芯片,只要芯片表现稳定、性价比不错,还得有个完善的生态配套,就完全够用,能搞定实际的需求。
只要国产芯片在这些应用场景中打稳基础,就能形成“实际操作-数据积累-技术升级”的良性循环,以国内的场景推动技术不断向前,然后再通过技术提升带动更多行业的发展。
结语
说到底,中美在AI芯片那些事儿,并不是真打‘零和’游戏,而更像是一场‘耐力赛’。美国那边技术确实领先,不过也离不开咱们中国的市场需求和稀土资源;中国嘛,既有庞大的市场需求,又有集群技术突破的潜力,但也得花点时间,逐步完善整个生态圈。
对咱们国内产业来说,不用太在意“啥时候能超越英伟达”,更应该把注意力放在“怎么打牢自主生态”上。产业真正的底气,从来不是“比别人强多少”,而是“别让别人掐住咱们的命根子”。
