
世界第一的英伟达,突然开始“买答案”了。
2026年3月,圣何塞GTC大会还没开幕,黄仁勋的底牌已经提前曝光:不是升级版GPU,而是一颗“外来户”芯片——基于Groq团队设计的LPU(语言处理单元)架构,专为推理优化。更扎眼的是,第一个客户已定:刚融到1100亿美元的OpenAI。这是英伟达成立以来,第一次在核心AI算力产品线上,把架构设计权交给外人。
老黄的算盘打得噼啪响:200亿美元收购Groq核心技术和团队,直接把成熟方案搬上战场。没有冗长的自研周期,没有试错成本,ROI(投资回报率)拉满。但这背后,哪是什么“精明”,分明是英伟达在推理战场上的“慌不择路”。

推理战场变天:GPU的时代要结束了?
过去三年,英伟达靠GPU垄断了AI算力市场,Hopper、Blackwell系列芯片让它赚得盆满钵满。但今年不一样了——AI行业的“发动机”变了。
以前是“训练为王”,模型从10亿参数冲到万亿,拼的是GPU的并行算力,英伟达躺着赢。现在风向转了:Agent应用爆发,用户每天调用AI的次数从几次变成几百次,推理需求规模暴涨10倍,成本成了命门。这时候,GPU的短板突然暴露:它就像个“大力士”,擅长搬砖(大规模并行计算),却干不了“绣花活”(低延迟推理)。
推理分两步:pre-fill(处理输入)和decode(逐token生成输出)。真正影响用户体验的是decode阶段——你问AI“今天天气如何”,它卡半秒才回答,体验就崩了。GPU的问题就在这:模型参数存在外部HBM内存里,计算时要频繁搬运数据,延迟高、能耗大。而Groq的LPU架构直接把数据“焊”在芯片上,用高密度片上SRAM存参数,计算核心贴着数据跑,路径缩短90%,理论速度比GPU快100倍。
这不是“小优化”,是架构革命。当OpenAI、Anthropic每天要处理几十亿次推理请求时,“快100倍”意味着成本砍半、体验翻倍。客户不傻,已经开始“叛逃”:OpenAI上个月刚和Cerebras签了数十亿美元推理合作;Meta拉着AMD优化推理GPU;DeepSeek把模型独家给了华为昇腾;连Anthropic都开始用AWS和谷歌的自研芯片。

Bernstein Research的预测更扎心:2026年华为在中国AI芯片市场份额可能达50%,英伟达或跌到个位数。老黄再不反击,推理这块肥肉就要被抢光了。
200亿买团队:老黄的“生存逻辑”
英伟达从不打无准备之仗。去年那笔200亿美元的“acqui-hire”(收购式招聘),现在看就是冲着推理战场来的。Groq团队什么来头?创始人Jonathan Ross是谷歌TPU之父,团队核心成员全是芯片架构老兵。他们打磨LPU多年,早就证明了在低延迟推理上的优势。
老黄的策略很明确:与其自己从零研发,不如直接买下成熟方案。这招他用过很多次:2019年收购Mellanox补全网络短板,2022年收Arm(虽未成功)想打通端侧,现在收Groq,就是要快速补上推理的“命门”。
OpenAI的1100亿美元融资文件里藏着答案:要扩大与英伟达的合作,包括3GW的“专用推理算力”。这3GW极可能就是基于这颗LPU芯片。对OpenAI来说,用LPU能把推理成本压下来,支撑每天百亿次的Agent调用;对英伟达来说,绑定OpenAI这个“流量入口”,就能在推理市场立住脚。
这不是“放弃GPU”,而是英伟达的“双轨制”:训练继续用GPU(Hopper、Blackwell、即将发布的Rubin系列仍是主力),推理交给LPU。就像当年智能手机时代,英特尔守着PC芯片,高通靠手机芯片崛起——英伟达不想当第二个英特尔。

推理霸权争夺战:谁能笑到最后?
英伟达的LPU芯片,本质是给推理市场投下的“原子弹”。但这场仗,没那么好打。
对手已经摆开阵势:谷歌TPU v5e专门优化推理延迟,亚马逊Trainium芯片瞄准Agent场景,AMD和Meta联合定制推理GPU,华为昇腾在国内市场步步紧逼。连字节、阿里都下场自研芯片,想把推理成本握在自己手里。
更关键的是,LPU的优势能维持多久?GPU厂商不会坐以待毙。AMD已经宣布要在下一代芯片里集成更多片上SRAM,英伟达自己的Blackwell Ultra也在优化数据路径。当所有玩家都开始学LPU的“数据贴着算力跑”,拼的就是迭代速度和生态粘性。
但至少现在,英伟达抢到了先机。OpenAI的“第一个吃螃蟹”,等于给LPU做了免费广告。接下来,就看GTC大会上老黄怎么秀肌肉:这颗LPU的实际性能如何?能耗比能不能真的碾压GPU?普通企业能不能“即买即用”?
说到底,AI算力的竞争,从来不是“谁技术更强”,而是“谁更懂客户的痛”。训练时代,客户痛的是“算力不够”,英伟达用GPU解决了;推理时代,客户痛的是“成本太高、延迟太卡”,LPU能不能接棒?

3月的圣何塞,答案很快揭晓。但可以肯定的是:推理战场的硝烟,已经烧到了英伟达的家门口。老黄这次“买答案”,是求生,更是野心——他要的,从来不止是GPU霸权,而是整个AI算力的未来。
实倍网官网提示:文章来自网络,不代表本站观点。