网站首页

伟德国际产品中心

智能终端处理器 智能云服务器 软件开发环境

伟德国际新闻

行业质询 公司新闻

关于伟德国际

公司概况 核心优势 核心团队 发展历程

联系伟德国际

官方微信 官方微博
主页 > 伟德国际新闻 > 行业质询

伟德bv1946官网-GPU英伟达发布LPU芯片:AI推理的「加速器」来了

发布时间:2026-03-21 14:08浏览次数:来源于:网络

  伟德国际(bevictor·1946)源自英国官方网站-

伟德bv1946官网-GPU英伟达发布LPU芯片:AI推理的「加速器」来了

  前谷歌 TPU(张量处理单元)团队的核心成员创立了 Groq,后者在 2020 年就推出了用于大语言模型的 LPU 芯片。2025 年 12 月,英伟达收购了 Groq 的核心技术和技术团队,并在 2026 年的 GTC 上正式发布了英伟达的 LPU 芯片,用于 AI 推理加速。

  那么是什么,让英伟达决定斥 200 亿美元巨资买下 Groq 呢?这还得从 LPU 芯片的功能和定位说起。

  在大多数人的认知里,AI 芯片功能都差不多,毕竟 GPU、NPU 甚至是 CPU 都能跑推理,英伟达的 GPU 长期以来也是这种「全能型」选手。但在Vera Rubin 平台,LPU 并不直接用于通用计算。

  简单来说,LPU 是大模型的「推理加速器」,它要用 SRAM 极高的显存带宽,解决大模型在生成回复时慢的问题。

  要知道在大模型的技术逻辑中,「AI 推理」的瓶颈往往不在于计算核心的算力上限,而在于显存带宽。以当前主流的 HBM(高带宽内存)方案为例,虽然 HBM 的带宽本身就比标准 DDR、GDDR 这些内存、显存要快,但其本质上是堆叠 DRAM,而 DRAM 的工作模式决定了其在读写延迟方面的短板。

  相比之下,LPU 采用的是 SRAM 方案,从数据结构上绕开了 HBM 方案较高的延迟,让模型可以直接在缓存中进行推理。尽管 SRAM 在空间表现上不如 HBM,但对于 AI 推理这一应用场景,SRAM 的优势足以弥补其短板。

  根据英伟达的介绍,基于 SRAM 方案的 LPU 每秒带宽高达 150 TB/s,能让 AI 之间通信的吞吐量从每秒 100 个 Token 提升到了 1500 个以上。这种源自数据传输底层的技术升级,就像给 AI 开了专门的「5G 网络」,让模型「直播」(边推理边输出)成为可能。

  当然了,LPU 架构也有自己的短板。作为「空间换时间」的技术代表,SRAM 虽然读写速度极快、带宽极高,但其数据结构和成本决定了它不可能像 HBM 那样动不动就堆叠几百 GB 的容量。这也意味着 LPU 必须与 Rubin GPU 配合工作,无法独立运行大规模模型。

  但从另一个角度想,LPU 的出现其实就像当年的 NPU 一样,利用异构单元「各取所长」,让大模型知道哪些任务交给 GPU 去算,哪些实时交互交给 LPU 去跑。在雷科技看来,这种算力分流的模式,才是 LPU 最有价值的地方,也是前几年英伟达愿意重金买下 Groq 的关键原因。

  可能有人觉得奇怪,就全球市场来说,英伟达早已控制了「头部算力」,GTC 2026 上也发布了 Rubin GPU,那为什么不继续走「绝对算力」的路线,要用 LPU 进行加速分流呢?

  在雷科技看来,这种算力结构的变化,其诞生也和 Agent 时代的 AI 交互模式有关。以往我们用 ChatGPT、Gemini 或千问等 AI 服务,本质上都是单线操作的「回合制 AI」;在 AI 给出结果之前,我们不需要、也不能做下一个操作。

  但在 Agent 时代,AI 需要在多个应用间执行超长的任务链,而这种「AI 间通讯」对延迟有着极高的要求。如果用传统的 GPU 跑推理,Token 生成速度可能只有每秒几十个。

  在一个需要跨越数十步决策的长任务链中,这种延迟会成倍增加。而 LPU 的加入,将部分推理前置,用低延迟换来了「连续响应」的能力。也正因如此,雷科技认为 LPU 的出现,必然会推动 AI 算力体系搭建的新一轮转型。

  从性能表现来看,Vera Rubin 平台、LPU 等概念的出现,确实又一次奠定了英伟达在 AI 领域的领先地位。但对于国内 AI 巨头来说,在短时间内跟进 LPU 架构其实并不现实——LPU 核心的高速 SRAM 颗粒高度对封装技术有较高的要求,在芯片行业产量朝着英伟达倾斜的背景下,国产芯片企业想建立自己的 SRAM 推理生态,从成本的角度看并不简单。

  但这并不代表国产厂商在推理端无路可走。以阿里平头哥在 2026 年初上线E 为例,线E 采用了阿里自研的并行计算架构和 ICN 片间互联技术,将片间互联带宽提升至 700BG/s。

  百度的昆仑芯则从 XPU 架构上入手,将计算和通信并行处理,在上一组数据计算时就提前请求下一组数据。摩尔线程则选择了全功能 GPU 的路线,用一站式方案降低企业部署成本,提高 AI 服务器的综合性价比。

  虽然在绝对吞吐量上,这些「曲线救国」的国产方案距离英伟达的 LPU 还有一定的差距,但凭借更好的 AI 用例适配,平头哥和昆仑芯在国内算力市场的影响力同样不容忽视。

  从行业发展的角度看,英伟达 LPU 的面世,固然推动了 AI 架构优化的进程。但对于国产算力企业而言,凭借更低的网络延迟和更好的本地化,依旧有超车的机会。毕竟对 AI 这样典型的「黑箱用例」来说,用户其实并不关心 AI 背后的算力结构和运行逻辑。一个好用、易用、低成本的综合体验,才是国内 AI 市场真正看重的核心竞争力。

  3月12日-3月15日,AWE(中国家电及消费电子博览会) 2026 盛大开幕!

  海信、海尔、美的、TCL、创维、华为、追觅、石头、MOVA、雷鸟、韶音、小熊、九号等AI科技巨头,将在上海滩围绕“AI科技·慧享未来”主题,呈现AI与硬件特别是家电融合的新潮流。人人“养龙虾”,家电如何融入Agent能力?机器人到家,家电无人化走到了哪一阶段?全场景融合,“人车家”生态会碰撞出哪些火花?AI硬件大爆发,硬件厂商又整出了哪些花活儿?

  在雷科技MCN总编辑罗超、核心主播“阿雷”领衔下,雷科技AWE报道团(10+人)奔赴上海展开现场报道,现已凯旋。欢迎在雷科技全平台获取相关内容。

  新华社北京3月20日电 美国和以色列对伊朗发动的军事打击20日进入第21天。

  3月20日,江苏省委组织部发布省管领导干部任职前公示,其中苏州市委副书记、市长吴庆文,拟任设区市委书记。

  伊朗:要毁灭性打击美以“邪恶官员”,他们在国外度假也将“不再安全”,刺杀伊朗官员“是源于其无助、困境和卑劣本性”

  据新华社消息,在伊朗高官接连遇害后,伊朗军方20日威胁要毁灭性打击“邪恶的”美国和以色列官员、指挥官及士兵,称他们即便在国外度假也将“不再安全”。

  3月19日(发布)河北邯郸三姐妹上坟被炸身亡案,该案主犯、三姐妹的大伯王某东已被执行死刑,但家属始终怀疑案件另有共犯,王女士为替逝去的3个姐妹讨公道,直播倾诉委屈,竟两次被网友发死亡威胁。#爆炸案#死亡威胁 (作者:chen)投稿邮箱:;更多视频点击关注@中安在线万次播放

  别当韭菜! C2027心跳配色你可真别急着买!#跑鞋 #跑鞋推荐 #跑鞋测评 #c2027 #跑步

  这是什么“神仙偶像”!粉丝偶遇黄日华 许愿想见苗侨伟上一秒:“寄己的事情寄已办”下一秒掏出电话摇人上演宠粉天花板#香港 #黄日华 #苗侨伟 #射雕英雄传

  3.20vivo系统大更新!实测对比旧版/友商,这波优化线 vivo OriginOS 6 全量大更(版本约 16.0.26.3),主打续航、信号、流畅、实用功能四大维度,实测对比旧版/友商,这波是真·底层优化,绝了。 一、推送范围(3.

  iQOO Z11 Turbo作为2026年中端手机市场的有力竞争者,把旗舰级配置下放到2000元价位,兼顾了颜值、性能与实用体验。它的外观设计很懂年轻人审美,比如“光晕粉”配色,低饱和度柔和粉色融合清透银色光晕,阳光下发细腻渐变光泽,温柔内敛又有辨识度,打破性能机的硬朗刻板印象。

  被主播种草的vivoX300 Pro,拍人像绝了!但续航让我差点摔手机…

  大家好,我是你们的老朋友!最近后台总有人问我:“博主,直播到底该选啥手机?苹果信号差、安卓拍人丑,有没有全能选手?”巧了!上周我自费入手了vivo X300 Pro,号称“直播神器”,号称能吊打友商的影像旗舰。

  vivo购机避坑+隐藏功能全拆解!2026年3月实测,90%用户都踩过雷

  步入2026年3月中旬,vivo这边的动静着实不小,OriginOS 6稳定版刚全量推送,X300系列新机又即将登场,不少人都想着趁这波换机,或是把手里的vivo手机用得更顺手。可折腾下来才发现,要么购机时踩了坑花了冤枉钱,要么手机里藏着一堆实用功能却全然不知,白白浪费了好配置。

  3月30日一起上台的三款新品里,X300Ultra被盯得最紧,原因很简单,主摄和长焦都上了2亿像素,时间也被传得很死,4月3日就开卖,想等价格稳定的人基本没窗口有人只关心拍照参数,35mm主摄和85mm长焦写得清清楚楚,外挂增距镜还能把焦段拉到更远,买不买先放一边,至少路线很明确

下一篇:伟德bv1946官网-AI 推理需求挤占产能消息称英特尔处理器将涨价 10%
上一篇:伟德bv1946官网-引领AI PC新标杆第三代英特尔酷睿Ultra重新定义轻薄本

咨询我们

输入您的疑问及需求发送邮箱给我们