原创
谷歌云年度Next大会:TPU打破“内存墙” OCS、液冷题材如期亮相
2026-04-23 03:20 星期四
财联社 史正丞

财联社4月23日讯(编辑 史正丞)当地时间周三,美国云服务巨头谷歌云举行2026 Next大会,发布了旨在推动企业工作流程全面转向智能体的“代理式企业”(Agentic Enterprise)技术栈,涵盖第八代TPU、智能体软件平台等一系列前沿创新。

发布会伊始,谷歌CEO皮查伊在一段预录的视频中重申了资本开支的巨额增长,称今年将投入1750亿-1850亿美元,较2022年的310亿美元翻了近6倍。

皮查伊也表示,谷歌已经进入了所谓的“智能体工作流程”。截至4月,这家科技巨头已经有75%的新增代码由AI生成(并由工程师审阅批准),较去年秋天的50%显著上升。

随后发布会进入正题。

在Vertex AI平台的基础之上,谷歌云周三推出Gemini Enterprise代理平台,这是专为建立、扩充、治理和优化AI代理所打造的全方位平台。该平台整合了原有的模型选择、模型建立和AI代理建立功能,并加入代理整合、开发运作、调度和安全等新功能。

最受资本市场关注的张量处理单元(TPU)紧接着亮相。据财联社周三早些时候报道谷歌的第八代TPU正式拆分成两款不同的芯片,分别是针对AI模型训练的TPU 8t和更适合推理任务的TPU 8i

分管AI基础设施和芯片的谷歌高级副总裁Amin Vahdat介绍称,单个TPU 8t集群现在已经能够扩展到9600枚芯片,并配备2PB共享高带宽内存,芯片间互联带宽较上一代提升一倍。该架构可提供121 ExaFlops(百亿亿次级)算力,使得最复杂的模型能够调用一个统一的超大规模内存池进行计算。

除了原始算力外,TPU 8t还有一整套可靠性、可用性与可维护性(RAS)能力的设计,包括覆盖数万枚芯片的实时遥测监控、在不中断任务运行的情况下自动检测并绕过故障的ICI互联链路,以及能够在无需人工干预的前提下围绕故障自动重构硬件拓扑结构的光路电路交换(OCS)技术

整体而言,TPU 8t阵列的计算性能较上一代Ironwood几乎提升了3倍,每瓦性能提升至最多两倍。

TPU 8i则是谷歌“打破内存墙”的作品。为避免处理器处于空闲等待状态,TPU 8i配备了288GB高带宽内存(HBM)和384MB片上SRAM——后者是上一代的3倍,从而使模型的活跃工作集能够完全保留在芯片内部运行。

“内存墙”指的是芯片无法足够快地访问数据时形成的瓶颈,迫使用户等待更长的响应时间。

TPU 8i采用分层式Boardfly网络拓扑结构:其基础构建单元由4枚完全互联的芯片组成,进一步扩展形成由8块板卡(通过铜缆)构成的本地化组;而36个这样的组再通过OCS互联成一个TPU 8i集群。在这样的结构下,任意两枚芯片之间的通信最多只需经过7次跳转。

与上一代芯片相比,TPU 8i实现了80%的性价比提升,使企业在相同成本下几乎能为近两倍的客户提供服务。

谷歌云同时透露,TPU 8t、TPU 8i均运行在公司自研的Axion ARM CPU平台上,由公司第四代液冷技术支持。

(谷歌云第四代冷却配给装置)

硬件升级之后,软件应用层面也紧跟着迎来AI时代的创新。

谷歌云在周三推出面向AI代理的数据库“知识目录”(Knowledge Catalog)。

公司介绍称,传统的数据目录是为开发者手工浏览设计,关注表结构而非AI代理所需的深层业务语义。当AI缺乏业务语义和数据关系时,就会导致幻觉、高延迟和过时的洞见。“知识目录”原生集成Gemini,能够识别有用的业务信息并自动构建流水线,从非结构化内容中提取实体并映射复杂的业务关系

同时通过谷歌云的“智能存储”(Smart Storage)功能,在数据上传到云端的那一刻,就会被自动添加标签、生成嵌入向量并丰富元数据。通过“智能存储”与“知识目录”相结合,智能代理能够即时找到非结构化数据。

在数据端,谷歌云推出跨云湖仓(Cross-Cloud Lakehouse),智能体可以像在本地谷歌云上一样使用存储在亚马逊AWS、微软Azure等外部云服务商的数据,实现无缝的跨云访问。

基于上述更新,谷歌云推出了面向企业洞察的深度研究代理。基于对所有结构化和非结构化数据的充分掌握,现在谷歌的数据智能体可以回答诸如“导致我供应链中断的根本原因是什么?”或“你能对该地区进行财务审计吗?”等复杂的业务问题,并提供此前需要消耗“数周人力”才能实现的精确度。

谷歌云也在周三更新了有关云安全方面的进展。随着公司上个月完成对云端与安全平台公司Wiz的320亿美元巨额收购,谷歌云顺势推出“谷歌云反诈防御平台”,旨在识别机器人、真人与代理的合法性与授权状况

最后,作为对标“微软办公全家桶”的谷歌Workspace也迎来AI智能时代,包括Gmail邮箱的智能收件箱助手;打工人们也能综合“谷歌聊天”应用的一系列对话和企业数据,在日历上安排会议、创建谷歌文档,或者生成符合企业品牌形象的PPT。

谷歌还“兴奋地宣布”,为了帮助广大企业立即开启全新的生产力时代,公司特意推出“快速企业迁移”功能。现在将整个组织的办公环境从微软的365平台迁移到谷歌Workspace的速度快了足足5倍

财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
热门评论
波浪中前行6回复1天前·福建0
随着公司上个月完成对云端与安全平台公司Wiz的320亿美元巨额收购,谷歌云顺势推出“谷歌云反诈防御平台”,旨在识别机器人、真人与代理的合法性与授权状况。
蓝天下的梦想回复1天前·山东2
OCS超预期,英伟达也要布局OCS全光交换机
哪吒封神传奇回复1天前·广东0
液冷散热
Ckl2026回复1天前·四川0
[龇牙]
cls-1cp7ux回复1天前·北京0
英维克,高澜股份
至道海菲回复1天前·云南1
最牛人工智能芯片:TPU8T、TPU8I,祝贺啊!
中华红牛回复1天前·广东0
国内TPU走起[龇牙]
cls-1591508回复1天前·四川6
液冷🥶之前被杀安逸了
hst885回复1天前·福建0
新赛道
yaoniming回复1天前·上海5
很长一段时间一直不理解这些大公司为什么界面设计要做这么离谱的大R角。看到最后一张图总算明白了,原来这些公司的大R角全是为了ppt服务的,怪不得现在软件行业大公司的产品全烂的跟狗屎一样
cls-1341731回复1天前·陕西0
人工智能?算力?gpu?还是什么?
回本就卖了回复1天前·江苏0
商业航天时代飞鹏有限公司
cls-1587555回复1天前·山东6
错杀
评论萝卜特回复1天前·上海9
背景补充 谷歌在2026年Cloud Next大会上发布第八代TPU芯片(TPU 8t训练专用、TPU 8i推理专用)及智能体技术栈,核心亮点包括: 1. 硬件突破: - TPU 8t:算力达121 ExaFlops,支持9600芯片集群,光路交换技术(OCS)实现故障自修复,训练性能较上代提升3倍。 - TPU 8i:片上SRAM扩容3倍至384MB,采用Boardfly拓扑降低通信延迟,推理性价比提升80%。 2. 软件生态: - 推出Gemini Enterprise代理平台,集成知识目录(自动映射业务语义)、跨云湖仓(无缝访问AWS/Azure数据)。 - 安全层面整合Wiz技术,推出反诈防御平台识别AI代理合法性。 3. 资本投入:2026年谷歌资本开支达1750亿至1850亿美元,超50%投入云业务AI算力。 影响分析 1. 算力产业链受益: - OCS光交换机:谷歌主导OCS市场(2025年规模4亿美元),需求复合增速58%,利好腾景科技(YVO4晶体供应商)、光库科技(OCS合作方)等光通信企业。 - 液冷/HBM:第四代液冷技术及288GB HBM应用推动英伟达、SK海力士相关技术迭代。 2. AI竞争格局重构: - 谷歌TPU差异化设计(训练/推理分离)挑战英伟达GPU垄断,企业推理成本降低或加速AI代理普及。 - 跨云湖仓技术可能冲击Snowflake、Databricks等独立数据平台。 3. 风险提示: - 谷歌1850亿美元资本开支挤压短期利润,叠加智能体落地进度不确定性,或影响估值修复。 - OCS等新技术商业化速度存疑,国产替代进程需跟踪。 (以上内容由AI生成,不构成投资建议,不代表刊登平台观点,请独立判断和决策。)
sallyoga回复1天前·重庆11
OCS 、液冷📈
轻螺谁扫回复1天前·山东2
营业科被按死了
尚威回复1天前·天津7
全新的生产力时代
cls-4uhw0k回复1天前·河南1
代理式企业
福运满满回复1天前·河北1
继续裁员
cls-quyq3b回复1天前·上海1
液冷终于来了
镇魂歌回复1天前·山东1
智能体工作流程
cls-o3a7hf回复1天前·江西11
科技发展
cls-1823896回复1天前·安徽0
谷歌云年度大会,液冷题材如期亮相
cls-1393250回复1天前·浙江0
内存池化呢?