原创
H100租金半年涨三成 Token热加剧算力荒 云厂商“坐不住了”
04-16 17:51 星期四
财联社记者 付静

财联社4月16日讯(记者 付静)眼下,“Token经济学”成为热议话题。Token调用量快速增长,导致与其强绑定的算力硬件需求持续攀升。“算力是强需求,而且是全球性的,H100涨价也不是个例。”日前,一位算力供应链人士向财联社记者这样介绍目前的市场情况。

半导体研究机构SemiAnalysis本月发布的一组数据显示,H100一年期GPU租赁合同价格从2025年10月的每GPU每小时1.70美元的低点飙升至2026年3月的每GPU每小时2.35美元,涨幅近40%。

不过,多位接受财联社记者采访的算力业内人士表示,“租金确实在上涨,但是(涨幅)应该没这么高,从去年10月到现在,H100租金涨幅大概在20-30%。”

“正常的租赁价是五六万,最低的时候都到四五万了,现在加上机柜以后大概八、九万。”前述算力供应链人士告诉财联社记者。

算力资源信息共享平台柏林云负责人也对财联社记者表示,“H100租金最近在8万多的较多。”

SemiAnalysis同时还在报告中分析,“许多推理工作负载,如大型专家混合(MoE)推理,在最新的大型全球规模系统(如GB300 NVL72)上运行效果佳,而训练工作负载在H100上性价比最佳。即使是较旧的显卡,需求也居高不下。”

一家算力租赁企业负责人向财联社记者介绍,不只H100,H系列的租金出现了普涨。

财联社记者查阅SemiAnalysis网站了解到,该机构询问的GPU供应商中,有一半称H系列“无货”,大部分称没有租赁即将到期的H卡,部分H100合同的续费期限长达4年(期限为4-5年的合同一般是长期合同);2026年8-9月之前所有即将上线的Blackwell系列产能也已被预订一空。

柏林云负责人也给财联社记者提供了一组最新的算力资源价格趋势,“一台在2025年2月以245万采购的H200,用了一年多后,目前价值接近300万。”

她提到,服务器价格上涨,主要是因为包括内存、硬盘、GPU、CPU、光模块在内的核心组成部分都在涨,“不仅是内存(在涨价),内存只是涨幅大。”

今年1月财联社曾报道,不仅原材料涨价,市场需求也颇为旺盛,因此市场屡屡传出货源告急的消息,供需极度失衡,算力从业者坦言“很痛苦,我们现在每天都心惊肉跳,因为买不到货,现在大家手上都没东西租了,都只有一点点零零散散的东西。”

而Token调用量持续激增,则进一步促进了算力需求攀升。

3月,国家数据局局长刘烈宏在中国发展高层论坛2026年会上透露,2024年初,中国日均Token调用量为1000亿,到2025年底,跃升至100万亿,今年3月,已突破140万亿,两年增长超千倍。

有分析人士告诉财联社记者,今年推动Token使用量大幅增长的,一方面主要是用户基于Seedance、Nano Banana等产品大规模生成的图像和视频;另一方面是包括“龙虾”在内要执行多步工作流的智能体,它们通常高并发运行,且需持续迭代。

“智能体可能让Token耗费量增长了10倍都不止。”一家AI公司的创始人告诉财联社记者。

“还有一个问题就是,国内大厂租服务器过去,变成直接卖模型或者Token,它这个价格涨幅是好几倍的。所以对比下来硬件20-30%涨幅不算多,还是因为供不应求、严重缺货。”前述算力供应链人士告诉财联社记者。

“听说很多企业项目因为硬件成本涨价,暂时用云服务器的方式先满足客户业务需求。”另有接近国内几家云大厂的算力从业者向财联社记者介绍,也正因此,“几家云厂商也坐不住了,涨价了。”

“Token供不应求是客观存在,特别是智谱等模型厂家,自己没有云基础设施,折扣空间很小,他们目前主要卡在供这个环节,而阿里、字节等相对好一些。”一位Token聚合平台创业者告诉财联社记者。

公开信息显示,3月11日,腾讯云官宣AI模型涨价,混元系列模型Tencent HY2.0 Instruct、Tencent HY2.0 Think服务涨价,不论输入或输出价涨幅普遍在4倍以上。3月18日阿里云公告,因全球AI需求爆发、供应链涨价,阿里云AI算力、存储等产品最高涨价34%。同日,百度智能云公告,AI算力相关产品上调约5%-30%。

本月,涨价趋势仍在延续。4月9日,腾讯云正式发布价格调整公告,宣布将于5月9日起对AI算力、容器服务TKE-原生节点及弹性MapReduce(EMR)相关产品刊例价统一上调5%。4月13日,阿里云宣布旗下大模型平台百炼的Coding Plan Lite基础套餐停止续费和升级。4月15日晚,阿里云再发大模型服务平台百炼部分模型单元服务涨价通知,本次涨幅在2%-7%不等,于5月15日起正式生效。

多位业内人士曾告诉财联社记者,云厂商“涨价潮”主要受上游算力成本递增、市场需求增长、现阶段Token单价较低、市场竞争激烈等多重因素影响。

此外,智谱年内也已三次宣布提价。

值得注意的是,SemiAnalysis经调研还发现,目前Neocloud(指“新云”,一类‌专注于为AI工作负载提供高性能GPU算力‌的新兴云计算服务模式或市场类别,旨在应对传统云厂商在AI算力供给上的结构性不足)厂商和超大规模厂商掌握着主动权,可以协商更有利条款,如更高的预付金额、更优惠的价格、更长的合同期限,甚至可以选择合同开始和结束的日期,以匹配其库存情况。

对此,一位港股算力厂商业务负责人告诉财联社记者,美国CoreWeave、Nebius等Neocloud厂商,可进一步和大厂用户建立强绑定关系,且根据市场需求趋势做资产投入调整,使商业模式形成有效闭环。

财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
热门评论
许生?21回复2天前·广东1
龙头利通,润泽
cls-ehbvd1回复2天前·贵州1
澜起科技
看到近日近期要小心回复2天前·北京0
今天没涨的都是后排了,明天谨慎接盘…
cls-1869994回复2天前·广东0
cls-1998958回复2天前·海南0
发个工号
cls-zdlwpd回复2天前·广东3
明天算力租赁再大涨
cls-lditjn回复2天前·福建0
[龇牙][龇牙]
Z_等风来回复2天前·江苏0
[色]
ST小韭回复2天前·上海3
H100租金涨40%?业内人士:没那么夸张,但20-30%是有的,现在八九万一台都算常态了
LL44回复2天前·湖南4
鸿博股份起飞了啊
评论萝卜特回复2天前·上海0
背景补充 1. 算力供需失衡加剧: - Token调用量激增:2024年初中国日均Token调用量为1000亿,2026年3月突破140万亿,两年增长超千倍。智能体(如"龙虾")和多模态应用(图像/视频生成)是主要驱动力,单任务Token消耗可达传统对话的10倍以上。 - 硬件成本攀升:H100显卡年租金涨幅达20%-30%(从4-5万/卡/月涨至8-9万),HBM内存、CPU、光模块等核心组件普涨,高端GPU产能紧缺(H100合同续签需4年,Blackwell系列产能已售罄)。 2. 产业链连锁涨价: - 云厂商提价:腾讯云(模型服务涨463%+算力涨5%)、阿里云(AI算力最高涨34%)、百度智能云(涨5%-30%)因成本压力集体调价。 - 模型厂商跟进:智谱年内三次提价,部分场景价格接近海外头部厂商(如Claude)。 3. 商业模式重构: - 算力租赁从"卖硬件"转向"卖Token",租赁商(如CoreWeave)议价权提升,与客户绑定更深; - "Neocloud"服务商(专注AI算力)主导资源分配,通过长协合同锁定溢价。 --- 影响分析 1. 利好国产算力产业链: - 国产芯片替代加速(华为昇腾、寒武纪等),2025年国产AI芯片市占率41%,预计2030年达60%-70%; - 算力租赁、先进封装(CoWoS)、存储(HBM)等环节受益,相关企业盈利空间扩大。 2. 投资机会分化: - 头部厂商占优:阿里、腾讯等自建云基础设施的巨头,可通过资源调配缓冲成本压力; - 模型厂商挑战:无自有云的厂商(如智谱)受制于算力供给,需通过提价维持利润; - 算力租赁商价值重估:具备高端算力资源的租赁企业(如宏景科技)议价能力提升,商业模式向"Token分成"升级。 3. 政策驱动普惠算力: - 工信部推"算力银行""算力超市",支持中小企业共享闲置算力,降低使用门槛; - 地方补贴加码(如成都年发1亿元算力券),利好中小AI应用企业降本。 风险提示:硬件产能扩张不及预期、地缘政治扰动供应链、中小企业因成本压力退出市场。 > (以上内容由AI生成,不构成投资建议,不代表刊登平台观点,请独立判断和决策。)
水泽国度回复2天前·广西2
词元经济学