华为昇腾、寒武纪、海光信息适配DeepSeek最新模型
09-30 09:03 星期二
财联社

财联社9月30日讯,9月29日,深度求索公司正式发布新一代大语言模型DeepSeek-V3.2-Exp,并于HuggingFace平台同步开源,模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率。

随后,华为昇腾、寒武纪、海光信息均同步宣布完成适配,其中昇腾实现0day支持并开源推理代码,寒武纪完成适配且开源推理引擎,海光信息达成无缝适配与深度调优,共同以软硬件协同助力国产AI生态发展。

据“华为计算”微信公众号消息,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现。

寒武纪在官方微信号宣布,已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本。

海光信息同日宣布其DCU实现无缝适配+深度调优,做到大模型算力“零等待”部署。海光信息表示,基于GPGPU架构强大的生态优势,与编程开发软件栈DTK的特性,DeepSeek-V3.2-Exp在海光DCU上展现出优异的性能,同时验证海光DCU高通用性、高生态兼容度及自主可控的技术优势。

财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
热门评论
股市长虹回复2天前·湖南1
[拳头]
cls-akntm5回复2天前·上海0
哪个软件发布会被硬件厂家追捧?
SUN14131915回复2天前·山东0
寒武纪,海光信息大跳水。这消息是利空。
cls-1350522回复2天前·山东1
哆啦米奇回复2天前·四川1
_抄家养股回复2天前·山东1
666
cls-ktj3p4回复2天前·广东1
装都不装了
cls-fle9rw回复2天前·浙江1
四川长虹起飞
cls-fle9rw回复2天前·浙江1
四川长虹常山北明起飞了要
cls-0ct9qj回复2天前·广东2
小注回复2天前·山东2
沙发
小注回复2天前·山东2