原创
DeepSeek-V3.2-Exp官宣发布,API价格下调超50%
09-29 19:54 星期一
科创板日报记者 黄心怡

《科创板日报》9月29日讯(记者 黄心怡)梁文锋最新动作来了,DeepSeek-V3.2-Exp 今天正式发布并开源。

根据DeepSeek官方介绍,这是一个实验性(Experimental)的版本,作为迈向下一代架构的过渡。V3.2-Exp 在 V3.1-Terminus 的基础上引入了DeepSeek稀疏注意力(Sparse Attention)机制,旨在对长文本的训练和推理效率进行探索性的优化和验证。

对于此次模型更新,中信建投TMT行业首席分析师武超则评价,DeepSeek-V3.2-Exp“易用性再次大幅提升”。

值得一提的是,除了英伟达CUDA版本外,DeepSeek还开源了TileLang版本GPU算子。

目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。

在缓存命中的情况下,输入价格由0.5元/百万token降低为0.2元。在缓存未命中的情况下,输入价格由4元/百万token减低为2元。输出价格则从12元/百万token大幅降低为3元。

在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

据介绍,该实验版本代表了DeepSeek对更高效的transformer架构的研究,特别注重提高处理扩展文本序列时的计算效率。

DeepSeek稀疏注意力架构(DSA)首次实现了细粒度(fine-grained)稀疏注意力,在保持几乎相同的模型输出质量的同时,显著提高了长文本训练和推理效率。

为了评估引入稀疏注意力机制的影响,DeepSeek方面特意将DeepSeek-V3.2-Exp的训练配置与V3.1-Terminus进行了对齐。在各个领域的公开基准测试中,DeepSeek-V3.2-Exp的表现与V3.1-Terminus相当。

DeepSeek方面称,在新模型的研究过程中,需要设计和实现很多新的GPU算子。

“我们使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。因此,本次开源的主要算子包含TileLang与CUDA两种版本。我们建议社区在进行研究性实验时,使用基于TileLang的版本以方便调试和快速迭代。”

《科创板日报》了解到,TileLang编程语言是由北京大学计算机学院副研究员杨智团队主导开发的开源AI算子编程语言。在华为全联接大会上,该团队核心成员董宇骐曾介绍,TileLang实现了FlashAttention算子开发,代码量从500+行减少至80行,并保持了与官方版本持平的性能。

除了DeepSeek外,近期阿里通义千问、智谱也都在推进大模型的迭代升级。

在2025云栖大会现场,阿里云接连发布了七款大模型技术产品,覆盖语言、语音、视觉、多模态、代码等模型领域。其中包括了阿里旗舰模型Qwen3-Max正式发布,预训练数据量达36T,总参数超过万亿,在Coding编程能力和Agent工具调用能力上有较大提升。

智谱新模型GLM-4.6将于近日发布,目前已可通过API接口调用。

月之暗面Kimi则发布Agent模式“OK Computer”并开启灰度测试。据官方介绍,“OK Computer”延续“模型即Agent”理念,通过端到端训练Kimi K2模型,进一步提升智能体及工具调用能力。

财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
热门评论
乂武犯禁回复1天前·河北0
随风飘摇1122回复1天前·浙江0
万兴科技
cls-gnm6ab回复1天前·北京0
👀
zgxt回复1天前·北京0
(*´I`*)
沛Sunya回复1天前·福建0
666
cls-1591628回复1天前·天津0
利好消息吗?
张总欢乐多73回复2天前·河北0
杭钢
cls-1378631回复2天前·上海0
300378鼎捷数智
咸宁大道回复2天前·广东0
主力都在硬件里,你这是让主力过来软件抬轿?
cls-1394568回复2天前·佛罗里达0
cls-cf390z回复2天前·广东1
算力板块很多票还在3200那时的价格,DS老龙头这波要起飞了!像 拓维信息 数据港 岩山科技 超讯通信
cls-1596601回复2天前·广东0
6
cls-xbq07q回复2天前·四川0
👍
cls-1596601回复2天前·广东0
6
股人东升回复2天前·内蒙古0
好的
拉萨天团之回复2天前·浙江0
寒武纪发公告了 跟你同步 明天原地起飞吧
cls-379bal回复2天前·浙江0
看来杭钢股份又要开始表演了
笑二回复2天前·江苏0
😇
海森堡海森堡回复2天前·上海0
cls-1984339回复2天前·云南0
cls-1984339回复2天前·云南0
1
开始你的表演回复2天前·云南1
利用AI应用,AI医疗,AI教育,AI交通,AI软件,AI大金融!
cls-ysbiel回复2天前·福建1
嘿嘿哈哈呼回复2天前·广东0
[得意]
雅卤回复2天前·广西壮族0
软件公司大多数都是亏的吧,3季度报马上发了,这是让散散们去接货?
cls-m300t5回复2天前·广东1
梦网科技又要来一波了
cls-ihqzbk回复2天前·广东0
牛回速归
悦宁回复2天前·佛罗里达0
鸣鸠79回复2天前·甘肃0
模型应该算是基础软件了
cls-7rtf3s回复2天前·广东0
文化低不配炒股不配看新闻。能把它搞成中文吗[流泪]
cls-1899881回复2天前·黑龙江0
拓尔思
北樨95回复2天前·广东1
666
北樨95回复2天前·广东1
[强][强][强]
溟枢回复2天前·黑龙江1
消息发出来了, 也就是建好仓了,来吧抬轿子接货
多点赞来多涨停3916回复2天前·新疆0
好消息
多点赞来多涨停3916回复2天前·新疆0
大涨了
多拿几天看看回复2天前·陕西0
啥意思
胖胖0755回复2天前·新疆3
cls-coke2j回复2天前·广东4
昆仑万维
cls-xuwuws回复2天前·广东1
十月份主线是软件,软件已经横盘了半年还多
【李、小 美 】回复2天前·辽宁0
[微笑]
cls-wab78x回复2天前·湖北1
英伟达天下第一了,你还闹腾啥,回家干老本量化收割吧
牛红红红牛牛回复2天前·宁夏回族4
cls-1863355回复2天前·广东1
算力利空
明仔79回复2天前·安徽7
模型软件应用端利好没跑了
cls-l9adrr回复2天前·浙江1
明天相关概念股起飞了吧
cls-invds3回复2天前·广西壮族2
美国想用科技来自救,这个美国的经济泡沫更加严重
cls-1372168回复2天前·上海1
跌死
哦哟哟哟回复2天前·浙江12
起飞,坐等主力抬轿子
小灰灰会回复2天前·山东15
利空硬件,利好软件,算力大降价,说明光模块应该是大降价了
宇宙基本力回复2天前·河北11
哈哈,我手里一把机器人人工智能算力
dyshan回复2天前·广东11
1
无_名回复2天前·上海20
DeepSeek这波开源+降价,简直是开发者福利大放送啊!
AugustSun回复2天前·上海27
梁文锋这是铁了心要把DeepSeek做成AI界的Linux