DeepSeek-V4预览版上线对计算和显存的需求降低百万字上下文成标配

DeepSeek-V4预览版上线对计算和显存的需求降低百万字上下文成标配

2026-04-24 11:48 星期五

《科创板日报》4月24日讯今日，Deepseek宣布，其全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。

DeepSeek-V4模型按大小分为Deepseek-V4-Pro（专家模式）和Deepseek-V4-Flash（快速模式）两个版本，均拥有百万字超长上下文，且同时支持非思考模式与思考模式。

据介绍，DeepSeek-V4-Pro的知识储备和推理能力优秀。其在世界知识测评中，大幅领先其他开源模型，仅稍逊于顶尖闭源模型Gemini-Pro-3.1；在数学、STEM、竞赛型代码的测评中，DeepSeek-V4-Pro超越当前所有已公开评测的开源模型，取得了比肩世界顶级闭源模型的优异成绩。

相比DeepSeek-V4-Pro，DeepSeek-V4-Flash在世界知识储备方面稍逊一筹，但展现出了接近的推理能力。而由于模型参数和激活更小，相较之下V4-Flash能够提供更加快捷、经济的API服务。

据官方介绍，DeepSeek-V4预览版具备两大亮点——

Agent能力大幅提高：相比前代模型，DeepSeek-V4-Pro的Agent能力显著增强。在Agentic Coding评测中，V4-Pro已达到当前开源模型最佳水平，并在其他Agent相关评测中同样表现优异。下图为V4-Pro在某Agent框架下生成的PPT内页示例：

目前DeepSeek-V4已成为公司内部员工使用的Agentic Coding模型，据评测反馈使用体验优于Sonnet 4.5，在代码任务、文档生成任务等方面表现均有提升，交付质量接近Opus 4.6非思考模式，但仍与Opus 4.6思考模式存在一定差距。

结构创新和超高上下文效率：

DeepSeek-V4开创了一种全新的注意力机制，在token维度进行压缩，结合DSA稀疏注意力（DeepSeek Sparse Attention），实现了全球领先的长上下文能力，并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始，1M（一百万）上下文将是DeepSeek所有官方服务的标配。

DeepSeek-V4和DeepSeek-V3.2的计算量和显存容量随上下文长度的变化

目前，DeepSeek API已同步上线V4-Pro与V4-Flash，支持OpenAI Chat Completions接口与Anthropic接口。两版本价格如下：

财联社声明：文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。

热门评论

zly（血祭的文明）48回复1月前·天津

1

昨天就出消息了，今天盘面并没有太好的表现

风一样的老哥回复1月前·福建

0

[发呆]

风一样的老哥回复1月前·福建

0

[发呆]

cls-m75ufi回复1月前·广东

1

就今天这么密集推送利好，盘中都没有什么大表现

cls-p0k653回复1月前·福建

1

星期一高开低走

我家邻居叫Tony回复1月前·上海

0

理工人的福音[龇牙]

天空的云28回复1月前·湖南

2

期待着[龇牙]

走不完的路L回复1月前·福建

1

牛

神清气爽啊回复1月前·江苏

0

利好国产算力

cls-7zo0n0回复1月前·湖北

1

就是这个破玩意。航锦套40个点

cls-ne23un回复1月前·上海

0

仅仅是人类知识而已

太空针灸疗法回复1月前·内蒙古

1

呵呵，真是个奇葩，憋不出来就不要憋了，小心憋出毛病吧

阿袁拉呱回复1月前·安徽

1

又来一遍？去年不也这样？

unichim?92回复1月前·江苏

1

法本信息遥遥领先

阿鹏95回复1月前·天津

0

没有豆包好用感觉

置地大厦回复1月前·贵州

0

澜起科技

波浪中前行6回复1月前·福建

2

DeepSeek-V4开创了一种全新的注意力机制，在token维度进行压缩，结合DSA稀疏注意力（DeepSeek Sparse Attention），实现了全球领先的长上下文能力，并且相比于传统方法大幅降低了对计算和显存的需求。

金牛Pro回复1月前·四川

8

天大的好事！全球算力硬件腰斩再腰斩[色]

pprint回复1月前·北京

0

真会起标题

评论萝卜特回复1月前·上海

7

背景补充 DeepSeek于2026年4月24日正式上线开源大模型DeepSeek-V4，分为Pro（专家模式）和Flash（快速模式）双版本，全系标配百万字（1M）上下文能力，支持非思考/思考双模式。技术突破在于： 1. 架构创新：通过Token压缩与DSA稀疏注意力机制，显著降低长文本处理的算力与显存需求，1M上下文成服务标配。 2. 性能对标顶级闭源模型： - V4-Pro：Agent能力达开源最优，世界知识测评接近Gemini-Pro-3.1，数学/代码推理比肩闭源模型。 - V4-Flash：推理能力接近Pro，API成本更低（输入0.2元/百万tokens）。 3. 商业化适配：针对Claude Code等主流Agent工具优化，提升代码生成、文档处理效率。 4. 国产算力支持：宣布下半年适配华为昇腾950芯片。 --- 影响分析 1. 利好国产算力产业链： - 华为昇腾生态合作伙伴（如寒武纪）受益于模型国产化迁移需求，技术适配已启动。 - 低算力需求特性降低服务器门槛，云服务商（如UCloud）可快速部署低成本AI服务。 2. 冲击同业竞争格局： - 开源模型性能跃升：V4-Pro在Agent、推理等领域逼近闭源模型，可能挤压智谱、Minimax市场份额，二者股价当日跌幅超3%。 - API价格战加剧：V4-Flash输入成本仅OpenAI的1/25（0.2元 vs 5美元/百万tokens），迫使同业降价或优化成本。 3. 赋能金融科技应用： - 百万上下文+低成本处理能力，助力自动化研报生成、财报分析等场景，降低金融机构AI部署成本。 - Agent专项优化提升代码生成效率，利好量化交易、风险管理工具开发。 4. 融资预期升温： - DeepSeek估值传闻达3000亿元，技术突破或加速融资进程，吸引腾讯、阿里等战略投资，提振AI赛道估值。 > （以上内容由AI生成，不构成投资建议，不代表刊登平台观点，请独立判断和决策。）

倪先森回复1月前·江苏

4

信你个鬼，去年也是，说对算力需求降低

cls-1852779回复1月前·山东

0

这个板块炒烂了

cls-i05wk9回复1月前·上海

1

拓维信息华胜天成

cls-u3hgvx回复1月前·湖北

0

看来跟过去相同配置的硬件和显存现在可以做到更快的运算和推理了