2024年9月29日,DeepSeek团队正式推出V3.2-Exp版本人工智能模型,该模型已在Huggingface和魔搭平台全面开源。目前,官方移动应用程序、在线平台及小程序系统均已同步升级至DeepSeek-V3.2-Exp版本,同时应用程序接口调用费用实现显著下调。
根据官方技术说明,DeepSeek-V3.2-Exp属于实验性版本。作为架构演进过程中的重要过渡,该版本在V3.1-Terminus基础架构上整合了DeepSeek稀疏注意力机制(DSA),针对长序列文本的处理效率进行了前瞻性的优化实验与验证。
技术细节显示,DeepSeek稀疏注意力机制首次实现了粒度更细的稀疏计算模式,在基本保持模型输出质量不变的前提下,显著提升了长文本训练与推理过程的计算效率。
华为计算官方平台透露,9月29日DeepSeek-V3.2-Exp模型正式开源并引入创新稀疏注意力架构。昇腾计算生态已快速完成与vLLM/SGLang等推理框架的适配工作,实现新模型的零日技术支持,并向开发社区全面开放推理代码与算子实现方案。
研发团队补充说明,在新模型开发过程中需要创建大量新型GPU运算单元。团队采用TileLang高级编程语言进行快速原型验证,支撑深度技术探索。在最终优化阶段,以TileLang版本作为精度基准,逐步开发出更高效的底层语言实现。本次开源的核心算子同时提供TileLang与CUDA两个版本,建议科研团队优先选用TileLang版本以便于实验调试和快速迭代。
基于新模型带来的显著成本优化,DeepSeek同步调整了API计价策略。全新价格体系下,开发者调用API服务的总体成本预计下降超过50%。
回顾发展历程,DeepSeek于8月21日正式发布V3.1版本,该次升级包含三大核心改进:创新混合推理架构使单一模型同时支持思考与非思考模式;推理效率显著提升,较先前版本响应速度更快;智能体能力增强,通过后期训练优化大幅提升了工具调用与代理任务执行能力。
在9月22日的版本迭代中,V3.1升级为Terminus版本,在保持原有性能的基础上重点优化了用户反馈问题:提升语言输出一致性,减少中英文混合使用及异常字符现象;增强智能体功能,特别优化了代码代理与搜索代理的任务表现。官方数据显示,Terminus版本的输出稳定性较前期版本有明显提升。
为准确评估稀疏注意力机制的技术影响,研发团队特别将V3.2-Exp的训练参数与V3.1-Terminus保持完全一致。在多项公开基准测试中,新模型的表现与基准版本基本保持相同水准。