中国AI公司深度求索宣布正式发布DeepSeek-V3.1版本,涉及混合推理架构的升级,一个模型将能够同时支持思考模式与非思考模式。思考效率得以提升,相较DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案。
DeepSeek-V3.1版本亦拥有更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。目前官方应用程式及网页模型均已同步升级为DeepSeek-V3.1,用户可以通过深度思考按钮,实现思考模式与非思考模式的自由切换。
在代码修复测评SWE与命令行终端环境下的复杂任务测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高,在多项搜索评测指标上也取得较大提升。在需要多步推理的复杂搜索测试与多学科专家级难题测试上,DeepSeek-V3.1性能大幅领先R1-0528。测试结果显示,经过思维链压缩训练後,V3.1-Think在输出token数减少20%至50%的情况下,各项任务的平均表现与R1-0528持平。
DeepSeek API亦已同步升级,Deepseek-chat对应非思考模式,Deepseek-reasoner对应思考模式,上下文均已扩展为128K,并新增对Anthropic API格式的支持,用户可将DeepSeek-V3.1的能力接入Claude Code框架。
深度求索表示,将於9月6日凌晨起调整DeepSeek开放平台API接口调用收费,DeepSeek-V3.1输入每百万tokens缓存命中及缓存未命中收费分别为0.5及4元人民币,输出每百万tokens收费12元人民币,同时将取消夜间时段优惠。(gc/j)
AASTOCKS新闻