刚才,DeepSeek已正式发布了DeepSeek-V3.2-Exp的实验模型。 DeepSeek称其为“迈向新一代建筑的中间步骤”。据报道,该模型首先基于v3.1-terminus引入了DeepSeek稀疏注意力(稀疏注意机制),以探索长期文本场景中训练和推理效率的优化。官员们说,在公共审查集中的v3.2-Exp的性能通常与v3.1-terminus相同,但达到了成本和效率。从新机制中受益,Deviceek将API呼叫价格降低了50%以上,新价格立即发生。 v3.2-exp已通过官方应用程序,网页和DeepSeek的迷你程序同时更新,并打开了HuggingFace和Mapai平台,并发布了相关的相关文件。同时,Deviceek开设了GPU运营商,包括Tilelang和Cuda版本,以支持社区研究并迅速。作为实验版本,Deepeek仍然邀请用户在现实生活中进行大规模测试。为了进行比较,该公司暂时维护v3.1-terminus API接口,该界面将开放至2025年10月15日。有关更多信息和深度内容,请关注我们。