开云体育DeepSeek推出数学推理新模型自验证框架达国际奥赛金牌水平

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

2025-11-30

浏览次数：次

　　研发团队指出，传统方法仅追求最终答案的正确率，难以确保推理链条的严谨性。这一局限在定理证明等需要逐步推导的任务中尤为明显。

　　DeepSeekMath-V2 基于 DeepSeek-V3.2-Exp-Base 构建，其核心创新在于引入了可自我验证的训练框架。该模型通过 LLM 验证器，对生成的数字证明进行自动审查，并利用扩展的验证计算持续生成高难度样本优化验证器性能。

　　该框架通过构建基于大语言模型的验证器，能够对模型生成的数学证明进行自动审查，并利用持续生成的高难度样本优化验证器性能，有效提升了推理链条的严谨性。

　　据了解，在 2025 年国际数学奥林匹克竞赛和 2024 年中国数学奥林匹克竞赛中，DeepSeekMath-V2 均达到金牌水准。特别是在 2024 年普特南数学竞赛中，该模型取得了 118 / 120 分的优异成绩，近乎满分。

　　目前，DeepSeek 已将该模型的代码与权重在 Hugging Face 及 GitHub 平台开源。研发团队表示，这一成果验证了自验证推理路径的可行性，尽管仍有大量工作待推进，但为构建更强大、更可靠的数学智能系统提供了新方向。

上一篇：开云体育AI智能芯片