2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告8%的成绩,略高于OpenAI-o1-1217。在MATH-500上,获得97.3% 的惊人成绩,表现与OpenAI-o1-1217相当。 ➢ 在编码相关的任务中表现出专家水平,在 Codeforces上获得了2029 Elo评级,在竞赛中表现 优于96.3%的人类参与者 ➢ DeepSeek-R1 在知识类问答上推动科学探索边界: ➢ MMLU \ MMLU-Pro \ GPQA Diamond 等 STEM- related10 积分 | 76 页 | 8.39 MB | 6 月前3
共 1 条
- 1
