评级 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

8%的成绩，略高于OpenAI-o1-1217。在MATH-500上，获得97.3% 的惊人成绩，表现与OpenAI-o1-1217相当。 ➢ 在编码相关的任务中表现出专家水平，在 Codeforces上获得了2029 Elo评级，在竞赛中表现优于96.3%的人类参与者 ➢ DeepSeek-R1 在知识类问答上推动科学探索边界： ➢ MMLU \ MMLU-Pro \ GPQA Diamond 等 STEM- related

10 积分 | 76 页 | 8.39 MB | 7 月前
3

共 1 条前往

页

2025 DeepSeek R1Kimi 1.5 及类推理模型推理模型开发解读报告