2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告org/pdf/2501.17161 [2] Demystifying Long Chain-of-Thought Reasoning in LLMs https://arxiv.org/pdf/2502.03373 39 技术对比讨论:蒸馏 vs 强化学习 ➢ Open Questions: ➢ Long-COT 指令数据扩展是否有助于慢思考推理能力? ➢ 哪种 Long-COT 数据构造方式具有最佳样本效率?10 积分 | 76 页 | 8.39 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版平台数据 优化方法论 38 02 英特尔 ® 技术方案 大语言模型操控机械臂的技术解决方案架构如下图所示: 2.3 创新技术方案 2.3.1 大语言模型赋能工业机械手臂 39 02 英特尔 ® 技术方案 整体架构从任务的角度整个任务可以分解成三个阶段: 第一阶段是外部数据收集 这一阶段主要依赖两个外部输 入,分别是人类的语音输入和 摄像头的图像/视频信息,语0 积分 | 82 页 | 5.13 MB | 5 月前3
共 2 条
- 1
