积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(2)技术工具(2)

语言

全部中文(简体)(2)

格式

全部PDF文档 PDF(1)PPT文档 PPT(1)
 
本次搜索耗时 0.007 秒,为您找到相关结果约 2 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    着训练步数的增长,模型的thinking response length 逐 渐增加(对应着 test-time computation increasing) ➢ Aha moment: 自然学会增加更多的推理时间,反思评价先前步骤、探索其他方法 RL驱动下自然涌现 Long-CoT 能力 “Aha”Moment 11 DeepSeek-R1 技术剖析:DeepSeek-R1 Zero 训练步数的增长,模型的thinking response length 逐渐增加 (test-time computation increasing) ➢ DeepSeek-R1-Zero 自主涌现学会重新评测原来的方法、反思和主动探索其他的路径 ➢ 多阶段训练下的冷启动让RL训练更加稳定,避免初期不稳定、加速收敛、提升思维链可读性 ➢ 未来后训练的重心会逐步倾向于RL,但是少量训练用于SFT可能还是必须的 A* 也是 Structure, 人为加入 Inductive Bias 强求LLM按照人为的结构化先验进行思 考可能会限制模型的能力; ➢ 不通过额外的Structure, 模型自身是否可以学会思考: ➢ Algorithm Distillation: 将RL的 Training History 序列直接 建模到语言模型中,学习到Data-Efficient RL 算法 ➢ Stream
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    变得可视化 本地化适配: 大模型能针对不同地区、 教材版本 动态调整教学内容 ,确保与教学大纲精准匹配 教师视角: 工具能节省时间 ,但不能让人完全省 心。 教师需要学会与 AI 协作 , 比如通过优化提 示 词 ,让大模型生成更贴合教学场景的内容 备注: 本部分内容来自对网络资料的整理 8. A I 赋能高校教学 大模型是工具——教育的“智能脚手架”
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
共 2 条
  • 1
前往
页
相关搜索词
2025DeepSeekR1Kimi1.5及类推理模型推理模型开发解读报告赋能高校教学科研
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩