积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(2)技术工具(2)

语言

全部中文(简体)(2)

格式

全部PDF文档 PDF(2)
 
本次搜索耗时 0.054 秒,为您找到相关结果约 2 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    10 DeepSeek-R1 技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero: 无需监督微调SFT,纯强化学习驱动的强推理模型 ➢ 推理为中心大规模强化学习:组相对策略优化(GRPO)+ 瞄准 Reasoning 推理任务 ➢ 自我迭代提升Self-Evolution:随着训练步数的增长,模型的thinking response length 逐 渐增加(对应着 多目标优化:兼顾推理性能、帮助性和安全性; ➢ 蒸馏的潜力:蒸馏可以帮助将更大模型通过RL发现的高阶推理范式蒸馏到小模型中,这比用小 模型直接使用大规模RL发现的推理范式要更加有效; ➢ 基于群组的相对策略优化 (GRPO) :通过构建多个模型输出的群组,并计算群组内的相对奖励来 估计基线,从而避免了传统策略优化算法中需要使用与策略模型大小相同的评论模型 ➢ 降低 RL 训练的计算成本 \保证模型能够有效地学习到策略
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • pdf文档 AI跃迁派:2025年DeepSeek零基础完全指南

    高危岗位:基础文案/客服/数据分析岗位替代率达 47% ⚫ 转型路径:建立“人机协作绩效评估体系”,重构岗位价值标准 ③认知依赖 ⚫ 思维退化:调查显示过度依赖 AI 导致 25%用户独立思考能力下降 ⚫ 应对策略:中小学增设“批判性使用 AI”课程,培养元认知能力 5.未来展望:AI 原生时代的生存法则 DeepSeek 预示的不仅是工具革新,更是认知革命的序幕: ①能力坐标系重构
    10 积分 | 21 页 | 1.01 MB | 6 月前
    3
共 2 条
  • 1
前往
页
相关搜索词
2025DeepSeekR1Kimi1.5及类推理模型推理模型开发解读报告AI跃迁基础完全指南
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩