积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(2)技术工具(2)

语言

全部中文(简体)(2)

格式

全部PDF文档 PDF(1)PPT文档 PPT(1)
 
本次搜索耗时 0.013 秒,为您找到相关结果约 2 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 山东大学:DeepSeek 应用与部署

    WSL2 Python 3.8+ ,推荐使用 Anaconda/Mini cond a 管理环境 DeepSeek 本地部署 - 硬件环境准 备 DeepSeek 本地部署 - 部署办法 方法 1 :使用 Hugging Face Transformers 方法 2 :使用 vLLM 加速推 理 方法 3 : Docker 部 署 Anything
    10 积分 | 79 页 | 6.52 MB | 5 月前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    Scaling Up 带来的边际收益开始递减;如果想要深度提升模 型推理能力和长程问题能力,基于RL的 Post-Training 将会成为下一个突破点。 ➢ 自回归模型在数学推理问题上很难进步的一点在于没有办法进行回答的自主修正,如果仅是依靠生成 式方法和扩大参数规模,那么在数学推理任务上带来的收益不会太大。所以需要寻找额外的 Scaling Laws [1]。 [1] Training Verifiers 尽管可以完成复杂的推理,但是仍然受限于一些对于人类来 说很简单的任务(例如,逆转诅咒),泛化能力较弱: ➢ 本质上在于 LLM 的思考范式仍然是静态,非过程性的; ➢ 一些看似复杂的任务,实则在互联网上有相近的解决办法, 在训练语料中有所蕴含(Hypothesis: Depends purely on Task Similarity instead of Task Complexity); ➢人类的Abstraction
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
共 2 条
  • 1
前往
页
相关搜索词
山东东大大学山东大学DeepSeek应用部署2025R1Kimi1.5及类推理模型推理模型开发解读报告
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩