积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(5)技术工具(5)

语言

全部中文(简体)(5)

格式

全部PPT文档 PPT(3)PDF文档 PDF(2)
 
本次搜索耗时 0.012 秒,为您找到相关结果约 5 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PPT文档 PPT
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    预训练模型上广泛观察到的现象,协调了计算量C、模 型参数量N和数据大小D之间的关系 6 回顾:Post-Training Scaling Law ➢ Post-Training 阶段,随着训练时计算量(来自RL的Training阶段)和 Test-Time 计算量 (例如Test-Time Search)的增长,模型性能(例如数学推理能力)也会随之提升 ➢ Post-Training Scaling com/index/learning-to-reason-with-llms/ 7 回顾:Post-Training Scaling Law 为什么我们需要后训练 Scaling-Law ? ➢ 随着模型尺寸逐渐增大,预训练阶段参数 Scaling Up 带来的边际收益开始递减;如果想要深度提升模 型推理能力和长程问题能力,基于RL的 Post-Training 将会成为下一个突破点。 ➢ 自回归模型在数学推理问题上很 更重要的是,它让模型能够自由地探索解决问题的路径,而不是被预先设定的模式所束缚。 12 DeepSeek-R1 技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero的关键启示 ➢ 跳过SFT阶段,直接运用纯强化学习拓展推理能力边界实际上也带来了几个很重要的启示: ➢ 需要足够强的基座模型:基座模型 (DeepSeek-V3 Base) 超过了某个质量和能力阈值 (671B 在14.8T
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    用场景较多,但碎片化明显。其中,知识管理/知识问答、数据 助手/数据问答、专业内容生产以及视觉检测四个方向,是目前应用探索最多的领域。工业大模型经过一年多的发展,目前 总体处于小规模商业应用落地阶段。 工业大模型凭借其卓越的理解、生成和泛化能力,通过与工业领域的深度融合,有望为工业领域带来 “基础模型 + 各类应用” 的新范式。因此,工业大模型的成功落地,离不开针对特定行业的丰富现场经验和深厚的行业 EDA 工具相结合,在电路设计阶段,AI 可以自动识别和优化电路拓扑结构,通过深度学习模型预测 不同电路设计的性能指标(如功耗、速度、面积等),从而快速筛选出最优设计方案。这种方法大大减少了人工试 错的时间,加速了设计迭代过程。在布局布线阶段,优化布局布线是集成电路设计中最为耗时的步骤之一,涉及到 芯片上数百万甚至数十亿个元器件的物理位置和连接。AI 技术可以在此阶段通过强化学习等方法,自动学习最优 本、图像、音频等多模态数据时,传统 AI 的落地还是有差距;而大模型凭借强大的自学习能力和泛化能力,以及与具体行 业数据的结合调优,优势明显。 大模型的出现,将 AI 技术在工业领域的应用推向了新的发展阶段。其具体落地将会以基础大模型为技术底座,融合工业细 分行业的数据和专家经验,形成垂直化、场景化、专业化的工业大模型。工业大模型相对基础大模型具有参数量少、专业度 高、落地性强等优势,可以为工业垂
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • ppt文档 华为昇腾DeepSeek解决方案

    Proprietary - Restricted Distribution DeepSeek R1: 在 Reasoning 任务达到了世界水平( OpenAI- o1 ) 以 2 阶段 SFT+2 阶段 RL 完成,从而解决 R1-Zero 可读性差、 多种 语言混合问题 本次开源同时发布了 6 个基于 DeepSeek-R1 蒸馏的更小稠密模 型 ( Qwen/LLaMa 1 MLA 每 token 的 KV Cache 量大幅减少,且精度更高。 DeepSeekV3 模型架构: Multi-Head Latent Attention ( MLA ) 1. 推理阶段,理论上可以将 KV Cache 降低 1~2 个数量级,大幅减少 HBM 存取和通信的开销。 2. 对昇腾更亲和,大幅降低对 HBM 依赖,提升推理 Decode 性能。 MLA 架构 昇腾 可参考投机采样改造 MTP 模块 ,加速推理效率 MTP : Multi-Token Prediction 多 token 预测提升模 型效果 • MTP 模块仅在训练中使用,提升模型训练效果,推理阶段可以不使用 MTP 模块,基础模型能够独立完成正常推 理 • 参考投机采样, MTP 模块也可以被重新配置用于 speculative decoding ,加速解码过程,降低整体时延 7
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    基于大模型的智能体 7. AI 赋能高校科研 8. AI 赋能高校教学 目录 厦门大学大数据教学团队作品 2025 年 2 月 1.1 图灵测试 1.2 人工智能的诞生 1.3 人工智能的发展阶段 1.4 未来人工智能发展的五个阶 段 1. 人工智能发展简 史 厦门大学大数据教学团队作品 1950 年 , “计算机之父”和“人工智能之父”艾伦 · 图灵( Alan M. Turing ,还为人类带来了巨大的变革和进步 1.2 人工智能的诞 生 1.3 人工智能的发展阶 段 从 1956 年人工智能元年至今 ,人工智能的发展历程经历了漫长的岁月 ,大致可以划分为以下 6 个 阶段 OpenAI Operator DeepSeek R1 1.4 未来人工智能发展 5 个阶 段 2. 人工智能思维 厦门大学大数据教学团队作品 拥有和人工智能协作的能力, 懂得如何运用人工智能 用于多种任务,无需重新 训练 语言生成能力 大模型可以生成更自然 、更流 利 的语言,减少了生成输出时 呈现 的错误或令人困惑的问题 3.1 大模型的概 念 3.2 大模型的发展历 程 大模型发展历经三个阶段 ,分别是萌芽期、 沉淀期和爆发 期 3.2 大模型的发展历 程 3.2 大模型的发展历 程 大模型发展对算力的需求演变 人工智能包含了机器学习 ,机器学习包含了深度学习 ,深度学习可以采用不同的模型
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
  • ppt文档 山东大学:DeepSeek 应用与部署

    搜索: 接入满血版 DeepSeek - R1 推理模型 , 无广告且搜索结果直达。 以学习 JDK21 新特性 为 例 , 能详细给出学习计划 ,包括快速预览、 深入学习核心特性、 实战与总结等阶段。 • 硅基流动: 注册即送 2000 万 Tokens ,提供多个基于 DeepSeek - R1 蒸馏训练的模型 ,如 DeepSeek - R1 - Distill - Llama
    10 积分 | 79 页 | 6.52 MB | 5 月前
    3
共 5 条
  • 1
前往
页
相关搜索词
2025DeepSeekR1Kimi1.5及类推理模型推理模型开发解读报告英特特尔英特尔工业人工智能人工智能白皮皮书白皮书年版华为解决方案解决方案赋能高校教学科研山东东大大学山东大学应用部署
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩