阶段 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

预训练模型上广泛观察到的现象，协调了计算量C、模型参数量N和数据大小D之间的关系 6 回顾：Post-Training Scaling Law ➢ Post-Training 阶段，随着训练时计算量（来自RL的Training阶段）和 Test-Time 计算量（例如Test-Time Search）的增长，模型性能（例如数学推理能力）也会随之提升 ➢ Post-Training Scaling com/index/learning-to-reason-with-llms/ 7 回顾：Post-Training Scaling Law 为什么我们需要后训练 Scaling-Law ? ➢ 随着模型尺寸逐渐增大，预训练阶段参数 Scaling Up 带来的边际收益开始递减；如果想要深度提升模型推理能力和长程问题能力，基于RL的 Post-Training 将会成为下一个突破点。 ➢ 自回归模型在数学推理问题上很更重要的是，它让模型能够自由地探索解决问题的路径，而不是被预先设定的模式所束缚。 12 DeepSeek-R1 技术剖析：DeepSeek-R1 Zero DeepSeek-R1 Zero的关键启示 ➢ 跳过SFT阶段，直接运用纯强化学习拓展推理能力边界实际上也带来了几个很重要的启示： ➢ 需要足够强的基座模型：基座模型 (DeepSeek-V3 Base) 超过了某个质量和能力阈值（671B 在14.8T

10 积分 | 76 页 | 8.39 MB | 10 月前
3
英特尔-工业人工智能白皮书2025年版

用场景较多，但碎片化明显。其中，知识管理/知识问答、数据助手/数据问答、专业内容生产以及视觉检测四个方向，是目前应用探索最多的领域。工业大模型经过一年多的发展，目前总体处于小规模商业应用落地阶段。工业大模型凭借其卓越的理解、生成和泛化能力，通过与工业领域的深度融合，有望为工业领域带来 “基础模型 + 各类应用” 的新范式。因此，工业大模型的成功落地，离不开针对特定行业的丰富现场经验和深厚的行业 EDA 工具相结合，在电路设计阶段，AI 可以自动识别和优化电路拓扑结构，通过深度学习模型预测不同电路设计的性能指标（如功耗、速度、面积等），从而快速筛选出最优设计方案。这种方法大大减少了人工试错的时间，加速了设计迭代过程。在布局布线阶段，优化布局布线是集成电路设计中最为耗时的步骤之一，涉及到芯片上数百万甚至数十亿个元器件的物理位置和连接。AI 技术可以在此阶段通过强化学习等方法，自动学习最优本、图像、音频等多模态数据时，传统 AI 的落地还是有差距；而大模型凭借强大的自学习能力和泛化能力，以及与具体行业数据的结合调优，优势明显。大模型的出现，将 AI 技术在工业领域的应用推向了新的发展阶段。其具体落地将会以基础大模型为技术底座，融合工业细分行业的数据和专家经验，形成垂直化、场景化、专业化的工业大模型。工业大模型相对基础大模型具有参数量少、专业度高、落地性强等优势，可以为工业垂

0 积分 | 82 页 | 5.13 MB | 10 月前
3
华为昇腾DeepSeek解决方案

Proprietary - Restricted Distribution DeepSeek R1: 在 Reasoning 任务达到了世界水平（ OpenAI- o1 ）以 2 阶段 SFT+2 阶段 RL 完成，从而解决 R1-Zero 可读性差、多种语言混合问题本次开源同时发布了 6 个基于 DeepSeek-R1 蒸馏的更小稠密模型（ Qwen/LLaMa 1 MLA 每 token 的 KV Cache 量大幅减少，且精度更高。 DeepSeekV3 模型架构： Multi-Head Latent Attention （ MLA ） 1. 推理阶段，理论上可以将 KV Cache 降低 1~2 个数量级，大幅减少 HBM 存取和通信的开销。 2. 对昇腾更亲和，大幅降低对 HBM 依赖，提升推理 Decode 性能。 MLA 架构昇腾可参考投机采样改造 MTP 模块，加速推理效率 MTP ： Multi-Token Prediction 多 token 预测提升模型效果 • MTP 模块仅在训练中使用，提升模型训练效果，推理阶段可以不使用 MTP 模块，基础模型能够独立完成正常推理 • 参考投机采样， MTP 模块也可以被重新配置用于 speculative decoding ，加速解码过程，降低整体时延 7

0 积分 | 32 页 | 2.52 MB | 10 月前
3
DeepSeek大模型赋能高校教学和科研2025

基于大模型的智能体 7. AI 赋能高校科研 8. AI 赋能高校教学目录厦门大学大数据教学团队作品 2025 年 2 月 1.1 图灵测试 1.2 人工智能的诞生 1.3 人工智能的发展阶段 1.4 未来人工智能发展的五个阶段 1. 人工智能发展简史厦门大学大数据教学团队作品 1950 年， “计算机之父”和“人工智能之父”艾伦 · 图灵（ Alan M. Turing ，还为人类带来了巨大的变革和进步 1.2 人工智能的诞生 1.3 人工智能的发展阶段从 1956 年人工智能元年至今，人工智能的发展历程经历了漫长的岁月，大致可以划分为以下 6 个阶段 OpenAI Operator DeepSeek R1 1.4 未来人工智能发展 5 个阶段 2. 人工智能思维厦门大学大数据教学团队作品拥有和人工智能协作的能力，懂得如何运用人工智能用于多种任务，无需重新训练语言生成能力大模型可以生成更自然、更流利的语言，减少了生成输出时呈现的错误或令人困惑的问题 3.1 大模型的概念 3.2 大模型的发展历程大模型发展历经三个阶段，分别是萌芽期、沉淀期和爆发期 3.2 大模型的发展历程 3.2 大模型的发展历程大模型发展对算力的需求演变人工智能包含了机器学习，机器学习包含了深度学习，深度学习可以采用不同的模型

10 积分 | 123 页 | 15.88 MB | 10 月前
3
山东大学：DeepSeek 应用与部署

搜索：接入满血版 DeepSeek - R1 推理模型，无广告且搜索结果直达。以学习 JDK21 新特性为例，能详细给出学习计划，包括快速预览、深入学习核心特性、实战与总结等阶段。 • 硅基流动：注册即送 2000 万 Tokens ，提供多个基于 DeepSeek - R1 蒸馏训练的模型，如 DeepSeek - R1 - Distill - Llama

10 积分 | 79 页 | 6.52 MB | 10 月前
3

共 5 条前往

页

分类

语言

格式

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

英特尔-工业人工智能白皮书2025年版

华为昇腾DeepSeek解决方案

DeepSeek大模型赋能高校教学和科研2025

山东大学：DeepSeek 应用与部署