2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告\ Kimi 1.5 及 类强推理模型开发解读 北大对齐小组 陈博远 北京大学2022级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 及 R1 技术剖析 ➢ Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 ➢ RL 算法的创新:GRPO及其技术细节 ➢ DeepSeek-R1 背后的Insights & Takeaways:RL加持下的长度泛化 \ 推理范式的涌现 ➢ DeepSeek-R1 社会及经济效益 ➢ 技术对比探讨 ➢ STaR-based Methods vs. RL-based \ o-series) ➢ 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及Takeaways ➢ PRM & MCTS 的作用 ➢ 从文本模态到多模态 ➢ 其他讨论:Over-Thinking 过度思考等 ➢ 未来方向分析探讨 ➢ 模态穿透赋能推理边界拓展:Align-DS-V ➢ 合成数据及Test-Time Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全:形式化验证10 积分 | 76 页 | 8.39 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版算法和大量代码数据训练模型,通过分析代码的结构 和模式,并根据开发者的需求,自动生成函数、类、 模块等代码,甚至优化现有代码,从而帮助开发者加 速代码生成,减少错误。 • 优化产品结构与应用模拟:通过形态识别技术,将 产品外形及特征转化为数据,辅助设计师不断优化 迭代。利用收集到数据构建数字孪生产品模型,模 拟产品的各种实际应用场景,如正常操作、极限性 能、潜在故障等,预测产品性能表现,进一步指导 设计改进。 1.2 的自动化与智能化。具体包括: • 设备管理: 在设备入库管理方面,AI 通过深度学习识别设备上的 条形码、二维码或设备特征,自动读取设备信息如型 号、序列号等;AI 的自然语言处理功能,可以自动 提取设备手册或标签上的文字信息,获取设备规格、 性能指标等关键参数。这些都能显著提升设备入库管 理的效率和准确性。 在设备运维管理方面,利用机器学习算法,对部署在 设备上的温度、压力、振动等各种传感器给出的监测 数据进行处理分析,实时监控设备运行状态,并可通 过模式识别算法检测数据中的异常,预测可能出现的 故障或发现故障甚至给出修复建议,便于运维人员及 时实施预测性维护或故障修复,减少停机时间,提高 设备的可靠性和生产效率。 • 质量管理:产品缺陷检测是质量管理的重要一环,尤 其是对于金属等高反光产品、薄膜产品的划痕、裂 纹、凹坑、气孔、污染等非常难检出的外观缺陷,利 用传统视觉算法,对工业相机采集到的图像经过预处0 积分 | 82 页 | 5.13 MB | 5 月前3
AI跃迁派:2025年DeepSeek零基础完全指南视频) ⚫ 超长上下文:一口气读完 3-4 万字的长文档(64Ktoken 容量) 技术架构: ⚫ MLA 多头潜在注意力:像多线程处理信息,显存占用降低 50%,适合普通电脑运 行 ⚫ MoE 混合专家系统:遇到问题自动召唤“专业团队”,比如数学题找数学专家模 块,写诗找创意模块 ⚫ 强化学习驱动:通过“试错+奖励”机制自我进化,类似游戏 AI 自学通关 竞品监控:自动生成友商产品功能对比表 ⚫ 风险预警:识别企业年报中的 34 种财务异常信号 ⚫ 生活助手:比价全网购物平台,推荐性价比最高商品 3.技术普惠:让 AI 像水电一样触手可及 DeepSeek 通过两大革新打破技术壁垒: 1.白菜价训练:用 2000 块国产昇腾芯片就能训练专业模型,大学生也能参与 AI 开发 2.手机端运行:1.5B 压缩版模型在千元机上流畅运行,山区医生可用 记忆外延:个人知识库与 AI 记忆网络深度融合,实现“瞬间调取 20 年工作经验”的 能力 ⚫ 决策共生:AI 构建“平行推演空间”,在重大决策前模拟 100 种可能性并标注风险 路径 ②感知升维突破 ⚫ 多模态进化:2025 年将实现“五感互联”,例如通过气味传感器分析食品安全,震 动反馈识别机械故障 ⚫ 时空穿越能力:结合历史数据与预测模型,企业可“预览”三个月后的市场格局10 积分 | 21 页 | 1.01 MB | 6 月前3
DeepSeek大模型赋能高校教学和科研2025Operator DeepSeek R1 1.4 未来人工智能发展 5 个阶 段 2. 人工智能思维 厦门大学大数据教学团队作品 拥有和人工智能协作的能力, 懂得如何运用人工智能 2. 人工智能思 维 具备区分人的能力 和机器的能力 协作 区分 了解 每个人都应了解人工智能 的基础运行模式 2024 年 12 月 , 人工智能教母级人物、 斯坦福大 学终 身教授李飞飞在公开演讲中说道: 取最会用 ChatGPT 的前 2000 名学生”。 2025 年 1 月 , 互联网知名企业家周鸿祎发表观点 ”未来擅长使用 AI 的人会淘汰不会使用 AI 的人 “。 2. 人工智能思 维 3.1 大模型的概念 3.2 大模型的发展历程 3.3 人工智能与大模型的关 系 3.4 大模型分类 3. 大模型:人工智能的前 沿 3.5 大模型原理 3.6 大模型产品 3.7 大模型应用领 提供语法检查、参考文献自动生成等功能 , 极大提高写作效率 文本创作与智能办公场景 实现高效语言生成、 辅助写作、 智能纠错 和摘要生成、多种语言实时互译 文本分析 可快速提炼论文创新点、方法及实验结果 数学推理 能够解答高等数学、 概率统计、 线性代数 等复杂问题 ,提供解题思路与引导式问题 编程助手 支持 10 余种编程语言的代码创作与问题诊 断 2025 年10 积分 | 123 页 | 15.88 MB | 6 月前3
山东大学:DeepSeek 应用与部署本地部署蒸馏小模型 第三方 UI 客户管接入服务 云端网站接入服 务 Deepseek 模型及蒸馏模 型 Chatbox API 及网络调 用 Chatbox API 及网络调 用 API 及蒸馏模 型 API 及蒸馏模 型 本地网络调用 API 接 入 DeepseeK 替代部署方案 • 本地部署蒸馏小模型: 可通过 o llama 平台、 确保设备满足一定硬件要求 , 显卡需 GTX 1060 ( 6GB ) 及以上 , 推荐 RTX3060 及以上; 内存 8GB 及以上 , 推荐 16GB 及更高; C 盘剩余 20GB 空间 , 建议 使用 NVMe 固态硬盘 。 • 安装 LM Studio 客户端: 在官网 lmstudio.a i 下载对应操作系统的安装包 ,双击 运 行并按提示完成安装。 启动后 , 点击右下角设置图标将语言改为简体中文。 , 再点击左上方搜索图标搜索 deepseek 选择模型。 注意参数规 模 不同 ,性能和硬件需求有差异。 例如 , 1.5B 适合体验尝鲜 , 7B 适合普通创 作及开 发测试 , 8B 适合对内容要求更高的场景 , 14B 适合专业及深度内容创作。 LM Studio+DeepSeek LM Studio 可以通 过 huggaface 下载 Deepseek 各种蒸 馏模型( GGUF10 积分 | 79 页 | 6.52 MB | 5 月前3
华为昇腾DeepSeek解决方案把握 DeepSeek 时刻,携手同 行 华为昇腾 AI 解决方案汇报 2025 年 2 月 DeepSeek 洞察及昇腾适配进展 华为昇腾 AI 基础软硬件介绍 CO NT E NTS 目 录 2 1 Huawei Proprietary - Restricted Distribution 2 训练资源 • 随着 DeepSeek 提供了一种高效率训练的方法,同等 Restricted Distribution 下一代 AI 技术 Mamba 、空间智能 等 算力 x 数据 x 思 考 模 型 效 果 低成本完美对标 OpenAI O1 ,突破精确语义理解及复杂推理任务 DeepSeek-V3 是一款 MoE 模型,总参数量 671B ,激活参数量 37B ,采用 2048 张 H800 (节点内 NVLink ,节点间 IB ,非超节点架构) 在 14 Reasoning 性能 Huawei Proprietary - Restricted Distribution 5 张量低秩压缩以降低 KV Cache 资源开销:相比于传统 MHA , MLA 通过降 维 操作使得存储的张量维度大幅减小。(下图中仅红色阴影部分需要存 储) (bs, ℎ) (bs, ℎ) 2bsℎ (bs, ℎ) (bs, ℎ) bsℎ′ 压缩后宽度ℎ′ ≪0 积分 | 32 页 | 2.52 MB | 5 月前3
从智慧教育到智慧课堂:理论、规范与实践息时代的教育新形态、教育的“新常态”,是信息化元素充分 融入教育以后,在“时代催化剂”的作用下教育发生的“化学反 应”。 信息化 教育 时代催化剂 智慧教育” 智慧教育体系 智慧教师 智慧管理 智慧学习者及智慧学习 智慧课程 智慧教学 智慧教育资源 智慧评价(教、学) 智慧服务 智慧教室 智慧校园 智慧平台 智慧教育方式 10 信息技术 与学科教 65” 互动电视 65” 互动电视 65” 互动电视 分组 桌椅 3 分组 桌椅 5 分组 桌椅 1 分组 桌椅 2 分组 桌椅 4 投影机 充电柜 OPS box 网络孔及电源 无障碍 坡道 分 离 式 冷 气 分 离 式 冷 气 讲桌 160” 触控电子白 板 退缩 空间 退缩 空间 退缩 空间 投影机 案例一:多功能教室整体设备配置图 案例二:合作探究学习情境10 积分 | 74 页 | 10.39 MB | 6 月前3
共 7 条
- 1
