北大:DeepSeek-R1及类强推理模型开发解读com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 RL 算法的创新: GRPO 及其技术细节 DeepSeek-R1 背后的 Insights & Takeaways : Train-Time Scaling 提升模型的推理能力? 得益于纯大规模强化学习 , DeepSeek-R1 具备强大推理能力与长文本思考能力,继开源来备受关注。 DeepSeek R1-Zero 和 R1 的出现再次证明了强化学习的潜力所在: R1-Zero 从基础模型开始构建,完全依赖强化学习,而不使用人类专家标注的监督微调( SFT ); 随着训练步骤增加,模型逐渐展现出长文本推理及长链推理能力; Diamond 等 STEM- related 榜单上取得良好表现 R1 展现出强推理模型在 AI-Driven Research 的潜 力 在长文本依赖任务如 FRAMEs 和 事实性推断 任务 Si l QA 上表现突出 得益于强大的推理能力与长文本思考能力 , DeepSeek R1 在复杂任务上表现卓越,成为开源领域的 又 一里程碑,标志着开源社区在与闭源大模型(如10 积分 | 76 页 | 6.72 MB | 5 月前3
山东大学:DeepSeek 应用与部署和自编程能力(自动模块设计、 代码编 写、 测试用例) 。 " 恨聪明 但没那么听话 " DeepseekV3 Deepseek R1 Deepseek r1 鞅的证 明 Deepseek r1 Roy 安全准则组合模型推 理 Deepseek r1 推理玻尿酸配 方 DeepSeek 提示词工 程 提示词工程 Deepseek 十类提示 词 • 1. 内容生成类 :文本生成、代码生成、创 和 Qwen 蒸馏 的 DeepSeek - R1 推理模型 ,涵盖多种不同参数规模 ,适合想在本地运行模型的用户。 • 第三方 UI 客户管接入服务: 可通过 Anything LLM 、 Cherry Studio 、 Chatbox 等选择 API 接入。 • 秘塔 AI 搜索: 接入满血版 DeepSeek - R1 推理模型 , 无广告且搜索结果直达。 以学习 JDK21 2000 万 Tokens ,提供多个基于 DeepSeek - R1 蒸馏训练的模型 ,如 DeepSeek - R1 - Distill - Llama - 70B 等 ,在推理能力上表现出色。 • 阿里云百炼: 提供多个 DeepSeek 系列模型 ,如 DeepSeek - V3 、 DeepSeek - R1 - Distill - Qwen - 1.5B 等 ,10 积分 | 79 页 | 6.52 MB | 5 月前3
DeepSeek消费电子行业大模型新型应用最佳实践分享核心收益 长上下文 (64~128K) 超大模型启动加速 独享 GPU 算力集群 私有 API 服务调用 高并发、高可用 企业级鉴权流控 算力投入持续降低 DeepSeek 全系 列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 满血版模型一键精调 • 256 卡 H20 • 全参 SFT • 8 小时 蒸馏后模型多模式精调 • 全参 +LoRA 双模 式 • 低至 1 卡 A10 DeepSeek 全系 列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 全系大语言模型支持 SFT 快速 直观 R1 推理结果 生成 R1 推理服务调用 构造蒸馏数据 集 清洗 R1 推理结果 灵活、易扩展 基于 TI 平台精调工具链,迁移 R1 高级推理能力至小尺寸模型,以更低推理成本满足垂直场景下的业务需 求 内置 R1 模型一键部 署 快速 选择并精调目标模型 评估对比模型效果 R1 模型部署 效果评 估 蒸馏模10 积分 | 28 页 | 5.00 MB | 6 月前3
金融-DeepSeek银行部署加速,AI金融应用迎来跃迁其通过对训练方式、算法架构和推理方 法 的工程化优化大幅降低了部署成本。近期采用大规模 RL 训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到了 DeepSeek R1 671B 的应用效果,有望进一步催生银行落地应用。 n 我们认为金融行业人工智能的应用价值大体可以分为三个层次: 降本增效,价值创造与决策赋能。在实际银行落地应用 中,可能包括: 1 技术落地不及预期、竞争加剧、信息更新不及时等。 2 核心观点 DeepSeek 开源、低成本、强推 理 助推银行业应用 1 n DeepSeek 模型在 Post-Train 阶段大规模应用了强化学习方法。 R1 使用了冷启动 + 大规模强化学习方法, R1-Zero 版 本模 型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和 long-CoT 能力涌现等) 。 图表:随步数提升 跨节点专家并行( Expert Parallelism , EP )来优化通信开销,尽可能实现负载均衡。 图表: DeepSeek R1 架构图 图表: DeepSeek R1 训练方法 资料来源: DeepSeek ,中泰证券研究所10 积分 | 25 页 | 1.44 MB | 2 天前3
华为昇腾DeepSeek解决方案AI 芯片:昇腾、寒武纪 … DeepSeek-R1 进一步验证“算力即性能” Scaling Law 升级,模型能力 = 算力 x 数据 x 思考 + 逻辑推理 DeepSeek-V3/R1 OpenAI-o1/o3 算力 x 数据 重新定义 Scaling Law 延续智能涌现的 方向 2017 谷歌发布首个 Transformer 架 构 模 型 2023 ChatGPT o1 的 3% 算法革命 架构创新 工程奇迹 开源生态 4 Huawei Proprietary - Restricted Distribution DeepSeek R1: 在 Reasoning 任务达到了世界水平( OpenAI- o1 ) 以 2 阶段 SFT+2 阶段 RL 完成,从而解决 R1-Zero 可读性差、 多种 语言混合问题 本次开源同时发布了 KVCache 降低内存 90% 支持更高并发 模型容量提升 3 倍 计算量减少 70% DeepSeek 通过从模型结构到训推全流程的优化,带来大模型新 范式 DeepSeekV3/R1 ,大幅提升从训练到推理的计算效率,降低模型创新及应用落地的门槛 降低学习复杂度 简化强化学习流程 降低后训练复杂度 推理优化 单次推理效率倍级提升 一次预测多个 token 推理倍级提升0 积分 | 32 页 | 2.52 MB | 5 月前3
Deepseek在药企研发领域的本地化部署和应用场景that cost more than E300 with ol,cost less than $10 with R1,"says 2025La81547 智慧芽 @LS- GTM 4 筋 京始前平台 动 她米 N 附大 等 A 附大 理白练 第三方乘道 AaMN 火 山 0 出元建 阿 白 Moly R1( 向量智能 )) 本地部署 · 打破垄断: R1 版以低成本和开源特性打破以往头部企业垄断局面。 · 价格优势: DeepSeek-R1 的 API 定价仅为行业均价的 1/10, 推动了中小型企业低成本接入 Al @LS-GTM 智 慧 芽 8 Deepseek-R1 满血版模型部署方案 · DeepSeek R1 模型就成了很多应用场景下的当务之急。受限于 DeepSeekR1671B(6710 亿参数 ) 的模型规模,通常 情况下部署 Deepseek R1 满血版模型需要 1200G 左右显存 ( 考虑百人内并发情况 ), 需要双节点 8 卡 H100 服务器 才能10 积分 | 33 页 | 2.29 MB | 6 月前3
2025年智启未来·险见新机-人保寿险大模型探索及实践(33页 PPT)并 表 自身模型的迭代。 • Meta 成立四个专门研究小组来分析 DeepSeek R1 的工 作 此改进其大模型 Llama 。 • 英伟达、微软 、亚马逊等国际巨头纷纷接入 DeepSeek 。 DeepSeek 颠覆出圈 , 霸榜热 议 DeepSeek R1 引 发 全 球 关 注 DeepSeek 发 展 节 点 2 0 2 3 年 7 月 D e e “算力降维打击” ,在相同算力下支持更 大参数规模 ,显著提升模型效率。 训练优化 通过低比特 FP8 训练技术、强化学习策略 ( DeepSeek R1 完全依赖 RL 而非人工标 注数据)和通信优化 ,降低训练成本至 550 万美元 ,仅为 GPT-4 的 1/4-1/6 。 性能对标 推理能力比肩 ChatGPT GPT-4 的千分之一。 自主试错优化 R1 采用纯强化学习( RL )训练,跳过 SFT ,让模型通过自主试错和优化来学习, 减少对标注数据依赖,降低训练复杂度。 在实际应用中, R1 在数学和编程任务中表现优于 OpenAI o1 。 自适应调整 极简单的奖励规则,让大模型自我博弈、不断顿悟与自适应调整,实现深度思 考。比如, R1 会深入思考多种解题路径,评估优劣后选择数学难题的最优解,10 积分 | 33 页 | 2.82 MB | 2 天前3
DeepSeek华为云AI解决方案时 问题 解决 等任 务上 超越 OpenAI O1 ,但《华尔街日报》测试发现 OpenAI O1 在部分问题上更快。 12.26 DeepSeek R1 发布 比肩 OpenAI o1 ,支持模型蒸馏, 国产 AI 迎来里程碑时刻 n 1 月底, DeepSeek 在苹果应用商店中霸占了 157 个国家 / 地区的第一名位置,其中包括美 ModelArts Lite (裸金属服务器)和 ModelArts Standard ( Console 平台)两 种方 式部署。 DeepSeek 模型 云服务 卡数 包月(元 / 月) R1 ModelArts Lite&Standard 32 卡起步 606480 V3 ModelArts Lite&Standard 32 卡起步 606480 场景 1 :基于 ModelArts ModelArts Lite&Standard 部署 DeepSeek R1&V3 全尺 寸模型 DeepSeek 模型 云服务 卡数 按需(元 / 小时) 包月(元 / 月) R1 ModelArts Studio 32 卡起步 1263.5 606480 V3 ModelArts Studio 32 卡起步 1263.5 606480 R1-Distill-32B ModelArts10 积分 | 16 页 | 850.86 KB | 6 月前3
DeepSeek大模型赋能高校教学和科研2025生 1.3 人工智能的发展阶 段 从 1956 年人工智能元年至今 ,人工智能的发展历程经历了漫长的岁月 ,大致可以划分为以下 6 个 阶段 OpenAI Operator DeepSeek R1 1.4 未来人工智能发展 5 个阶 段 2. 人工智能思维 厦门大学大数据教学团队作品 拥有和人工智能协作的能力, 懂得如何运用人工智能 2. 人工智能思 维 具备区分人的能力 和机器的能力 模型。推理模型的核心在于处 理那些需要 多步骤逻辑推导才能解决的 复杂问题。 3.4 大模型的分 类 大语言模型可以分为通用大模型和推理大模型 3.4 大模型的分 类 n 推理大模型 DeepSeek R1 的对话效果 非推理问题 : ” 法国的首都是哪里 ? ” (答案直接 、 无需推导 ) 推理问题: ” 一列火车以每小时 60 英里的速度行驶 3 小时 , 行驶距离是多少? ” (需先理解 ,为师生提供定制化、情境化 的教 学辅助 ,还支持学生的个性化与探究式学习需求。 DeepSeek 满血版 R1 , 参数高达 6710 亿( 671B ) , 相当于一个 “超级大脑” , 能处理复杂数学题、 编程、 长文本分析等高 难度 任务。 部署本地 DeepSeek- R1 ( 671B ) 满血版模型 ,支持校园办公自动化、 科研项目辅助、 学术资源分析等多领域应 用 浙江大学、10 积分 | 123 页 | 15.88 MB | 6 月前3
清华大学:DeepSeek赋能家庭教育纳米 AI APP 671B 满血版(官方同款) 目前提供免费使用(满血版暂时开放) 。
推荐用于编程等场景,性能与官方 一致 。 秘塔搜索 https://metaso.cn/ R1 增强版(基于 671B 参 数 优化) 免费使用,侧重搜索功能,编程性能略有牺牲 。
支持“长思考 ”模式,适合 复杂问题处理 。 英伟达 NIM 微服务 671B (全量模型) 满血版 R1 ( 671B 参数) 无需注册 ,免费接入满血版模型;支持联网插件和工作流功能 DeepSeek 的使用入 口 官方入口: https://chat.deepseek.com/ https://build.nvidia.com/d eepseek-ai/deepseek-r1 特性 基础模型 ( DeepSeek V3) 深度思考模型 ( DeepSeek R1) 联网模型 基础模型 ( DeepSeek V3) • 概念深度理解和思维能力培养 → 深度思考模型 ( DeepSeek R1) • 探究性学习项目和最新知识获取 → 联网模型 DeepSeek 的三种模式对 比 家庭教育交互式提示框架 聊法: 如何与 AI 进 行有效沟通 ( R1 ) 词法: 如何设计 和 输入具体的提示词 (V3) • 避免直接提问: 不要让 AI 直 接提供答案,10 积分 | 89 页 | 9.10 MB | 5 月前3
共 30 条
- 1
- 2
- 3
