2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告Post-Training 时代下的RL新范式:后训练扩展律 Post-Training Scaling Law ➢ DS-R1 独立发现了一些通往o1路上的核心理念,并且效果还好到受到了OpenAI 的认可 ➢ 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力? ➢ 得益于纯大规模强化学习,DeepSeek-R1 具备强大推理能力与长文本思考能力,继开源来备受关注。 表现出在推理任务上思维链长度的自然增长和涌现 ➢ 反思深度逐层加深,出现标记不明确的步骤、保持中间结论、验证、混合语言推理等现象 ➢ 模型在准确率奖励和格式奖励下自然探索到 验证、回溯、总结、反思 的行为范式 ➢ 如何控制来保证最后的response 长度能够稳定上升,可能会出现反复重复验证、或者验 证时间过晚的情况; (REINFORCE 系列更快;PPO训练稳定但是慢) ➢ 多语言可能是因为预训练数据是多语言的,“一视同仁”被 对于一些简单的数学问题例如 2+3 =? 也会过多思考 ➢ 看似有反思范式,重复Pattern多,可能会 导致更好的表现,但是会带来training 和 inference过程中极大的损耗 ➢ 如何合理的分配Test-Time Compute, 进行 选择性思考? ➢ Long2Short Distillation ➢ 长度优化的Penalty ➢ 优化采样策略 [1] Do NOT Think10 积分 | 76 页 | 8.39 MB | 6 月前3
AI跃迁派:2025年DeepSeek零基础完全指南页的长文档建议拆分处理,避免解析超时 3.常见问题速查 Q1:为什么联网搜索时断时续? 原因:服务器负载过高或网络波动 解决方案:避开晚高峰使用,或切换至深度思考模式本地处理 Q2:如何导出对话记录? 操作路径:网页版/APP 端点击对话历史→右键选择“导出为 Markdown” Q3:上传文件后 AI 无法识别内容? 排查步骤: 1.检查文件是否受损(重新保存后上传) 错误:“帮我写点文案”→AI 无法判断需求 修正:“为 30-40 岁女性设计护肤品广告语,突出‘抗皱+提亮’功效,带 Emoji 和话题标 签” 2.过度复杂 错误:一次性提问“如何从零开始做小红书账号?” 修正:分步拆解“冷启动→爆款公式→变现路径” 3.忽略背景 错误:“推荐旅游城市”→可能推荐南极科考站 修正:“预算 5000 元/3 天/亲子游,推荐 代码优化: “下面这段 Python 代码运行缓慢,请解释问题并提供两种优化方案” 2.内容润色: “将这段话改为李诞脱口秀风格,加入谐音梗和反转” 3.流程拆解: “分三步解释如何拍摄星空照片:设备准备→参数设置→后期处理” 五、全民生产力革命 1.高频场景:AI 赋能日常生活 DeepSeek 通过技术普惠,正在重塑个人与组织的生产力模式,以下是三大用户群体的10 积分 | 21 页 | 1.01 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版是企业的生存之道。而引领工业 革命浪潮的 AI 技术和大模型,是企业从多维度重塑自身生产方式、实现新质生产力的关键。 通过这本白皮书,工业领域的企业和合作伙伴可以更系统、更全面地了解 AI 技术如何为工业制造的各 个环节赋予怎样的智能化能力,以及英特尔在帮助企业落地部署 AI 技术方面所能提供的产品、平台和 系统性支持与服务以及成功案例。 本白皮书中包括了工业 AI 和工业大模型的概念介绍、当前的市场规模与市场增长潜力、工业 产中的隔膜缺陷检测,前段工序中的极片表面缺陷检测、涂布外观缺陷检测,中段工序中的密封钉焊道缺陷检测、 电池包蓝膜后缺陷检测,后段工序中的 Busbar 焊后检测等。目前锂电检测的主要痛点在于:如何以接近 100% 的 检测良率精准地检测出多种复杂难检的缺陷;同时质检速度还要跟上生产节拍,以保证甚至提升产能。 以电芯顶盖板焊接质量检测为例,在将电芯顶盖焊接到电池壳体的过程中,很容易出现爆点、焊坑、孔洞、断焊、 高效仿真模型,可以在原子、分子、颗粒、电极和电芯等多个尺度上进行仿真模拟, 让研发人员更深入地理解电池内部的作用机理,并在此基础上快速优化材料和结构设计,缩短设计时长。 半导体制造作为一个高度复杂、技术密集、资本密集的行业,如何实现产品的快速设计、确保生产过程的精度和良率,以保 障研发和生产成本的良性投入,最终满足市场对芯片产品的快速更新迭代需求,是半导体行业面临的痛点问题。 1.4.4 半导体行业 加速集成 电路芯片0 积分 | 82 页 | 5.13 MB | 5 月前3
DeepSeek大模型赋能高校教学和科研2025人工智能的诞生可以追溯到 20 世纪 50 年代。 当时 ,计算机科学刚刚起步 ,人们开始尝试通过计算机程序来模拟人类的思维 和 行为。 在这个背景下 , 一些杰出的科学家和工程师们开始研究如何使计算机具备更高级的功能 1956 年 8 月 ,在美国达特茅斯学院举办的人工智能夏季研讨会 ,是人工智能领域具有里程碑意义的一次重要会议。 这次会 议汇 聚了众多杰出的科学家和工程师 ,他们共同探讨和研究人工智能的发展和应用前景 个 阶段 OpenAI Operator DeepSeek R1 1.4 未来人工智能发展 5 个阶 段 2. 人工智能思维 厦门大学大数据教学团队作品 拥有和人工智能协作的能力, 懂得如何运用人工智能 2. 人工智能思 维 具备区分人的能力 和机器的能力 协作 区分 了解 每个人都应了解人工智能 的基础运行模式 2024 年 12 月 , 人工智能教母级人物、 斯坦福大 DeepSeek 科大讯飞的讯飞星火 阿里的通义千问 OpenAI 的 ChatGPT AIGC 大模型的提示词( Prompt ) 是指用户向大模型输入的文本内容 , 用于触发大模型的响应并指导其如何生成或 回应 这些提示词可以是一个问题、 一段描述、 一个指令 , 甚至是一个带有详细参数的文字描述。 它们为大模型提供了生 成对 应文本、 图片、 音频、 视频等内容的基础信息和指导方向。10 积分 | 123 页 | 15.88 MB | 6 月前3
共 4 条
- 1
