2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告Test-Time 计算量 (例如Test-Time Search)的增长,模型性能(例如数学推理能力)也会随之提升 ➢ Post-Training Scaling Laws 下 训练时计算量 多了一个新的变量:Self-Play 探索时 LLM Inference 的计算量 [1] https://openai.com/index/learning-to-reason-with-llms/ Scaling-Law ? ➢ 随着模型尺寸逐渐增大,预训练阶段参数 Scaling Up 带来的边际收益开始递减;如果想要深度提升模 型推理能力和长程问题能力,基于RL的 Post-Training 将会成为下一个突破点。 ➢ 自回归模型在数学推理问题上很难进步的一点在于没有办法进行回答的自主修正,如果仅是依靠生成 式方法和扩大参数规模,那么在数学推理任务上带来的收益不会太大。所以需要寻找额外的 Scaling (推理链可读性更强) Stage I: 推理链可读性 18 DeepSeek-R1 技术 Pipeline 总览 ➢ 拒绝采样和全领域SFT Rejection Sampling and SFT ➢ 当上一个阶段的RL收敛之后,再进行SFT ➢ 和之前Cold-Start 的数据不同,这部分SFT主要是负责全领域 任务 ➢ 600k 推理任务:(1) 基于规则的奖励 (2) 利用批判模型融 合生成式奖励10 积分 | 76 页 | 8.39 MB | 6 月前3
DeepSeek大模型赋能高校教学和科研2025为人工智能科学的开山之作。 在论文的开篇 , 图灵提出了一个引人深思的问题: “机器能思考吗? ”。这个问题激发了人们 无尽的想象 , 同时也奠定了人工智能的基本概念和雏形 在这篇论文中 ,图灵提出了鉴别 机 器是否具有智能的方法 ,这就是 人 工智能领域著名的“图灵测试”。 如图所示 ,其基本思想是测试者 在 与被测试者(一个人和一台机 器) 隔离的情况下 ,通过一些装 置(如 McCarthy ) 首次提出。 与会者们不仅对人工智能的研究和应 用 前景进行了深入探讨 ,还提出了许多重要的观点和思路 ,为人工智能的发展奠定了基础。 这次会议的召开标志着人工智能作 为一个独立学科的正式诞生 , 因此 ,达特茅斯会议被称为“人工智能的开端” , 1956 年也被称为“人工智能元年”。这次会 议不仅为人工智能的研究和发展奠定了基础 ,还为人类带来了巨大的变革和进步 Pro 智能手机。 Gemini 的应用范围广泛 ,包括问题回答、 摘要生成、 翻译、 字幕生成、 情感分析等任务。 然而 , 由于其 复杂 性和黑箱性质 , Gemini 的可解释性仍然是一个挑战 3.6.1 国外的大模型产 品 2024 年 2 月 16 日 , OpenAI 再次震撼全球科技界 ,发布了名为 Sora 的 文本 生成视频大模型 ,只需输入文本就能自动生成视频。 这一技术的诞生,10 积分 | 123 页 | 15.88 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版用传统视觉算法,对工业相机采集到的图像经过预处 理,基于图像分割等深度学习模型,高效且较为准确 地检出缺陷,为传统的视觉检测技术赋予高度智能 化。质量检测也是目前 AI 技术在工业领域落地应用 较多、较为成功的一个方向。 • 智能生产管理: 在生产计划和排程方面,AI 算法可以优化生产计划 和排程,最大程度地减少产线空闲时间,提高产品交 付准时率。 在生产资源分配方面,通过深度学习和大数据分析, AI 赋能的方案,大幅提升了车身漆面缺陷的检出率和检测效率,满足生产线的快速节拍需求。 汽车零部件和整车的性能,不仅关乎驾驶性能和体验,更关乎生命安全。因此,必须保证汽车零部件完好无缺陷, 整车装配高度精准可靠,确保每一个部件都符合严格的安全标准。 例如,轮毂是汽车的重要组成部分,其质量直接关系到汽车的安全性和使用寿命。在轮毂的生产制造中,容易产生 划痕、擦伤、气孔、毛刺、喷涂不到位、黑点等外观缺陷。缺陷的多样性、表面反光的干扰以及生产线上的实时检 秒/轮毂,提高检测精度和生产线效率。 08 01 工业人工智能 (AI) 行业观察 以智能手机、平板电脑、笔记本电脑等为主导的消费电子产品以及生产制造,也是 AI 技术和工业大模型落地应用的一个重 点行业。 AI 技术强大的计算和分析能力,已经为锂电制造行业带来巨大变革,从材料选型、器件设计和优化生产保障质量方面,帮 助锂电制造企业缩短开发周期,提升检测效率,控制成本投入。 1.40 积分 | 82 页 | 5.13 MB | 5 月前3
华为昇腾DeepSeek解决方案算力规模可以探索更强的模型能力 • 在竞争背景下,头部玩家仍将追逐 Scaling Law ,坚定 AI 算力的战略投资,加速探索下一代 AI 技术 DeepSeek 是 AI 发展史上的一个关键里程碑,但远未达到 AI 终点 AI 模型算法: GPT 、 LLaMA AI 框架: PY 、 TF 异构计算架构: CUDA 互联技术: NV Link AI 芯片: 依赖,提升推理 Decode 性能。 MLA 架构 昇腾 影响 具体实现 实验结果 ① 模型结构 • 每个 MTP 模块共享嵌入层和输出头 • 每个 MTP 模块独占一个 Transformer Block 和一个投影矩阵 • 多个 MTP 模块串联保持完整的因果关系链 ② 训练策略 • 每个 MTP 模块输出预测 token 的概率分布 • 每个 MTP 模块计算对应的交叉熵损失函数0 积分 | 32 页 | 2.52 MB | 5 月前3
浙江大学-DeepSeek模型优势:算力、成本角度解读20252020 ■ 大型机时代:数字化未开始,算力需求潜力未发掘 ■ PC 时代:一个应用只需一台电脑,算力够 ■ 云计算时代:应用需要超过一台机器的算力,算力基本够 ■ 人工智能时代:算力开始不足,需大量高性能 Al 加速器 计算机算力的发展 人工智能大模型算力估计 ■ 人工智能大模型算力估计10 积分 | 23 页 | 7.53 MB | 5 月前3
从智慧教育到智慧课堂:理论、规范与实践network connect Client OS / App Image Client OS / App Image Client OS / App Image 在一个刀片上(每个刀片上具有 10-12 个桌 面图像)支持多种操作系统 对于新的桌面体验来讲,用户需要最小的适 应性。 虚拟桌面架构 通过分享应用环境,每个刀片 支持 50-10010 积分 | 74 页 | 10.39 MB | 6 月前3
AI跃迁派:2025年DeepSeek零基础完全指南一、DeepSeek 全景认知 1.颠覆性定义:人人都能用的认知引擎 DeepSeek(深度求索)是中国首个全栈开源的大语言模型,由杭州深度求索人工智能 公司研发,定位为“认知智能引擎”。简单来说,它是一个能像人类一样思考、学习和解 决问题的超级 AI 工具。 核心能力: ⚫ 复杂推理:像学霸解数学题一样处理逻辑难题(R1 模型) ⚫ 多模态融合:能理解文字、图片、文件等多种信息(未来还将支持语音和视频)10 积分 | 21 页 | 1.01 MB | 6 月前3
共 7 条
- 1
