方法 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

带来的边际收益开始递减；如果想要深度提升模型推理能力和长程问题能力，基于RL的 Post-Training 将会成为下一个突破点。 ➢ 自回归模型在数学推理问题上很难进步的一点在于没有办法进行回答的自主修正，如果仅是依靠生成式方法和扩大参数规模，那么在数学推理任务上带来的收益不会太大。所以需要寻找额外的 Scaling Laws [1]。 [1] Training Verifiers to Solve Math Word response length 逐渐增加（对应着 test-time computation increasing） ➢ Aha moment: 自然学会增加更多的推理时间，反思评价先前步骤、探索其他方法 RL驱动下自然涌现 Long-CoT 能力 “Aha”Moment 11 DeepSeek-R1 技术剖析：DeepSeek-R1 Zero DeepSeek-R1 Zero的关键启示 ➢ Zero DeepSeek-R1 Zero的关键启示：举例 - 自动化标记和验证 ➢ 示例输入: 编写 python 代码，该代码采用数字列表，按排序顺序返回，在开始时添加 42。 ➢ 自动化验证方法： ➢ 利用软件检查代码补全判断是否为完整代码； ➢ 执行Python代码检查运行情况判断是否为可运行代码； ➢ 调用外部模块构建额外的检测单元； ➢ 甚至可以更进一步，测量执行时间，使训练过程首选性能更高的解决方案；

10 积分 | 76 页 | 8.39 MB | 1 年前
3
英特尔-工业人工智能白皮书2025年版

工业人工智能 (AI) 行业观察 01 02 01 工业人工智能 (AI) 行业观察工业 AI，是 AI 技术在工业领域的应用，它通过机器学习、深度学习、计算机视觉等先进的计算智能方法，实现对工业生产过程的优化和智能化，最终帮助企业提高生产效率、降低成本、提升产品质量，实现数字化转型。 2023 年 12 月，由信通院牵头、多家单位联合编制的《工业大模型技术应用与发展报告》指出，AI 一，它不仅关系到车辆的美观性，更事关车辆的防腐性、耐久性等问题。漆面喷涂环节工艺繁多复杂，易出现颗粒、缩孔、焊渣、脏污等各类缺陷，进而影响整车外观甚至漆面的耐久性。传统的人工漆面缺陷检测方法，受检测人员自身状态及长时间工作易疲劳等因素的影响，无法精确检出各类缺陷，很难满足现代汽车生产需求。在 AI 算法赋能下的 3D 成像技术，与机器人手臂协同作业，能够在线采集整车漆面数据进行并行计算，实现车身生划痕、擦伤、气孔、毛刺、喷涂不到位、黑点等外观缺陷。缺陷的多样性、表面反光的干扰以及生产线上的实时检测要求，使得效率和准确率低下且容易漏检的人工质检和容易受复杂环境光干扰的传统机器视觉检测方法无法胜任。将 AI 视觉算法技术与机器视觉成像技术相结合，利用经过缺陷图像训练的深度学习模型识别工业相机捕获的缺陷图像，满足终端检测节拍要求 24 秒/轮毂，提高检测精度和生产线效率。 08

0 积分 | 82 页 | 5.13 MB | 1 年前
3
山东大学：DeepSeek 应用与部署

，教师模型生成合成数据或伪标签，然后这些数据用于训练学生模型。 • 2. Logits 蒸馏在 logits 蒸馏中，学生模型被训练来匹配教师模型的 logits ，而不仅仅是最终的预测。这种方法保留了更多关于教师模型置信水平和决策过程的信息。 • 3. 特征蒸馏特征蒸馏涉及将教师模型中间层的知识转移到学生模型中。通过对齐两个模型的隐藏表示，学生模型可以学习到更丰富和更抽象的特征。 cond a 管理环境 DeepSeek 本地部署 - 硬件环境准备 DeepSeek 本地部署 - 部署办法方法 1 ：使用 Hugging Face Transformers 方法 2 ：使用 vLLM 加速推理方法 3 ： Docker 部署 Anything LLM 接入 • 下载安装 • 打开官网，根据自己的系统选择下载对应的版本。 and Embed” ，对文档进行切分和词向量化。完成后 • ，点击图钉按钮，将文档设置为当前对话的背景文档，即可在聊天窗口基于上传的文档内容与模型进行对话本地部署方法 Ollama+Deepseek LM Studio+DeepSeek Anything LM+Ollama+Deepseek + 向量模型（ Embessing Model ） Dify

10 积分 | 79 页 | 6.52 MB | 1 年前
3
DeepSeek大模型赋能高校教学和科研2025

在论文的开篇，图灵提出了一个引人深思的问题： “机器能思考吗？ ”。这个问题激发了人们无尽的想象，同时也奠定了人工智能的基本概念和雏形在这篇论文中，图灵提出了鉴别机器是否具有智能的方法，这就是人工智能领域著名的“图灵测试”。如图所示，其基本思想是测试者在与被测试者（一个人和一台机器）隔离的情况下，通过一些装置（如键盘）向被测试者随意提问。进行，在美国达特茅斯学院举办的人工智能夏季研讨会，是人工智能领域具有里程碑意义的一次重要会议。这次会议汇聚了众多杰出的科学家和工程师，他们共同探讨和研究人工智能的发展和应用前景这次会议的主题围绕着人工智能的定义、研究方法和应用场景展开。与会者们深入探讨了人工智能的基本概念、算法和技术，以及其在各个领域的应用潜力。他们共同认识到，人工智能的研究和发展将为人类带来巨大的变革和进步 1.2 人工智能的诞生， OpenAI 定义推理模型是在回答之前进行思考，并在回复用户之前，在内部生成一长串的思维链过程。思维链是一种提示大语言模型进行逐步推理的方法。它让模型在得出最终答案之前，先显式地写出推理的中间步骤。这就像人类解决复杂问题时会先把思考过程写下来一样。推理模型的核心也就是说，如果模型在回复你之前有一

10 积分 | 123 页 | 15.88 MB | 1 年前
3
华为昇腾DeepSeek解决方案

目录 2 1 Huawei Proprietary - Restricted Distribution 2 训练资源 • 随着 DeepSeek 提供了一种高效率训练的方法，同等算力规模可以探索更强的模型能力 • 在竞争背景下，头部玩家仍将追逐 Scaling Law ，坚定 AI 算力的战略投资，加速探索下一代 AI 技术 DeepSeek 软件栈多且复杂，客户不清楚模型组件安装依赖顺序，模型分析工具链有哪些，模型是否支容器化部署镜像封装，提供容器命令物理机部署基于场景，提供开发环境部署方法推荐昇腾最佳实践，快速复现 DeepSeek 系列模型推理流程，加速客户应用上线。 DeepSeek-R1-Distill-qwen Janus-Pro 已支持的 DeepSeek 系列模

0 积分 | 32 页 | 2.52 MB | 1 年前
3

共 5 条前往

页

分类

语言

格式

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

英特尔-工业人工智能白皮书2025年版

山东大学：DeepSeek 应用与部署

DeepSeek大模型赋能高校教学和科研2025

华为昇腾DeepSeek解决方案