关键 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

华为昇腾DeepSeek解决方案

算力规模可以探索更强的模型能力 • 在竞争背景下，头部玩家仍将追逐 Scaling Law ，坚定 AI 算力的战略投资，加速探索下一代 AI 技术 DeepSeek 是 AI 发展史上的一个关键里程碑，但远未达到 AI 终点 AI 模型算法： GPT 、 LLaMA AI 框架： PY 、 TF 异构计算架构： CUDA 互联技术： NV Link AI 芯片：得通用性 + 专用性，可以满足各应用场景需求 • DS 对通过从模型结构到训推全流程的极致工程优化，大幅提升 AI 的计算效率，提升模型落地经济性 • 中国 AI 公司首次以关键创新贡献者的身份加入到全球 AI 竞争中，冲击美国 AI 霸权 • 打破 NV+OpenAI 的资金、技术、人才的垄断，全球重新思考中美技术路线的选择泛化性和经济性大幅提升 LLM ② 训练策略 • 每个 MTP 模块输出预测 token 的概率分布 • 每个 MTP 模块计算对应的交叉熵损失函数 • 多个 MTP 模块的损失函数加权平均得到最终训练目标 ③ 关键作用 • 提升每批训练数据的使用效率，强化训练信号 • 优化模型表达能力，提升 next-token 的预测效果 • 可参考投机采样改造 MTP 模块，加速推理效率 MTP

0 积分 | 32 页 | 2.52 MB | 1 年前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

开创RL加持下强推理慢思考范式新边界 ➢ 得益于强大的推理能力与长文本思考能力，DeepSeek R1在复杂任务上表现卓越，成为开源领域的又一里程碑，标志着开源社区在与闭源大模型（如 OpenAI o1 系列）的竞争中迈出了关键性一步。 ➢ DeepSeek-R1 在数学代码任务上表现突出 ➢ Deepseek R1在AIME2024上获得了79.8%的成绩，略高于OpenAI-o1-1217。在MATH-500上，获得97 探索其他方法 RL驱动下自然涌现 Long-CoT 能力 “Aha”Moment 11 DeepSeek-R1 技术剖析：DeepSeek-R1 Zero DeepSeek-R1 Zero的关键启示 ➢ 传统RLHF背景下，SFT通常被认为是不可或缺的一步，其逻辑先用大量人工标注的数据来让模型初步掌握某种能力（如对话或者语言风格），然后再用RL来进一步优化性能 ➢ DeepSeek-R1 ➢ 更重要的是，它让模型能够自由地探索解决问题的路径，而不是被预先设定的模式所束缚。 12 DeepSeek-R1 技术剖析：DeepSeek-R1 Zero DeepSeek-R1 Zero的关键启示 ➢ 跳过SFT阶段，直接运用纯强化学习拓展推理能力边界实际上也带来了几个很重要的启示： ➢ 需要足够强的基座模型：基座模型 (DeepSeek-V3 Base) 超过了某个质量和能力阈值

10 积分 | 76 页 | 8.39 MB | 1 年前
3
AI跃迁派：2025年DeepSeek零基础完全指南

⚫ 开源策略吸引全球 20 万开发者，形成中美双极化的 AI 生态格局二、核心能力图谱 1.技术特性：AI 界的“六边形战士” DeepSeek 之所以成为现象级 AI 工具，关键在于它在效率、成本、能力三大维度实现了突破性平衡：技术黑话翻译： ⚫ MoE 混合专家系统：像医院分诊台，遇到数学题自动转接“数学博士”，写诗转接 “文学教授” ⚫ MLA 离线缓存：断网时可查看历史对话记录避坑指南：若遇安装失败，检查存储空间是否充足，或关闭杀毒软件后重试 ③微信小程序（轻量化入口）获取路径： 1.微信搜索"DeepSeek"公众号 2.后台发送关键词【小程序】获取专属链接 ⚫ 优势：无需注册，微信一键登录，适合快速查询天气、新闻等简单任务 ⚫ 限制：高峰期可能响应延迟，建议复杂任务切换至 APP 或网页版 ④电脑版（专业场景必备）年市场策略”→生成可交互的 3D 知识网络 ⚫ 企业智慧大脑：销售数据+客服录音+生产日志多源融合→自动生成经营决策建议（ ②流程自动化矩阵 ⚫ 智能工作流：邮件接收→AI 提取关键信息→自动创建待办事项→生成执行方案→推送进度提醒 ⚫ 跨平台协作： Excel 表格+微信聊天记录+邮件内容→自动整合为 CRM 客户档案 3.社会影响：重新定义工作边界 DeepSeek

10 积分 | 21 页 | 1.01 MB | 1 年前
3
英特尔-工业人工智能白皮书2025年版

降本，增强竞争力。在日趋激烈的工业市场竞争中，寻求部署新技术来提升综合竞争力，是企业的生存之道。而引领工业革命浪潮的 AI 技术和大模型，是企业从多维度重塑自身生产方式、实现新质生产力的关键。通过这本白皮书，工业领域的企业和合作伙伴可以更系统、更全面地了解 AI 技术如何为工业制造的各个环节赋予怎样的智能化能力，以及英特尔在帮助企业落地部署 AI 技术方面所能提供的产品、平台和左右。Gartner 预测，到 2027 年，中国制造业的 AI 使用渗透率将以 10% 的年复合增长率上升。随着技术的不断进步和应用场景的拓展，我们认为工业 AI 有望成为推动工业 4.0 和智能制造发展的关键力量。 1.1 工业 AI — 市场规模与增长潜力 03 01 工业人工智能 (AI) 行业观察 AI 技术在工业领域的应用，已经贯穿于产品设计、生产、管理、服务等众多环节，它主要通过各种方式收集海量数据，然后在设备入库管理方面，AI 通过深度学习识别设备上的条形码、二维码或设备特征，自动读取设备信息如型号、序列号等；AI 的自然语言处理功能，可以自动提取设备手册或标签上的文字信息，获取设备规格、性能指标等关键参数。这些都能显著提升设备入库管理的效率和准确性。在设备运维管理方面，利用机器学习算法，对部署在设备上的温度、压力、振动等各种传感器给出的监测数据进行处理分析，实时监控设备运行状态，并可通

0 积分 | 82 页 | 5.13 MB | 1 年前
3
DeepSeek大模型赋能高校教学和科研2025

2 月 19 日，郑州大学国家超级计算中心、计算机与人工智能学院、信息化办公室携手攻坚，成功在超算中心设备上部署本地化“满血版” DeepSeek-R1 大模型（ 671B ）。在多个关键应用领域， DeepSeek-R1 大模型展现出强大的实力 4.2 国产 AI 大模型 DeepSeek 走入高校知识问答提郑州大学 DeepSeek-R1 系列大模型正在对接学校统一身份认证平台 n AIGC 的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过训练模型和大量数据的学习， AIGC 可以根据输入的条件或指导，生成与之相关的内容。例如，通过输入关键词、描述或样本， AIGC 可以生成与之相匹配的文章、图像、音频等 n AIGC 技术不仅可以提高内容生产的效率和质量，还可以为创作者提供更多的灵感和支持。在文学创作、艺术设计、游戏开发等领域简洁明确示例驱动考虑受众明确角色分解复杂任务遵守规则使用肯定性指令自然语言回答通用模型 n 需显式引导推理步骤（如通过“思维链” 提示），否则可能跳过关键逻辑。 n 依赖提示语补偿能力短板（如要求分步思考、提供示例）。 n 提示语更简洁，只需明确任务目标和需求（因其已内化推理逻辑）。 n 无需逐步指导

10 积分 | 123 页 | 15.88 MB | 1 年前
3

共 5 条前往

页

分类

语言

格式

华为昇腾DeepSeek解决方案

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

AI跃迁派：2025年DeepSeek零基础完全指南

英特尔-工业人工智能白皮书2025年版

DeepSeek大模型赋能高校教学和科研2025