加速 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

英特尔-工业人工智能白皮书2025年版

................................................................29 2.2.1 英特尔® oneAPI 工具包 — 跨架构性能加速 .................................................................................29 2.2.2 OpenVINO™ 的设备维护解决方案 .........................................................................................58 合作伙伴加速项目和产品推荐 ................................................. 60 4.1 AI 硬件产品推荐 ..................... 过程的优化和智能化，最终帮助企业提高生产效率、降低成本、提升产品质量，实现数字化转型。 2023 年 12 月，由信通院牵头、多家单位联合编制的《工业大模型技术应用与发展报告》指出，AI 与大模型将加速赋能新型工业化，预计从 2022 年至 2032 年，工业 AI 市场规模将以 46% 的年均复合增长率高速成长。相较于发达国家，中国制造企业的 AI 应用率相对较低，大约在 11% 左右。Gartner

0 积分 | 82 页 | 5.13 MB | 1 年前
3
华为昇腾DeepSeek解决方案

DeepSeek 提供了一种高效率训练的方法，同等算力规模可以探索更强的模型能力 • 在竞争背景下，头部玩家仍将追逐 Scaling Law ，坚定 AI 算力的战略投资，加速探索下一代 AI 技术 DeepSeek 是 AI 发展史上的一个关键里程碑，但远未达到 AI 终点 AI 模型算法： GPT 、 LLaMA AI 框架： PY 、 TF 异构计算架构： GRPO ：群体进化的智慧筛选器自我验证机制： AI 的 " 错题本系统 " 混合专家模型的 " 智能路由器“ 多头潜在注意力 MLA ：空间压缩术训练框架加速： 16 到 3 的量化压缩，通信降低 89% 推理加速：预加载，动态批处理等模型、数据、工具链、部署全开源蒸馏技术使能第三方模型性能 DeepSeek V3 ：实现极致性能，稀疏 MOE 提质降本技术创新可参考投机采样改造 MTP 模块，加速推理效率 MTP ： Multi-Token Prediction 多 token 预测提升模型效果 • MTP 模块仅在训练中使用，提升模型训练效果，推理阶段可以不使用 MTP 模块，基础模型能够独立完成正常推理 • 参考投机采样， MTP 模块也可以被重新配置用于 speculative decoding ，加速解码过程，降低整体时延 7

0 积分 | 32 页 | 2.52 MB | 1 年前
3
浙江大学-DeepSeek模型优势：算力、成本角度解读2025

■ PC 时代：一个应用只需一台电脑，算力够 ■ 云计算时代：应用需要超过一台机器的算力，算力基本够 ■ 人工智能时代：算力开始不足，需大量高性能 Al 加速器计算机算力的发展人工智能大模型算力估计 ■ 人工智能大模型算力估计 ■ 1, 数据量 ( D ) >15* 模型参数量 ( N ) ■ 万亿模型 (N )=1000*109=1012 可行性分析：美国可以发禁令美国政府对我国的禁令现成成熟算力： 2023 年禁止出口高端 Al 芯片 ■ A100 、 H00 、 H800 、 A800 等数据中心 GPU ■ 运力： 2022 年限制 Al 加速器的互联带宽算力： 2024 年禁止台积电代工 7nm 工艺的国内芯片存力： 2024 年禁止 HBM 芯片光刻机： 2024 年限制荷兰 ASML 出口 7nm 光刻机到中国

10 积分 | 23 页 | 7.53 MB | 1 年前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

能否在Zero基础上兼顾推理性能的同时，提升模型的帮助性和安全性？例如产生 Clear & Coherent CoT 并且展现出通用能力的模型 R1； ➢ 能否利用一些高质量反思数据集做 Cold Start 从而加速RL的收敛或帮助提升推理表现 16 DeepSeek-R1 技术 Pipeline 总览 DeepSeek-v3-Base (671B) DeepSeek-R1-Zero 推理为中心的大规模强化学习 computation increasing) ➢ DeepSeek-R1-Zero 自主涌现学会重新评测原来的方法、反思和主动探索其他的路径 ➢ 多阶段训练下的冷启动让RL训练更加稳定，避免初期不稳定、加速收敛、提升思维链可读性 ➢ 未来后训练的重心会逐步倾向于RL，但是少量训练用于SFT可能还是必须的 ➢ 强化学习技术不只局限在基于规则的数学、算法代码等容易提供奖励的领域，它还可以创造性地把些需要跨越多个逻辑步骤才能找到答案的问题至关重要，例如复杂的数学题或逻辑谜题。 ➢ 冷启动让RL训练更加稳定： ➢ 避免 RL 训练初期的不稳定，使得模型能够更快地进入稳定的训练状态； ➢ 有效地加速 RL 训练的收敛，缩短训练时间； ➢ 提高模型输出的可读性，减少不同语言混合使用的情况。 26 DeepSeek-R1 Takeaways 总结 Part II ➢ 推理为中心的RL训练： ➢

10 积分 | 76 页 | 8.39 MB | 1 年前
3
山东大学：DeepSeek 应用与部署

硬件环境准备 DeepSeek 本地部署 - 部署办法方法 1 ：使用 Hugging Face Transformers 方法 2 ：使用 vLLM 加速推理方法 3 ： Docker 部署 Anything LLM 接入 • 下载安装 • 打开官网，根据自己的系统选择下载对应的版本。 • • 安装文件，按照安装向导的提示进行操作

10 积分 | 79 页 | 6.52 MB | 1 年前
3
AI跃迁派：2025年DeepSeek零基础完全指南

流路径规划） ⚫ 超导量子比特：训练速度提升 1000 倍，模型参数突破百万亿级应用场景： ⚫ 1 小时优化全国高铁时刻表，减少 30%能源消耗 ⚫ 破解蛋白质折叠难题，加速癌症药物研发 ②多模态深度对齐 ⚫ 跨模态理解：通过神经符号系统实现图文音统一编码（如从建筑设计图生成施工解说视频） ⚫ 具身智能：2026 年机器人将具备“触觉-视觉-力学”联觉（如凭触感判断水果成熟

10 积分 | 21 页 | 1.01 MB | 1 年前
3

共 6 条前往

页

分类

语言

格式

英特尔-工业人工智能白皮书2025年版

华为昇腾DeepSeek解决方案

浙江大学-DeepSeek模型优势：算力、成本角度解读2025

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

山东大学：DeepSeek 应用与部署

AI跃迁派：2025年DeepSeek零基础完全指南