路渐 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

华为昇腾DeepSeek解决方案

的资金、技术、人才的垄断，全球重新思考中美技术路线的选择泛化性和经济性大幅提升 LLM 进入“ CV Resnet 时刻” 补齐最后一块自主创新的版图真正形成中美两条 AI 技术路线 AI 框架：昇思、飞桨 … 异构计算架构： CANN … 互联技术：灵衢 AI 芯片：昇腾、寒武纪 … DeepSeek-R1 进一步验证“算力即性能” Scaling Law 系统吞吐 4940 Token/s@32B 7500 Token/s@14B 730 Token/s@14B 956 Token/s@8B 956 Token/s@7B 80 路 @14B 115 路 @8B 115 路 @7B 昇腾 DeepSeek 一体机：大吞吐 + 高并发，加速行业模型落地模型参数： 14B/32B DeepSeek-R1-Distill-Qwen-32B 移动、电信一体机 247 路 @32B 300 路 @14B 思腾合力珑京科技思腾合力珑京科技珑京科技思腾合力潞晨科技思腾合力珑京科技 1911 Token/s 系统吞吐并发路数并发路数并发路数并发路数 165 路 192 路 16 路 13 … 模型集合模型名称参数计算精度产品

0 积分 | 32 页 | 2.52 MB | 7 月前
3
英特尔-工业人工智能白皮书2025年版

的机密虚拟机中，客户机操作系统和虚拟机应用程序被隔离开来，无法被云端主机、虚拟机管理程序和平台的其他虚拟机访问。 24 02 英特尔 ® 技术方案亮点技术 AI 计算能力 • 单路英特尔® 至强® 6 性能核处理器拥有多达 128 个内核，实现了更高密度计算性能和可扩展性。 • 对于基于 BF16 和 FP16 的模型，英特尔® AMX 的乘法累加 (MAC) 运算速度比英特尔® 超级通道互联（Intel® Ultra Path Interconnect，英特尔® UPI）2.0 的跨插槽内带宽速度高达 24 GT/s，与上一代产品相比提升高达 20%。 • 双路服务器拥有多达 178 条 PCIe Gen 5 通道，单路服务器则多达 136 条，可以支持重要的 I/O 附加组件，包括加速器、网络适配器、存储控制器和存储。 • 多达 64 条 Compute Express Link 500W • 单路或双路服务器 • 12 条内存通道 • 高达 6,400 MT/s DDR5 • 8,800 MT/s MCR DIMM • 多达 96 条 PCle 5.0 通道 • 6 条英特尔® UPI 2.0 链路即将推出 • 每个 CPU 拥有多达 86 个内核（172 个线程） • 每个 CPU 高达 350 W • 单路、双路、四路或八路服务器 • 8 条内存通道

0 积分 | 82 页 | 5.13 MB | 7 月前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

开创RL加持下强推理慢思考范式新边界 ➢ OpenAI o1 开启后训练 Post-Training 时代下的RL新范式：后训练扩展律 Post-Training Scaling Law ➢ DS-R1 独立发现了一些通往o1路上的核心理念，并且效果还好到受到了OpenAI 的认可 ➢ 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力？ ➢ 得益于纯大规模强化学习，DeepSeek-R1 精细化编排计算和通信 ➢ 控制前向和反向过程中计算和通信的GPU SM 数量，保证计算和通信完全重叠 ➢ 双向流水线并行 ➢ 降低流水线的Bubble ➢ 需要存两份模型参数 ➢ 64路的专家并行 [1] DeepSeek-V3 技术报告 https://arxiv.org/pdf/2412.19437v1 双向流水线并行计算和通信重叠气泡和内存分析 72 拓展分析： System

10 积分 | 76 页 | 8.39 MB | 7 月前
3
DeepSeek大模型赋能高校教学和科研2025

理论或数据。其产生原因主要包括：模型训练数据存在偏差、不完整或错误，导致在学习过程中引入了不准确的信息；模型基于概率分布生成内容，在某些情况下会选择一些看似合理但实际错误的路径。大模型幻觉会影响信息的准确性和可靠性，在信息传播、学术研究等领域可能带来不良影响。因此，在使用大模型时，需要对其输出内容进行仔细验证和甄别。 3.6.3 主流大模型“幻觉”评测

10 积分 | 123 页 | 15.88 MB | 7 月前
3

共 4 条前往

页

分类

语言

格式

华为昇腾DeepSeek解决方案

英特尔-工业人工智能白皮书2025年版

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

DeepSeek大模型赋能高校教学和科研2025