25 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

华为昇腾DeepSeek解决方案

Q1 ）场景核心技术 A2 DeepSeek 适配 LoRA 微调 CCLoRA 支持 25Q1 支持 Fused_MLP 支持 qLoRA 微调 CCLoRA 支持 Fused_MLP 不支持长序列微调长序列 CP 方案支持核心技术 H800 A2 FP8 +20%~25% 不支持无辅助负载均衡损失评分效果提升评分效果提升 DualPipe 计算通信比 1:1->8:1 用于访问存储区的高速大带宽互联的存储系统，推荐部署为 RoCE 无损网络，每台推理服务器 2 个 25GE 光口业务面用于系统业务调度和管理。通常部署为 TCP/IP 有损网络，每台推力卡服务器 2 个 25GE 光口带外管理 AI 服务器 BMC 管理，可选业务面 CE6865E 8*25GE 推理调度管理流量 400G RoCE 交换机 Leaf CE9860*2 台推理服务器（ Atlas 800I A2 ） 4 台 *8 口 *200GE 样本面（可选） CE9860 8*25GE 带外管理面（ BMC 管理可选） CE5882 4*GE DeepseekV3/R1 模型本地化部署组网方案图例 400G 200G 25G GE 100G 10G DeepSeek R1/V3 推理配置建议 BF16 最小配置 4 台计算节点；

0 积分 | 32 页 | 2.52 MB | 1 年前
3
浙江大学-DeepSeek模型优势：算力、成本角度解读2025

Language Models",2020 ■ 万亿大模型预训练系统成本估计 ■ 条件：计算量 C≈ 6 * N * D ≈1.5*1 025 ■ 最低时间、成本估计 ■ 单 H800(25 万 ):1.5*1010 秒 (174000 天 ) ■ 1000 张 H800(2.5 亿 ):1 .5*107 秒 (174 天 ) 算力 ( 每秒 ) 显存运力生态政策风险成本成本华为 910B 320T=3.2*101 4 32GB 240 GB/s 较好无 12 万英伟达 H800 1000T=1015 80GB 900 GB/s 好有 25 万人工智能计算平台成本估计算力存力运力 ■ 大模型扩展规律 ( 资本非常喜欢确定性故事 ) ■ 算力：算力越大 (X 轴 ), 模型效果越好 (Test Loss 小 ) ■ 数据集：数据集越大

10 积分 | 23 页 | 7.53 MB | 1 年前
3
从智慧教育到智慧课堂：理论、规范与实践

23 物联网创新学生体质健康监测学习情境数据采集拓展课外教学活动教育安全监控与危机快速处理教学设备管理 05/06/2025 大数据大数据技术 25 大数据创新教育舆情监测与剖析教育信息化与现代化发展水平评估教育机构布局与教育经费调整学生的发展性评价基于大数据的科学研究 26 云计算 • 云计算中的“云”主要用来强调计算泛

10 积分 | 74 页 | 10.39 MB | 1 年前
3
AI跃迁派：2025年DeepSeek零基础完全指南

高危岗位：基础文案/客服/数据分析岗位替代率达 47% ⚫ 转型路径：建立“人机协作绩效评估体系”，重构岗位价值标准 ③认知依赖 ⚫ 思维退化：调查显示过度依赖 AI 导致 25%用户独立思考能力下降 ⚫ 应对策略：中小学增设“批判性使用 AI”课程，培养元认知能力 5.未来展望：AI 原生时代的生存法则 DeepSeek 预示的不仅是工具革新，更是认知革命的序幕：

10 积分 | 21 页 | 1.01 MB | 1 年前
3
英特尔-工业人工智能白皮书2025年版

2 否否 1. 12 Gbps (FRL) 2. 1x8 PCIe Gen 5 Meteor Lake-H 3. 4 MIPI CSI (IPU) 50 mm x 25 mm x 1.35 mm BGA Type 3 eSPI SPI 英特尔® 酷睿™ Ultra 处理器多达 12 个内核（U 多达 16 个内核（H 8 个 X e 内核嵌入式 DisplayPort 敏感的企业数据。 • 英特尔® On Demand 服务使硬件提供商可以启用部分基于 CPU 的特性和功能。它通过两种模式提供服务：基于一次性许可证激活功能，以及基于用量付费。 25 02 英特尔 ® 技术方案 1. 详情请见以下网址的：intel.com/processorclaims（英特尔® 至强® 6 处理器）。结果可能不同 2. 详情请见以下网址的：intel 权重压缩技术，降低内存消耗，简化生成式 AI 应用 27 02 英特尔 ® 技术方案专为边缘设计 • 英特尔 ODM 合作伙伴生态系统提供的广泛产品，涵盖不同的形态和性能要求 • 满足边缘的低功耗 (25-75W) 和小尺寸形态要求的 SKU • 五年产品供应和软件支持 • 多种操作系统支持，包括 Linux、Windows client、 Windows 10 LTSC • 转为嵌入式使用设计的

0 积分 | 82 页 | 5.13 MB | 1 年前
3
DeepSeek大模型赋能高校教学和科研2025

DeepSeek 每个人都可以读懂的大模型科普报告（高校篇） DeepSeek 大模型赋能高校教学和科研厦门大学大数据教学团队作品 2025 年 2 月 25 日厦门大学林子雨副教授国内高校大数据教学的重要贡献者团队负责人：林子雨副教授年轻力量：核心成员全部 46 周岁以下结构合理：教学型、科研型、实验工程师专注专业：从 1. 硬件采购成本 • 服务器集群：含 8 张 NVIDIA A100/H100 显卡的服务器，市场价格约 80-120 万元 • 配套设备：液冷系统、冗余电源等附加成本约 15-25 万元 2. 运维成本 • 电费：满载功耗约 6000W ，年电费约 5-8 万元（按工业电价 1.2 元 / 度计算） • 维护：专业工程师团队年成本约 30-50 万元 4.4

10 积分 | 123 页 | 15.88 MB | 1 年前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

个输出的总步数。归一化后，优势值为后续步骤归一化奖励的累加和 DeepSeekMath https://arxiv.org/pdf/2402.03300 基于结果监督的GRPO优势值估计基于过程监督的GRPO优势值估计 25 DeepSeek-R1 Takeaways 总结 Part II ➢ DS-R1 Zero 跳过监督微调SFT阶段，展现出大规模强化学习的潜力。这种自主学习的方式，不仅节省了大量的标注成本，

10 积分 | 76 页 | 8.39 MB | 1 年前
3

共 7 条前往

页

分类

语言

格式

华为昇腾DeepSeek解决方案

浙江大学-DeepSeek模型优势：算力、成本角度解读2025

从智慧教育到智慧课堂：理论、规范与实践

AI跃迁派：2025年DeepSeek零基础完全指南

英特尔-工业人工智能白皮书2025年版

DeepSeek大模型赋能高校教学和科研2025

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告