华为昇腾DeepSeek解决方案,采用 2048 张 H800 (节点内 NVLink ,节点间 IB ,非超节点架构) 在 14.8T token 数据集上基 于自 研 HAI-LLM 训练系统总计训练了 1394h ( 58.08 天) 性能优 数学、科学和代码等领域领先业界, 成为业界公认的 LLM 的领先模型 来源: DeepSeek 模型测试数据 & 互联网 硬件级优化 绕过 GUDA 进行 PTX 编程 、 Qwen 、 … 开箱即用的一体机,加速大模型应用落地 华为云 移动云 电信天翼云 联通云 京东云 基础模型 (DeepSeek/ Llama/Qwen/…) 少量行业数据 腾讯云 阿里云 亚马逊 AWS 微软 Azure 部署更高效 月级调优 周 / 天级优 化 数据依赖降低 高质量数据 生成数据 算法依赖降低 高端人才 Distribution TO BE 云服务 AS IS 魔乐社区 昇腾 11 …… 模型服务商 潞晨科技 已上线 硅基流动 已上线 清昴 已上线 讯飞 测试中 运营商 电信天翼云 已上线 联通云 已上线 移动云 已上线 南京、福建、浙江移动 已上线 上海、江苏电信 已上线 国计民生行业 龙岗区政府 已上线 北京银行 已上线 广大证券 已上线 北京、南京、西安、武0 积分 | 32 页 | 2.52 MB | 5 月前3
浙江大学-DeepSeek模型优势:算力、成本角度解读2025C≈ 6 * N * D ≈1.5*1 025 ■ 最低时间、成本估计 ■ 单 H800(25 万 ):1.5*1010 秒 (174000 天 ) ■ 1000 张 H800(2.5 亿 ):1 .5*107 秒 (174 天 ) 算力 ( 每秒 ) 显存 运力 生态 政策风险 成本 华为 910B 320T=3.2*101 4 32GB 240 GB/s 较好 无 1210 积分 | 23 页 | 7.53 MB | 5 月前3
AI跃迁派:2025年DeepSeek零基础完全指南错误:一次性提问“如何从零开始做小红书账号?” 修正:分步拆解“冷启动→爆款公式→变现路径” 3.忽略背景 错误:“推荐旅游城市”→可能推荐南极科考站 修正:“预算 5000 元/3 天/亲子游,推荐 5 个国内城市并说明交通和住宿方案” 4.专业术语滥用 错误:“用 MoE 架构优化输出”→普通人难以理解 修正:“让不同专家模块共同解决这个问题” 5.过度依赖 ①数据直通车 操作流程: 1.粘贴 Excel 销售数据→输入“分析 Q4 各品类销售额占比” 2.追加“生成可视化代码(Pythonmatplotlib)” 效果:10 分钟完成原本需 1 天的数据分析报告 ②多 AI 联合作战 指令模板: “先让 DeepSeekR1 制定《智能手环市场调研方案》,再用 GPT-4 生成问卷文案,最后 用 Claude 整理数据图表”10 积分 | 21 页 | 1.01 MB | 6 月前3
DeepSeek大模型赋能高校教学和科研2025接 收仅用时 1 天! 这篇论文主要探讨了不同人工智能 ( A I ) 工具在传播心肺复苏( CPR ) 指南方面的效果 ,并重点分析了它们 在心脏骤停教育中的应用潜力。 7. A I 赋能高校科 研 c e e p seek 首篇 DeepSeek SCI 已发表 , 1 区高分期刊 , 用时 1 天! 《自然》杂志 202510 积分 | 123 页 | 15.88 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版材料齐全? 是否通过测试? 发送申请材料 (产品规格信息、报名表、 第三方机构测试报告等) 客户使用软件调优测试工具 测试并将寄送样机 至英特尔复测 是 是 否 否 20 天 20 天 30 天 68 04 合作伙伴加速项目和产品推荐 4.2.4 联系方式 如果您对本项目的内容感兴趣或想进一步了解项目,欢迎您与您公司所对应的英特尔客户经理联系。 若您对项目申请条件、0 积分 | 82 页 | 5.13 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告576,000美元 )带来惊艳效果 ➢ MoE 架构 671B 激活37B \ 使用 Multi-head Latent Attention (MLA) 架构 ➢ 2048张 H800 计算: ~54天 21 DeepSeek-R1 技术剖析:RL 加持下的 Length 泛化&推理范式涌现 ➢ 大规模RL的加持下,DeepSeek-R1 Zero 表现出在推理任务上思维链长度的自然增长和涌现10 积分 | 76 页 | 8.39 MB | 6 月前3
共 6 条
- 1
