华为昇腾DeepSeek解决方案泛化性和经济性大幅提升 LLM 进入“ CV Resnet 时刻” 补齐最后一块自主创新的版图 真正形成中美两条 AI 技术路 线 AI 框架:昇思、飞桨 … 异构计算架构: CANN … 互联技术:灵衢 AI 芯片:昇腾、寒武纪 … DeepSeek-R1 进一步验证“算力即性能” Scaling Law 升级,模型能力 = 算力 x 数据 x 思考 + 逻辑推理 DeepSeek-V3/R1 ,采用 2048 张 H800 (节点内 NVLink ,节点间 IB ,非超节点架构) 在 14.8T token 数据集上基 于自 研 HAI-LLM 训练系统总计训练了 1394h ( 58.08 天) 性能优 数学、科学和代码等领域领先业界, 成为业界公认的 LLM 的领先模型 来源: DeepSeek 模型测试数据 & 互联网 硬件级优化 绕过 GUDA 进行 PTX 编程 、 Qwen 、 … 开箱即用的一体机,加速大模型应用落地 华为云 移动云 电信天翼云 联通云 京东云 基础模型 (DeepSeek/ Llama/Qwen/…) 少量行业数据 腾讯云 阿里云 亚马逊 AWS 微软 Azure 部署更高效 月级调优 周 / 天级优 化 数据依赖降低 高质量数据 生成数据 算法依赖降低 高端人才0 积分 | 32 页 | 2.52 MB | 1 年前3
浙江大学-DeepSeek模型优势:算力、成本角度解读2025C≈ 6 * N * D ≈1.5*1 025 ■ 最低时间、成本估计 ■ 单 H800(25 万 ):1.5*1010 秒 (174000 天 ) ■ 1000 张 H800(2.5 亿 ):1 .5*107 秒 (174 天 ) 算力 ( 每秒 ) 显存 运力 生态 政策风险 成本 华为 910B 320T=3.2*101 4 32GB 240 GB/s 较好 无 1210 积分 | 23 页 | 7.53 MB | 1 年前3
AI跃迁派:2025年DeepSeek零基础完全指南错误:一次性提问“如何从零开始做小红书账号?” 修正:分步拆解“冷启动→爆款公式→变现路径” 3.忽略背景 错误:“推荐旅游城市”→可能推荐南极科考站 修正:“预算 5000 元/3 天/亲子游,推荐 5 个国内城市并说明交通和住宿方案” 4.专业术语滥用 错误:“用 MoE 架构优化输出”→普通人难以理解 修正:“让不同专家模块共同解决这个问题” 5.过度依赖 ①数据直通车 操作流程: 1.粘贴 Excel 销售数据→输入“分析 Q4 各品类销售额占比” 2.追加“生成可视化代码(Pythonmatplotlib)” 效果:10 分钟完成原本需 1 天的数据分析报告 ②多 AI 联合作战 指令模板: “先让 DeepSeekR1 制定《智能手环市场调研方案》,再用 GPT-4 生成问卷文案,最后 用 Claude 整理数据图表”10 积分 | 21 页 | 1.01 MB | 1 年前3
DeepSeek大模型赋能高校教学和科研2025接 收仅用时 1 天! 这篇论文主要探讨了不同人工智能 ( A I ) 工具在传播心肺复苏( CPR ) 指南方面的效果 ,并重点分析了它们 在心脏骤停教育中的应用潜力。 7. A I 赋能高校科 研 c e e p seek 首篇 DeepSeek SCI 已发表 , 1 区高分期刊 , 用时 1 天! 《自然》杂志 202510 积分 | 123 页 | 15.88 MB | 1 年前3
英特尔-工业人工智能白皮书2025年版材料齐全? 是否通过测试? 发送申请材料 (产品规格信息、报名表、 第三方机构测试报告等) 客户使用软件调优测试工具 测试并将寄送样机 至英特尔复测 是 是 否 否 20 天 20 天 30 天 68 04 合作伙伴加速项目和产品推荐 4.2.4 联系方式 如果您对本项目的内容感兴趣或想进一步了解项目,欢迎您与您公司所对应的英特尔客户经理联系。 若您对项目申请条件、0 积分 | 82 页 | 5.13 MB | 1 年前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告576,000美元 )带来惊艳效果 ➢ MoE 架构 671B 激活37B \ 使用 Multi-head Latent Attention (MLA) 架构 ➢ 2048张 H800 计算: ~54天 21 DeepSeek-R1 技术剖析:RL 加持下的 Length 泛化&推理范式涌现 ➢ 大规模RL的加持下,DeepSeek-R1 Zero 表现出在推理任务上思维链长度的自然增长和涌现10 积分 | 76 页 | 8.39 MB | 1 年前3
共 6 条
- 1
