电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域chenweiguang@dgzq.com.cn 电子行业指数走势 资料来源:东莞证券研究所,Wind 相关报告 投资要点: DeepSeek推动模型平权,关注AI终端及算力领域。2024年12月,DeepSeek V3 首 个 版 本 上 线 , 在 多 项 评 测 成 绩 超 越 了 Qwen2.5-72B 和 Llama-3.1-405B 等 开 源 模 型 , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩,四 大科技巨头Q4资本开支合计同比大幅增长77%,主要支持云计算、AI等 基础设施建设。同时后续资本开支指引积极,海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐,反而加大相关投入,而国内 CSP为了保持竞争优势亦有望跟进,增加AI领域相关投入。同时AI应用 场景加速普及,也将反哺算力需求。 风险提示:终端需求不 ......14 图 27 :雷鸟创新 V3 拍摄眼镜 .......................................................... 15 图 28 :雷鸟创新 AI 下棋实时指导功能 .................................................. 15 图 29 :雷鸟创新 V3 支持边充边用 ............0 积分 | 23 页 | 2.65 MB | 10 月前3
电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求公司成立于 2023 年 7 月,是一家致力 于实现 通用人工智能 (AGI) 的创新型科技公司。 2024 年 12 月, DeepSeek-V3 发布,性能对齐海外领军闭源模型。据官方技术论文披露, V3 模型的总训练成本 为 557.6 万美元, 对比 GPT-4o 等模型的训练成本约为 1 亿美元。 2025 年 1 月, DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。在数学、代码、 英伟达、亚马逊等已先后上线部署支持用户访问 DeepSeek-R1 模型。 2 月 1 日,华为云官方发布消息,硅基流动和华为 云团队联合首发并上线基于华为云昇腾云服务 的 DeepSeekR1/V3 推理服务。 l DeepSeek 通过 MLA 和 DeepSeekMoE 实现高效的推理和低成本训练,构建 DualPipe 算法和混合精度训练优化计算与通信负载;通过 ( 分阶段 ) 强化学习实现 里 Qwen2.5-72B 、 Meta 的 Llama-3.1-405B 等其他开源 模型,并 逼近 GPT-4o 、 Claude-3.5-Sonnet 等顶尖闭源模型。据官方技术论文披露, V3 模型的总训练成本为 557.6 万美元,对比 GPT-4o 等模型的训练成本 约为 1 亿美元。 l 2025 年 1 月, DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。0 积分 | 38 页 | 1.95 MB | 10 月前3
中国推理算力市场追踪报告,2025H1-沙利文增长到截至今年6月底,日 均Token消耗量突破30万亿,1年半时间增长了300多倍,这反映了中国 人工智能应用规模快速增长。天翼云息壤一体化智算服务平台率先完 成国产算力与DeepSeek-R1/V3系列大模型的深度适配优化,成为国内 首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。 02 未来推理算力长序列与超大模型推理优化成为关键,国产软硬件 协同与生态成熟推动推理普及 中国推理算力市场份额,2025H1 来源:沙利文、头豹研究院 2025H1,在中国推理算力市场中,天翼云以市场份额21.4%位列第一 天翼云息壤一体化智算服务平台率先完成国产算力与DeepSeek-R1/V3系列大模型的深 度适配优化,成为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云 平台。此次突破标志着国产AI生态建设迈入新阶段,为行业提供了性能卓越、安全可 控的智能算力基座。10 积分 | 12 页 | 1.12 MB | 4 月前3
2025年智能金融:AI+驱动的金融变革报告-浙江大学(郑小林)面向全场景的强化学习 (规则奖励+奖励模型) DeepSeek-R1 (强推理模型) 671B 第一阶段训练:增强推理能力,生成高质量推理数据 第二阶段训练:增强通用能力,避免灾难性遗忘 对V3模型 监督微调 推理导向强化学习 (准确率奖励+可读性奖励) R1-Zero生成的 长思维链数据 60万条 推理数据 20万条 通用数据 多阶段增强训练 拒绝采样:筛选高质量样本 R1蒸馏版 大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研 浙江大学人工智能教 浙 根据Vectara的测试,R1的幻觉率14.3%,显著高于其前身V3的 3.9%。这跟它加强了的“思维链”(CoT)和创造力直接相关。 OpenAI:推理增强会明显减少幻觉! DeepSeek R1 实测:推理增强后幻觉率增加! 过度延展的推理机制 解决方案?10 积分 | 45 页 | 7.21 MB | 4 月前3
共 4 条
- 1
