中国推理算力市场追踪报告,2025H1-沙利文1 中国推理算力 市场追踪报告,2025年H1 头豹研究院 弗若斯特沙利文咨询(中国) 2025年8月 2 关键发现 算力需求重心从训练转向推理,算力基础设施持续扩展与升级 AI算力消耗已从集中式训练转向大规模推理,带来前所未有的增量需 求。2025年被认为是算力爆发的元年,推理算力的需求将迎来井喷式 增长。推理算力的需求将在未来几年内远超训练算力。 01 2025年H1中国推理算力服务市场中,天翼云以【21 2025年H1中国推理算力服务市场中,天翼云以【21.4%】的市场份 额领先 中国日均Tokens消耗量从2024年初的1000亿增长到截至今年6月底,日 均Token消耗量突破30万亿,1年半时间增长了300多倍,这反映了中国 人工智能应用规模快速增长。天翼云息壤一体化智算服务平台率先完 成国产算力与DeepSeek-R1/V3系列大模型的深度适配优化,成为国内 首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。 02 未来推理算力长序列与超大模型推理优化成为关键,国产软硬件 协同与生态成熟推动推理普及 03 中国算力正朝着“训推一体”融合架构快速发展,以支撑大规模 模型与多模态应用的高效低延迟推理。国产AI芯片与推理框架不 断优化,结合模型压缩、量化、动态推理等技术,进一步提升能 效比和部署灵活性。 3 沙利文市场研读 | 2025/08 2 研究框架 中国推理算力市场综述 • 关键发现10 积分 | 12 页 | 1.12 MB | 1 月前3
电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域本报告的信息均来自已公开信息,关于信息的准确性与完整性,建议投资者谨慎判断,据此入市,风险自担。 请务必阅读末页声明。 电子行业 超配 (维持) 电子行业深度报告 DeepSeek 推动模型平权,关注 AI 终端及算力领域 2025 年 2 月 20 日 罗炜斌 SAC 执业证书编号: S0340521020001 电话:0769-22110619 邮箱: luoweibin@dgzq.com.cn 陈伟光 SAC 资料来源:东莞证券研究所,Wind 相关报告 投资要点: DeepSeek推动模型平权,关注AI终端及算力领域。2024年12月,DeepSeek V3 首 个 版 本 上 线 , 在 多 项 评 测 成 绩 超 越 了 Qwen2.5-72B 和 Llama-3.1-405B 等 开 源 模 型 , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3.5-Sonnet不分伯仲,训练成本约为558万美元。1月20日, mini。通 过推出高性能、低成本且开源的模型,DeepSeek给全球AI发展带来了模 型平权,同时也将刺激其他头部模型厂商加快推出性能更强、成本更具 竞争力的模型。而随着模型调用门槛降低,AI终端有望加速落地,而AI+ 快速发展也将反哺训练算力、推理算力需求。 AI终端有望加速落地。AI手机:苹果国行AI功能渐行渐近,三星国行S25 系列搭载智谱Agentic GLM,而华为、荣耀、OPPO等多家国产终端近期0 积分 | 23 页 | 2.65 MB | 7 月前3
电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求电子 AI+ 系列专题报告 Deep Seek 重 塑 开 源 大 模 型 生 态 , A I 应 用 爆 发 持 续 推 升 算 力 需 求 证券分析师:胡剑 证券分析师:胡慧 证券分析师:叶子 证券分析师:张大为 证券分析师:詹浏洋 021-60893306 021-60871321 0755-81982153 021-61761072 010-88005307 hujian1@guosen DeepSeek( 深度求索 ) 公司成立于 2023 年 7 月,是一家致力 于实现 通用人工智能 (AGI) 的创新型科技公司。 2024 年 12 月, DeepSeek-V3 发布,性能对齐海外领军闭源模型。据官方技术论文披露, V3 模型的总训练成本 为 557.6 万美元, 对比 GPT-4o 等模型的训练成本约为 1 亿美元。 2025 年 1 月, DeepSeek-R1 发布,性能对标 DeepSeekMoE 实现高效的推理和低成本训练,构建 DualPipe 算法和混合精度训练优化计算与通信负载;通过 ( 分阶段 ) 强化学习实现 性能突破。 多头潜在注意力 (MLA) 通过低秩联合压缩技术,大幅削减了注意力键 (keys) 和值 (values) 的存储空间,显著降低了内存需求。 DeepSeekMoE 架构采 用了更为精细粒度 的专家设置,能够更加灵活且高效地调配资源,进一步提升了整体的运行效率和表现。0 积分 | 38 页 | 1.95 MB | 7 月前3
电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页机交互困难一直是困扰其发展的一大难点。从最近谷歌推出的 Project Astra 以及 Meta 的雷朋眼镜中我们看到,大模型所具备的图像理解、语音交互, 以及根据语音交互结果进行的执行能力有望大幅度提高 AR 眼镜的交互能 力。目前具身智能的发展仍处于非常早期的阶段,但是大模型所具备的以上 能力有望大幅提高机器人对环境的理解能力,以及根据理解结果控制关节等 的执行能力。相关标的包括:Meta,奕瑞,龙旗,舜宇,水晶光电,歌尔。 Dynamics 套件等专业软件在内的生产力工具矩阵,向数据协同、功 能联动的方向发展。如何保护自身私域数据的安全是企业导入微软 Copilot 的主要痛点之一。24 年 5 月,微软推出 Copilot+PC,通过在终端侧部署轻 量级的大模型,在保护隐私的前提下,能够实现会议纪要、文档总结、PPT 智能创作、文生图等企业的基本办公需求,是大模型时代生产力工具的主要 支点。我们认为 2025 年 AI 大模型交互能力,看好智能眼镜等轻量级 AR 发展机遇 .................................................................. 11 大模型应用#2:生产力工具的 AI 化有望推动新一轮 PC 换机周期 ............................................................................0 积分 | 40 页 | 2.60 MB | 7 月前3
电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 参数在十亿级以上发展并受限于优质数据集的增速是 AI 发展的必然趋势。 大模型增长挑战芯片算力和内存,无法实现完整端侧部署。大模型训练和推 理的三大瓶颈是算力、显存和通信,根据我们的测算,算力方面 GPT-3 训练 所需算力为 121528 TFLOPS,若 30 天内完成,需要 1558 颗 A100。内存角度, GPT-3 训练至少需要 3.2T 内存,至少 ................. 5 大模型的参数上限:参数的增加需要同等量级的训练集增加 .................................. 6 大模型训练对硬件的挑战:算力、内存和通信 .............................................. 8 终端部署具有必要性,轻量化技术优化模型 ....................... ........................................ 9 图12: 算力计算公式 ...................................................................... 10 图13: 近年推出的大预言模型有效算力比率 ...............................................0 积分 | 25 页 | 2.20 MB | 7 月前3
青岛市微电网发展研究——基于典型示范项目的调查山东建设 绿色低碳高质量发展先行区。《青岛市深化新旧动能转换推动绿色低碳高质量发展三年 行动计划(2023—2025 年)》明确:“加强源网荷储电网布局,率先应用柔性直流、 有源配电网、智能微电网、虚拟电厂等先进技术,提升新能源消纳及电力调峰保障能 力。”青岛微电网试点示范和推广环境日趋向好。相关政策如表 1 所示。 (2)市场需求逐渐显现 第一,分布式发电装机规模快速增长,微电网建设需求增加。“十四五”以来,青 设可拓展电网可调控资源,提高电网的可靠性和安全性。 表 1.1:国家出台的有关微电网发展的政策 发布日期 发布日期 政策名称 政策名称 与微电网相关内容 与微电网相关内容 2015 《关于推进新能 源微电网示范项 目建设的指导意 见 》 国 能 新 能 〔2015〕265 号 新能源微电网示范项目建设的目的是探索建立容纳高比例 波动性可再生能源电力的发输(配)储用一体化的局域电 力系统,探索电力能源服务的新型商业运营模式和新业态, 2017 《关于并网型微 电网建设试行办 法 》 发 改 能 源 〔2017〕1339 号 为有力推进电力体制改革,切实规范、促进微电网健康有 序发展,建立集中与分布式协同、多元融合、供需互动、 高效配置的能源生产与消费体系 . 2021 《2030 年前碳达 峰行动方案》国 发〔2021〕23 号 积极发展“新能源 + 储能”、源网荷储一体化和多能互补, 支持分布式新能源合理配置储能系统。0 积分 | 35 页 | 1.96 MB | 6 月前3
AI 金融大模型的两条技术路线【AI金融新纪元】系列报告(二)业务流程等。但金 融领域的数据分散在各个金融机构,通用大模型缺少金融数据进行训练,金融专业知识不足;另外一方面,如果从底层开始训练大模型, 所需要投入的算力成本非常高,比如千亿级别的通用大模型,训练一次需要付出几千万的成本 在特定任务上,精确性与适用性欠缺,需要更多优化与定制。金融垂类大模型通常会投入大量的时间和资源来收集和整理金融领域的专业 大模型迎来爆发式增长,技术和应用不断发展,但与国外顶尖 AI 大模型尚有 差距。自 2022 年 OpenAI 发布 ChatGPT 以来,国内迅速形成大模型共识,开始追赶国外。目前各行 各业开闭 源大模型不断出新,竞争形势越发激烈。 综合表现上,头部模型国外领先,平均水平国内外差距较小。在所有模型中, GPT4-Turbo 遥遥领 先,国内最好的大模型为百度文心一言,但仍有 15.77 强的控制、模 型的知识升级、多 模态、模型微 调定制以及更高的 速率限制。 谷歌框架领先 模型丰富 ,应用偏弱 谷歌于 2023 年 2 月宣布将在 谷歌云上部署 ChatGPT 的有 力竞品 Claude ,并于同月推 出自研的基于 1270 亿参数大 模型 LaMDA 的聊天机器人 Bard 。应用方面 ,谷歌在过 去更注重发表论文 ,未能及 时将成果产品化。 同时10 积分 | 26 页 | 1.36 MB | 1 月前3
数字服务与数字运营的市场现状报告共享单车出现。 现代阶段( 2010 年 - 至今) 大数据、 大模型、 人工智能开始出现、 推动了数字化服务向智能化、 精准化、 经营化方向发展 ,数据成为关键生产 要 素、企业的核心竞争力聚焦数据 , 聚焦 数字化行为生命周期的客户经营。 初始阶段( 20 世纪 90 年 代) 互联网技术、 电子商务、 在线支付、 标志数字化服务模式初步形成、 企 业主要利用互联网技术提高内部效 的发展要素 ,数字业务发展成为全 球 顶尖的数据产业市场。 03 核心动力提升 科技和数字赋能才能进一步引数字服 务与运营的人工智能方向发展 ,不仅 仅具备规模优势 ,科技赋能才是核心 竞争力 中资代替外资 扶植和发展国内经济, 切实落地 信息安全及知识产权保护 ,进一 步壮大发展国内数字服务行业走 向世界级发展水平。 数字化服务外包加速 数字化、智能化转型已成为大势所趋。 一带一路合作潜力巨 大 05 随着共建“ 一带一路 ”国际合作不 断推进, 中国与共建国家在服务 外 包领域的合作将不断加强 ,增 长潜 力巨大。特别是 RCEP 的保障 持续性 利好助推外包服务发展壮大。 行业 六大 发展 趋势 呈 现 出 六 大 发 展 特 点 01 04 二60 积分 | 48 页 | 12.97 MB | 6 月前3
2025年智能金融:AI+驱动的金融变革报告-浙江大学(郑小林)“预训练-微调” 学习范式 (BERT、GPT) 上下文学习、指令微调、 扩展规律 (GPT3、GPT4…) 基于Transformer架构的语言模型 • 优点: ✓ 长距离依赖处理能力强:自注意力机制能捕捉任 意距离的依赖关系。 ✓ 并行计算能力强:Transformer架构支持并行计算, 训练速度更快。 • 缺点:资源消耗大 自然语言处理模型的演进 浙江大学人工智能教育教学研究中心 虑词的排序和位置信息,所以通过positional encoding来衡量word位置信息 注意力Attention 自注意力机制:使序列中的每个单词都能“关注”其他单词,包括自己 在内,以更好地理解上下文。(通过计算输入序列中每个位置与其他位置之间 的注意力权重,得到加权的位置向量作为输出) 多头注意力机制:多个独立计算的自注意力机制,将相同的输入映射到 不同的空间中进行上下文理解,使得模型获得了对输入序列有更细致透视,丰 Forward 捕捉序列中元素之间复杂关系的多功能组件。通过使用线性变换和非线性激活 函数,前馈网络使模型能够处理复杂语义,促进文本的稳健理解和生成。 Google Transformer:引入注意力(Attention)学习, 2017 浙江大学人工智能教育教学研究中心 中心 智能教育教学研究中心 大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心10 积分 | 45 页 | 7.21 MB | 1 月前3
某银行数据中心项目可行性研究报告(174页 WORD)XX银行经营能力 17 4.3 XX银行数字赋能 18 5 项目实施的必要性 19 5.1 夯实XX数字化转型的坚实底座 19 5.2 提升金融服务生态系统的竞争力 19 5.3 保障银行的业务安全与运营稳定 20 6 建设必要性小结 20 三、需求分析与建设规模 21 1 数据中心需求分析 21 1.1 月,国家发改委《全国一体化大数据中心协同创新体系算力枢纽 实施方案》提出在京津冀、长三角、粤港澳大湾区、成渝,以及贵州、内蒙古、甘肃、 宁夏等地布局建设全国一体化算力网络国家枢纽节点,发展数据中心集群,引导数据中心 集约化、规模化、绿色化发展。对于贵州、内蒙古、甘肃、宁夏可再生能源丰富、气 候适宜、数据中心绿色发展潜力较大的节点,积极承接全国范围需后台加工、离线分 析、存储备份等非实时算力需求,打造面向全国的非实时性算力保障基地。要求数据 ,我国数字经济竞争力和影响力 稳步提升。为实现新阶段的发展目标,优化升级数字基础设施、充分发挥数据要素作 用、大力推进产业数字化转型、加快数字产业化等成为重要路径,其中包括结合应 用、产业等发展需求优化数据中心建设布局,全面加快金 融等服务业数字化转型的具体要求。 2022 年 2 月,“东数西算”工程正式启动,通过构建数据中心、云计算、大数据一体化 的新型算力网络体系,推动数据中10 积分 | 193 页 | 10.49 MB | 1 月前3
共 34 条
- 1
- 2
- 3
- 4
