32 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

电子行业AI+系列专题：边缘AI，大语言模型的终端部署，推动新一轮终端需求-20230531-国信证券-25页

...........17 图31： PaLM2 的从小到大的四种版本 .........................................................18 图32： PaLM2 在部分测试中体现出了优异性 ...................................................18 图33： ChatGPT App 欢迎界面资料来源：知乎，国信证券经济研究所整理我们可以粗略的计算训练 1750 亿参数的 GPT3 所需内存，大约需要 3.2TB 以上。静态内存方面，大多数 Transformer 都是以混合精度训练的，如 FP16+FP32，以减少训练模型内存，则一个参数占 2 个字节，参数和优化器状态合计占用内存 1635G。而动态内存，根据不同的批量大小、并行技术等结果相差较大，通常是静态内存的数倍。更简洁的估算方法，可以假设典型的亿参数的 GPT3 大概需要 3.2TB 内存。推理所需内存则较小，假设以 FP16 存储，175B 参数的 GPT3 推理大约需要内存 327G，则对应 4 张 80G A100，如果以 FP32 运算，则需要 10 张。请务必阅读正文之后的免责声明及其项下所有内容证券研究报告 9 表2：大语言模型的计算公式注释模型参数优化器内存梯度内存激活重计算模型训练内存

0 积分 | 25 页 | 2.20 MB | 9 月前
3
电子AI+系列专题：复盘英伟达的AI发展之路

2024 年的 785 亿元，对应 CAGR 达 45.11% 。 AI 芯片中由于 GPU 通用型强，满足深度学习大量计算的需求，因此 GPU 在训练负载中具有绝对优势。以 GPT-3 为例，在 32 位的单精度浮点数数据下，训练阶段所需 GPU 数量为 1558 个，谷歌级应用推理阶段所需 GPU 数量为 706315 个。 l 英伟达开辟 GPGPU 加速计算格局， GPU 架构演进及产品布局赋能运算性能（ TFLOPS ）整型定点运算性能（ TOPS ）显存 (GB) 显存带宽 (GB/s) 功耗 (W) Google TPU v4 2021 7nm - 275 275 32 1200 192 平头哥含光 800 2021 12nm - - 825 - - 276 寒武纪思元 370 MLU370-X8 2021 7nm 24 96 256 资料来源：英伟达 CUDA 文档，国信证券经济研究所整理资料来源： CSDN ，国信证券经济研究所整理 l 《 AI 大语言模型的原理、演进及算力测算》 l 训练阶段：考虑采用精度为 32 位的单精度浮点数数据进行训练和推理。以 A100 PC le 芯片为例（ H100 PC le 芯片同理）， GPT-3 训练所需运算次数为：样本 token 数 3000 亿个 *6*

0 积分 | 30 页 | 1.27 MB | 9 月前
3
电子行业深度报告：DeepSeek推动模型平权，关注AI终端及算力领域

DeepSeek开源R1模型，后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，性能比肩OpenAI o1正式版，不仅极大提升了模型推理能力，也大幅降低了训练成本。同时，DeepSeek-R1蒸馏了6个小模型，其中32B和70B模型在多项能力上实现对标OpenAI o1 mini。通过推出高性能、低成本且开源的模型，DeepSeek给全球AI发展带来了模型平权，同时也将刺激其他头部模型厂商加快推出性能更强、成本更具 ............... 15 图 31 ：闪极科技推出“录眸 OS” ...................................................... 16 图 32 ：闪极科技 AI 拍拍镜售价 ........................................................ 16 图 33 ：CES 2025 展出的 AI、AR OpenAI o1 正式版。图 1：DeepSeek R1 性能比肩 OpenAI o1 数据来源：DeepSeek公众号，东莞证券研究所同时，DeepSeek-R1 蒸馏了 6 个小模型，其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1 mini 的效果。通过将 R1 模型知识蒸馏到轻量化模型中，不仅能够提升轻量化模型的性能，同时也会降低成本，有助于进一步加快端侧

0 积分 | 23 页 | 2.65 MB | 9 月前
3
电子AI+系列专题：DeepSeek重塑开源大模型生态，AI应用爆发持续推升算力需求

OpenAIo1-mini 。在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时，通过 DeepSeek-R1 的输出，蒸馏了 6 个小模型开源给社区，其中 32B 和 70B 模型在多项能力上实现了对标 OpenAIo1-mini 的效果。请务必阅读正文之后的免责声明及其项下所有内容 DeepSeek-R1 发布，性能对标 OpenAI-o1 正式版同。请务必阅读正文之后的免责声明及其项下所有内容采用硬盘缓存技术大幅降低延迟和成本图：数据分析场景，后续具有相同前缀的请求会命中上下文缓存 DeepSeek -R1 16 元 32K 64K 4 元 1 元 8K 图： DeepSeek-R1 等模型输入输出价格对比百万 tokens 百万 tokens 输入价格输入价格 ( 9.18 开源 Llama3.1-405B 4050 85.2 Meta 2024.7.23 开源 Gemini-Ultra 未公布 83.7 谷歌 2023.12.7 未开源 Qwen2.5-32B 320 83.3 阿里 2024.9.18 开源 Gemin i 1.5 Pro 未公布 81.9 谷歌 2024.2.15 未开源 GLM4 未公布 81.5 智谱 AI 2024.1.16

0 积分 | 38 页 | 1.95 MB | 9 月前
3
电子行业：AI大模型需要什么样的硬件？-20240621-华泰证券-40页

国内大模型：格局清晰，闭源追赶 GPT-4，开源具备全球竞争力 ...................................................................... 32 百度：文心大模型持续迭代，B/C 端商业化稳步推进 ...................................................................... 13,627 47% 6,452 金属结构件 2382 HK 舜宇光学科技 51,171 31,832 32% 10,207 摄像头镜头、模组 002138 CH 顺络电子 22,021 4,968 17% 864 射频电感、功率电感、车用磁性器件 Xlite Apple M3 Pro Max Intel Lunar Lake NPU 算力 14TOPS 45TOPS 18TOPS 45TOPS 内存最高 32GB + 1TB 最高 32GB + 1TB 最高 128GB+TB 尚未发布应用 PPT 智能创作、文生图、文档总结、智能问答、AI 识图、会议纪要、智会分身、设备调优 GPT-4o，Copilot+PC

0 积分 | 40 页 | 2.60 MB | 9 月前
3
2024中国主要城市交通分析报告-高德地图

广州市杭州市成都市上海市北京市超大城市换乘系数 54% 49% 45% 42% 41% 40% 39% 38% 36% 29% 33% 34% 34% 32% 35% 35% 35% 34% 东莞市重庆市深圳市武汉市广州市杭州市成都市上海市北京市换乘次数占比 1.429 1.467 1.474 25% 24% 26% 28% 27% 30% 29% 25% 29% 26% 30% 26% 31% 31% 34% 33% 31% 33% 35% 31% 32% 海口市哈尔滨市惠州市乌鲁木齐市兰州市贵阳市厦门市大连市中山市绍兴市洛阳市台州市长春市常州市南宁市石家庄市南通市无锡市南昌市超200万 61.7% -0.62% 1.691 0.00% 29.02 - 0.08% 31 昆明市超200万 61.1% 3.77% 1.642 -2.22% 24.35 48.1% 0.23% 32 长春市超200万 58.5% 9.72% 1.796 -7.07% 25.67 74.1% 0.04% 33 大连市超200万 58.2% 2.76% 1.818 -2.54% 25.28 76

10 积分 | 30 页 | 2.00 MB | 9 月前
3
金融垂类大模型试用体验【AI金融新纪元】系列报告（一）

HithinkGPT 大模型。此款大模型采用 transformer 的 decoder-only 架构，提供 7B 、 13B 、 30B 、 70B 和 130B 五种版本选择，最大允许 32k 文本输入，支持 API 接口调用、网页嵌入、共建、私有化部署等能力，并为用户提供一站式标注和评测服务。通用领域： HithinkGPT 大模型在 C-Eval 、 GSM8K 、数据来源：同花顺，东吴证券研究所图表：同花顺 AI 产品介绍 9 妙想金融大模型是东方财富重磅打造的金融行业大语言模型，使用 Decoder-only 的 Transformer 网络结构，支持 32K 的上下文长度，致力于满足各类金融场景下的需求。通过自建的数据治理和数据实验流程，结合效果预估算法、高效预训练框架、 SFT 、 RLHF 训练等技术，妙想金融大模型建立起自主研发的技术壁垒。

10 积分 | 25 页 | 1.60 MB | 3 月前
3
2025年数字政府服务能力暨第二十四届政府网站创新发展调查研究总报告

.......30 第五章指标设计思路及指标体系 .........................................32 第一节指标设计思路 ...............................................32 第二节数字政府服务能力调查指标 ...................................34 第三节政府网站创新发展调查指标调查对象与样本中国软件评测中心报告编号：DGPE20251218A 第 1页调查对象与样本一、数字政府服务能力调查对象（一）省级层面省、直辖市、自治区（含新疆生产建设兵团）（32 个）北京市、天津市、河北省、山西省、内蒙古自治区、辽宁省、吉林省黑龙江省、上海市、江苏省、浙江省、安徽省、福建省、江西省山东省、河南省、湖北省、湖南省、广东省、广西壮族自治区海南省注：国家安全部、国务院研究室、中央广播电视总台尚未开通政府网站。调查对象与样本中国软件评测中心报告编号：DGPE20251218A 第 1页（二）地方政府网站省、自治区、直辖市、兵团（32 个），省会、计划单列市（32 个），地级市（301 个），区县（485），共计 850 家政府网站北京市（17 个）省级：北京市区县：东城区、西城区、朝阳区、海淀区、丰台区、石景山区、门头沟区

10 积分 | 344 页 | 19.12 MB | 1 月前
3
中国制造2025：实现技术领先的代价研究报告（英文版）

defensive action to protect the Single Market from perceived or potential market distortions. 29,30,31&32 Some of the spikes in exports from China to the EU seen in some MIC2025 sectors reflect increasing newsroom/press-releases/eu-starts-investigation-into-chinese-wind-turbines-under-new-foreign-subsidies-regulation/> 32 Commission moves to protect EU mobile access equipment industry from dumped imports, Directorate-General 7% 22% 14% 13% 13% 11% 4% 25% 11% 5% 33% 7% 13% 8% 7% 44% 20% 38% 25% 40% 25% 16% 32% 7% 7% 20% 13% 11% 16% 25% 26% 27% 36% 43% 13% 25% 25% 12% 25% 37% 18% 43% 36% 27% 25%

10 积分 | 51 页 | 2.82 MB | 8 月前
3
全球重点区域算力竞争态势分析报告（2025年）-中国通信工业协会数据中心委员会

....21 二、欧盟算力产业发展现状...............................................................................32 三、新兴经济体算力产业发展现状.....................................................................39 四、海外算力产业发展成功经验 ..............104 图表31：2024-2026年中国、美国发电量规模及预测.............................................105 图表32：2023/2030年中国、美国数据中心用电量规模及占比预测..........................106 算力产业缘起与战略经济价值 PART 01 全球重点区域算力竞争态势分析报告（2025年）在数据中心领域的应用，例如在北加州数据中心集群周边大规模部署风电、光伏+电池储能，实现绿电直供与峰谷调节。未来十年，电力与AI的协同演进将成为美国科技与能源转型的关键主线。全球重点区域算力竞争态势分析报告（2025年） 32 二、欧盟算力产业发展现状 1、算力产业政策欧洲联盟将算力基础设施建设视为数字主权的核心要素，通过系统性政策布局推动数字化转型、技术自主与产业升级。其政策体系具有鲜明的战略导向性，注重当前算力

10 积分 | 114 页 | 8.80 MB | 1 月前
3

共 38 条前往

页

分类

语言

格式

电子行业AI+系列专题：边缘AI，大语言模型的终端部署，推动新一轮终端需求-20230531-国信证券-25页

电子AI+系列专题：复盘英伟达的AI发展之路

电子行业深度报告：DeepSeek推动模型平权，关注AI终端及算力领域

电子AI+系列专题：DeepSeek重塑开源大模型生态，AI应用爆发持续推升算力需求

电子行业：AI大模型需要什么样的硬件？-20240621-华泰证券-40页

2024中国主要城市交通分析报告-高德地图

金融垂类大模型试用体验【AI金融新纪元】系列报告（一）

2025年数字政府服务能力暨第二十四届政府网站创新发展调查研究总报告

中国制造2025：实现技术领先的代价研究报告（英文版）

全球重点区域算力竞争态势分析报告（2025年）-中国通信工业协会数据中心委员会