电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 | 2023年05月31日 超 配 电子 AI+系列专题报告 边缘 AI:大语言模型的终端部署,推动新一轮终端需求 核心观点 行业研究·行业专题 电子 超配·维持评级 证券分析师:胡剑 证券分析师:胡慧 021-60893306 021-60871321 hujian1@guosen.com.cn huhui2@guosen 研究表明,模型参数的 上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 参数在十亿级以上发展并受限于优质数据集的增速是 AI 发展的必然趋势。 大模型增长挑战芯片算力和内存,无法实现完整端侧部署。大模型训练和推 理的三大瓶颈是算力、显存和通信,根据我们的测算,算力方面 GPT-3 训练 所需算力为 121528 TFLOPS,若 30 天内完成,需要 1558 颗 A100。内存角度, GPT-3 优化后大模型可在旗舰机型芯片上运行,AI 落地有望推动新一轮换机潮。 AI 部署本地化具有必要性,优势包括更低的延迟、更小的带宽、提高数据安 全、保护数据隐私、高可靠性等。完整的大模型仅参数权重就占满一张 80G 的 GPU,但是通过量化、知识蒸馏、剪枝等优化,大模型可以在手机本地实 现推理。高通团队使用骁龙 8 Gen2 部署 Stable Diffusion,实现本地运营 15 秒出图,证明了大模0 积分 | 25 页 | 2.20 MB | 7 月前3
金融行业银行客户经理基于DeepSeek构建AI Agent智能体应用方案(237页 WORD)...........................................................................................151 7. 部署与实施计划.............................................................................................. .....................................................................................163 7.2.1 分阶段部署计划................................................................................................. .......................................................................................203 9.1 开发与部署成本.................................................................................................10 积分 | 247 页 | 2.05 MB | 1 月前3
金融与AI融合持续深化【AI金融新纪元】系列报告(四)-东吴证券恒生电子:恒生电子于 2025 年 3 月发布了恒生光子大模型一体机 DeepSeek 版,基于华为昇腾 800IA2 推理服务器,满足行业对于 AI 应用高 效部署、算力底座以及业务数智化创新的需求,助力金融机构快速完成大模型的部署落地,加速行业数智化转型进程。 蚂蚁金服: 2025 年 3 月,蚂蚁集团 Ling 团队发表了一篇技术成果论文,推出两款不同规模的 MoE 大语言模型——百灵轻量版( 日,腾讯混元自研的快思考模型 Turbo S 正式发布,能够实现“秒回”,吐字速度提升一倍,首字时延降低 44% , 同 时在知识、数理、创作等方面也有突出表现。通过模型架构创新, Turbo S 部署成本也大幅下降,持续推动大模型应用门槛降低。 东方财富:妙想金融大模型是东方财富重磅打造的金融行业大语言模型, 2025 年 3 月 21 日,东方财富宣布妙想大模型已正式向所有用户开 放,并全面登陆东方财富 程度上提高基础工作效率,降低成 本。 引入 AI 系统后, B+C 端投资者 投资效率提升,投融资需求提升, 市场交易活跃度提高。 AI 赋能券商业务的三种形式 与现有模型合作 本地化部署开源模型与自研模型结 合 纯自研模型 投研、投顾 资管业务 自营业务 新生业务 2.1. AI 赋能券商行业逻辑链条梳 理 风控合规 战略支持 市场研究、人力资源等后台部门10 积分 | 38 页 | 1.08 MB | 1 月前3
美国研究报告:2025数据中心市场 平衡前所未有的机会与战略风险信贷。专注与扩展 项目旨在与Securities, Inc.会面,共同构建超大规模数据中心 激增的需求以及加拿大丰业银行支持GPU中心。 数据中心将资助云公司及美国,共计1.5吉瓦。 由能力驱动的持续发展 部署资本 由人工智能工作负载开发,一站式服务。 其北部的定制AI/ 美国高性能计算数据中心 中心平台发展。 总计近 1.4吉瓦的IT 容量 机构投资者对数据中心融资的新兴趣显著增长,这得益于有吸引力的供需 高价($/千瓦) 2024年,美国数据中心租赁率在不同部署类型和地 区市场间的变化减少,但与历史基准相比出现了显 著增长。在疫情前,低于500kW的零售数据中心租 赁率平均不到200美元/kW,包括电力,每月,但 现在已飙升至超过250美元/kW,在北加利福尼亚 等市场甚至高达300-400美元/kW。平均国内价格 至少上涨了20%。 对于大规模部署,由于供应限制和新建项目预期的 回报,批发和超大规模容量定价已经趋同。批发和 回报,批发和超大规模容量定价已经趋同。批发和 超大规模部署(超过500kW)以前的价格在电费扣 除后为$85–$110/kW,而现在在主要市场为$150–$2 00/kW,在二级位置为$125–$160/kW。资本成本的 上升,加上大多数吸收发生在新建项目,推动了这 些增长。 注:包括电力来源:Colliers U.S. Researc h,Green Street 注:净电力来源:科利斯美国研究,格林 街 t0 积分 | 53 页 | 6.67 MB | 7 月前3
中国推理算力市场追踪报告,2025H1-沙利文协同与生态成熟推动推理普及 03 中国算力正朝着“训推一体”融合架构快速发展,以支撑大规模 模型与多模态应用的高效低延迟推理。国产AI芯片与推理框架不 断优化,结合模型压缩、量化、动态推理等技术,进一步提升能 效比和部署灵活性。 3 沙利文市场研读 | 2025/08 2 研究框架 中国推理算力市场综述 • 关键发现 • 中国推理算力定义及服务覆盖范围 • 算力需求重心从训练转向推理 • 中国推理算力市场规模分析 中国:人工智能系列 市场研读 | 2025/02 58% 49% 16% 26% 19% 8% 12% 5% 4% 3% 2023 2027 推理平台及应用部署偏好 设备端 边缘服务器 本地一体机部署 私有云 公有云 来源:沙利文、头豹研究院 中国推理算力:定义与服务覆盖范围 关键发现 推理算力主要负责AI模型的推理任务,主要用于处理和执行已经训练好的模型进行实 确保快速响应时间和稳定的服务。 但不一定需要与训练时相同的硬 件配置 。 推理型智算中心的硬件更注重处 理速度和可靠性。 推理算力定义范围 随着AI从训练为重走向推理为主,私有化环境及边 缘的部署需求都在迎来爆发。 ??????? ‘自行车’ 模型推理 Inference 模型权重 Model weights Forward 5 www.leadleo.com 400-072-558810 积分 | 12 页 | 1.12 MB | 1 月前3
经济开发区“智慧园区”可行性研究分析报告益增长的生产生活需求之间的矛盾愈发突出。园区从安全、体验、 成本和效率等方面,面临着挑战,大致归纳为以下几个方面: 1、园区基础设施收待改造:数量众多的园区,弱电系统、园区 网络、数据中心等基础设施老化,有线、无线等多张网络独立部署, 彼此不联通,缺乏智能化的基础,迫切需要升级改造。 2、园区建设缺乏顶层设计:传统园区往往缺乏系统性和前瞻性 规划,智慧化建设以碎片化功能建设为主,系统性考虑不足,各子 系统封闭孤立。园区 信息孤岛现象严重;同时,缺乏对数据的有效挖掘,数据应用少, 即使单个部门/业务做了智慧化改造,但系统之间无法联动,无法实 现整体智能化。 六、项目建设的必要性 1、项目的建设是响应产业信息化战略部署的必然选择,智慧园 区建设是国家创新发展,产业升级,推动新型信息化园区建设的重 要战略。 2、建设智慧园区平台对加快工业化、信息化融合,提升管委会 与园区内企业的经济、能耗等方面的管控能力及可持续发展能力具 经济开发区“智慧园区”项目项目建议书 件,并且该告警事件能在地图上进行定位,展示其告警事件详情。 从而全面掌握告警事件的发生及进展情况,做到情况明、处理清、 责任到人。 5)环境监测展示 通过部署在园区敏感点的监测设备,基于物联网传感和无线传 输技术,对园区内的空气质量、水源质量以及环境噪声进行动态采 集和实时监测和展示。 6)会议室信息展示 ●会议室使用状况统计 提供会议室使用状况统计展示,可统计出已预订、会议结束、10 积分 | 164 页 | 16.45 MB | 7 月前3
智慧停车发展及智慧停车系统白皮书平衡的突出问题,通过停车资源 信息化和停车运营管理信息化建设,整合城市停车资源,集中运营管理,实现有效供 给,提升停车便利性。 基础信息化阶段的典型应用场景包括: 实时车位信息发布:通过部署传感器等感知设备,对路内停车位和路外停车场的 车位使用状况进行采集,通过物联网将采集的信息以统一的数据格式上传至静态交 通大数据平台,经过大数据动态分析后,生成实时车位信息,并通过停车场的电子屏 场侧向云服务平台上报停车场、停车位和车辆的监控信息,用于停车服务提供商使能 停车服务以及业主和运营管理单位的监督与管理。此外,为了保障智能设备的功能实 现,还需要对传统停车基础设施进行相应的升级和新设施的部署,同时兼顾新设备与 停车场已有设备之间的信息系统(如车位检测器),以提高资源利用率。 在云服务平台,按照业务逻辑可包括智慧停车云平台、车企 TSP 平台、地图平 台、和城市综合管理服务平台等 车辆的实时通信。 C-V2X RSU 可以部署在智慧停车场出入口、停车场内部,提供完整的 PC5 信号覆 盖。RSU 负责向区域内目标车辆发送停车辅助信息包括:本车实时定位,障碍物,异 常事件等车辆状况和停车场状况信息,以及车辆行驶到停车位的路径规划信息,进行 路径指引,辅助网联车辆或自动驾驶车辆完成停车。 Uu 通信采用运营商已经部署的 4G/5G 网络,实现智能终端和车辆、智能终端以10 积分 | 43 页 | 1.73 MB | 7 月前3
某区智慧旅游可行性研究报告(286页 WORD).....................................234 7.9 系统部署说明.......................................................................................235 7.9.1 部署方式.............................................. 262 12.3.1.2 硬件设备部分...............................................................265 12.3.1.3 系统部署部分...............................................................266 12.3.1.4 系统维护部分.............. 267 12.3.2.2 硬件设备部分...............................................................269 12.3.2.3 系统部署部分...............................................................270 12.3.2.4 系统维护部分..............40 积分 | 408 页 | 7.76 MB | 2 月前3
电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求OpenAI-o1 正式版。 2 月 1 日消息,据彭博社报道, DeepSeek 的人工智能助手在 140 个市场下载次数最多的移动应用程序排行榜 上名列前茅。国外大型科技公司如微软、 英伟达、亚马逊等已先后上线部署支持用户访问 DeepSeek-R1 模型。 2 月 1 日,华为云官方发布消息,硅基流动和华为 云团队联合首发并上线基于华为云昇腾云服务 的 DeepSeekR1/V3 推理服务。 l DeepSeek Appfigures 数据(不 包括中国的第三方应用商店),这款推理人工智能 聊天机器人于 1 月 26 日升 至苹果公司应用商店的榜首,此后一直占据全 球第一的位置。 l 国外大型科技公司已上线部署支持用户访问 DeepSeek-R1 模型。 1 月 30 日, 微软宣布 DeepSeek-R1 模型已在 Azure AI Foundry 和 GitHub 上提 供。 1 月 31 日,英伟达宣布 SageMaker AI 中部署 DeepSeek-R1 模型。 l 硅基流动和华为云宣布上线 DeepSeekR1/V3 推理服务。 2 月 1 日,华 为云 官方发布消息,硅基流动和华为云团队联合首发并上线基于华为云 昇腾云 服务的 DeepSeekR1/V3 推理服务。该服务具备以下特点: 1 ) 得益于自研推 理加速引擎加持,硅基流动和华为云昇腾云服务支持部署 的 DeepSeek0 积分 | 38 页 | 1.95 MB | 7 月前3
电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页套件等专业软件在内的生产力工具矩阵,向数据协同、功 能联动的方向发展。如何保护自身私域数据的安全是企业导入微软 Copilot 的主要痛点之一。24 年 5 月,微软推出 Copilot+PC,通过在终端侧部署轻 量级的大模型,在保护隐私的前提下,能够实现会议纪要、文档总结、PPT 智能创作、文生图等企业的基本办公需求,是大模型时代生产力工具的主要 支点。我们认为 2025 年 AI PC 渗透率有望大幅提升。 套件等专业软件在内的生产力工具矩阵,向数据协同、 功能联动的方向发展。如何保护自身私域数据的安全是企业导入微软 Copilot 的主要痛点之 一。24 年 5 月,微软推出 Copilot+PC,通过在终端侧部署轻量级的大模型,在保护隐私的 前提下,能够实现会议纪要、文档总结、PPT 智能创作、文生图等企业的基本办公需求, 是大模型时代生产力工具的主要支点。我们认为 2025 年 AI PC 渗透率有望大幅提升。 工具,由 OpenAI 与 Microsoft 合作开发。 Copilot 具备强大的网络搜索和推理决策能力,能回答开发过程中的问题。比如通过自然语 言描述需求,Copilot 可以自动生成代码,并提供部署建议。据微软 FY3Q24(对应日历季 度 1Q24)业绩会,GitHub Copilot 付费用户数已达到 180 万,环比增速 35%以上,收入同 比增长超过 45%。2024 年 5 月微软 Build0 积分 | 40 页 | 2.60 MB | 7 月前3
共 29 条
- 1
- 2
- 3
