电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求557.6 万美元, 对比 GPT-4o 等模型的训练成本约为 1 亿美元。 2025 年 1 月, DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。在数学、代码、 自然 语言推理等任务上,性能比肩 OpenAI-o1 正式版。 2 月 1 日消息,据彭博社报道, DeepSeek 的人工智能助手在 140 个市场下载次数最多的移动应用程序排行榜 上名列前茅。国外大型科技公司如微软、 DeepSeek-R1 模型。 2 月 1 日,华为云官方发布消息,硅基流动和华为 云团队联合首发并上线基于华为云昇腾云服务 的 DeepSeekR1/V3 推理服务。 l DeepSeek 通过 MLA 和 DeepSeekMoE 实现高效的推理和低成本训练,构建 DualPipe 算法和混合精度训练优化计算与通信负载;通过 ( 分阶段 ) 强化学习实现 性能突破。 多头潜在注意力 (MLA) DeepSeek-R1-Zero 通过强化学习架构创新实现突破性性能,核心技术创新体现在训 练效能优化策略、双维度评价体系、 结构化训练范式三个维度。 DeepSeek-R1 采用分阶段强化学习架构演进,包括冷启动阶段、面向推理的强化学习、拒绝采样 与监督式微调、全场景强化学习等。 l AI 应用爆发在即,算力需求持续攀升,关注 ASIC 及服务器产业链。 Scaling Law 与“涌现”能力是大模型训练遵循的重要法则,随着0 积分 | 38 页 | 1.95 MB | 6 月前3
电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页大模型参数量级飞涨,相应训练集需同比提升。李开复定义 AI 2.0 时代的 特征是通过海量数据,无需标注自监督学习,训练一个基础大模型,并在各 领域将其专业化。据相关论文,当模型的参数量大于某阈值,会展现出类似 推理、无监督学习等未曾出现的能力,这种现象被称为“涌现”,因此目前 大语言模型参数均在十亿量级以上。同时,Deepmind 研究表明,模型参数的 上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 算力方面 GPT-3 训练 所需算力为 121528 TFLOPS,若 30 天内完成,需要 1558 颗 A100。内存角度, GPT-3 训练至少需要 3.2T 内存,至少 44 张 A100,推理任务则主要受显存限 制,需要 4 至 8 张 A100,因此完整的模型无法在终端上离线运行。 优化后大模型可在旗舰机型芯片上运行,AI 落地有望推动新一轮换机潮。 AI 部署本地化具有必要性,优势包括更低的延迟、更小的带宽、提高数据安 部署本地化具有必要性,优势包括更低的延迟、更小的带宽、提高数据安 全、保护数据隐私、高可靠性等。完整的大模型仅参数权重就占满一张 80G 的 GPU,但是通过量化、知识蒸馏、剪枝等优化,大模型可以在手机本地实 现推理。高通团队使用骁龙 8 Gen2 部署 Stable Diffusion,实现本地运营 15 秒出图,证明了大模型本地化运行的可能,也体现出目前手机芯片的局限 性。根据 IDC 数据,1Q23 全球手机销量中主处理器频率超过0 积分 | 25 页 | 2.20 MB | 6 月前3
电子AI+系列专题:复盘英伟达的AI发展之路GPU 通用型强,满足深度学习大量计算 的需求,因此 GPU 在训练负载中具有绝对优势。以 GPT-3 为例,在 32 位的单精度浮点数数据下,训练 阶段所需 GPU 数量为 1558 个,谷歌级应用推理阶段所 需 GPU 数量为 706315 个。 l 英伟达开辟 GPGPU 加速计算格局, GPU 架构演进及产品布局赋能 AI 时代。 英伟达 (NVIDIA) 成立于 1993 年,总部位于 变革初期就已参与并与 OpenAI 、微 软合作。 2023 年 3 月,英伟达在 GTC 大会上推出 4 个针对各种生成式 AI 应用程序进行优化的推理平台,其中发布带有双 GPU NVLink 的 H100 NVL 加速计算卡, 以支持 ChatGPT 类大型语言模型推理。与适用于 GPT-3 处理的 HGX A100 相比,配备四对 H100 与双 GPU NVLink 的标准服 务器的速度最高可达 10 数增长而线性增长,这种现象被称为 Scaling Law 。 但当模型的参数量大于一定程度的时候,模 型能力 会突然暴涨 ,模型会突然拥有一些突 变能力 ( Emergent Ability ),如推理能力、无 标注学习 能力等。例如 GPT 之前的大语言模型主 流是深度神 经网络驱动,参数在数十亿水平,而 ChatGPT 达到 1750 亿参数。 全球数据量及数据中心负载量大幅上涨0 积分 | 30 页 | 1.27 MB | 6 月前3
电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域5-Sonnet不分伯仲,训练成本约为558万美元。1月20日, DeepSeek开源R1模型,后训练阶段大规模使用了强化学习技术,在仅有 极少标注数据的情况下,性能比肩OpenAI o1正式版,不仅极大提升了 模型推理能力,也大幅降低了训练成本。同时,DeepSeek-R1蒸馏了6个 小模型,其中32B和70B模型在多项能力上实现对标OpenAI o1 mini。通 过推出高性能、低成本且开源的模型,DeepSeek给全球AI发展带来了模 ek给全球AI发展带来了模 型平权,同时也将刺激其他头部模型厂商加快推出性能更强、成本更具 竞争力的模型。而随着模型调用门槛降低,AI终端有望加速落地,而AI+ 快速发展也将反哺训练算力、推理算力需求。 AI终端有望加速落地。AI手机:苹果国行AI功能渐行渐近,三星国行S25 系列搭载智谱Agentic GLM,而华为、荣耀、OPPO等多家国产终端近期 亦官宣接入R1模型。群智咨询预计今年全球智能手机出货量同增4%。其 .. 7 图 7 :Grok 3 基准测试成绩 ............................................................ 7 图 8 :Grok 3 推理基准测试成绩 ........................................................ 7 图 9 :苹果近年营业收入 ...................0 积分 | 23 页 | 2.65 MB | 6 月前3
电子:DeepSeek-R1加速AI进程,看好AI应用端潜力释放日突破 3000 万大关,成为史上最快达成这一里程碑的应用。 革命性推理能力叠加出色性价比,DeepSeek-R1 模型引发全球关注。 据 DeepSeek 官网数据,DeepSeek-R1 在后训练阶段大规模使用了强化 学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力, 其在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式 版。并且,DeepSeek-R1 版。并且,DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借 助 R1 训练其他模型,进一步促进技术的开源和共享,用户可通过官 网或 App 调用 DeepSeek-R1 完成各类推理任务。此外,DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命 中),每百万输出 tokens 16 元,具备极高的性价比。据财联社 2 月 1 日消息,DeepSeek在 开源大模型,实现在多场景、多产品 中应用,针对热门的 DeepSeek-R1 模型提供专属算力方案和配套环境, 助力国产大模型性能释放。 投资建议:我们维持电子行业“领先大市”评级。1)推理侧发展有望 -6% 14% 34% 54% 74% 2024/02 2024/05 2024/08 2024/11 电子 沪深300 行业点评 电子 此报告仅供内部客户参考0 积分 | 4 页 | 269.47 KB | 6 月前3
电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页华泰观点:关注 AI 大模型 x 硬件的两条思路 从 22 年 11 月 OpenAI 推出 ChatGPT 至今,我们看到 Chatbot 应用的能力 不断增强,从最初的文字问答,迅速向具有自主记忆、推理、规划和执行的 全自动能力的 AI Agent 发展。我们认为端侧智能是大模型发展的重要分支。 建议投资人沿着:1)大模型如何赋能终端,2)终端如何解决大模型普及难 点两条思路,寻找硬件的落地机会。我们看好 点两条思路,寻找硬件的落地机会。我们看好 1)Apple Intelligence 推动苹 果用户换机,2)交互能力提升推动轻量级 AR 开始普及,3)隐私保护需求 推动办公用 PC AI 化等三大机会。 具备记忆、推理、规划、执行能力的 AI Agent 可能是大模型的最终形态 大模型的应用能力最初功能仅限于文字问答,此后逐渐引入图像理解、文生 图功能,并通过 GPT Store 拓展功能,形成了 AI Agent 雏形,近期 年 5 月 ChatGPT 的 PC+移动端独立访客数达到 3 亿,在全球所有网站中排名第 22。 我们认为大模型的演进方向是智能化和自动化程度逐渐提升,最终形态是 AI Agent,具有自主记忆、推理、规划和执行的全自动能力。 观点#1:Apple Intelligence 推动苹果用户换机,利好产业链业绩增长 6/11, 苹果 WWDC 2024 大会推出由苹果自研的端侧大模型、云端大模型、0 积分 | 40 页 | 2.60 MB | 6 月前3
电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页年中国物联网行业规模预测(万亿元) 数据来源:GSMA,东吴证券研究所 数据来源:赛迪,东吴证券研究所 物联网由三项关键的新兴技术支持:人工智能(AI):使设备能够像人类一样学习、 推理和处理信息的可编程功能和系统。5G 网络:具有高速,接近零延迟的第五代移动 网络,用于实时数据处理。大数据:从众多互联网连接来源处理的大量数据。随着物联 网设备数量的增加,数据的泛滥也将是自然而然的。这就是 音交互 是智能音箱核心的功能和卖点,传统智能音箱产品难以实现类似人与人之间的“对话式” 交流,难以应付复杂的对话场景。目前,随着 ChatGPT 等全新语言模型的到来,无论 是对更加复杂语言的推理和分析,还是优秀的对话连贯性和流畅性,或是所能提供的更 加个性化的服务,均有希望延展到智能音箱上。ChatGPT 的到来使智能音箱从自动理解、 生成语言,到进行流畅的对话和问答,都可以给用户提供更加全面、智能、个性化的服0 积分 | 28 页 | 2.68 MB | 6 月前3
浙江省地标-大中型体育场馆智慧化建设和管理规范、安 全认证、安全运营管理、平台安全架构设计等安全保障。 DB33/T 2305—2021 4 6.3 核心技术层 6.3.1 核心技术层向各场馆、各部门提供计算、存储、传输、学习、推理、决策等保障和服务。 6.3.2 核心技术层可应用 BIM、云计算、物联网、5G 通信、人工智能、VR、边缘计算、数字孪生等现 代数字技术。 6.3.3 核心技术应用应符合 GB/T 31168、GB/T0 积分 | 20 页 | 613.17 KB | 5 月前3
中国零售数字化企业出海现状与趋势白皮书户的商业习惯、业务需求和数据反馈进行分析,打造专属的产品功能模块和界面 布局,为客户企业提供个性化定制服务。同时,零售数字化企业将AI技术与定向营 销、客户反馈分析,以及选品、推荐引擎等相结合,基于AI大模型推理能力,AI 既 能捕获和分析以个人购买行为为重点的数据,也能捕获和分析来自所有类型购物 者的汇总数据,因此可以在所有渠道和互动中创造出更加精简的客户体验。同时 AI基于零售商已有的商品品类体系,通过机器学习和智能算法完善商家品类结10 积分 | 39 页 | 19.55 MB | 4 月前3
星图研究院:2025年视觉IoT消费市场分析报告场景化产品落地,视 觉行业也从产品思维往运营思维再转变,视觉行 业新的经营模型已经到来。 安凯微物联网摄像机芯片事业部总经理 葛保建: 大模型强力加持,视觉物联产业迎来新变革。凭 借强大的学习和推理能力,AI 算法驱动下,结合 先进的 AI 芯片,将重塑诸多老产品,改进功能、 革新体验,推动视觉物联设备从基础采集向自主 决策跨越。 警视卫总经理 郭江峻: 视觉 iot 在监控中的应用就像给传统监控装上了眼10 积分 | 50 页 | 29.10 MB | 5 月前3
共 10 条
- 1
