电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域本报告的风险等级为中高风险。 本报告的信息均来自已公开信息,关于信息的准确性与完整性,建议投资者谨慎判断,据此入市,风险自担。 请务必阅读末页声明。 电子行业 超配 (维持) 电子行业深度报告 DeepSeek 推动模型平权,关注 AI 终端及算力领域 2025 年 2 月 20 日 罗炜斌 SAC 执业证书编号: S0340521020001 电话:0769-22110619 邮箱: luoweibin@dgzq DeepSeek推动模型平权,关注AI终端及算力领域。2024年12月,DeepSeek V3 首 个 版 本 上 线 , 在 多 项 评 测 成 绩 超 越 了 Qwen2.5-72B 和 Llama-3.1-405B 等 开 源 模 型 , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3.5-Sonnet不分伯仲,训练成本约为558万美元。1月20日, DeepSeek开源R1模型,后训练阶段大规模使用了强化学习技术,在仅有 极少标注数据的情况下,性能比肩OpenAI o1正式版,不仅极大提升了 模型推理能力,也大幅降低了训练成本。同时,DeepSeek-R1蒸馏了6个 小模型,其中32B和70B模型在多项能力上实现对标OpenAI o1 mini。通 过推出高性能、低成本且开源的模型,DeepSeek给全球AI发展带来了模 型平权,同时也将刺激其他头部模型厂商加快推出性能更强、成本更具 竞争力的模型。而随着模型调用门槛降低,AI终端有望加速落地,而AI+0 积分 | 23 页 | 2.65 MB | 6 月前3
电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 电子 AI 大模型需要什么样的硬件? 华泰研究 电子 增持 (维持) 研究员 黄乐平,PhD SAC No. S0570521050001 SFC No. AUZ066 leping.huang@htsc 华泰观点:关注 AI 大模型 x 硬件的两条思路 从 22 年 11 月 OpenAI 推出 ChatGPT 至今,我们看到 Chatbot 应用的能力 不断增强,从最初的文字问答,迅速向具有自主记忆、推理、规划和执行的 全自动能力的 AI Agent 发展。我们认为端侧智能是大模型发展的重要分支。 建议投资人沿着:1)大模型如何赋能终端,2)终端如何解决大模型普及难 点两条思路,寻找硬件的落地机会。我们看好 Agent 可能是大模型的最终形态 大模型的应用能力最初功能仅限于文字问答,此后逐渐引入图像理解、文生 图功能,并通过 GPT Store 拓展功能,形成了 AI Agent 雏形,近期 GPT-4o 则实现了具备情感的互动。用户数方面,根据 Similarweb,24 年 5 月 ChatGPT 的 PC+移动端独立访客数达到 3 亿,在全球所有网站中排名第 22。 我们认为大模型的演进方向是智能化和自动化程度逐渐提升,最终形态是0 积分 | 40 页 | 2.60 MB | 6 月前3
电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求发展突飞猛进,领跑开源大模型技术与生态, DeepSeek 模型已成为全球现象级模型。 DeepSeek( 深度求索 ) 公司成立于 2023 年 7 月,是一家致力 于实现 通用人工智能 (AGI) 的创新型科技公司。 2024 年 12 月, DeepSeek-V3 发布,性能对齐海外领军闭源模型。据官方技术论文披露, V3 模型的总训练成本 为 557.6 万美元, 对比 GPT-4o 等模型的训练成本约为 日消息,据彭博社报道, DeepSeek 的人工智能助手在 140 个市场下载次数最多的移动应用程序排行榜 上名列前茅。国外大型科技公司如微软、 英伟达、亚马逊等已先后上线部署支持用户访问 DeepSeek-R1 模型。 2 月 1 日,华为云官方发布消息,硅基流动和华为 云团队联合首发并上线基于华为云昇腾云服务 的 DeepSeekR1/V3 推理服务。 l DeepSeek 通过 MLA 和 DeepSeekMoE (values) 的存储空间,显著降低了内存需求。 DeepSeekMoE 架构采 用了更为精细粒度 的专家设置,能够更加灵活且高效地调配资源,进一步提升了整体的运行效率和表现。 DeepSeek 模型对跨节点的全对全通信机制进行优化, 充分利用 InfiniBand 和 NVLink 提供的高带宽。创新性提出了 DualPipe 算法,通过优化计算与通信的重叠,有效减少了流水线中的空闲时间。采用0 积分 | 38 页 | 1.95 MB | 6 月前3
电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 | 2023年05月31日 超 配 电子 AI+系列专题报告 边缘 AI:大语言模型的终端部署,推动新一轮终端需求 核心观点 行业研究·行业专题 电子 超配·维持评级 证券分析师:胡剑 证券分析师:胡慧 021-60893306 021-60871321 hujian1@guosen.com.cn huhui2@guosen 2023-05-08 大模型参数量级飞涨,相应训练集需同比提升。李开复定义 AI 2.0 时代的 特征是通过海量数据,无需标注自监督学习,训练一个基础大模型,并在各 领域将其专业化。据相关论文,当模型的参数量大于某阈值,会展现出类似 推理、无监督学习等未曾出现的能力,这种现象被称为“涌现”,因此目前 大语言模型参数均在十亿量级以上。同时,Deepmind 研究表明,模型参数的 上涨需要配合等比例 上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 参数在十亿级以上发展并受限于优质数据集的增速是 AI 发展的必然趋势。 大模型增长挑战芯片算力和内存,无法实现完整端侧部署。大模型训练和推 理的三大瓶颈是算力、显存和通信,根据我们的测算,算力方面 GPT-3 训练 所需算力为 121528 TFLOPS,若 30 天内完成,需要 1558 颗 A100。内存角度, GPT-3 训练至少需要 3.2T0 积分 | 25 页 | 2.20 MB | 6 月前3
电子:DeepSeek-R1加速AI进程,看好AI应用端潜力释放革命性推理能力叠加出色性价比,DeepSeek-R1 模型引发全球关注。 据 DeepSeek 官网数据,DeepSeek-R1 在后训练阶段大规模使用了强化 学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力, 其在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式 版。并且,DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借 助 R1 训练其他模型,进一步促进技术的开源和共享,用户可通过官 日消息,DeepSeek在 140 个市场的移动应用下载量排行榜上位居榜首。 DeepSeek-R1 模型以其卓越性价比和出色性能,为 AI 模型的研发和应 用提供了新的思路,打破了传统观念中对 AI 大模型高投入、高算力的 固有认知,加速 AI 大模型落地应用端。 DeepSeek-R1 蒸馏小模型性能卓越,驱动端侧 AI发展。根据 DeepSeek 官 网 数据 , DeepSeek-R1 的效果。这些蒸馏所得的小模型能够有效降低端侧 AI 应用的开发成本和门槛,有望加速 AI 技术在多种设备上的应用突破, 包括 AI 手机、AI PC、AI 眼镜和 AI 玩具等。尤其是对于注重轻便性 的 AI 眼镜,AI 大模型的接入可以帮助厂商在不增加设备体积的前提 下,丰富其智能化功能,优化用户体验,推动 AI 眼镜产业落地进程。 DeepSeek 模型加速国内 AI 进程,推动0 积分 | 4 页 | 269.47 KB | 6 月前3
电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页爆火,其能力已接近人类水平。GPT 升级至四代,模型能力 高速提升。2023 年 3 月 15 日,OpenAI 正式官宣了多模态大模型 GPT- 4,ChatGPT4 将输入内容扩展到 2.5 万字内的文字和图像,较 ChatGPT 能够处理更复杂、更细微的问题。最新版的 GPT-4 在 ChatGPT 的 GPT- 3.5 基础上主要提升了语言模型方面的能力,并添加了多模态功能,在 不同语言情 各种专业和学术基准上已经表现出人类水平。智能终端接入人工智能大 模型的趋势是明确的,预计很快在下游应用层面将出现 AI 百花齐放的 景象。国产半导体产业已经加速了“创新车轮”,在端侧围绕计算、感 知、存储等关键环节作充足准备,以迎接人工智能新机遇。 ◼ AI 拓宽 C 端应用场景,推动创新需求。 C 端更注重用户体验和使用场 景的匹配,随着轻量型大模型的发布,AI 应用有望从 PC 延伸到手机、 IOT 电子 沪深300 请务必阅读正文之后的免责声明部分 东吴证券研究所 行业深度报告 2 / 28 内容目录 1. ChatGPT 快速迭代,OpenAI 模型演进,下游应用百花齐放 ....................................................... 5 1.1. GPT 迭代更新,人工智能掀起科技潮 ...0 积分 | 28 页 | 2.68 MB | 6 月前3
电子AI+系列专题:复盘英伟达的AI发展之路是人工智能时代下满足深度学习大量计算需求的核心 AI 芯片。 过去五年,大型语言模型的参数规模以指数级增长;从 2018 年起, OpenAI 开始发布生成式预训练语言模型 GPT 以来, GPT 更新换代持续提升模型 及参数规 模; 2022 年 12 月, OpenAI 发布基于 GPT-3.5 的聊天机器人模型 ChatGPT ,参数量达到 1750 亿个。 ChatGPT 引领全球人工智能浪潮,人工智能 月,英伟达在 GTC 大会上推出 4 个针对各种生成式 AI 应用程序进行优化的推理平台,其中发布带有双 GPU NVLink 的 H100 NVL 加速计算卡, 以支持 ChatGPT 类大型语言模型推理。与适用于 GPT-3 处理的 HGX A100 相比,配备四对 H100 与双 GPU NVLink 的标准服 务器的速度最高可达 10 倍。 l 计算与网络事业部收入占比提升,数据中心超过游戏成为收入主要来源。 ;其中,云数据中心负载任务量 CAGR 预计达 22% 。 l 以模型中的参数数量衡量,大型语言模型的参数 在过去五年中以指数级增长。随着参数量和训练 数据量的增大,语言模型的能力会随着参数量的指 数增长而线性增长,这种现象被称为 Scaling Law 。 但当模型的参数量大于一定程度的时候,模 型能力 会突然暴涨 ,模型会突然拥有一些突 变能力 ( Emergent Ability0 积分 | 30 页 | 1.27 MB | 6 月前3
星图研究院:2025年视觉IoT消费市场分析报告跨域负载均衡 路由 高件能异步 API引警 分布式总线&批 处理引擎 物联网实时 计费引擎 网络 兼容 NB 4G(Cat.1) 5G(公专网) 物联网规则引 警 安全风险监测 安全管控 风险能力模型 泛在融合能力(卫星通讯-在建) 模式更灵活 elpful H 计费因子多 多APN分离、上下行非对称、带 宽、QoS等多因子融合计费 运营更智慧 legant E 保障更安全 技术的发展更多需要 芯片厂商来引领,低功耗发展趋势就是与常电产品同样的使用体验。而以往低功耗产品相比较常电产品来说存在无法24小时录 像、探测距离短、漏报误报等痛点,于是AOV因势而生。 AI 大模型 AI的趋势所有人都不怀疑,在IPC硬件的价格竞争愈演愈烈的时候,增值服务盈利方式就变得至关重要,尤其是做海外市场,硬 件高毛利的时代也已经一去不复返,而市场投入却不断增加,在海外市场4G产品未来是一个趋势,但目前占比还不算高,而云 产业生态图谱 ( 排名不分先后 ) 视觉物联网消费市场产业链全景图 上游 中游 下游 配套 语音芯片 蜂窝组芯片 / 模组 流量 配套 方案商 云 / 平台商 图像传感器 AI 大模型 / 算法 芯片 wifi 芯片 / 模组 思必驰 聆思 技威 宏视 九安 维拍 腾讯云 阿里云 华为云 TUTK 声网 探鸽 尚云 火山引擎 360 视觉 云生态 鹤梦 爱为物联10 积分 | 50 页 | 29.10 MB | 5 月前3
数字服务与数字运营的市场现状报告营状态 ,实现智 能 供应链和全球 数字 化协同闭环 处理。 企业构建智能化平 台 ,集成不同业务 领域的数据 ,实现 全方位的智能决策 支持。 模型和算法引入使 得企业能够进行更 高级的数据分析和 趋势预测 , 支持更 精准的战略规划和 决策制定。 最初的阶段主要集 中在内部信息的基 本传递上 域的数字化服务模式 ,线上和线下融 合的 OTOTO 服务兴起 ,如各类视频网 站、外卖、 共享单车出现。 现代阶段( 2010 年 - 至今) 大数据、 大模型、 人工智能开始出现、 推动了数字化服务向智能化、 精准化、 经营化方向发展 ,数据成为关键生产 要 素、企业的核心竞争力聚焦数据 , 聚焦 数字化行为生命周期的客户经营。 初始阶段( 20 在线支付、 标志数字化服务模式初步形成、 企 业主要利用互联网技术提高内部效 率 ,如 OA 、 ERP 等系统的应用。 2010 年代 --- 至今 变革发展阶段 云计算、 大数据、 大模型、 人工智能技术 引入、 企业通过数字化手段提升客户体验、 优化运营流程、 实现数据驱动智能决策, 如字节跳动利用数字技术精准定位短视频 和直播目标客群。 腾讯在社交媒体、 游戏、60 积分 | 48 页 | 12.97 MB | 5 月前3
服饰时尚行业数字化转型白皮书-百胜软件&Thoughtworks申洲国际的“72小时快反链”本质是需求感知-生产响应的神经网络。通过分析小红书“冻哭”话题下的3亿条UGC,其AI系统 在寒流到来前72小时向工厂推送发热围巾生产指令,最终以98.6%的售罄率验证预测模型有效性。 3)体验升维:神经愉悦的经济学 跑步生态的“多巴胺激励系统”,将运动数据转化为NFT勋章,用户积累100公里跑量即可解锁限量款设计权。这种神经奖 励机制使其APP月活提升至1200万,用户日均使用时长达到27分钟。 管理,可以提高数据的准确性和一致性。通过业务中台的数据分析工具和仓储管理系统,实时追踪和监控库存情况。包括库 存周转率、滞销品的预警、库存盘点等,以便及时调整采购计划和销售策略,降低库存风险。 此外,利用数据分析和算法模型,对库存进行预测和优化。根据历史销售数据、市场趋势等因素,预测库存需求,并合理规划 库存水平,以减少过剩库存和缺货风险。 2)库存成本管理 通过业务中台的成本管理系统,对库存成本进行核算和分析 合适的算法 和模型结构来进行需求预测。在服饰时尚行业,季节性的影 响相对更为明显,数据的分析与挖掘意义也更为突出。 模型优化与应用:通过历史销售数据的分析,了解销售趋势、季节性波动和产品生命周期等模式,有助于为预测模型提供 基准和参考,同时可以发现异常和趋势变化;利用历史数据进行预测模型的训练,并通过交叉验证和模型评估方法来优化 模型的准确性和鲁棒性。根据实际情况,对模型参数进行调整和优10 积分 | 39 页 | 14.97 MB | 6 月前3
共 21 条
- 1
- 2
- 3
