电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页
2.20 MB
25 页
0 下载
20 浏览
0 评论
0 收藏
| 上传 | 格式 | 评分 |
|---|---|---|
itfangan | .pdf | 3 |
| 概览 | ||
请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 | 2023年05月31日 超 配 电子 AI+系列专题报告 边缘 AI:大语言模型的终端部署,推动新一轮终端需求 核心观点 行业研究·行业专题 电子 超配·维持评级 证券分析师:胡剑 证券分析师:胡慧 021-60893306 021-60871321 hujian1@guosen.com.cn huhui2@guosen.com.cn S0980521080001 S0980521080002 证券分析师:周靖翔 证券分析师:李梓澎 021-60375402 0755-81981181 zhoujingxiang@guosen.com.cn lizipeng@guosen.com.cn S0980522100001 S0980522090001 证券分析师:叶子 联系人:詹浏洋 0755-81982153 010-88005307 yezi3@guosen.com.cn zhanliuyang@guosen.com.cn S0980522100003 联系人:李书颖 0755-81982362 lishuying@guosen.com.cn 市场走势 资料来源:Wind、国信证券经济研究所整理 相关研究报告 《电子行业周报-AI+开启半导体新周期》 ——2023-05-29 《复盘英伟达的 AI 发展之路》 ——2023-05-29 《电子行业周报-半导体周期拐点临近,国产化进程提速》 —— 2023-05-24 《电子行业周报-景气拐点将至,以时间换空间》 —— 2023-05-15 《电子行业周报-在行业周期筑底阶段无需过度悲观》 —— 2023-05-08 大模型参数量级飞涨,相应训练集需同比提升。李开复定义 AI 2.0 时代的 特征是通过海量数据,无需标注自监督学习,训练一个基础大模型,并在各 领域将其专业化。据相关论文,当模型的参数量大于某阈值,会展现出类似 推理、无监督学习等未曾出现的能力,这种现象被称为“涌现”,因此目前 大语言模型参数均在十亿量级以上。同时,Deepmind 研究表明,模型参数的 上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 参数在十亿级以上发展并受限于优质数据集的增速是 AI 发展的必然趋势。 大模型增长挑战芯片算力和内存,无法实现完整端侧部署。大模型训练和推 理的三大瓶颈是算力、显存和通信,根据我们的测算,算力方面 GPT-3 训练 所需算力为 121528 TFLOPS,若 30 天内完成,需要 1558 颗 A100。内存角度, GPT-3 训练至少需要 3.2T 内存,至少 44 张 A100,推理任务则主要受显存限 制,需要 4 至 8 张 A100,因此完整的模型无法在终端上离线运行。 优化后大模型可在旗舰机型芯片上运行,AI 落地有望推动新一轮换机潮。 AI 部署本地化具有必要性,优势包括更低的延迟、更小的带宽、提高数据安 全、保护数据隐私、高可靠性等。完整的大模型仅参数权重就占满一张 80G 的 GPU,但是通过量化、知识蒸馏、剪枝等优化,大模型可以在手机本地实 现推理。高通团队使用骁龙 8 Gen2 部署 Stable Diffusion,实现本地运营 15 秒出图,证明了大模型本地化运行的可能,也体现出目前手机芯片的局限 性。根据 IDC 数据,1Q23 全球手机销量中主处理器频率超过 2.8GHz 的占比 36%,价格在 1000 美金以上的占比 13%,即旗舰机型占比较低,随着 AI 大模 型在边缘端落地,有望推动新一轮换机潮。 以大语言模型为核心,以语言为接口,控制多 AI 模型系统,构建“贾维斯” 式智能管家。我们认为大语言模型不仅可以实现对话、创意,未来也有望作 为众多复杂 AI 模型的控制中心,同时也是接受用户指令的交互窗口,实现 《钢铁侠》电影中“贾维斯”式综合智能管家。23 年 5 月,Google 推出 PaLM 2 轻量版 Gecko,其可在最新的旗舰机型上离线运行。同月,OpenAI 首次推 出 ChatGPT 移动端应用,各家大厂正式进入 AI 模型移动端创新、竞争时期。 智能音箱、全屋智能中控屏、手机、MR 等均有望成为这一时代的交互入口。 产业链相关公司:半导体:晶晨股份、瑞芯微、全志科技、北京君正、兆易 创新;消费电子:传音控股、歌尔股份、福立旺、闻泰科技、创维数字。 风险提示:AI 技术发展不及预期;边缘端芯片发展不及预期。 重点公司盈利预测及投资评级 公司 公司 投资 昨收盘 总市值 EPS PE 代码 名称 评级 (元) (亿元) 2023E 2024E 2023E 2024E 688099.SH 晶晨股份 买入 86.36 358.62 1.77 2.23 48.79 38.66 300223.SZ 北京君正 买入 93.77 451.57 1.64 1.87 57.22 50.23 688036.SH 传音控股 买入 127.95 1,028.65 3.09 4.61 41.41 27.73 002241.SZ 歌尔股份 买入 18.29 625.59 0.52 0.76 35.17 24.22 688678.SH 福立旺 买入 18.70 32.42 0.94 1.35 19.89 13.89 600745.SH 闻泰科技 买入 50.08 622.40 0.94 1.35 53.28 37.20 000810.SZ 创维数字 买入 15.74 181.04 0.94 1.35 16.74 11.69 资料来源:Wind、国信证券经济研究所预测 请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 2 内容目录 百亿参数大模型具备涌现能力,训练数据需等比例提升 .............................. 5 大模型的参数下限:AI2.0 时代,基础大模型参数指数级增长 ................................ 5 大模型的参数上限:参数的增加需要同等量级的训练集增加 .................................. 6 大模型训练对硬件的挑战:算力、内存和通信 .............................................. 8 终端部署具有必要性,轻量化技术优化模型 ....................................... 11 超低时延的智慧场景,终端部署具有必要性 ...............................................11 缩减优化模型,部署终端设备 ...........................................................12 “贾维斯”式智能管家,引领全新换机需求 ....................................... 16 大语言模型有望成为复杂 AI 系统的控制中心和交互入口 .................................... 16 当前旗舰机款手机芯片仅可运行优化版十亿参数级大模型 ...................................19 风险提示 ..................................................................... 23 oPxOoMqQsNsOpPoOmQwOqM8OdN7NpNmMpNoNlOmMoQeRoOnM6MnMtPvPqMqOwMoOuN 请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 3 图表目录 图1: AI2.0 时代的特征是通过超级海量数据无需标注训练一个大模型 .............................5 图2: 过去五年 LLM 模型参数快速增长 ........................................................ 6 图3: 参数量的指数提升线性提高模型性能 .................................................... 6 图4: 当模型的参数量大于一定程度时模型效果会突然提升 ...................................... 6 图5: 小模型的性能也随着规模扩大而逐步提高 ................................................ 6 图6: 2022 年最大的五个 transfomer 模型条件 .................................................7 图7: 各模型位于 LM 损失等高线图上的位置 ................................................... 7 图8: LaMDA 模型训练数据来源 ...............................................................7 图9: 静态内存 ............................................................................ 8 图10: 动态内存 ........................................................................... 8 图11: 模型大小与设备内存的增长示意图 ..................................................... 9 图12: 算力计算公式 ...................................................................... 10 图13: 近年推出的大预言模型有效算力比率 .................................................. 10 图14: 边缘计算的应用场景 ................................................................ 11 图15: 云计算与边缘计算的区别 ............................................................ 11 图16: 云计算与边缘计算 .................................................................. 11 图17: 边缘 AI 的数据传输 ................................................................. 12 图18: 量化可以降低功耗和占用面积 ........................................................ 13 图19: NVIDIA Turing GPU 体系结构中各种数据类型相对的张量运算吞吐量和带宽减少倍数 ........ 13 图20: 优化 AI 完全在终端侧高效运行 Stable Diffusion .......................................13 图21: 骁龙 8 Gen2 旗舰芯片组 15 秒出图 .................................................... 13 图22: 知识蒸馏基本框架 .................................................................. 14 图23: 单独训练子模型反哺主模型 .......................................................... 14 图24: 联邦学习的升级版 FedCG .............................................................14 图25: 两种经典剪枝方法 .................................................................. 15 图26: 剪枝算法流程 ...................................................................... 15 图27: 钢铁侠和 Jarvis ....................................................................16 图28: 微软亚洲研究院的 Jarvis 项目 ....................................................... 16 图29: Hugging Face AI 模型写作系统四个步骤 ...............................................17 图30: Plugin 插件界面 ....................................................................17 图31: PaLM2 的从小到大的四种版本 .........................................................18 图32: PaLM2 在部分测试中体现出了优异性 ...................................................18 图33: ChatGPT App 欢迎界面 ...............................................................18 图34: 微软 bing chat 应用 ................................................................ 18 图35: 2019 年美国语音助理市场份额 ........................................................19 图36: 全球智能音箱市场下滑 .............................................................. 19 图37: 语音交互过程示意图 ................................................................ 19 请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 4 图38: Siri 信号流示意图 ..................................................................20 图39: 双通检测(AOP 唤醒主 CPU) ......................................................... 20 图40: 苹果 A11 芯片开始搭载 NPU ...........................................................20 图41: 全球手机分处理器频率销量占比 ...................................................... 21 图42: 全球手机分价格段销量占比 .......................................................... 21 图43: AIGC 支撑 AI 多模交互 ...............................................................21 图44: 鸟鸟和类 ChatGPT 模型分身对话 ...................................................... 21 图45: 全球 AR/VR 出货量预测 .............................................................. 22 图46: 全球智能家居啊出货量预测 .......................................................... 22 表1: GPT 参数和训练集规模快速增长 .........................................................8 表2: 大语言模型的计算 .................................................................... 9 表3: 大预言模型算力测算 ................................................................. 10 请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 5 百亿参数大模型具备涌现能力,训练数据需等 比例提升 大模型的参数下限:AI2.0 时代,基础大模型参数指数级增长 李开复提出本次由 GPT-4、ChatGPT 引发的 AI 新机遇与之前有所不同,属于 AI 2.0 时代。AI 1.0 时代具体指的是以 CNN(卷积神经网络)为核心,机器视觉和自然 语言处理快速发展的时期,暴涨的数据量伴随搜集、清洗、标注整个过程的成本 增加,且单一领域的数据集和模型形成孤岛,每个领域和应用的优化都是割裂的, 难以形成“通用”。 AI 2.0 时代的特征是通过海量数据,无需标注自监督学习,训练一个基础大模型, 并在各个应用领域将其专业化。具体来说有三个特点:1)对于拥有的超级海量的 数据,无需进行人工标注,即进行自监督学习;2)基础模型规模非常大,参数规 模从十亿到千亿级别;3)训练出的基础模型具有跨领域知识,而后通过微调用降 低成本的方法来训练,以适应不同领域的任务。AI 2.0 的巨大跃迁之处在于,它 克服了前者单领域、多模型的限制。 图1:AI2.0 时代的特征是通过超级海量数据无需标注训练一个大模型 资料来源:创新工场,国信证券经济研究所整理 以大语言模型(Large Language Model,LLM)为例,语言模型已经存在了几十年, 从最基本的 N-gram 模型(语言由简单的向量表示),到更复杂的 RNN 模型、LSTM 神经网络,再到 2017 年 Google Brain 提出 Transformer。Transformer 不再基 于对每个单词的单独理解进行处理,而是将句子和段落作为一个整体进行处理, 使 LLM 能够从自然语言中深入理解人类的意图,并让一系列应用成为可能:从描 述中生成艺术创作、将大量非结构化数据提炼成简洁的摘要、更准确的翻译、
| ||
下载文档到本地,方便使用
- 可预览页数已用完,剩余
24 页请下载阅读 -
文档评分


电子AI+系列专题:复盘英伟达的AI发展之路