ppt文档 2024年汽车AI大模型TOP10分析报告(59页 PPT) VIP文档

27.94 MB 59 页 0 下载 3 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pptx
3
概览
Big-data Driven ,模型基于大规模语料训练而成; Multi-tasks Adaptive ,支持多种任务 ,包括自然 语言生成 NLG 和自然语言理解 NLU 类的任务; AI 大模型就是预训练语言模型 通过在大规模宽泛的数据上进行训练后能适应一系列下游任务的模 型 产业研究 战略规划 技术咨询 2 Few-shot (Zero-shot) ,在少甚至无标注样本的 条件下支持推理(自监督学习)。 将模型在下游各种自然语言处理任 务上的小规模有标注数据进行微调 得到适配模型 预训练语言模型 从海量数据中自动学习知识 将模型在大规模无标注数据上进 行自监督训练得到预训练模型 不同特定任务 有标注训练数 据 模型预训练 模型微调 最终模型 ⼤规模⽆标注 ⽂本数据 预训练语⾔模型“预训练 + 微调”技术范 式 预 训 练 测试数据 微 调 2012 2013 2014 2015 2016 2017 2018 2019 2020 2022 2022 2023 自 然 语 言 处 理 Word2Vec (Google. 引用 78550) Attention ( 图灵奖得主 Bengio) Model ERNIE( 百度 ) CPM( 智源 ) GLM( 洁华 ) 预训练模型 大模型 Transformer( Google. 引用 91332) Foundation 计 算 机 视 觉 AlexNet ( 图灵奖得主 Hinton) CAN (Gioodfellow. 图灵奖得主 Bengio) ResNet ( MSR. 引用 183222) 跨模态模型 DALL E2 (OpenAI) 2017 年 , Google 提出 Transformer 框架在机器翻译中取得显著进步 ,其分布式学习和强大编码能力受到广泛关注。 2018 年 Google 和 OpenAI 基于 Transformer 提出了预训练语言模型 BERT 和 GPT ,显著提高了 NLP 任务的性能 ,并展示出广泛的通 用性。 众多预训练模型相继涌现, OpenAI 以 GPT2 、 GPT-3 、 ChatGPT 等系列模型为代表,持续引领大模型时代的浪潮 产业研究 战略规划 技术咨询 3 认 知 感 知 BERT (Google) GPT (OpenAI) 大模型发展历程 来源:大模型驱动的群体智能行业白皮书 ChatGPT (OpenAI) GPT-4V (OpenAI) GPT-2 (OpenAI) GPT-3 (OpenAI) ViT (Google) PaLM (Google) (Stanford) 大模型参数规模不断增长,推动 AIGC 技术升级。 AIGC 技术发展的背后是大模型( Foundation Models )技术的持续迭代。从 2017 年 Transformer 结构 的提 出,加速了深度学习模型的参数学习能力。另一方面, GPU 算力也在指数级增长。 产业研究 战略规划 技术咨询 4 图 1 : 2018-2023 年模型参数规模变化 图 图 2 : CPU 与 GPU 算力演进 比较 来源: techovedas ,国元证 券 来源:中国人工智能系列白皮书 我国高端 GPU 芯片进口从 2019 年以来就一直有被限制,只是之前主要针对的厂商是 AMD ,在应用场景上又以超算中心为主; 2023 年 10 月 17 日,美国加强了面向中国市场的 AI 芯片禁令。其中明确将性能、密度作为出口管制标准,将单芯片超过 300teraflops 算力,以及性能 密度超 过每平方毫米 370 gigaflops 的芯片都纳入了禁止出口行列。禁令涉及 A100 、 H100 等主流 AI 训练用英伟达 GPU 。 来源:浙商证券研究所、华泰证券研究所 图 3 :英伟达 GPU 架构演进 图 图 4 :训练芯片算力成本呈下降趋 势 英伟达每 2 年推出一个微架构,对产品线进行升级, 6 月 2 日,英伟达在 Computex 2024 大会上发布了至 2027 年的芯片路线图, GPU 迭代 周期由 2 年缩短到 1 年,走类似英特尔的 Tick-Tock 模式(一年工艺一年架构)。同时,英伟达践行“ Buy More Save More” 让算力 成本 指数级下降。 产业研究 战略规划 技术咨询 5 发展 AI 大模型相关的软硬件技术需要大量 人才 ,大量的优秀本科生选择出国深造, 而其中超过 60% 的毕业生选择在海外工作, 导致长期的优秀人才流失。另外在中西方 脱钩的背景下 ,美西方限制了对中国高科 技人才的培养与学术合作交流 由于各类政策管制和商业模式复制壁垒 低 ,导致的基础数据和语言语料同质化 中文语料 短缺 数据和语 料 的同质 化 全球化 经营 人才流失与 人才短缺 中国在高质量数据获取方面面临挑战 , 主要由于缺乏完善的数据法规、行业内 固有的竞争性保密性 ,对开源合作文化 的不足 中国科技企业的市场导向和商业化压力 常使得大厂技术部门在追求 KPI 的同时 , 难以专注于前言技术的研发 相较于英文、中文高质量开源数据非常 少 ,特别是在构建通用领域大模型的百 科类、问答类、图书贡献、学术论文、 报告杂志等高质量内容 中国科技企业较少开展全球化经营 , 导致在营收、人才获取、全球化商业 场景方面制约明显 产业研究 战略规划 技术咨询 6 数据 人才 行业高精 数据短缺 商业化 压力大 产业研究 战略规划 技术咨询 7 创业新势力 科技大厂 产业研究 战略规划 技术咨询 8 综合各测评平台的方法论来看,在基础能力的测评维度基本相同,仅测评数据集和评估权重占比不同;而在基础能力之外,各测评平台 侧 重点不同 OpenCompass 2.0 司南 沙利文 IDC To C 通用场景类 Agent To B 特定行业类 Language 特定行业类 超长文本 Agent 道德责任 Knowledge Reason Other Math Code 知识 其他 代码 推理 语言 数学 IDC 测试题目分为基础能力和应用能力两个大类共 7 个维度 IDC 采取实测的方式,成立产品测试团队,通过多个维度对基础大模型及相关产品进行评测,并邀请外部专家团队深入分析各个产品答案准确性、合理性等,在 审 核委员会的监督下,最终得出各厂商的评估结果,供用户选型参考。 toC 通用 场景类 生活助手 办公工具 toB 特定 行业类 金融 : 推荐场景 金融 / 咨询服务 : 财报 / 市场分析 互联网 / 媒体 : 文案 / 海报设计、广告词 创作、视频生成场景 零售 / 电商 : 客服问答 工业 : 产品设计辅助 && 生产规划 教育 : 智能问答、试题生成 法律 : 智能法律助手,法律咨询 医疗 : 问诊,用药咨询 科研 问答理解类 常识、专业知识、多语言、多模态、角 色扮演 + 多轮对话、安全陷阱 推理类 情感推理、演绎推理、逻辑推理、归纳 推理、类比推理 创作表达类 文字创作 & 创意、内容改写 / 续写、修改 / 润色、文字处理、编辑 / 语义匹配、摘 要提取、关键、字提炼、标题生成、文 本风格迁移、图像创作、短视频创作 ( 文 生视频 ) 、其他创作 ( 文学艺术、商 业通 用 ) 数学类 小学数学、初中数学 高中数学、高等数学 推理类 代码生成、编程翻译 代码解释、代码纠错 代码自动补全 生成代码文档 单元测试 产业研究 战略规划 技术咨询 9 代码类 创作 数学类 表达类 问答 理解类 推理类 应用能力 基础能力 Ernie-4.0 Qwen-Max-0428 SenseChat V5 Tencent Hunyuan Spark 4.0 Ultra 产业研究 战略规划 技术咨询 10 我们跟踪研究了多个通用大模型,其中包括: CongRong 2.0 Pangu 5.0 Yi-Large GLM-4 Baichuan4 技术端 模型整合统一 未来的技术演进方向是实现大模型底层框架的整合与标准化,从多样的架构(如双编码器、 单边解码等)转向统—的、效率最优化的开源底层框架 ,提升模型的通⽤性和可维护性。 参数规模扩展 为确保模型质量和性能,未来的大模型将采⽤更深层的⽹络结构和更庞⼤的数据集进⾏预 训练,尤其在数据量和参数量上将迎来显著跃升。 多模态融合 大模型将逐渐融入图⽚ 、⾳频、视频等多种模态信息 ,实现跨模态的交互与理解 ,从⽽拓 宽其应⽤场景和实⽤价值。 大模型小模型化 在产业应⽤层⾯ ,结合底层基础大模型和针对特定⾏业的精简数据微调,将训练出更为实 用、更易于产业落地的小型化大模型。 产业端 国产 AI 芯片自主研发 为确保中国大模型的长远发展和避免外部制裁风险,国内 AI 计算芯片的自主研发将成为关 键战略方向。 数据产权标准深化 优化和完善现有数据标准和规范,是 推动大模型“燃料”质量提升和数量增长的重要驱动 力, 在 2024 年将作为产业发展的首要任务。 “ 套壳”微调策略 为满足产业实际需求并适应中小企业的发展特点,“套壳”微调(即在现有大模型基础上 进 ⾏针对性调整)将成为除行业巨头外企业的主要发展策略。 人工智能伦理责任 随着大模型性能的飞速提升和实⽤性的增强 ,确保 AI 技术与社会伦理道德标准相—致将成 为⼤模型持续发展的关键考量因素。 在 2024 年,大模型的技术发展将趋向多功能与小型化,同时产业端将强调自主研发和行业标准 化 产业研究 战略规划 技术咨询 11 来源:沙利文中国大模型测评报告 过去四年大语言模型在 MMLU 榜单 ( 评估大模型知识能 力 ) 上的性能表现 大模型时代的摩尔定律 大模型的知识密度每 8 个月左右会翻一倍 , 同等知识量的模型参数量会减半 右图显示了过去四年大语言模型在 MMLU 榜单(评估大模型知识能力)上的性能表现, 红色曲线表明 ,大模型的知识密度平均每 8 个月左右会翻一倍, 同等知识量的模型其 参 数量会减半 知识密度 = 知识量 / 参数量 产业研究 战略规划 技术咨询 12 来源:面壁智能公众号 随着时间增长 , GPT-4V 水平的不同 多模态模型参数量正在逐渐缩减 面壁智能 在 2 0 2 4 年 5 月 发 布 的 多 模 态 大 模 型 MiniCPM-Llama3-V 2.5 仅凭 8B 参 数 , 实现了“以最小参数 , 撬动最强性 能 ” 的最佳平衡点。 面壁智能迭代的最新版本 MiniCPM-S 1.2B 采用了高度稀疏 架构 ,通过将激活函数替换为 ReLU 及通过带渐进约束的稀 疏感知训练 ,巧妙地解决了此前主流大模型在稀疏激活上面 临的困境。 在通用大模型越来越卷参数规模和算力的情况下 ,如何通过 架构和算法创新去规避算力和成本的短板 ,我们认为小参数、 高性能模型是一个重要的趋势 ,特别对于手机、车载终端而 言 ,这样的端侧模型具有现实的需求。 产业研究 战略规划 技术咨询 13 来源:面壁智能公众号 文心一言沿袭了 ERNIE 3.0 的海量无监督文本与大规模知识图谱的平 行 预训练算法 ,模型结构上使用兼顾语言理解与语言生成的统一预训 练框 架。为提升模型语言理解与生成能力 ,研究团队进一步设计了可 控和可 信学习算法。 结合百度飞桨自适应大规模分布式训练技术和“鹏城云脑Ⅱ ”领先算力 集群 ,解决了超大模型训练中的多个公认技术难题。在应用上 ,首创 大 模型在线蒸馏框架 ,大幅降低了大模型落地成本 是最重要的落地场景之一。 来源:文心一言官网 与百度的方案类似,各科技大厂基于云平台、算力基础设施和大模型技术相结合,推动行业应用落地,汽车产业链当然也 产业研究 战略规划 技术咨询 14 算法框架上 训练上 目前海外特斯拉、 Wayve 、 Comma.ai ,国内包括小鹏、理想、华为、蔚来汽车、元戎启行、商汤、地平线等诸多玩家都提出自己的 端 到端自动驾驶方案,在算法上端到端已经成为大势所趋。 但在发展路径上,行业预计也会经历渐进的过程。早期玩家致力于将算法从模块化架构平稳过渡到端到端,远期大语言模型和端到端 基 础模型有望结合形成“系统一”和“系统二”共同赋能自动驾驶,最终强大的通用人工智能( AGI )或许可覆盖所有驾驶能力。 算力层面 规模法则驱动下,海量的算力成为开发优秀 AI 算法的基础 数据方面 数据的体量、质量、以及收集方式、处理方式、以及模型的训练和验证体系都考验着开发者的技术和工 程能力 算法层面 如何构建一个性能优异且稳定可靠的算法来支撑功能落地,亦尤为关键 产业研究 战略规划 技术咨询 15 对自动驾驶而言,与所有 AI 应用类似,算力、算法、和数据三要素都必不可 少 端 到 端 模 型 多模态大语言模型 AGI 通用世界模型 算法 场景 数据 算力 算法 数据 框架 • 四种竞争要素缺一不可; • 持续的产品迭代能力; • 逐步建立于自研芯片或者国产芯片的 算 力建设; • 汽车行业的合作与量产应用; 场景 大模型 行业 大模型 通用大模型 产业研究 战略规划 技术咨询 16 • 单一场景的技术积累; • 广泛的汽车行业客户与量产应用; • 可以允许“套壳”与 API 调用; • 单场景技术方向的领先发展潜力; • 多场景的覆盖能力与量产应用; • 持续的产品迭代能力; • 走向通用世界模型的潜力; 竞争因素 评选原则 数据 场景 服务 产业研究 战略规划 技术咨询 17 Tier1 提高客户整体解决方案竞争力 通用大模型公司下沉行业应用场景 自动驾驶方案商发展垂类大模型 主机厂向科技企业转型 四类 参与者 ins puT 浪 潮 Neu soft 4 面壁智 能 轻 舟 Q C R A F T 主机厂 N 公司 1 公司 2 主机厂 1 主机厂 2 供应商 1 供应商 2 供应商 3 产业研究 战略规
下载文档到本地,方便使用
共 59 页, 还有 3 页可预览, 继续阅读
文档评分
请文明评论,理性发言.