pdf文档 国元证券-汽车智能驾驶行业深度报告:端到端与AI共振,智驾平权开启新时代 VIP文档

6.54 MB 95 页 0 下载 53 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pdf
3
概览
端到端与AI共振,智驾平权开启新时代 ——汽车智能驾驶行业深度报告 证券研究报告 发布时间:2025年3月31日 分析师:刘乐 执业证书编号:S0020524070001 邮箱:liule@gyzq.com.cn 分析师:陈烨尧 执业证书编号:S0020524080001 邮箱:chenyeyao@gyzq.com.cn 智能驾驶行业研究 请务必阅读正文之后的免责条款部分 目录 2 1.端到端发展进入加速期,基于规则长期护航 1.1 端到端的定义、发展历程、实现方法及挑战 1.2 自动驾驶产业支持充足,标志性政策落地 1.3 车企抢滩DeepSeek,AI行业与智能驾驶共振 1.4 10万级别智驾落地推动行业进入智驾平权 1.5 汽车行业加速迈向智能驾驶全面普及时代 2.关注自研核心算法的整车企业 2.1 特斯拉:纯视觉方案+一体化端到端先驱 2.2 华为鸿蒙智行:模块化端到端,聚焦生态整合与全域协同 2.3 小鹏:云端蒸馏模型+纯视觉方案,大幅提升车端上限 2.4 理想:双系统并行,VLM规范端到端模型下限 2.5 比亚迪:智驾平权加速,边际变化可期 3.智能驾驶产业链 3.1 车端:电子电气架构向中央计算迈进 3.2 感知层 3.2.1 传感器数量减配、性能提升 3.2.2 激光雷达市场快速增长,格局集中 3.2.3 高阶智驾需要激光雷达提供安全冗余 3.2.4 前视摄像头市场分散 3.2.5 从全量感知到按需感知的算法演进 3.3 决策层 3.3.1 域控制器构成 3.3.2 智驾域控市场逐渐走向合作定制化 3.3.3 德赛西威:高算力智驾域控行业的领军企业 3.3.4 Momenta:提供基于端到端技术架构的自动驾驶解决方案 3.3.5 智驾域控芯片市场的竞争格局呈现多极化,SoC高性能更 适应未来趋势 3.3.6 地平线:软硬结合是必由之路 3.3.7 黑芝麻智能:依托技术创新,构建自动驾驶芯片产品矩阵 3.4 执行层 3.4.1 线控底盘结构及优势 3.4.2 智驾渗透加速线控底盘国产放量,行业格局集中,主机厂 粘性高 3.4.3 线控底盘技术在自动驾驶领域的应用正逐渐普及 3.4.4 拓普集团:业务体系多元化,已形成XYZ三大系列产品线 3.4.5 线控制动发展历程 3.4.6 线控制动:EHB One-Box当前是主流方案 3.4.7 伯特利:线控制动持续攀升,全面打造XYZ三轴汽车底盘 控制系统供应商 3.4.8 线控转向:L4级及以上自动驾驶必备,尚处市场导入期 4.投资建议 5.风险提示 请务必阅读正文之后的免责条款部分 3 端到端发展进入加速期,基于 规则长期护航 1 请务必阅读正文之后的免责条款部分 图1:端到端与模块化自动驾驶 资料来源:电动车公社,国元证券研究所 4 端到端的定义:基于数据驱动的深度学习 在广义语境中,端到端是一种研发范式,指在一个任务中,从输入端到输出端,中间不经过任何其他处理环节,由 一个模型完整实现输入到输出的全过程。在智能驾驶领域,端到端架构是指车辆将传感器采集的信息直接输入统 一的深度学习神经网络,经过处理后直接输出驾驶命令。深度神经网络赋予端到端模型强大的学习能力,使其能 从大量驾驶数据中自动学习复杂的驾驶模式和场景特征。 传统智驾系统的感知层、决策规划层和控制执行层之间 相互独立,信息传递容易积累误差,且智驾方案依赖于 工程师通过代码制定的规则,难以处理所有复杂场景, 边际效应随着智驾能力的提升呈现几何式骤减。与基于 规则的传统自动驾驶算法结构相比,端到端算法基于数 据驱动,可以实现信息的无损传递。同时,端到端架构 将感知、预测和规划结合为一个可以共同训练的单一模 型,整个系统都针对最终任务进行优化,并且共享的骨 干网络大幅提高了计算效率,使智驾方案具备更高的迭 代效率,有效降低了维护成本。 请务必阅读正文之后的免责条款部分 图2:端到端技术演进 资料来源:辰韬资本,Ai fighting,国元证券研究所 5 从模块化方案向一体化端到端模型过渡 端到端架构的本质是深度学习的全面使用与数据驱动。根据感知模块与决策模块之间的贯通程度,可分为模块化 端到端与一体化端到端。 模块化端到端将感知模块和决策规划模块视为两个独立部分,分别使用神经网络,但模块之间仍存在人工设计的 数据接口。例如,华为乾崑ADS 3.0由GOD感知网络和PDP决策规划网络组成,GOD负责感知障碍物,PDP则根据感知 信息迅速做出决策。一体化端到端则将感知与规控模块全部打通,形成一个统一的大模型,使系统能够更直接、 高效地处理信息并作出反应。业内典型代表为特斯拉、Momenta、理想等。这种架构取消了模块划分,减少信息损 失的同时,对数据标注的需求也更少,同时具有更强的泛化性。从模块化端到端到一体化端到端是一种相对平滑 的过渡形式。随着算法优化,技术将逐步向一体化端到端或端到端+多模态大模型的冗余双系统架构演进。 感知“端到端”: 当前的主流感知算法路线 模块化“端到端”: 决策规划控制模块升级“端到端”并且两模块间的的数据传递 有望由人为定义的结果抽象为特征向量 0ne Model/单一模型“端到端”: 原始信号输入到最终规划轨迹的输出直接采用单一深度神经网 络实现 请务必阅读正文之后的免责条款部分 图3:UniAD架构设计概览 资料来源:Hu Y, Yang J, Chen L, et al,Planning-oriented Autonomous Driving,国元证券研究所 6 端到端的发展历程 • 早期探索阶段(2016-2018年) 2016年:英伟达(NVIDIA)推出DAVE-2。端到端概念的提出 可 以 追 溯 至 英 伟 达 于 2016 年 发 表 的 论 文 《 End to End Learning for Self-Driving Cars》。同年,英伟达发布了 基于卷积神经网络(CNN)的端到端自动驾驶系统DAVE-2, 通过摄像头图像直接输出转向指令。这是端到端技术的早期 尝试,标志着自动驾驶从模块化向一体化迈进的起点。 2017年:Wayve.AI成立并发布“Learning to Drive in a Day”。Wayve.AI采用强化学习结合深度学习的方法,仅用 一天时间训练即可应对复杂城市驾驶场景,展示了端到端技 术在快速学习和适应能力上的潜力。 2017 年 : Comma.ai 推 出 OpenPilot 。 Comma.ai 发 布 了 OpenPilot软件,最初为L2级辅助驾驶系统,后逐步转向端 到端神经网络模型,成为首个商业化端到端自动驾驶产品。 • 技术突破与现实应用阶段(2019年-) 2021年:特斯拉发布BEV(Bird Eye View)技术。特斯拉在 AI Day上公布了BEV技术架构,通过多传感器融合实现感知 模块的端到端化,为后续端到端技术的全面应用奠定了基础。 2023年:特斯拉FSD V12发布。特斯拉正式推出FSD V12版本, 采用端到端架构,实现了感知、决策、规划的一体化,显著 提升了驾驶体验的拟人化和安全性。这一版本成为行业标杆, 推动了全球车企加速端到端技术的研发。 2023年:OpenDriveLab发布UniAD。OpenDriveLab推出了全 栈Transformer端到端模型UniAD,整合感知、预测和规划模 块,进一步提升了复杂场景下的环境理解和决策能力。 Pipeline架构 MontionFormer Planner OccFormer 请务必阅读正文之后的免责条款部分 强化学习(RL) 策略蒸馏 多模态/先进结构 合成数据 模仿学习(IL) 条件模仿学习 泛化 可解释性 策略预训练 模块化端到端 图4:端到端发展历程 资料来源:Chen L, Wu P, Chitta K,et al,End-to-end Autonomous Driving: Challenges and Frontiers,国元证券研究所 端到端的发展历程(续) 7 端到端自动驾驶的起源可以追溯至1988年,当时ALVINN系统利用相机和激光测距仪的输入,通过简单神经网络生成转向指令。 2016年,英伟达开发了端到端CNN原型系统,推动了这一概念在GPU计算时代的发展。随着深度神经网络的进步,端到端自动驾 驶在模仿学习和强化学习方面取得突破,LBC中的策略蒸馏方法通过模仿优秀专家,提升了闭环性能。 为增强系统的泛化能力,尤其是针对专家策略和学习策略之间的差异,业内研究提出了在训练过程中聚合在线数据的策略。 2021年左右,端到端自动驾驶迎来重要转折点。随着传感器配置在合理计算预算内普及,研究重点转向融合更多感知模态和先 进架构(例如Transformer),以捕捉全局上下文和关键特征,例如TransFuser及其变体。这些设计结合对仿真环境的深入理解, 使模型在CARLA基准测试中显著提升性能。 为提高自主系统的可解释性和安全性,一种解决方案是引入各种辅助模块以更好地监督学习过程,另一种则采取注意力可视化。 2023-2024年,研究重点聚焦生成安全关键数据、预训练策略学习的基础模型或骨干网络,推动感知与规划模块的端到端整合。 同时,更具挑战性的CARLAv2和nuPlan基准测试也被引入。 请务必阅读正文之后的免责条款部分 端到端实现方法:模仿学习 8 算法实现层面,端到端的方法可以大致分为模仿学习和强化学习。 模仿学习也称为从示范中学习,是一种通过模仿专家行为来训练智能体学习策略的方法。模仿学习中,一种 广泛使用的方法是行为克隆(BC),将问题转化为监督学习问题。另一种方法是逆最优控制(IOC,也称为 逆强化学习),利用专家示范来学习奖励函数。 表1:模仿学习的两大算法类别 类别 简述 优势 挑战 行为克隆(BC) 在行为克隆中,通过最小化规划损失 来实现智能体策略与专家策略的匹配, 其中监督学习中的损失函数用于度量 智能体动作与专家动作之间的距离。 早期应用于自动驾驶的BC,利用端到 端神经网络从摄像头输入生成控制信 号(如方向盘转动、加速等)。为了 使基于BC的端到端驾驶模型能够应对 复杂的城市场景,业内提出了进一步 改进,如多传感器输入、辅助任务和 改进的专家设计。 简洁性和高效性,因为无须手工设计奖励函数。 协变量偏移。协变量偏差指的是在训练过程中模型 训练时所用的数据分布(例如,某些路况、驾驶场 景的频率)与实际部署时遇到的数据分布(例如, 实际道路的复杂性和多样性)不一致。对于一般的 模仿学习,一些在线方法已经提出以解决这个问题。 在端到端自主驾驶的背景下一般采用DAgger方法。 因果混淆。即模仿者会利用并依赖于输入组件与输 出信号之间的错误相关性(模型可能会将某些表面 上相关的因素,如天气、交通状况,错误地认为是 决定驾驶行为的关键因素,从而导致决策不准确)。 逆最优控制(IOC) 逆最优控制是一种从专家示范中学习 的算法,通过观察专家驾驶员的行为 来推测出一个“奖励函数”。这个奖 励函数可以理解为:专家做出的每一 个动作都有一个“奖励值”,这些奖 励值反映了每个行为的好坏。逆最优 控制的主要方法分为对抗模仿学习 (GAIL)与成本学习(Cost Learning)。 对抗模仿学习(GAIL):不仅仅是模仿专家的行为,而是 通过让学习系统和专家系统之间“对抗”来学习最佳策略。 具体来说,GAIL的目标是让一个“判别器”区分专家行为 和学习行为,系统通过不断调整自己的行为,使得这个 “判别器”无法再区分专家的行为和系统自己的行为。 在自动驾驶的场景中,奖励函数的定义非常复杂, 因为要考虑的因素众多,比如路况、交通规则、其 他车辆的行为等等,而且这些因素是动态变化的。 所以,优化奖励函数非常困难。 成本学习(Cost Learning) :将“奖励函数”替换成 “成本函数”,两者含义相反。在成本学习中,自动驾驶 系统会学习如何选择最低成本的行为。例如,在路上行驶 时,系统会选择最少危险、最舒适的行驶轨迹,这些轨迹 的“成本”是最小的。成本函数可以有不同的表示方法, 例如鸟瞰图(BEV)中的成本体积、联合能量,以及概率语 义占用层和自由空间层。 成本学习方法中,为了生成更现实的成本,通常需 要结合高清地图(HD maps)、辅助感知任务和多 传感器数据,这增加了为多模态多任务框架学习和 构建数据集的难度。 资料来源:Chen L, Wu P, Chitta K,et al,End-to-end Autonomous Driving: Challenges and Frontiers,焉知汽车,国元证券研究所 请务必阅读正文之后的免责条款部分 端到端实现方法:强化学习 9 强化学习是一种通过“试错”学习的方法。智能体(比如自动驾驶系统)通过不断地尝试不同的动作,并根据结 果得到奖励或惩罚,从而学习哪些动作是好的,哪些是不好的。这种方法最早依托于“深度Q网络”(DQN)应用 在Atari游戏中,通过学习来控制游戏中的角色。 在自动驾驶中,强化学习的目标是让车辆学会在复杂多变的交通环境中做出最优决策,例如如何转弯、加速、刹 车等。由于驾驶过程中存在众多不确定因素,如交通流量、路况变化等,决策任务极为复杂。强化学习通过让系 统与环境互动,不断优化驾驶策略,从而提高驾驶的舒适性和安全性。 强化学习在应用中面临的主要挑战是需要大量的数据进行训练,而现实中很难保证所有可能的情况都能被模拟出 来,并且训练过程需要大量的“试错”。为了弥补强化学习的不足,许多研究选择将强化学习与监督学习(SL) 结合,例如隐式效用,通过使用监督学习对CNN编码器进行预训练。监督学习通过“标注数据”助力系统更好地理 解环境,强化学习则帮助系统在复杂环境中逐步优化自身策略。二者结合,让系统既能从已有的知识中学习,又 能在实践中持续改进。 图5:行为克隆(BC) 资料来源:Chen L, Wu P, Chitta K,et al,End-to-end Autonomous Driving: Challenges and Frontiers,焉知汽车,国元证券研究所 图6:逆最优控制(IOC)方法 图7:强化学习方法 请务必阅读正文之后的免责条款部分 10 端到端的挑战:数据 由于端到端算法基于数据驱动,大模型依赖大量的高质量数据进行训练。以训练数据为核心,重点关注数据量、数 据标注、数据质量、数据分布、云端存储与超算中心等因素。2023年,特斯拉在端到端神经网络开发初期,就向系统 输入了1000万个经过筛选的人类驾驶视频片段,按每段15秒估算,高清视频的总计时长超过4万小时。根据特斯拉的 测算,单个端到端模型至少需要经100万个分布多样且高质量的视频片段训练才能正常运作。此外,在大规模数据收 集的基础上,需要对海量道路场景的数据进行标注,将其转化为支撑算法训练的数据,这也需要重资产投入。因此, 优质训练数据的体量与企业的自研实力、综合产品力、资金投入、智驾车型销量等因素密切相关,这些因素在一定程 度上强化了车企的马太效应。 真实数据中,长尾场景覆盖率低。长尾场景(暴雨、积雪或施工复杂环境中事故高发区域)中,车辆的行为决策需要 高度鲁棒的模型支持,然而,这些场景在真实数据中占比极低,难以通过传统的路测覆盖全面。现有的仿真测试技术 只能生成部分场景,而针对动态交互场景(如复杂的多车协同避让)的模拟能力有限,导致验证结果难以完全反映真 实情况。因此,调整长尾场景在训练数据中的分布比例有很大的探索价值。目前的普遍解决方案是采用合成数据来模 拟真实世界数据的特征分布。合成数据能够以较低成本增加训练数据的规模、丰富泛化场景的多样性,并有效生成长 尾场景。例如,英伟达通过其Omniverse平台,利用合成数据提升模型对复杂场景的适应性。此外,特斯拉也采用合 成数据生成边缘场景来扩充数据集,通过迭代方法捕捉更多边缘情况。 表2:主要车企辅助驾驶里程累计情况 特斯拉 鸿蒙智行 理想 蔚来 小鹏 超16亿英里(2024年中报) 4.6亿公里(2024.08) 29.3亿公里(2024.12) 14.8亿公里(2024.11) 756万公里(实车测试里程, 2024.07) 资料来源:汽车之心,中工汽车网,中国财经报,AI新能源低碳出行,国元证券研究所 请务必阅读正文之后的免责条款部分 道路交通的复杂程度与训练数据的体量使端到端的落地对于算力有极高的要求。道路交通环境的复杂性并不能完 全用交通规则来覆盖。例如,机动车道上闯入的行人、自行车、两轮电动车等非规则的情况千差万别,难以用理 论模型来归纳概括,只能尽可能扩大数据库来“教”自动驾驶系统,这无形中就会提升算力需求。从特斯拉的 FSD自动驾驶系统看,端到端所需算力成倍增加:FSD V12全面采用端到端,用3000行代码替代了原来的30多万行 代码,但算力要求提升了10倍,整个平台算力需要达到3000~5000T0PS才能满足端到端的需求。除了对车端算力 的需求外,对云端算力要求也很高。由于端到端系统依赖大规模数据集,训练过程对算力资源需求极高,尤其是 为了使大模型具备复杂路况识别能力,需要在大量模拟场景和真实世界数据上进行训练。通常,样本量越大,系 统越成熟,这也推动了对高性能计算芯片和计算模块的需求。目前,特斯拉超算中心的算力支持由其自研的D1芯 片和自研的超级计算机Dojo组成,投资约10亿美元。而国内一些车企的端到端则更多使用了云计算方案,如小鹏 汽车的云计算大模型等。 图8:一体化端到端架构 资料来源:Chib P S , Singh P,Recent Advancements in End-to-End Autonomous Driving using Deep Learning: A Survey,国元证券研究所 端到端的挑战:算力&算法可解释性 11 端到端的另一挑战是大模型的黑盒属性。由于端到端 模型直接从输入(传感器数据)到输出(控制指令) 进行映射,决策过程是一个复杂的非线性映射,难以 直观理解其内部逻辑。决策过程不透明且缺乏可解释 性,可能导致开发者在调试和优化模型时难以定位问 题的根源,造成模型调试和优化上的困难,安全性难 以验证。 请务必阅读正文之后的免责条款部分 国内政策:产业支持充足,标志性政策落地 12 表3:相关政策文件及内容 发布时间 发布/制定单位 文件名称 相关内容 2020.10.20 国务院 《新能源汽车产业发 展规划(2021—2035 年)》 推动新能源汽车与信息通信融合发展,推进以数据为纽带的“人—车—路—云”高效协同。基于汽车感知、交通管 控、城市管理等信息,构建“人—车—路—云”多层数据融合与计算处理平台,开展特定场景、区域及道路的示范 应用,促进新能源汽车与信息通信融合应用服务创新。 2023.11.17 工信部等四部 门 关于开展智能网联汽 车准入和上路通行试 点工作的通知 在智能网联汽车道路测试与示范应用工作基础上,工业和信息化部、公安部、住房和城乡建设部、交通运输部遴 选具备量产条件的搭载自动驾驶功能的智能网联汽车产品,开展准入试点;对取得准入的智能网联汽车产品,在 限定区域内开展上路通行试点,车辆用于运输经营的需满足交通运输主管部门运营资质和运营管理要求。本通知 针对智能网联汽车搭载的3级和4级驾驶自动化功能。 2024.1
下载文档到本地,方便使用
共 95 页, 还有 1 页可预览, 继续阅读
文档评分
请文明评论,理性发言.