国元证券-汽车智能驾驶行业深度报告:端到端与AI共振,智驾平权开启新时代比亚迪:智驾平权加速,边际变化可期 3.智能驾驶产业链 3.1 车端:电子电气架构向中央计算迈进 3.2 感知层 3.2.1 传感器数量减配、性能提升 3.2.2 激光雷达市场快速增长,格局集中 3.2.3 高阶智驾需要激光雷达提供安全冗余 3.2.4 前视摄像头市场分散 3.2.5 从全量感知到按需感知的算法演进 3.3 决策层 3.3.1 域控制器构成 3.3.2 智驾域控市场逐渐走向合作定制化 从大量驾驶数据中自动学习复杂的驾驶模式和场景特征。 传统智驾系统的感知层、决策规划层和控制执行层之间 相互独立,信息传递容易积累误差,且智驾方案依赖于 工程师通过代码制定的规则,难以处理所有复杂场景, 边际效应随着智驾能力的提升呈现几何式骤减。与基于 规则的传统自动驾驶算法结构相比,端到端算法基于数 据驱动,可以实现信息的无损传递。同时,端到端架构 将感知、预测和规划结合为一个可以共同训练的单一模 型 端到端架构的本质是深度学习的全面使用与数据驱动。根据感知模块与决策模块之间的贯通程度,可分为模块化 端到端与一体化端到端。 模块化端到端将感知模块和决策规划模块视为两个独立部分,分别使用神经网络,但模块之间仍存在人工设计的 数据接口。例如,华为乾崑ADS 3.0由GOD感知网络和PDP决策规划网络组成,GOD负责感知障碍物,PDP则根据感知 信息迅速做出决策。一体化端到端则将感知与规控模块全部打通,形成一个统一的大模型,使系统能够更直接、10 积分 | 95 页 | 6.54 MB | 5 月前3
智驾地图市场研究报告(2025)-32页Reserved. 研究背景 智能驾驶技术正加速从早期“功能验证”向“全域场景”突破,头部整车厂与科技公司大规模投入车规 级大模型、“世界模型”等自动驾驶方案,智驾地图作为支撑自动驾驶决策与感知的关键底层能力,如 何成为实现自动驾驶落地和差异化体验的基础保障? 随着舱驾一体化架构成为主流,智驾地图成为连接座舱体验与驾驶功能的关键枢纽,如何实现从导航指 引到更优的出行体验的全面升级? ght@2025,Beijing Taibo Co., Ltd. All Rights Reserved. 智驾地图是支撑L2级及以上智能驾驶系统的关键数据基础设施,其核心价值在于补充车载实时感知、提 供超视距信息及优化路径规划。 智驾地图正从重几何精度的高精地图向更注重拓扑、语义与鲜度的轻量化地图演进,其具体形态随自动 驾驶算法需求动态演进,众源更新成为保障鲜度的关键技术。 5 - 支撑城市NOA落地 - 众源更新探索 轻地图成为主流 重语义/拓扑/规划 - 与端到端算法深度 融合 - 地图成为在线先验 与离线训练数据源 - 兼顾AP友好性 驱动: 感知算法进步 (Transformer, BEV等) 驱动: 成本压力/规模化 (数据闭环, 众源成熟) • 精度按需: 对绝对几何精度要求动态调整,部分场景下拓扑关系与 语义准确性优先度更高。10 积分 | 32 页 | 5.32 MB | 4 月前3
人形机器人标准化白皮书(2024版).......................................................................................36 2.2.3 多模态感知与场景理解.............................................................................................. 机交互实现任务理解与反馈,需要强大的感知计算与运动控制能力 (《创业邦》); 2)人形机器人是一种仿生机器人,指形状与尺寸与人体相似,能 够模仿人类运动、表情、互动与动作的机器人,并具有一定程度的认 知和决策智能(《高工咨询》); 3)人形机器人是一种模仿人类外形的机器人,除具备人形和模拟 人类动作外还兼具智慧化和可交互性等特点。 人形机器人主要包含三 大核心技术模块:环境感知模块、运动控制模块和人机交互模块(《觅 则和指令,虽然可以在一定程度上应对环境变化,但并不一定具备真 正的理解和适应能力。智能性是指物体或系统具有类似人类的智慧、 学习和适应能力,智能体能够感知环境、进行决策并采取行动,同时 不断学习和优化自身行为,以实现特定目标。这种能力不仅要求具备 自主性,还需要具备感知、学习、适应和决策等更高级的功能。所以 虽然所有机器人都具备自主性,但是并不是所有机器人都具备智能性, 机器人中具备智能性的那部分为智能机器人。0 积分 | 93 页 | 3.74 MB | 5 月前3
2025年人形机器人应用场景洞察白皮书-工业场景篇Reserved. 人形机器人细分场景落地顺序评估逻辑 …聚焦工业/家庭/商业领域细分场景落地顺序,需评估两大维度①场景结构化程度(环境、工具)②任务复杂程度(动作、交 互理解)。对机器人的四大关键能力提出需求(感知、运控、决策、交互) 7 一级指标 二级指标 能力等级 指标定义 结构化程度 环境 1 路线与物品位置固定 2 路线涉及物体机械移动 3 路线涉及生物自主移动 操作工具 1 不使用工具/使用固定工具 语音指导行动,动作不接触 3 语音指导行动,动作接触/长时间配合 工 作 环 境 复 杂 程 度 任 务 复 杂 程 度 场景与任务对人形 机器人的要求评估 感知 决策 运控 交互 从人形机器人面临的环境、任务的复杂程 度入手,对应机器人感知、决策、运控、 交互四大能力,全方位评估各场景任务对 人形机器人的要求难度,进而映射人形机 器人在各场景任务的落地时间顺序。 人形机器人四大能力需求 要求安装精准度与速度 新能源车场景适配工种 vs 人形机器人能力需求 …不同工种对人形机器人关键能力提出不同要求。其中,关键指标涉及感知(图像识别等)运控(响应速度、精度、静态载荷等) 决策(避障策略、路线规划、任务泛化等)交互(语义理解等) 15 质检类 搬运类 基础组装类 工站衔接类 感知 运控 决策 交互 新能源车场景人形机器人适配工种 人 形 机 器 人 能 力 需 求 ✓ 图像识别能力10 积分 | 33 页 | 2.38 MB | 5 月前3
智能机器人行业产业研究报告2025-20250318-极光大数据39405-2020)将机器人定义为:具有两个或两个以上可编程的轴,以及一定程度的自主能力,可在其环境内运动以执 行预定任务的执行机构。以此为基础,极光月狐研究院将智能机器人定义为:加入智能技术,能够实现自主感知、交互、决策、执行等操作的机器人。 定义及分类:从机械化、单一化向高度智能化、泛在化迈进, 智能机器人历经数十年技术革新与应用探索,仍在持续突破 资料与数据来源:公开资料,月狐研究院整理 5 容如控制代码、任务分解等指令 Ø 利用多模态大模型对环境进行建 模, 实现具身智能对空间信息的 多模态理解 Ø 机器人能够从数据中学习决策与 规划策略,基础模型为机器人决 策与规划引入了丰富的先验知识。 感知、交互与决策 大模型在控制上的助力主要集中于大模型处理环境观察与提示,输出动作序 列,动作序列可以是一系列关节角度或末端执行器的位姿与夹爪开合数据, 这些序列将直接用于控制机器人的运动。 控制 于人工智能大模型的人形机器人“大脑”与 开发控制人形机器人运动的“小脑”。大模型作为最爆火的人工智能概念,推动了人形机器人大脑的形成,助力人形机器人具有人的感知、交互与决策能力;对 于控制系统仍在切入中。 中游:大模型与机器人本体结合提供感知交互新能力 资料与数据来源:《基于大模型的具身智能系统综述》 大 模 型 赋 能 传 统 控 制 “我渴了,需要喝水” 导航至水杯、抓取水杯、 导航至用户0 积分 | 24 页 | 3.34 MB | 5 月前3
2025具身机器人行业未来展望报告丘脑:感觉信息的中转,将视觉、听觉传递至大脑 皮层 下丘脑:调节体温、饥渴、睡眠周期,并控制内分 泌系统 人脑结构与机器人大脑对应关系 01 7 资料来源:浙商证券产业研究院 依照低层次感知到高层次感知逐个来看,人脑的间脑与脑干在机器人中对应的主要是(1)各类传感器及执行器自身部署的嵌入式驱动及算法。 各类传感器及执行器包括旋转执行器、直线执行器、力传感器、温度传感器、姿态传感器等,此类部件一般内部配有MCU,其内部的嵌入式 RT-2」为代表,通过一个神经网络完成从任务目标输 入到行为指令输出的全过程。首先在大规模互联网数据预训练视 觉语言模型,然后在机器人任务上微调,结合机器人动作数据, 推出视觉语言动作模型。RT-2不仅负责最上层的感知与规划,还 参与中下层的控制与执行,打通了端到端的链路。端到端模型的 缺点是:训练数据海量、消耗资源巨大、机器人执行实时性差。 训练方案技术路线 03 14 资料来源:量子位智库、浙商证券产业研究院 nie Operator-1),提出了Vision-Language-Latent-Action (ViLLA) 架构,该架构由VLM+ MoE组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规 划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执0 积分 | 31 页 | 3.33 MB | 4 月前3
信通院:“机器人+人工智能”工业应用研究报告2025Geoffrey E. Hinton,以 表彰利用人工神经网络进行机器学习的基础发现和发明。对于机器人 产业来说,物理智能将使机器人能够理解 3D 世界的空间关系和物理 行为,赋予机器人更强的环境感知、理解和交互能力,实现更广泛的 功能应用,如宇树科技的机器人实现了原地侧空翻、复杂舞蹈动作、 平衡木行走、灵巧手操作等复杂功能。 硬件和软件的深度协同推动了算力效能的提升,为机器人的大规 模应用提供了算力支持。2024 人工智能技术的进步和机器人应用的扩展(图 1)。第一阶段是无智 4 能阶段,机器人只能执行简单的预设任务,缺乏自主性和适应性;第 二阶段是基础智能阶段,机器人开始具备基本的感知能力,能够对外 界环境做出简单的反应;第三阶段是中等智能阶段,机器人能够进行 更复杂的感知和处理任务,如图像识别和语音识别;第四阶段是高度 智能阶段,机器人展现出较高的自主性和适应性,能够进行自我学习 和优化,执行复杂的任务;第五阶段是超级智能阶段,机器人理论上 段,机器人理论上 将具备超越人类的智能水平,能够进行创新和自我意识的决策。 在工业领域,机器人的规模化应用正在从中度智能向高度智能过 渡。随着深度学习算法的优化以及多模态感知技术的融合,工业机器 人将具备更强大的感知、认知和决策能力,能够更加精准地识别复杂 环境中的物体、声音和图像,理解人类的语言和意图。同时,工业机 器人将具备更强的自主学习能力,能够根据环境变化和任务需求进行 自我0 积分 | 37 页 | 2.06 MB | 5 月前3
2025年DeepSeek手册:DeepSeek给我们带来的创业机会人工智能发展历程(一) 从早期基于规则的专家系统,走向基于学习训练的感知型AI 从基于小参数模型的感知型AI,走向基于大参数模型的认知型AI 从擅长理解的认知型AI,发展到擅长文字生成的生成式AI 从语言生成式AI,发展到可理解和生成声音、图片、视频的多模态AI 从生成式AI,发展到推理型AI 专家系统 感知AI 认知AI 生成式AI 多模态AI 推理式AI 9 政企、创业者必读 球团1颗粒粒度检测 • 球团1现场生产安全 态势感知与预警 • 皮带机预测性维护 • 建立设备健康模型 • 焦化皮带智能监测 • 生产现场动作远程控制 • 焦化现场生产安全态势 感知与预警 • 部署打滑预测分析 • 能源计划 • 炼焦煤分级调湿工艺稳 定协调控制 • 焦化皮带智能监测 • 生产现场动作远程控制 • 焦化现场生产安全态势 感知与预警 • 部署打滑预测分析 • 能源计划 • • 钢包水口位置定位 • 钢包顶升高度预测 • 钢包吊钩姿态监测 • 钢包温度远程智能监测 • 钢包坐罐过程识别 • 钢包挂罐过程识别 • ·转炉吹氧自动控制 • 炼钢现场生产安全态势感知与预警 • 炼钢过程智能调度 • 能源动态管控 • 碳资源智能分析 • 电弧炉炼钢尾气检测与控制 • 钢包内渣状态识别 • 渣罐残留水识别 • 钢包挂钩挂实确认 • 钢包内渣状态识别10 积分 | 76 页 | 5.02 MB | 5 月前3
北京金融科技产业联盟:2025年数字孪生技术金融应用研究报告北京市委金融委员会办公室于 2024 年 10 月 28 日发布,旨在通过数字技术推动金融业高质量发展,服务数字经济和数字中国建设。 3 服务层:包含支撑数字孪生业务应用的各类技术服务, 包括感知技术类服务,通常有 IoT,5G 等类型服务。建模服 务,指通过技术手段对物理实际业务实体进行建模映射。渲 染服务,指根据通过建模服务得到的模型进行渲染,从而得 到一个与物理实体等价的虚拟实体。仿真服务,指在建立虚 字孪生提供了坚实的理论和技术支撑,正向着更加自动化、 智能化的方向不断发展。 5.感知类技术 感知类技术包括常见的物联网 IoT、射频识别 RFID、计 算机视觉和声波雷达等。IoT(Internet of things,物联 网)本质上是互联网从人向物的延伸,物联网是将“物”和 互联网相互连接的技术,涉及对于“物”的感知、信息采集、 传输和控制,用于实现物与物、人与物之间的信息交互。具 体而 动、更精准地 感知和管理。计算机视觉,以摄像机为常见载体,能感知物 理世界并能获取丰富的信息,在日常生活中已得到普遍地使 用,即使恶劣环境,已有基于太阳能发电、无线网络回传、 自动补光的高端摄像机。声波雷达又是一种高效且普遍的感 知技术,特别适用于对移动、变化的事物通过声波的测量和 监测。感知技术作为构建数字孪生的源头,针对不同环境、 场景和诉求,综合运用各种不同感知技术更全面、更多层面10 积分 | 53 页 | 2.07 MB | 5 月前3
清华:AI驱动政务热线发展研究报告(2025)能够促进医疗、教育等多种社 会服务平台的信息互通,同时通过对大数据等信息技术分析数据的动态演变规律, 及时对社会问题和社会风险进行甄别监测,将问题化解在基层,风险防控在事前, 真正实现政府风险感知、风险预测和风险防控能力的提升。 最后,大模型优化服务流程,进一步提升数字政府督办考核能力。 我国人口、面积、经济总量大的特征决定了民生诉求多、业务办理压力大的 客观现实,进而也容易滋生懒政怠 , 在统筹疫情防控和稳定经济增长的大背景下,如何更加及时、高效地感知和回应 社情民意、研判和处置社会风险成为我国政府亟待解决的重要难题。政务热线作 为我国政府感知民生、理解民意的重要渠道,同样面临着上述难题。在此背景下, 《意见》对新时期政务热线提出了新定位和新需求。 第一,政务热线是社情民意的“传感器”。政务热线是感知城市、社会和民 情的重要手段,是政府实现有效治理和提升治理能力的重要方式。随着各地实现 要方式。随着各地实现 多号归并、一号响应、多渠道融合,政府以政务热线为主渠道,整合微信公众号、 官方微博等多渠道诉求以感知民生热点和治理重难点所在。政务热线通过与市民 时刻“即联”,实时捕捉民情动向,及时查堵治理盲点。尤其是在疫情防控期间, 市民诉求往往多变和紧急,政务热线发挥着便捷联通的优势,汇聚最新消息,预 警最新风险。 政务热线的数智化转型进一步强化了其“传感器”功能,主要体现在数智化0 积分 | 58 页 | 1.68 MB | 5 月前3
共 26 条
- 1
- 2
- 3
