国元证券-汽车智能驾驶行业深度报告:端到端与AI共振,智驾平权开启新时代信息迅速做出决策。一体化端到端则将感知与规控模块全部打通,形成一个统一的大模型,使系统能够更直接、 高效地处理信息并作出反应。业内典型代表为特斯拉、Momenta、理想等。这种架构取消了模块划分,减少信息损 失的同时,对数据标注的需求也更少,同时具有更强的泛化性。从模块化端到端到一体化端到端是一种相对平滑 的过渡形式。随着算法优化,技术将逐步向一体化端到端或端到端+多模态大模型的冗余双系统架构演进。 感知“端到端”: 当前的主流感知算法路线 的情况都能被模拟出 来,并且训练过程需要大量的“试错”。为了弥补强化学习的不足,许多研究选择将强化学习与监督学习(SL) 结合,例如隐式效用,通过使用监督学习对CNN编码器进行预训练。监督学习通过“标注数据”助力系统更好地理 解环境,强化学习则帮助系统在复杂环境中逐步优化自身策略。二者结合,让系统既能从已有的知识中学习,又 能在实践中持续改进。 图5:行为克隆(BC) 资料来源:Chen L, 注数据量、数 据标注、数据质量、数据分布、云端存储与超算中心等因素。2023年,特斯拉在端到端神经网络开发初期,就向系统 输入了1000万个经过筛选的人类驾驶视频片段,按每段15秒估算,高清视频的总计时长超过4万小时。根据特斯拉的 测算,单个端到端模型至少需要经100万个分布多样且高质量的视频片段训练才能正常运作。此外,在大规模数据收 集的基础上,需要对海量道路场景的数据进行标注,将其转化为支撑算10 积分 | 95 页 | 6.54 MB | 5 月前3
北大:DeepSeek-R1及类强推理模型开发解读具备强大推理能力与长文本思考能力,继开源来备受关注。 DeepSeek R1-Zero 和 R1 的出现再次证明了强化学习的潜力所在: R1-Zero 从基础模型开始构建,完全依赖强化学习,而不使用人类专家标注的监督微调( SFT ); 随着训练步骤增加,模型逐渐展现出长文本推理及长链推理能力; 随着推理路径增长,模型表现出自我修复和启发式搜索的能力; DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 通常被认为是不可或缺的一步,其逻辑先用大量人工标注的数据来让 模型 初步掌握某种能力(如对话或者语言风格),然后再用 RL 来进一步优化性能 DeepSeek-R1 系列跳过对于大规模人工标注数据的依赖 无需构建和维护高质量的 SFT 数据集,而是让模型直接在 RL 环境中进行探索 类比:初学者在没有老师指导的情况下,通过不断的尝试和错误来掌握一门新的技能。 这种自主学习的方式,不仅节省了大量的标注成本; DeepSeekMath https://arxiv.org/pdf/2402.03300 DS-R1 Zero 跳过监督微调 SFT 阶段,展现出大规模强化学习的潜力。这种自主学习的方式,不 仅 节省了大量的标注成本,而且让模型更自由的探索解决问题的路径 ,而不是被预先设定的模 式所 束缚。这也使得模型最终具备了更加强大的泛化能力和适应能力。 为了充分释放 GRPO 的潜力并确保训练稳定性, DeepSeek10 积分 | 76 页 | 6.72 MB | 5 月前3
2024年中国人工智能产业研究报告来源:艾瑞咨询研究院自主研究绘制。 2024年,“后训练”和“强化学习”成为大模型技术创新的热点。后训练通常由大模型厂商在预训练模型基础上完成,其流程一般包括: 监督微调(SFT),即利用特定任务的标注数据对模型进行微调,使其学习任务模式;奖励模型(RM)训练,通过收集人类反馈数据训练 奖励模型,评估输出质量;以及强化学习(RL),利用奖励模型反馈优化模型,最终生成更符合人类偏好的输出等。由于代码、数学等领 以ViT为代表 (Vision Transformer) • 人脸识别、车辆识别 • 违停违放等行为检测 • 抽烟检测、安全帽检测 • 明厨亮灶检测等 • 泛化能力增强,可处理更多图像类 目,且标注工作变少 • 可识别分析图像质量不高、像素较 少的影像,可处理复杂影像,具备 进一步推理分析能力 • 如意图识别、微表情识别、人员追 踪、流量统计分析等 1)政策、技术升级驱动 2)商业驱动:前端摄像头路数及图像体量足 使用集成视觉和语言数据的方式进 行预训练,在不丢失语言能力的情 况下融入多模态能力 沿用DeepSeek V2模型结 构,具备全球顶尖的代码能 力和数学能力 在后训练阶段大规模使用强化学习 技术,在极少标注数据的情况下极 大提升模型推理能力 MoE架构的大语言模型,具 备多任务泛化能力,在知识 问答、长文本处理、代码生 成、数学问题求解等方面性 能领先 数学推理模型 DeepSeek Math0 积分 | 51 页 | 3.35 MB | 5 月前3
2024年中国人工智能产业研究报告来源:艾瑞咨询研究院自主研究绘制。 2024年,“后训练”和“强化学习”成为大模型技术创新的热点。后训练通常由大模型厂商在预训练模型基础上完成,其流程一般包括: 监督微调(SFT),即利用特定任务的标注数据对模型进行微调,使其学习任务模式;奖励模型(RM)训练,通过收集人类反馈数据训练 奖励模型,评估输出质量;以及强化学习(RL),利用奖励模型反馈优化模型,最终生成更符合人类偏好的输出等。由于代码、数学等领 以ViT为代表 (Vision Transformer) • 人脸识别、车辆识别 • 违停违放等行为检测 • 抽烟检测、安全帽检测 • 明厨亮灶检测等 • 泛化能力增强,可处理更多图像类 目,且标注工作变少 • 可识别分析图像质量不高、像素较 少的影像,可处理复杂影像,具备 进一步推理分析能力 • 如意图识别、微表情识别、人员追 踪、流量统计分析等 1)政策、技术升级驱动 2)商业驱动:前端摄像头路数及图像体量足 使用集成视觉和语言数据的方式进 行预训练,在不丢失语言能力的情 况下融入多模态能力 沿用DeepSeek V2模型结 构,具备全球顶尖的代码能 力和数学能力 在后训练阶段大规模使用强化学习 技术,在极少标注数据的情况下极 大提升模型推理能力 MoE架构的大语言模型,具 备多任务泛化能力,在知识 问答、长文本处理、代码生 成、数学问题求解等方面性 能领先 数学推理模型 DeepSeek Math10 积分 | 51 页 | 3.35 MB | 6 月前3
智驾地图市场研究报告(2025)-32页4D时空理解与预测 多模态融合 (训练端): • 视觉、行为、车辆状态等 音频感知 (探索): • 识别紧急车辆警报声 数据引擎: • 海量车队数据采集 (影子模式) • 自动化标注与仿真 Dojo超级计算机:加速端到端大模型训练 OTA持续进化:快速部署模型更新 FSD V13.2功能突破: 新增停车场直启、三点掉头、纯视觉 倒车及自动停车,提升复杂场景自主 决策。” jing Taibo Co., Ltd. All Rights Reserved. 23 • 合规:腾讯合规云、数据合规方案 • 训练资料:HD/点云、HD Air/SD • 采集/标注:数据采集、训练标注 • 地图数据: HD Air /SD/HD,动态数据 • 云图服务:数据服务、车道级引导服务 • 车端应用:数据引擎、EHPV2-SDK • 数据回传:合规、建图、融合、审图、发布10 积分 | 32 页 | 5.32 MB | 5 月前3
2025年人形机器人应用场景洞察白皮书-工业场景篇业绩,允许一定范围的误差。 为尊重知识产权、保障数据贡献者和服务者的权益,请数据及报告的使用者在相关信息及数据的引用时(包括项目研究报告、财务报告, 以及学术论文或毕业论文等)中标注数据来源,并按照文献引用方式标注来源,同时向M2觅途咨询进行申请和报备。 法律免责: 1. 本报告内所有的数据仅供参考,受范围、定义、时效等的影响,M2觅途咨询不保证数据使用时的准确性、完整性、及时性、可靠性,以及对此提供任何明示 该等解释和修改将不定期的进行并发布。如果用户不接受M2觅途咨询的免责声明或对我们的服务有任何疑问 ,请随时与我们联系。 5. 本报告所有的数据由中文、英文或其他语言组成,除非本报告对语言进行特殊标注,否则用户应当基于对语言的上下文或其普通含义来理解。 6. 任何对本报告及其所使用的数据提起的任何争议均适用于中华人民共和国的法律法规。 7. 请用户确认已阅读、理解并接受所有的条款。如用户不接10 积分 | 33 页 | 2.38 MB | 5 月前3
2025具身机器人行业未来展望报告过大规模互联网数据对视觉语言模型进行预训练,提供了丰富的语义信息。 中层:来自视频生成及基于物理模拟器生成的轨迹数据及机器人操作轨迹 数据。其特点是数据量中等,成本低。如使用多模态LLM对视频进行过滤, 并重新标注。最终生成视频数据相当于原始数据的约10倍。 顶层:来自各种构型的机器人在真实环境中的操作数据,数据收集成本高, 但对于模型的准确性至关重要。特点是此层用于确保模型在真实环境下的 执行能力。 数据。目前,智元数据采集工厂模拟了家庭、零 售、服务业、餐饮、工厂五个场景。在基础能力建设方面,智元退出了智元具身智能数据系统AIDEA,其涵盖了广泛的数据采本体,遥操设备以及 “数据采集-数据标注-数据管理-模型训练-模型评测-模型部署-数据回传”等全链路的数据平台。 智元具身智能数据系统 AIDEA 智元数采工厂 遥操作-可行商业模式落地探究 05 32 资料来源:钛媒体AGI、浙商证券产业研究院0 积分 | 31 页 | 3.33 MB | 5 月前3
信通院:“机器人+人工智能”工业应用研究报告2025慧仓储物流等数字化装备领域。博众自主开发的 MasterpieceAI 系统 是一套集数据分析、标注、调参、训练、测试为一体的工业视觉深度 学习平台软件。通过灵活简单的 GUI 界面,用户快速创建深度学习应 用系统。满足视觉检测、分类、定位等应用需求。系统包含了四大项 26 目板块,分别为项目管理、样本标注、构建&训练&检测模型以及评估 模型。另外包含图像分割算法、图像分类算法、目标检测算法、单样0 积分 | 37 页 | 2.06 MB | 5 月前3
清华:AI驱动政务热线发展研究报告(2025)降低沟通成本,提升需求文件审核效率。在需求文件编制过程中,代理机 构与采购人往往需要多次沟通,部分采购人对政策了解不足,难以进行规范性描 述,导致编制时间延长,影响项目进度。通过在标注的需求文档数据集上训练大 模型,可以实现对违反《负面清单》及其他重要规则的自动标注。需求文档批注 功能使招标人能够在线初步审核需求文件,显著节省了招标项目准备阶段的时间 成本。 2.智能审核提升招标过程公平性。不合规的采购需求描述可能引发法律风险 大模型在政务服务领域的应用潜力和实际价值。 其一,该系统通过大模型技术,实现了对政策文件信息公开的实时更新和智 能解析,突破了传统问答系统需人工拆解知识的限制。通过训练大模型识别《负 面清单》和重要规则的能力,系统能够自动标注和批注需求文件,减少了人工干 预,提高了效率。这种智能化的政策解读和问答能力,为政务服务带来了全新的 变革。 其二,系统已成功接入北京市海淀区公共资源交易平台,提供文件审核、智 能批注、AI0 积分 | 58 页 | 1.68 MB | 5 月前3
备份 清华:AI驱动政务热线发展研究报告(2025)降低沟通成本,提升需求文件审核效率。在需求文件编制过程中,代理机 构与采购人往往需要多次沟通,部分采购人对政策了解不足,难以进行规范性描 述,导致编制时间延长,影响项目进度。通过在标注的需求文档数据集上训练大 模型,可以实现对违反《负面清单》及其他重要规则的自动标注。需求文档批注 功能使招标人能够在线初步审核需求文件,显著节省了招标项目准备阶段的时间 成本。 2.智能审核提升招标过程公平性。不合规的采购需求描述可能引发法律风险 大模型在政务服务领域的应用潜力和实际价值。 其一,该系统通过大模型技术,实现了对政策文件信息公开的实时更新和智 能解析,突破了传统问答系统需人工拆解知识的限制。通过训练大模型识别《负 面清单》和重要规则的能力,系统能够自动标注和批注需求文件,减少了人工干 预,提高了效率。这种智能化的政策解读和问答能力,为政务服务带来了全新的 变革。 其二,系统已成功接入北京市海淀区公共资源交易平台,提供文件审核、智 能批注、AI0 积分 | 58 页 | 1.70 MB | 5 月前3
共 16 条
- 1
- 2
