2025具身机器人行业未来展望报告银河通用抓取基础大模型 GraspVLA 04 17 资料来源:银河通用公众号,浙商证券产业研究院 2025年1月,银河通用发布抓取基础大模型GraspVLA。GraspLVA的训练包括预训练及后训练。其中预训练完全基于合成大数据,训练数据 达到了有史以来最大的数据体量——十亿帧「视觉-语言-动作」对,掌握泛化闭环抓取能力、达成基础模型;预训练后,模型可直接 Sim2Real 在未见过的、千变万化的真实场景 具身机器人智能化分级及能力展望 05 26 资料来源:小鹏汽车官网,浙商证券产业研究院 今年两会上,小鹏汽车董事长、CEO何小鹏认为机器人可分为五个智能等级:L1级(完全由人控制)、L2级(基础辅助智能)、L3级(具身 智能和训练监督)、L4级(自成长智能)和L5级(完全自主智能)。当前,人形机器人产业正朝着L3级迈进,这一阶段的机器人能够在大量 场景中独立运行,但在复杂情况下仍需人工监督。何小鹏预计,到2026 结合何小鹏对于机器人分级以及我们对于机器人能力程度的拆解,我们将具身机器人分级进一步细化。 L1 L2 L3 L4 L5 等级分类 完全由人控制 基础辅助智能 具身智能和训练监督 自成长智能 完全自主智能 代表产品 传统机械产品 工业机器人、AGV、扫地机 器人 现有人形机器人 尚未出现 尚未出现 拥有的能力 被人类完全操控的能力 基于人类制定规则进行执行 的能力,需要人类监督 基于人类指定的规则及训 练的成果进行一定的自主0 积分 | 31 页 | 3.33 MB | 5 月前3
2025年自动化人工智能报告们开始更多地信任他们。他们过马路时不需要你牵着 他们的手,但你仍然会陪在他们身边。他们可以自己 在外面玩耍,但只能在围栏内。随着我们的信任不断 增强,我们绘制的护栏边界也越来越宽。直到有一天 ,他们完全成长为了成年人。我们还会检查他们的情 况——但现在,他们是独立个体,拥有做出自己决定 的自主权。 关键在于,这个例子展示了信任和自主性是如何密不可 分的。但它也表明了信任领导者现在需要考虑的细微差 其员工手 中的这项技术,确保自主决策与企业目标一致的管理, 以及保持系统安全和弹性的网络安全和测试实践,对于 企业在涉足的新领域至关重要。 二进制大爆炸将感觉混乱。前所未有的定制化机会, 以及拥有完全适合的... 第三支柱是自主性,它正处于最显著的位置。今天的 架构设计是为了执行单一且严格规定的操作。 竞争对手也将以同样的速度移动,并且新的颠覆者可 能以更少的摩擦出现。 021 生成式UI是利用AI技术生成用户界面的概念,通常旨在 提供个性化的体验。其长期愿景是一个能够根据个人的 环境和需求实时动态生成界面的系统。这不仅仅是用用 户特定的内容填充预定义的布局,而是完全改变结构、 流程和交互方式。这些能力可以应用于网站、应用程序 ,甚至代理系统,并可能依赖于文本、语音或其他直观 的交互。 代理系统和可组合的数字核心将彻底改变我们对用户界 面的看法,并解开当今软件范式的一个核心组成部分。10 积分 | 66 页 | 5.50 MB | 5 月前3
国元证券-汽车智能驾驶行业深度报告:端到端与AI共振,智驾平权开启新时代高度鲁棒的模型支持,然而,这些场景在真实数据中占比极低,难以通过传统的路测覆盖全面。现有的仿真测试技术 只能生成部分场景,而针对动态交互场景(如复杂的多车协同避让)的模拟能力有限,导致验证结果难以完全反映真 实情况。因此,调整长尾场景在训练数据中的分布比例有很大的探索价值。目前的普遍解决方案是采用合成数据来模 拟真实世界数据的特征分布。合成数据能够以较低成本增加训练数据的规模、丰富泛化场景的多样性,并有效生成长 资料来源:同花顺,国元证券研究所 特斯拉:纯视觉方案+一体化端到端先驱 19 特斯拉经历了自研芯片、算法结构、数据标注与融合等方面的升级,一体化端到端技术架构逐渐完善。 Full Self-Driving(完全自动驾驶,FSD)是特斯拉研发的最高级自动辅助驾驶系统,计划通过OTA(Over-The- Air)软件更新逐步实现L5级别的自动驾驶。截至2024年Q2,特斯拉宣布其FSD技术助力下的汽车已经行驶了超过 垂直车位泊入时间≤30秒 资料来源:HMI 智能座舱设计,国元证券研究所 表9:不同层级的自动驾驶软件及功能 自动驾驶功能 BAP (基础版自 动辅助驾驶) EAP (增强版自 动辅助驾驶) FSD (完全自动 驾驶) 主动巡航/跟车 √ √ √ 车道维持/居中 √ √ √ 自动辅助导航驾驶 √ √ 自动变换车道 √ √ 自动泊车 √ √ 召唤/智慧召唤 √ √ 交通识别/标志识别 √10 积分 | 95 页 | 6.54 MB | 5 月前3
北大:DeepSeek-R1及类强推理模型开发解读DeepSeek-R1 具备强大推理能力与长文本思考能力,继开源来备受关注。 DeepSeek R1-Zero 和 R1 的出现再次证明了强化学习的潜力所在: R1-Zero 从基础模型开始构建,完全依赖强化学习,而不使用人类专家标注的监督微调( SFT ); 随着训练步骤增加,模型逐渐展现出长文本推理及长链推理能力; 随着推理路径增长,模型表现出自我修复和启发式搜索的能力; DeepSeek-R1 ,从而追踪模型的决策过程, 减少黑箱推理。 同时, CoT 使监督者更容易检测模型是否遵循合理逻辑,并有助于 AI 对齐过程中对模型行 为 的透明化处理。 然而, CoT 并不能完全解决可解释性问题, 因为模型仍可能利用 CoT 进行欺骗性推理,即 In- Context Scheming 。 CoT 生成的推理步骤是模型输出的一部分,并不能保证它反映了模型的真实内部计算过程。 Large Language Models Discussion 个体安全 ≠ 群体安全, 行为安全 ≠ 价值安全 形式化验证起源于数学的形式化证明,例如 Lean 数学形式化的目的是提供一个完全客观和可验证的证明过程 形式化具备消除模型幻觉的潜力,类似还有软件工程相关代码的形式化证明 与此同时,安全价值的监管具有多元性 : 人类的安全价值观具有多样性 , 内建价值冲突 \ 单智能体系10 积分 | 76 页 | 6.72 MB | 5 月前3
信通院:“机器人+人工智能”工业应用研究报告2025中的常识生成操控任务。在小脑方面,本田 Asimo 人形机器人采用传统的逻辑推理控制,能够完成各种复杂的行走功能 和人类肢体动作;Figure 在 OPEN AI 提供的大脑功能以外,打造了 完全端到端的运动控制系统;智元机器人采用云端超脑、大脑、小脑 等多层次架构,分别负责任务级、技能级和指令级的操作任务。 部分人形机器人头部厂商开展了端到端架构的探索。端到端架构 融合“大脑”和“小 在生产制程控制方面引入航天质量控制专家进行指导,确保产品批量 交付的一致性和稳定性。 25 3、灵猴螺纹完整性检测机器人 螺纹完整性检测系统无需旋转或者多相机系统,只需要单个相机 单次拍摄即可获得 6 个对称分布、可完全覆盖物体侧面的图像,适用 于 M1.0~M2.5 的螺纹孔检测。光学系统具有可变光阑,可根据需求改 变景深;一体式照明设计,方便螺纹孔内部打光;双镜组成像设计, 工作距离较大,可满足在线快速检测。软件系统采用先进的工业 引导工作,协同完成自动化扫描,整个扫描与检测过程不超过 3 分钟。 汽车空调出风口组装及检测应用。汽车空调出风口组装及检测的 工序相对细致、麻烦,采用人工流水线作业方式,每一道工序需要配 备一名工人,且流水线完全铺开所需场地面积较大。终端客户采用 2 台大族 E05 协作机器人对产线进行自动化升级改造,将组装、检测工 32 序合并,与生产工人共同作业,协作完成任务。另外,大族 E05 协作 机器人也0 积分 | 37 页 | 2.06 MB | 5 月前3
人工智能机器人的崛起研究报告:物理AI时代开启Citi GPS: 全球视⻆与解决⽅案 2024年12⽉ 每秒25,000次模拟步骤 这代表与当前模拟⽅法相⽐加速100倍。 根据Gartner的数据,到2030年,预计合成数据在⼈⼯智能模型中完全取代真实数据。 5. 边缘计算 为了使机器⼈能够在现实环境中⾃主有效地运⾏,它们必须能够实时分析数据并做 出决策,⽽不依赖于集中式基于云的服务器。这种需求促使了边缘计算的⽇益重要 ,这是⼀种新的范式,涉及在⽹络的“边缘”处 度,并显⽰73%的受访者认为如果有机器⼈做家务,他们的家会更⼲净17 图18. 与洗碗机相比,机器人吸尘器可能会有类似甚至更快的采用速度 来源:纽约时报尼古拉斯·费尔顿,花旗研究 17 ⼗⼈中七⼈将完全信任机器⼈来做所有家务事(雅⻁ 新闻英国) © 2024 花旗集团 2023 2024 2025 2026 2027 2028 2029 2030 2031 2032 2033 18 2020 RECS调查数据(美国能源信息管理局) © 2024 花旗银⾏ 25 花旗集团全球洞察与解决⽅案 2024年12⽉ Fybots(图21)推出的扫地机器⼈SweepXL是⼀款完全⾃主的机器⼈,具有⾃我清洁和⾃ 动排放垃圾功能。它使⽤内部构建的智能、导航和⾃我定位功能,确保避开移动和固定障碍 物。 图20. LionsBot的R12 Rex Scrub 图21. Fybots的Sweep10 积分 | 82 页 | 5.53 MB | 5 月前3
2025食品饮料行业AI转型白皮书-甲子光年-82页各模态独立发展阶段 多模态融合阶段 物理世界模型阶段 转型案例 全场景、全链路的价值跃迁, AI驱动行业升级再造 实操问题难以解决 奶牛养殖往往依靠专业知识及实操 经验,通识概念无法完全解决实际 遇到的问题 企业知识碎片化 需要一套领域专家知识库和智能问 答系统,实现企业级知识沉淀 查找资料过程繁琐 养殖员日常工作需要翻阅大量资料 解决操作问题,人工查找过程繁 琐,期望使用自然语言描述自己遇10 积分 | 82 页 | 17.71 MB | 5 月前3
清华:AI驱动政务热线发展研究报告(2025)二是在完成与来电人的地理位置核对以后,接线员通常还要借助地图工具检索来 电人所在行政区划,再结合自己对各承办单位职能分工的理解,将工单派发到具 体的承办单位。因行政区划调整、承办单位职能交叉等多种因素影响,这个过程 并不能完全保证工单的精准派发,依然会经常出现工单打回的情况,这不仅会耽 误来电人诉求办理的时间,也可能引起政务热线与承办单位之间的矛盾。 第二,转单过程可控性弱。很多工单无法一次派发完成,还需要承办单位进 时纠正。其次,不同于大多数计件型工作的工作成果可以通过仪器或肉眼快速扫 描完成质量评估,热线服务数据是以语音为主要内容的非结构化数据,在缺少先 进质检技术的情况下需要质检人员依据个人经验进行评估,完全不具备批量扫描 质检的可行性。最后,长期依靠专人进行评估,不仅难以避免人工偏误,同时也 23 无法避免部分质检人员可能对接线员的中低风险违规进行包庇。 第二,难以对热线服务体系进行全量质检评估。一个城市的政务热线每日接 ,可通过联邦学习 等技术,在保护隐私的前提下实现数据共享与模型优化。此外,需要严格规范系 统的日志记录,确保每一次数据调用都有迹可循。 2.人机协作的合理分工 尽管大模型能够提升服务效率,但完全依赖智能系统可能会影响用户体验。 31 部分市民仍习惯于与人工客服交流,尤其是在处理复杂或紧急事务时。因此,应 合理设置“人工优先”或“智能预处理+人工介入”模式。例如,对于涉及法律 解释或0 积分 | 58 页 | 1.68 MB | 5 月前3
备份 清华:AI驱动政务热线发展研究报告(2025)二是在完成与来电人的地理位置核对以后,接线员通常还要借助地图工具检索来 电人所在行政区划,再结合自己对各承办单位职能分工的理解,将工单派发到具 体的承办单位。因行政区划调整、承办单位职能交叉等多种因素影响,这个过程 并不能完全保证工单的精准派发,依然会经常出现工单打回的情况,这不仅会耽 误来电人诉求办理的时间,也可能引起政务热线与承办单位之间的矛盾。 第二,转单过程可控性弱。很多工单无法一次派发完成,还需要承办单位进 时纠正。其次,不同于大多数计件型工作的工作成果可以通过仪器或肉眼快速扫 描完成质量评估,热线服务数据是以语音为主要内容的非结构化数据,在缺少先 进质检技术的情况下需要质检人员依据个人经验进行评估,完全不具备批量扫描 质检的可行性。最后,长期依靠专人进行评估,不仅难以避免人工偏误,同时也 23 无法避免部分质检人员可能对接线员的中低风险违规进行包庇。 第二,难以对热线服务体系进行全量质检评估。一个城市的政务热线每日接 ,可通过联邦学习 等技术,在保护隐私的前提下实现数据共享与模型优化。此外,需要严格规范系 统的日志记录,确保每一次数据调用都有迹可循。 2.人机协作的合理分工 尽管大模型能够提升服务效率,但完全依赖智能系统可能会影响用户体验。 31 部分市民仍习惯于与人工客服交流,尤其是在处理复杂或紧急事务时。因此,应 合理设置“人工优先”或“智能预处理+人工介入”模式。例如,对于涉及法律 解释或0 积分 | 58 页 | 1.70 MB | 5 月前3
2025智慧银行报告:以人工智能驱动转型并创造价值-毕马威-45页管理层在这一转型中也发挥着关键的作用。人工智能的推 广使用要求领导层能够打破隔离现状,协调不同的职能团 队并培养勇于试验和提倡协作的文化。然而,银行业的传 统管理风格通常等级分明且厌恶风险,无法完全满足转型 需求。 我认为最大的挑战在于员工对这项技术的接 受和共识。准备程度最为重要。变革管理永 远不可能一蹴而就。 某加拿大银行的人工智能负责人 3《践言于行:打造人工智能驱动的卓越客户体验》(Beyond 过无缝合作创造价值。 Erik Brynjolfsson ——斯坦福以人为本人工智能研究院(HAI)教授兼高级研究员,斯坦福数 字经济实验室主任 人工智能驱动的银行业务自 动化 客户财务管理完全由人工智能执行。通过 人工智能驱动的系统自动管理账户余额, 优化投资组合,甚至根据市场状况和客户 财务行为实时调整贷款条款。例如,某英 国零售银行正尝试银行服务全面自动化, 以根据实时现金流分析自动在账户之间转 图7:只有一半受访银行在如何实施人工智能方面具备明确的战略愿景 人工智能愿景与业务战略的相符程度 人工智能愿景的清晰程度 已完全融入业务战略 与战略相符 34% 有清晰的愿景 31% 部分相符 29% 正在发展愿景 22% 仅少量相符 15% 有较为局限的愿景 21% 完全不相符 5% 没有愿景 4% 15% 有颠覆性的愿景 21% 我认为,每名职能部门的管理人员都必 须更加深入地了解人工智能的意义、它10 积分 | 45 页 | 1.77 MB | 5 月前3
共 24 条
- 1
- 2
- 3
