pdf文档 世界互联网大会&联通:2025人形机器人应用与发展前瞻报告 VIP文档

5.42 MB 24 页 0 下载 55 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pdf
3
概览
中国联合网络通信有限公司研究院 金砖国家未来网络研究院 (中国·深圳) 人形机器人 应用与发展前瞻 2025年7月 世界互联网大会智库合作计划系列成果 目 录 前 言.........................................................................................Ⅰ 编 组.........................................................................................Ⅱ 一、 人形机器人发展新态势............................................................1 (一) 人形机器人发展现状............................................................1 (二) 全球人形机器人市场前景广阔................................................3 二、 人形机器人的技术演进............................................................6 (一) 整机“智能化感知决策水平”不断提升...................................6 (二) 多模态模型算法赋能“大脑”层级进步 ...................................7 (三) 小脑模型算法迭代优化,实现拟人化运动控制..........................7 (四) “肢体”构筑机器人的“钢铁之躯”......................................8 三、 全球人形机器人的典型实践与探索............................................10 (一) 人形机器人率先重构工业制造人机协同范式............................11 (二) 人形机器人探索构建普惠、精准、有温度的医疗未来................12 (三) 人形机器人将重塑交通物流生产力范式 ..................................13 (四) 人形机器人将重构家庭生活的效率与体验...............................14 四、 探索人形机器人未来发展新路径............................................ ..16 (一) 筑牢硬件根基,推动人形机器人产业标准互通.........................16 (二) 强化感知能力,促进人形机器人技术融合创新.........................17 (三) 聚焦重点场景,驱动人形机器人应用健康发展.........................18 世界互联网大会智库合作计划系列成果 前 言 Ⅰ 人形机器人作为人工智能与物理世界深度融合的前沿范式,正成 为智能技术突破虚拟边界的关键支点。人形机器人打破传统人工智能 的"离身认知"局限,通过独特的“人形”设计,使人工智能系统能够 无缝适应人类工作与生活环境,熟练操作为人类设计的工具与设备,实 现从纯粹信息处理到与物理世界通用交互的本质跨越,为人工智能提 供了理解和改造物理世界的最佳“身体”,进而实现真正的“知行合 一”。我们将聚焦人形机器人产业发展的前瞻和最新趋势,深度洞察 这一技术的应用探索与未来图景,希望可以助力人形机器人产业的高 质量发展。 世界互联网大会智库合作计划系列成果 编写组 组长: 李红五 中国联合网络通信有限公司研究院 陈辉 金砖国家未来网络研究院(中国·深圳) 副组长: 杨锦洲 中国联合网络通信有限公司研究院 张阳 中国联合网络通信有限公司研究院 工作组成员: 郭耀隆 中国联合网络通信有限公司研究院 杨峥 中国联合网络通信有限公司研究院 罗力卓 中国联合网络通信有限公司研究院 夏璠 中国联合网络通信有限公司研究院 薛竞 中国联合网络通信有限公司研究院 韩莹莹 中国联合网络通信有限公司研究院 林桢 金砖国家未来网络研究院(中国·深圳) 李纪超 金砖国家未来网络研究院(中国·深圳) 张雅文 金砖国家未来网络研究院(中国·深圳) Ⅱ 世界互联网大会智库合作计划系列成果 一、人形机器人发展新态势 (一)人形机器人发展现状 1.人形机器人的内涵 人形机器人作为融合了人工智能、高端制造等先进技术的革命性 突破,以颠覆性创新重塑全球科技竞争格局,加速形成数实融合的新 质生产力,催生人机协同的新型生产关系,成为驱动数字经济向自主 经济跃迁的核心引擎,为数字经济的可持续发展提供更强韧性。 人形机器人是一种利用人工智能和机器人技术制造的具有类似人 类外观和行为的机器人。人形机器人灵感来源于人类的身体,集仿生 学原理和机器电控原理于一体。与普通机器人相比,人形机器人最大 的特点是拥有拟人智能能力,可以通过人工智能大模型技术的赋能, 实现拟人化的感知、决策、控制能力,实现了智能的飞跃。同时,人 形机器人还需要具有拟人的外观,通常由头部、躯干、四肢等部分组 成,能够实现模拟人类的行走、抓握等动作。这种类似人类的形态,可 以快速融入人类社会,完成具体的任务,通用性和适应性较强。 人形机器人依据其结构与功能特性,可主要分为轮式人形机器人、 足式人形机器人以及通用人形机器人。轮式人形机器人采用轮式驱动, 搭配机器人手臂与灵巧手,兼具移动能力;足式人形机器人着重腿部 运动能力,手部主要用于平衡;通用人形机器人具备双足、双臂、双 手及各类感知和人工智能功能,有全面软硬件基础,能适应开放环境 中的多任务。 01 2.人形机器人的发展历程 1950年—1980年,为人形机器人的概念萌芽阶段,图灵在其论文 中提出了人工智能可能的发展方向,为机器人的概念奠定了基础。现 代机器人的雏形是1954年美国麻省理工学院创造的可预编程机械臂。 美国通用汽车1960年首次将Unimate工业机器人投入生产线进行焊接 工作。斯坦福大学、早稻田大学分别研发了首台移动机器人和可对话 的人形机器人。 1980年—2000年,进入早期探索阶段,得益于计算机硬件和传感 器设备取得突破,麻省理工学院推出了具有类似人类听觉、视觉和本 体感知功能的机器人Kismet。1991年出现了六条腿机器人Genghis, 实现了自主行走。 2000年—2010年,进入跨学科融合与技术积累阶段,人形机器人 研究开始融合跨学科的方法和技术,如机构学、机器学习、机器人学 等,形成了相对完整的学科分支。 2011年—2020年,进入技术突破阶段。深度学习技术的快速发展 为其注入了新的发展动力。出现大量仿生、类人机器人,帮助机器人 适应自然环境。比如本田的升级版ASIMO机器人能够精确完成抓取物 体和倒液体等精细任务,波士顿动力推出的Atlas可以在复杂的户外自 然环境中行走、奔跑、跳跃,还能在雪地、草地等不同地形上保持平 衡。 2022年至今,为产业应用普及阶段。以ChatGPT为代表的大语言 模型为人形机器人实现智能感知、自主决策乃至拟人化交互,正逐步 走向产业应用。涌现了宇树、优必选、Figure、Optimus、波士顿动 力等一批独角兽企业,推动人形机器人应用深入生产实践。 02 世界互联网大会智库合作计划系列成果 (二)全球人形机器人市场前景广阔 1.各国人形机器人战略布局各有侧重 全球主要经济体均高度重视具身智能发展,不断出台政策支持具身 智能发展,提升全社会对机器人领域的关注和支持。美国紧抓人工智 能基础研究,保持具身智能领域的前沿领先地位。先后出台《国家机 器人计划3.0》和《国防部人工智能战略》,将AI技术竞争上升至国家 战略层面。欧盟方面,积极推进具身智能发展,强调具身智能的安全 与透明度,先后推出《欧盟机器人研发计划》、《欧洲人工智能战略 》和《人工智能驱动机器人战略》等。欧盟还以《人工智能法案》为 基础,构建了具身智能发展的伦理框架与产业规范。亚洲地区,日本 正在将机器人纳入社会并使机器人成为其社会基础的关键部分。2022 年日本政府将机器人赋能制造、服务、医疗等应用场景的资金支持提 升至1057亿日元。人口老龄化背景下的机器人替代人类是支持重点, 推出了《社会基础设施用机器人重点领域》和《服务机器人安全操作 国际标准》等政策制度。韩国在机器人产品或服务的技术层面具备一 定的实力,但在机器人核心部件或软件技术方面却相对滞后。因此, 2008年出台《智能型机器人开发与普及促进法》,2023年发布机器 人产业发展战略和《先进机器人监管创新方案》。 图1 人形机器人的发展历程及展望 (来源:中国联通研究院) 03 2.全球人形机器人市场发展迅速 未来一段时间即将迎来人形机器人高速增长的阶段。从整体规模 上看,中国高工机器人产业研究所(GGII)预测,2025年全球人形 机器人市场销量有望达到1.24万台,市场规模63.39亿元。到2030 年,全球人形机器人市场销量将接近34万台,市场规模将超过640 亿元;到2035年,全球人形机器人市场销量将超过500万台,市场 规模将超过4000亿元。而高盛预测,到2035年全球范围内人形机 器人市场规模有望达到1540亿美元 。 投融资方面,CB Insights公司数据显示,人形机器人市场2024 年融资金额达到了12亿美元的新高,预计今年将达到23亿美元的规 模,实现翻一番。 图2 全球人形机器人市场规模及展望 (来源:高工机器人产业研究所) 04 来源:高工机器人产业研究所(GGII)《2025年人形机器人产业发展蓝皮书》 来源:高盛《人形机器人专题报告》 世界互联网大会智库合作计划系列成果 3.各国科技巨头加速推进人形机器人落地实践 全球人形机器人产品已经处于产品发布和应用验证阶段,但到商 业落地和大规模量产仍有一段距离。 各国科技巨头已宣布推出多款人形机器人。特斯拉发布“擎天柱” (Optimus)二代的人形机器人。2024年6月,Optimus二代已经被 应用在特斯拉工厂,进行电池的分拣训练。波士顿动力(Boston Dynamics)发布了人形机器人Atlas,同样在汽车工厂得到应用, 实现汽车支柱搬运等工作。敏捷机器人公司(Agility Robotics)发 布了人形机器人Digit。Digit可以实现搬运货物、码垛、卸载等仓库 日常工作,在GXO、亚马逊公司已经得到应用。独角兽企业Figure AI通过OpenAI大模型赋能人形机器人,推出Figure 02机器人,能 完成叠衣服、餐桌清理、购物袋包装等相对复杂任务,并在宝马汽车 工厂中测试开展零件装配等工作。优必选推出Alpha和Walker系列 机器人,为教育、物流、消费及其他产业定制,是全球合作车厂最多 的人形机器人企业。杭州宇树推出的Unitree H1、Unitree G1人形 机器人性能佳、价格低,可用于工业、家庭服务等多重场景。 图3 国外企业融资情况概览 (来源:中国联通研究院) 05 来源:中金公司《具身智能:AI下一站》 二、人形机器人的技术演进 (一)整机“智能化感知决策水平”不断提升 在全球人形机器人领域,特斯拉、Figure AI、波士顿动力处于第 一梯队,1X、Digit等欧美产品紧随其后。这些企业在硬件上追求轻量 化、高自由度,软件上借助AI大模型实现多模态感知与推理,部分产 品已进入场景测试阶段,展现了人形机器人在工业生产、民生服务、特 种作业等多元场景的应用潜力,预计2025年将成为人形机器人的量产 元年。 特斯拉Optimus系列展现了快速迭代能力。2022年10月发布 Optimus Gen1身高173cm,重73kg,搭载汽车级FSD系统,凭借 28个身体自由度和11个手部自由度实现基础运动功能。2023年 Gen2实现重大突破,重量降至63公斤,步行速度提升30%,新增颈 部自由度显著增强平衡性,可应对爬楼梯等非平坦地形;其配备触觉 传感器的灵巧手能精准抓取鸡蛋等易碎物。该系列计划于2026年以2 万-3万美元量产,目标覆盖工厂、物流及家庭服务场景。 波士顿动力Atlas作为行业运动能力标杆,2024年推出电动版新 款Atlas机器人,具备三指灵巧手,可搬运14kg物体,能完成行走、跳 跃、爬楼梯等复杂动作。核心技术模型预测控制器(MPC)推动其从 预设动作向自主路径规划进化,在复杂地形运动中保持卓越稳定性,持 续拓展运动控制与感知技术的边界,主要服务于科研验证领域。 宇树科技代表中国创新力量。2023年H1搭载自研M107关节电机, 单腿自由度设计使其在负重30公斤或外力冲击下稳定运动,3D激光 雷达实现360°环境感知。2025年G1转向轻巧化,23-43关节电机支 持单腿跳跃等高阶动作,三指灵巧手结合多传感器适应复杂地形,由世 界模型UnifoLM驱动的自主学习能力瞄准救援与人机协作应用。 06 来源:全球人形机器人技术演进趋势.2025年5月29日.https://mp.weixin.qq.com/s?__biz= MzU2MTg0NjE0Mg==&mid=2247591656&idx=1&sn=e0eeac7b407d687cea6ef 014b68e26f8#:~:text=o%E8%83%BD%E8%80%97%E4%BC%98%E5%8C%96, %E5%B7%A5%E4%B8%9A%E5%9C%BA%E6%99%AF%E9%AA%8C%E8%AF%81 来源:宇树科技官网.https://www.unitree.com/ 世界互联网大会智库合作计划系列成果 (三)小脑模型迭代优化,实现拟人化运动控制 1.“小脑”运动控制路线:基于模式和基于学习 (二)多模态模型算法赋能“大脑”层级进步 1.大模型是机器人“大脑”最为理想的选择 2.多模态大模型技术发展呈现多元路径共存的演进趋势 人形机器人“大脑”技术以大模型为核心,提供任务交互、环境感知、 任务规划及决策控制能力。需具备四大关键能力,实时交互能力,能与人 类进行任务级交互;多模态感知能力,整合多感官信息;自主可靠决策 能力,分解复杂任务;涌现和泛化能力,在新环境执行任务。 从技术路线演进看,基于大模型的机器人“大脑”正沿着四条并 行路径向端到端智能发展。其一,LLM+VFM融合路线,最成熟方案。 以谷歌SayCan为代表,通过预训练技能的价值函数与大语言模型对齐, 将用户指令分解为可执行任务链,实现交互与规划闭环。其二,视觉- 语言模型(VLM)路线,重点弥合语言与视觉语义鸿沟。例如清华大学 CoPa模型,利用GPT-4V等基础模型的常识知识,生成任务导向的抓取 姿态及运动规划方案。其三,视觉-语言-动作模型(VLA)路线,在 VLM基础上增加运动控制层。典型代表谷歌RT-H,通过多任务数据集 联合训练语言-视觉-动作模块,学习自适应动作策略以解决轨迹决策问 题。其四,多模态大模型路线,未来主导方向。如MIT与IBM的MultiPY, 融合视觉、触觉等3D环境特征,通过多视图关联构建以对象为中心的场 景表征,实现全维度环境感知与决策。 “小脑”运动控制是实现人形机器人自然流畅动作的关键,主要分为 基于模型和基于学习两类方法。前者通过建立运动学和动力学模型进行 规划控制,如ZMP、混杂零动态规划等算法,但开发复杂、成本高;后 者借助人工智能技术,以人类示教(模仿学习)或自主探索(强化学习) 建立策略,能降低开发难度、加快迭代。二者各有优劣,共同推动人形 机器人运动控制技术发展。 07 (四)“肢体”构筑机器人的“钢铁之躯” 2.“小脑”向基于强化学习和模仿学习的控制策略发展 传统机器人控制方法因高度依赖精确动力学模型及专家先验知识, 在动态开放环境适应性方面存在局限。尽管数据驱动的学习型控制能 通过经验优化策略,其泛化能力与环境鲁棒性仍待提升。大模型的引 入为人形机器人“小脑”控制带来新突破,正推动控制范式从模型驱 动向数据驱动迁移。 大模型通过整合先验知识显著提升数据利用率。如Language Plan利用GPT-3将任务描述解译为抽象行动序列,通过状态空间嵌 入增强分层强化学习智能体的泛化性能。LOFT、T-EBM等模型实 现语言指令到控制策略的端到端映射。在模仿学习方向,视觉-语言 模型开辟新路径。CLIP-ASAP融合CLIP语义编码与因果语言建模, 基于视觉观察与语言指令预测关键动作帧,支持复杂技能的长时程学 习。当前挑战聚焦于实时计算效率、极端环境鲁棒性及决策可解释性 三大维度,亟须突破多模块协同以实现真正的端到端自主系统。 人形机器人的“肢体”是实现拟人功能的关键,涵盖芯片、传感 器、执行机构(电机、灵巧手)等先进技术。这些技术协同工作,为 机器人提供了类似人类的运动能力和交互功能,是其执行任务和适应 环境的物质基础。 08 来源:中国信通院,《人形机器人产业发展研究报告》 来源:具身智能与人形机器人论坛.2025年6月7日.https://event.baai.ac.cn/activities/898 世界互联网大会智库合作计划系列成果 1.AI芯片:人形机器人的“心脏” 2.传感器:感知交互基础 3.电机:执行控制核心 芯片是人形机器人智能的算力核心。在架构创新上,全球企业积极 探索:存算一体架构打破“内存墙”,缓解数据传输瓶颈;神经拟态芯 片模拟人脑神经元工作模式,实现低功耗动态处理;异构计算将CPU、 GPU、ASIC优势整合,提升运算效率。制程与封装技术不断突破,台 积电3nm工艺量产,让芯片性能显著提升;Chiplet技术在国际上广泛 应用,通过芯片堆叠降低成本与设计难度。算法-硬件协同成趋势, Transformer架构推动专用加速器发展,如美国Groq推出的LPU,加 速AI模型运算。 多模态传感器融合赋予人形机器人感知能力。视觉领域,3D视觉 传感器成焦点,特斯拉坚持纯视觉方案,而波士顿动力等企业通过激光 雷达与深度相机结合,提升环境建模精度。触觉与力觉传感器方面,柔 性触觉传感器应用突破,Optimus Gen2借此实现鸡蛋抓取;六维力传 感器在国际上广泛应用,助力精准力控。多模态融合技术兴起,美国 MIT研发的RoboFusion系统,通过视觉、触觉、力觉数据融合与强化学 习,大幅提升工业装配精度。 电机作为人形机器人核心执行部件不断升级。在控制精度上,日本 安川等企业的伺服电机,通过优化驱动器与编码
下载文档到本地,方便使用
- 可预览页数已用完,剩余 22 页请下载阅读 -
文档评分
请文明评论,理性发言.