具身智能的基础知识(68页 PPT)
1.83 MB
68 页
0 下载
3 浏览
0 评论
0 收藏
| 语言 | 格式 | 评分 |
|---|---|---|
中文(简体) | .pptx | 3 |
| 概览 | ||
具身智能的基础知识 2025 年 9 月 11 日 R1 .0 版 目录 CONTENTS 具身智能 的基 本概念 具身智能 的发 展演 进 具身 智能 的核 心技 术 具身智 能 的产 业链 具身智能的基 本概念 PART ■ 具身智能的基本概念 □ 具身智能的定义 > 具身智能 (Embodied Intelligence) , 是一种基于物理身体进行感知和行动的智能系统。 它通过实体智能体与环境的动态交互,获取信息、理解问题、做出决策,并实现行动,从而产生 智能行为和适应性。 > 具身智能是人工智能与机器人学交叉的前沿领域,其核心在于将感知、行动与认知深度融合。 ■ 具身智能的基本概念 □ 什么是“具身” >“ 具身“是一个很小众的名词,通常都出现在哲学、认知科学领域。 >“ 具身”的英文叫 Embodied , 是 embody 的过去式和过去分词。 em- 表示 进入,使 … … ” , -body 表 示 身 体”。组合起来,就是“使 . … 进入身体”。 Embod'ed Inteligence ( 具身智能 ) , 顾名思义,就是“使智能进入身体”、“给智能一个身体”的意思。 具身智能 Embodied lntelli gence 维度 传统 Al ( 如 ChatGPT, 图像识别 ) 具身 Al ( 如家庭机器人,自动驾驶 ) 环境 静态、封闭的数字世界 动态、开放的物理世界 输入 单一或特定模态 ( 文本、图片 ) 多模态、实时传感器数据流 输出 数字信号 ( 文本、标签、概率 ) 物理动作 ( 移动、抓取、说 话 ) 目标 模式识别、内容生成 在环境中完成具体物理任务 学习 基于大规模静态数据集 通过与环境的实时交互和试错 ■ 具身智能的基本概 念 □ 具身智能与传统 Al 对比 ■ 具身智能的基本概念 □ 具身智能、离身智能、反身智能 > 具身智能 (Embodied Inte ligence) : Ⅱ 强调智能体通过物理身体与环境的直接交互来产生认知和行动。其 核心在于“感知 - 行动 闭环,智能通过身体与世界的互动动态形成。 > 离身智能 (Disembodied Intelligence) : 指不依赖物理身体,主要在虚拟或符号空间中通过计算和算法 处 理信息、进行推理的智能形式 . > 反身智能 (Reflexive!Intelligence) : 指智能体能够监控、评估并调整自身的内部状态、决策过程和行为 策 略,具备某种程度的“自我意识”和反思能力。 反身 智能 离身 智能 具身 智 能 ■ 具身智能的基本概念 □ 具身智能的研究意义 宏观意义:研究具身智能,可以推动我国各个领域的数智化转型,为建设制造强国、网络强国和数字中国提 供支撑,促进我国实体经济的发展 , 科研意义:具身智能是通用人工智能未来的发展方向。它推动人工智能从虚拟世界走向物理现实,从专用 任 务迈向通用智能,有助于我们深入理解智能的本质。 应用意义:具身智能技术能够提升机器人、自动化设备的智能化水平,增强其环境适应性和任务执行能力, 从而在服务、医疗、教育等多个行业实现广泛应用。 ■ 具身智能的基本概念 □ 具身智能的政策支持 发布时间 发布单位 政策名称 重点内容 2025 年 3 月 国务院 《 2025 年政府工作报告》 首次将“具身智能 e 和 ∩智能机器人”纳入国家战略,明确培育生物制造、量子科技、具身智能等未来产业。 2024 年 7 月 国务院国资委、发改委 《关于规范中央企业采购管理工作的指导意见》 在工业机器人、先进医疗设备等科技创新重点领域,鼓励中央企业采购具身智能相关创新产品。 2024 年 4 月 工信部等部门 《推动工业领域设备更新实施方案 } 以生产、仓储物流等环节为重点,推动工业机器人等通用智能装备更新。 2023 年 8 月 工信部等部门 《新产业标准化领航工程实施方案 (2023-2035 年习》 研制人形机器人相关标准,涵盖术语、核心零部件 范 、 决策、运动控制、安全和应用等方面,推动行业规 2023 年 4 月 网 等 《关于推进 IPV6 技术滴进和应用创新发展的实施意见》 推动 IPV6 与 5G 、人工智能 云计算等技术融合,支持具身智能在工业互联网等场票的应用感知网络创新 2023 年 1 月 工信部等部门 《“机器人 + ” 应用行动实施方案》 设立专项基金支持机器人研发与推广,加速具身智能 造业、物流、医疗等领域的场聚落地,建设国东级试验 2022 年 8 月 工信部等部门 k 信息通信行业绿色低碳发展行动计划 (2022-2025 年 ) 推动 IPv6 与 5G 、人工智能、云计算笔技术的融合创新,支持智能机器人等应用场景拓展。 中心 在制 发改委 、中央 、 部 信办 工信 。 知 化发展 智能感 2024 年 1 月 工信部等部门 《关于推动未来产业创新发展的实施意见》 提出到 2027 年人形机器人作为创新标志性产品,需突破高端装备技术,带动新技术产业化落地。 2023 年 12 月 工信部、应急管理部 《关于加快应急机器人发展的指导意见》 提出到 2025 年研发一批先进应急机 化 , , 试 化 , 。 提升机器人载荷功能、模块化水平和 2023 年 11 月 工信部 《人形机器人创新发展指导 = 见》 到 2025 年初步建立人形机器人创新体系,实现关键技术突破和批量生产;到 2027 年形成完整产业链。 管理装备现代 实战测试基地 急 及 应 景 推动 点场 能力 廷立 智能 器人 ■ 具身智能的发展演进 □ 具身智能的发展阶段 2020s- 现在 技术突破阶段 1990s-2020s 技术积累阶段 1950s-1990s 技术萌芽阶段 ■ 具身智能的发展演进 □ 具身智能的发展阶段——技术萌芽阶段 > 1927 年,第一个电驱人形机器人“ Televox' 诞生于美国西屋。 > 1950 年,艾伦 · 图灵 (Alan Turing) 发表了经典的《 Computing Machinery and Inte iigence ( Ⅱ 计算机器与智 能 ) 》一文,其中首次提出了具身智能概念。 > 1960 年,首台工业机器人 Unimate 在美国通用汽车投入使用。 > 1968 年,斯坦福研究院研制了世界上首台移动机器人 Shakey 。 > 1973 年 ,日本早稻田大学研制第一台人形机器人 WABOT:1 。 1985 年 , 日本 Epson 公司推出了第一款家庭机器人“ AlBO” 。 > 1986 年, 日本本田公司的人形机器人 ASIMO-E0 问世 , > 1986 年,美国计算机科学家罗德尼 · 布鲁克斯 (Rodney Brooks) 提出通过感知和动作驱动的环境交互来设 计 智能机器。智能体可以通过与环境进行直接的物理交互,以一种更加简单、有效的方式产生智能亍为。 > 1991 年,麻省理工学院 (MIT) 的 Cog 项目开始研究仿人形机器人的认知能力。 > 1991 年,罗德尼 · 布鲁克斯发表论文《 intelligence:Without RepΓesentation ( 无表征智能 ) 》 , 认为智能可以通 过行动与环境的交互而自然涌现 , ■ 具身智能的发展演进 □ 具身智能的发展阶段——技术积累阶段 (1) > 1990 年,麻省理工学院推出一款模仿人头部的机器人 Kismet 。 > 1991 年,布鲁克斯基于“感知 - 行动框架,研发可以自主行走的六条腿机器人 Genghis , 可以自主行走。 > 1999 年 ,日本索尼公司推出犬型机器人爱宝。 > 2002 年,丹麦 IRobot 公司推出世界上第一台家用扫地机器人 Roomba 。 > 2004 年, AldebaΓan 发布了能够识别情感的机器人 Nao 。 > 2006 年, Hanson Robofi.cs 发布了能够模拟人类面部表情的机器人。 > 2009 年,谷歌推出 Prius 自助驾驶汽车。 > 2010 年,柳树车库 (Wlow Garage) 发布了开源机器人操作系统 ROS, 促进了机器人领域的合作研究 , ■ 具身智能的发展演进 □ 具身智能的发展阶段——技术积累阶段 (2) > 2013 年,美国波土顿动力发布机器人 Atlas 。 > 2015 年,软银公司发布机器人“ Papper” 。 > 2016 年,法国 Inria Flower 实验室开发的 POPPY 上市。 > 2016 年,美国谷歌公司开源推出 Tesorlow 深度学习平台和 Dopamine 强化学习平台。 > 2018 年 ,中国优必选 WWalkeΓ 系列机器人上市。 > 2020 年,美国 - 敏捷机器人公司 DIGIT, 避障、上下楼梯,配会自动驾驶车辆送快递交付包 裹。 > 2020 年,中国达闼机器人发布 Cloud Ginger XR-1 。 ■ 具身智能的发展演进 □ 具身智能的发展阶段——技术突破阶段 > 2021 年,优必选 WalkeΓ X 实现了中国双足机器人行走能力的突破 , > 2022 年,小米发布 CybeΓOne , Mi-Sense 深度视觉模块及 AI 算法构造三维空间感知。 > 2022 年,美国特斯拉发布机器人 Optimus, 搭载自动驾驶级 FSD 芯片,基于视觉神经网络预测能力的自动驾驶技 术。 > 2023 年,英伟达 CEO 黄仁勋表示,人工智能的下一个浪潮是具身智能。英伟达发布多模态具身智能系统 VIMA, > 2023 年,李飞飞等提出 VoxPoser 系统,将大语言模型 (LLM) 接入机器人。 > 2023 年,英国 EngineeΓed Arts 为 Ameca 接入 GPT:3/4 增强了其语言的灵活性并增强了其面部表情 , > 2023 年,中国傅利叶推出 GR-1 通用人形机器人,多模态大模型、高度仿生的躯干构型、拟人的运动控制;宇树科 技 UnitΓee H1 发布;智元机器人远征 A1 发布 , > 2023 年 8 月,谷歌 DeepMind 推出机器人模型 Roboiics Transformer 2 (RT-2) 。 > 2024 年 3 月, OpenAI 与人形机器人初创公司 Figure 合作推出了 Figure:01 机器人。 > 2024 年,智元机器人发布“远征”与“灵犀”两大系列共五款商用人形机器人新品。 > 2025 年,挪威公司 1X Technologies 发布仿人体骨骼结构 Neo Gamma 机器人。 > ■ 具身智能的发展演进 □ 具身智能的爆发背景 > 一方面, Al 浪潮爆发 ,出现了功能强大的大模型和智能体,能够对大量的感知数据进行高效学习和处理。 Al 越来越强, 但想要将 Al 能力真正用起来,就必须让它在物理世界落地。这肯定需要一个物理载体。 另一方面,传统的自动化机械,只能完成死板的程序指令,大大限制了它的应用场景。引入强大的 AGl ( 通用人工智 能 ) 大脑,能够提升泛化能力,让机器变得真正聪明,扩大应用场景和范围 , > Al 需要身体,机器人需要大脑。两者双向奔赴,刺激了具身智能的全面爆发 , 我们也可以说,具身智能是 Al 发展到一定阶段的必然产物,是一种新的 A 范式。 ■ 具身智能的发展演进 □ 具身智能的五个阶段 > 无智能阶段:只能执行简单的预设任务,缺乏自主性和适应性; 基础智能阶段:开始具备基本的感知能力,能够对外界环境做出简单的反应; > 中等智能阶段:能够进行更复杂的感知和处理任务,如图像识别和语音识别; > 高度智能阶段:展现出较高的自主性和适应性,能够进行自我学习和优化,执行复杂的任务; > 超级智能阶段:理论上将具备超越人类的智能水平,能够进行创新和自我意识的决策。 ■ 具身智能的核心技术 □ 具身智能的三大核心要素 > 本体:智能体的物理载体,具备感知、运动和操作能力。本体的形态和功能直接影响智能体的任务执行能力。 > 智能:负责感知、理解、决策和控制的核心模块,通常由多模态大模型 ( 如 LLM 、 VLM) 驱动。通过整 合视 觉、语言、触觉等多种模态数据,生成适应环境的行动策略。 > 环境:智能体交互的物理世界,包括动态变化的场景和任务目标。环境的复杂性和不确定性要求智能体具备 强大的适应能力和实时学习能力。 感知交 互 环 境 ■ 具身智能的核心技术 □ 具身智能的分类 ( 按功能用途 ) 工业机器人:应用于生产过程与环境的机器人。 · 搬运作业 / 上下料机器人、焊接机器人、喷涂机器人、加工机器人、装配机器人、洁净机器人等。 服务机器人:个人 / 家用服务机器人及专业服务机器人 , · 家务机器人、教育机器人、娱乐机器人、养老助残机器人、餐饮机器人、讲解机器人、迎宾机器人等。 特种机器人:可以在极端环境下 ( 如高温、高压、辐射等 ) 替代人类完成任务。 · 检查维修机器人、专业检测机器人、搜救机器人、专业巡检机器人、侦察机器人、排爆机器人、专业安装 机 器人、采掘机器人等。 ■ 具身智能的核心技术 □ 具身智能的分类 ( 按形 态 ) > 人形机器人 > 固定式机器人 > 轮式机器人 / 履带式机器人 > 多足机器人 > 仿生机器人 智能汽车 / 无人机 / 无认船 □ 具身智能的分类 ( 按形态 ) —— 人形机器人 > 人形机器人是目前最常见,也最引人瞩目的类别。 > 人形机器人的最大优势——通用性强 , > 人形机器人因为有类似人类的身体结构,可以更方便地使用门把手、 楼 梯、工具等设施,也能够适应人类工作场景。 > 人形机器人在交互上也有天然优势。它们可以通过表情、动作与人类 交 流,比如点头、挥手,甚至模仿人类的情绪,更容易被用户接纳。 ■ 具身智能的核心技 术 ■ 具身智能的核心技术 □ 具身智能的分类 ( 按形态 ) —— 固定式机 器人 > 通常安装在固定位置执行任务。 常用场景:安装在工业生产线上 ( 如焊接、装配、搬运 ) 。 □ 具身智能的分类 ( 按形态 ) —— 轮式机器人 > 轮式机器人主要依靠轮子进行移动,常见于仓储物流、巡检安防等领域。 > 为了方便工作,制造厂商往往会开发那种“下面是轮子,上面是手臂 9 的轮式机器人,也叫做轮臂机器人。 > 轮式机器人的优点主要是移动速度较快,能够快速穿梭在仓库或工厂中 丨 完成货物的搬运 : 分拣等工作。它们具备较好的环境感知能力 丨 能够 在 复杂环境中自主导航和避障〉 ■ 具身智能的核心技 术 ■ 具身智能的核心技术 □ 具身智能的分类 ( 按形态 ) —— 多足机器人 > 比较常见的机器狗,其实就属于多足机器人 ( 四足机器人 ) 。 > 多足机器人模仿了昆虫或爬行动物的行走方式,具备较强的地形适应能力,灵活性和稳定性更强,可以在 崎 岖不平的山路、废墟等环境中自由行走,执行勘探、救援等任务。 > 像机器狗这样的四足机器人,也适合扮演 Al 宠物这样的角色,用于家庭服务或特殊人群服务 ( 导盲 ) 场 景。 ■ 具身智能的核心技术 □ 具身智能的分类 ( 按形态 ) —— 仿生机器人 > 仿生机器人是一类通过模仿生物体的结构、运动方式、感知机制或行为特性来设计和工作的机器人。 > 它们融合了生物学、机械工程、电子技术、控制科学和人工智能等多个领域的知识 ,旨在让机器人能够像生 物一样灵活、高效地适应复杂环境并执行任务。 > 代表:水下仿生机器人、空中仿生机器人、地面仿生机器人、特殊仿生 . … ■ 具身智能的核心技术 □ 具身智能的分类 ( 按形态 ) —— 智能汽车 / 无人机 / 无人船 > 智能汽车、无人机、无人船等设备,本质上也属于具身智能。 它们通过传感器 ( 摄像头、雷达等 ) 实时感知周围环境,并利用 Al 算法进行数据处理和分析, 从 而实现自动驾驶、自主导航、自动避障等功能,符合前面说的具身智能定义。 ■ 具 身智能的核心技术 □ 具身智能的技术体系 参考:《具身智能发展报告 (2024) 》 , 中国信通院 。 位 置定位 世 界 模 型 视 觉 语 古 动 作 模 里 V A s 强 化 学 习 范 式 升 级 环 填 交 互 大 模 型 加 环 境 交 互 基 础支撑层 操作系统 中间件 云计算与边缘计算 仿真平台 具 身本体 决策 行动 从环境感知信息 任务层 感知 对象识别 场聚理解 … … 真实世界数据 知觉 温 度 触 行 动改变环境 反馈 安 全 与 隐 私 保 护 预 到
| ||
下载文档到本地,方便使用
共 68 页, 还有
4 页可预览,
继续阅读
文档评分


具身智能标准化研究与评测方法探索