具身智能科技前瞻探索(第3期):多任务操作、第一人称世界模型、低光照与模糊感知) 多任务操作、 第一人称世界模型、 低光照与模糊感 知 2025/04/08/ 为产业发展和投资决策提供最前瞻视角。 本期核心关注多任务操作、 第一人称世界模型、 低光照与模糊感知、 仿真数据生成等六大前沿进展 本期科技前瞻探索摘录来自港科大 ( 广州 ) 、上海交通大学、 浙江大学等研究机构的 6 篇最新学术前沿成果 , 包括 MOE-ACT: 多任务双臂操作规模化学习框架、 : 1: 对具身智能学术 研究前沿的影响 : 本文为多任务机器人模仿学习提 供 了轻量化的 MOE 融合方案 , 验证了稀疏专家激活机制在缓解多任务干 扰 上的有效性 , 其 FiLM 语言调制与多尺度注意力设计 , 可为后续 ACT 类策 略的多任务优化提供可复用的技术路径 , 同时也为双臂操作场景的轻量 化 多任务学习研究提供了新的实证参考。 2: 对具身智能产业界发展的参考意义 GPU 完成实时推理 , 适配工业机器人、人形机器人的现场控制需求 ; 其多任务统一策略的优化方案 , 可降低工业场景多任务操作的模型训 练 与 部署成本 , 为 3C 电子、 汽车制造等场景的双臂机器人规模化落地 , 提 供 了轻量化、 易部署的技术优化方向参考。 主要贡献 : 1: 提出轻量化多任务双臂操作框架 MOE-ACT: 将稀疏 MOE 模块融入 ACT 的10 积分 | 25 页 | 1.12 MB | 18 天前3
低空环境智能感知关键技术及应用方案(43页 PPT)全球包括卡耐基梅隆大学等 在内的 2000+ 参赛队伍 5000+ 篇论文使用并引用 > 关键平台: 建立了复杂环境协同感知数据平台 ( TPAMI 2022 ) 构建了大规模多源、多模态、多任务、非完备复杂环境协同感知数据平 台 VisDrone ,覆盖单机和多机协同感知任务。 国内外广泛使用的无人机视觉基准数据平台 DroneCrowd-TJU DroneVehicle-TJU 视觉-语言-导航 (VLN) 多模态动态感知 多任务协同学习 视觉-语言-动作 (VLA) 多智能体社会化交互 群体态势自主感知 集 群 协 同 感 控 一 体 视 觉感 四 未来工作 一 研究背景 二 VisDrone 数据平 台 · 三 · 低空协同感知脑 混合专家动态融合 数据支撑 大规模、多源、多模态、多任务的协同感知开放数据平台 双向动态提示学习 复杂环境下低空视觉感知面临通用表征学习模型缺乏、任务定制表征学习难等挑战难点。 实现复杂环境下智能无人集群全天候精确感知 复杂环境低代价感知难 非对称掩码视频计数 任务定制混合 Adapter 大规模、多源、多模态、多任务的协同感知开放数据平台 数据 - 标签关系挖掘不充分 任务定制表征学习难 缺乏通用表征学习模型 复杂环境低代价感知技术 挑 战 难 点 关 键 技 术 创 新 海河天眼基座模型 数据支撑10 积分 | 43 页 | 14.84 MB | 3 月前3
低空智能—从感知推理迈向群体具身解决方案(38页)2020 年 大规模密集数据与 通用检测数据集 03 VTUAV 2020 年至 2023 年 多模态 动态感知数据集 02 DroneVehicle 04 低空环境感知数据呈现出多任务、 多模态和多源协同特性 以 VisDrone 数据集为代表 ,低空环境感知数据面临简单静态到动态复杂的演进。 AG-ReID UAV-123 现实空间推理 基于多源信息构建物理度量, 在真实环境中进行空间推理。 可进化世界 无人机智能体 VLN 、 VLA 面向低空需求 ,构建大规模低空视觉感知开放数据平 台 VisDrone 开源社区 Star 数 量 图像 / 视频 帧 论文引用量 多任务感知 多模态感知 人群计数 物体追踪 多机感知 目标检测 模型 流水工厂 数据 百城共建 通过数据、模型、场景的三维融合展示 ,为政府、企业、公众提供低空领域的一站式资源入口 ,构建 70% 50% 一、 低空研究背 景 二、 低空数据平 台 三、 低空感知大 脑 CONTEN TS 城市治理 多传感器协同学习 多任务协同学习 多机协同学习 低空环境智能感知理论与方 法 科学问题 研究挑战 关键难题 技术创新 核心贡献 成果应用 “ 看不准”10 积分 | 38 页 | 11.86 MB | 3 月前3
智慧仓储物资可视化方案及预算(44页 PPT合瑞华思)根据电子标签提示拣货数量进行拣货,拣货完成手动按键灭灯 实现以下效果 1 、采用卡扣粘贴在料盒上,并配有防撞铝型材进行标签保护, 随料盒在仓库内周转。 2 、每个料盒四种物料实时信息在线监测管理。 3 、支持多任务同时拣货,标签信息随着物料变更绑定物资可以 及时调整 4 、可以设置低库存预警,提醒采购人员 应用场景预期效果 2 、料盒物资管理(每个料盒粘贴一个无线水墨屏亮灯指引电子标签,管理三种物料,最多支持一 )拣货人员根据亮灯指引电子标签提示精准找到该物资。并根据电子标签提示拣货数量进行拣货, 拣货完成手动按键灭灯。多任务同时拣货,手动确认切换物资进行拣货。 实现以下效果 1 、采用卡扣粘贴在料盒上,并配有防 撞铝型材进行标签保护,随料盒在仓库 内周转 2 、每个料盒三种物料实时信息在线监 测管理,最多支持 6 种。 3 、支持多任务同时拣货,标签信息随 着物料变更可以及时调整 4 、设置低库存预警,提醒采购人员 系统介绍10 积分 | 44 页 | 12.82 MB | 4 月前3
低空空域数字孪生构建应用方案(47页PPT)无人机智能解译样本集 样本管理系统 构建多时相、多尺度等多区域适应的飞行器智能解译样本集 飞行要素模拟样本集 航路规划样本集 多任务负载样本集 应急模拟样本集 GISTC P22 快速开始 视频影像地理配准 AI 大模型 - 智能算法引 擎 关键点匹配 智能航线规划引擎 虚 各种飞行任务、飞行规则、空域划分、空域管理、空域规则、航道划 分、航道管理等进行模拟,验证其可行性与可靠性后再进行真实环境飞行。 飞行仿真模拟平台 GISTC 空域规则模拟 环境条件模拟 飞行状态模拟 多任务模拟 P40 SuperMap 项目开发能力支撑应用 层 空域仿真模拟 飞行模拟 环境选址模拟 空域模拟 航道模拟 立体交通管控 交通调度 接泊管理 预约游览 巡检管理 低空空 域展示20 积分 | 47 页 | 26.94 MB | 10 月前3
2024年汽车AI大模型TOP10分析报告(59页 PPT)ERNIE 3.0 Zeus | 鹏城 - 百度 · 文心 ERNIE 3.5 | ERNIE 4.0 视觉 OCR 图像表征学习 VI MER-StrucTexT 多任务视觉表征学习 VI MER-UFO 视觉处理多任务学习 VI MER-TCIR 自监督视觉表征学习 VI MER-CAE 跨模态 文档智能 ERNIE-Layout 文图生成 ERNIE-ViLG 视觉 28 加符合物理规律的多模态内容。 能力以及工具调用能力。 跨领域多任务。 该平台基于盘古大模型和 ModelArts AI 开发生产线 , 提供了数据 生成、 自动标注、 模型训练、 云端仿真、 虚实结合仿真、 数据 闭 环等一系列能力。 该平台预集成了超过10 积分 | 59 页 | 27.94 MB | 6 月前3
基于大模型的企业架构建模助力银行数字化转型应用方案通过设计领域特定的特征提取器,捕 捉金融数据中的关键模式和规律,如 交易行为特征、风险评估指标等,增 强模型对金融领域数据的理解和处理 能力。 多任务学习 结合银行数字化转型中的多种任务 (如风险预测、客户画像、智能推荐 等),采用多任务学习框架,使模型 在多个任务中共享知识,提高整体效 率和效果。 领域自适应( Domain Adaptation )技术实现 增量学习策略 反馈闭环优化40 积分 | 56 页 | 11.28 MB | 1 年前3
2025企业级AI Agent(智能体)价值及应用Agent Core 平台和 Agentic IDE 工具 Kiro ,助力企业快速构建和运行 Agent 应用; 谷歌依靠 Gemini 系列大模型、通用人工智能助手 Project Astra 和多任务智能体 Project Mariner ,打造强大的智能 Agent 产品矩阵; OpenAI 凭借 Operator 图形界面交互智能体和 ChatGPT Agent 多模态任务执行中枢,为企业提供便捷高效的智能交互体验。 AI Agent 风口已至:科技巨头竞逐企业级 Agent 赛 道 Google • Gemini 系列大模型 • 通用人工智能助手 Project Astra • 多任务智能体 Project Mariner AWS • Agentic IDE 工具 Kiro 科技巨头纷纷布局企业级 Agent • Amazon Bedrock AgentCore 所得”的跨系统操控 庭宇科技:“ Lybic+Agentkit” 打造企业多任务秒级响应自动化智能助理 庭宇科技和火山引擎合作推出“ Lybic+Agentkit” 企业自动化智能助理。作为火山引擎 Agentkit 智能体平台核心生 态伙伴 ,基于其面向 Agent20 积分 | 76 页 | 10.80 MB | 6 月前3
深度学习在智能助理产品中的应用(20页PPT-吾来)肯德基到公司 查一下附近卖麻小的餐厅 预约保洁阿姨上门 相同意思 多种表达 多轮 交互 相同表达 多种意思 口语 表达 网络 流行语 表达错误 和纠正 混合 多任务 了解用 户习惯 语音识别 的错误 更好的 用户体验 更高的 用户活跃度 更多的 高质量数据 • HI 的介入使得对话系统更加可 靠 • 由 AI 决定何时需要10 积分 | 20 页 | 427.93 KB | 6 月前3
钢铁工业智慧管控与运行优化有更高的交货期准确度。其按周交货命中率在 80% 以上。 DUT Artificial Intelligence Institute, Dalian 20 生产调度与智能管控 —— 行车优化调度 可适用于多任务、多行车的各种复杂情况,可移植性强 算法可在短时间内获得最佳行车方案,以某炼钢车间为例,相较人工调度可提前 34min 能够促进工序调度的稳定,减少和均衡行车工作量 该解决方案已成10 积分 | 25 页 | 20.83 MB | 1 年前3
共 36 条
- 1
- 2
- 3
- 4
