具身智能科技前瞻探索(第3期):多任务操作、第一人称世界模型、低光照与模糊感知) 多任务操作、 第一人称世界模型、 低光照与模糊感 知 2025/04/08/ 为产业发展和投资决策提供最前瞻视角。 本期核心关注多任务操作、 第一人称世界模型、 低光照与模糊感知、 仿真数据生成等六大前沿进展 本期科技前瞻探索摘录来自港科大 ( 广州 ) 、上海交通大学、 浙江大学等研究机构的 6 篇最新学术前沿成果 , 包括 MOE-ACT: 多任务双臂操作规模化学习框架、 : 1: 对具身智能学术 研究前沿的影响 : 本文为多任务机器人模仿学习提 供 了轻量化的 MOE 融合方案 , 验证了稀疏专家激活机制在缓解多任务干 扰 上的有效性 , 其 FiLM 语言调制与多尺度注意力设计 , 可为后续 ACT 类策 略的多任务优化提供可复用的技术路径 , 同时也为双臂操作场景的轻量 化 多任务学习研究提供了新的实证参考。 2: 对具身智能产业界发展的参考意义 GPU 完成实时推理 , 适配工业机器人、人形机器人的现场控制需求 ; 其多任务统一策略的优化方案 , 可降低工业场景多任务操作的模型训 练 与 部署成本 , 为 3C 电子、 汽车制造等场景的双臂机器人规模化落地 , 提 供 了轻量化、 易部署的技术优化方向参考。 主要贡献 : 1: 提出轻量化多任务双臂操作框架 MOE-ACT: 将稀疏 MOE 模块融入 ACT 的 Transformer10 积分 | 25 页 | 1.12 MB | 18 天前3
具身智能科技前瞻探索(第3期):多任务操作、第一人称世界模型、低光照与模糊感知10 积分 | 25 页 | 3.85 MB | 18 天前3
XX 市低空经济“一网统飞”平台建设方案.. 44 6.2 技术创新点 ............................................................. 44 6.2.1 “ ” 一航线多任务 智能规划..............................44 6.2.2 跨系统数据融合底座......................................45 6 ...........46 7.1 项目周期 .............................................................. 46 7.2 阶段任务安排 ....................................................... 46 7.2.1 前期准备阶段(第 1-3 个月) ........... 以 统筹资 源、协同高效、安全可控 9 为核心,构建覆盖全域 ‘ 的无人机 一网统飞 9 服务体系,破解政务侧无人机 应 ” 用分散、数据孤岛等问题 ,将本项目列为 “智慧城 ” 市建设重点任务 ,纳入市委市政府年度工作考核清 单。 1.2 现实需求 当前,XX 市无人机巡飞技术已在应急救援、交通疏导、 违建排查等政务领域初步应用:应急管理部门通过无 人机开展森林火情监测,年均飞行超10 积分 | 66 页 | 135.69 KB | 18 天前3
用友智能工厂(离散版)实施方法论V2.0【91页PPT】用友智能工厂(离散版) 实施方法论 V2.0 综述 阶段任务详解 项目管理要点 实施指引 综述 “ 中国制造 2025” 及“工业 4.0” 概念的快速普及将会极大促进中国传统制造业的转型升级,构建“体现信息技术与制造技术深度融合的数 字化、网络化、智能化制造”成为中国制造业近十年的发展目标。 基于多年以来在离散制造行业深度经营的积累,并满足原型样板客户 记录”的理念,借鉴互 联网产品和移动应用产品的技术架构和开发模式,重点解决离散行业车间现场管理中有关 进度采集与监控、品质管理、现场物流驱动、生产过程防错等业务需求,实现车间现场人 员、设备、物料、任务等各个方面的有机整合,协助客户实现离散制造业的智能化改进。 1. 综述 - 定义及适用范围 1. 综述 - 用友智能工厂概貌 1. 综述 - 智能工厂实施方法论整体架构 组建团队 内部交接 动员会 方案评 审会 仿真模拟 上线 报告 1. 综述 - 实施路线图 调研与评估 方案设计 系统构建 上线运行 项目总结 1. 综述 - 智能工厂方法论与标准实施方法论的对比分析 - 阶段任务 U9 SMART 实施方法论 V2.5 项目规划 蓝图设计 系统建设 上线切换 持续支持 • 团队组建 • 内部交接 • 首次访谈 • 实施策略与计划确认 • 项目启动与宣贯 • 运行环境规划与部署10 积分 | 91 页 | 6.40 MB | 3 月前3
低空环境智能感知关键技术及应用方案(43页 PPT)2000+ 参赛队伍 5000+ 篇论文使用并引用 > 关键平台: 建立了复杂环境协同感知数据平台 ( TPAMI 2022 ) 构建了大规模多源、多模态、多任务、非完备复杂环境协同感知数据平 台 VisDrone ,覆盖单机和多机协同感知任务。 国内外广泛使用的无人机视觉基准数据平台 DroneCrowd-TJU DroneVehicle-TJU 视觉-语言-导航 (VLN) 多模态动态感知 多任务协同学习 视觉-语言-动作 (VLA) 多智能体社会化交互 群体态势自主感知 集 群 协 同 感 控 一 体 视 觉感 四 未来工作 一 研究背景 二 VisDrone 数据平 台 · 三 · 低空协同感知脑 混合专家动态融合 数据支撑 大规模、多源、多模态、多任务的协同感知开放数据平台 双向动态提示学习 2024 ) 任务门控的多合一退化多模态融合模型( TG-ECNet ) Ir=TG-EC Net(t,f 动态感知低质量图像退化类型 ,提示引导专家协同学习 , 实现 All-in-One 退化 多 模态图像融合 创新:提出任务自适应门控的多模态专家协同模型解决多种类型退化干扰下融合难题 (ICML 2025) 复杂环境下低空视觉感知面临通用表征学习模型缺乏、任务定制表征学习难等挑战难点。10 积分 | 43 页 | 14.84 MB | 3 月前3
2025年云计算研究白皮书-中国电信. 12 1.3.2 面向大模型时代的智能数据平台技术 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.3.3 支撑智能任务的高性能存储平台技术 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.4 热点方向三:智能化云运维、可信安全与能效优化 . . . 41 2.4.1 数据协同构建跨层级数据流通体系 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 2.4.2 任务协同实现多点协作与动态调度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.4.3 模型协同支撑智能能力演进 . . 开发的一站式平台集成训练框架、推理优化、向 2 CHAPTER 1. 面向下一代云计算的研究 量检索与模型压缩能力,降低开发门槛;数据库与大数据平台向“湖仓一体”、“实时分析 +AI 内嵌”演 进,支撑复杂的数据科学任务。CI/CD 流程也扩展至 MLOps(Machine Learning Operations)范畴,实现 模型交付的自动化与可追溯。与此同时,模型即服务 MaaS(Model as a Service)正成为连接模型能力与10 积分 | 140 页 | 11.65 MB | 3 月前3
智慧仓储物资可视化方案及预算(44页 PPT合瑞华思)标签系统与管理系统对接,分析库存现状,库位实时管理; 暂存区半成品快速定位查找; 实现单据的分割和合并,满足多单多人同时操作; RFID 技术引入, RFID 目标半成品到达目标工位时,目标工位作业任务自动推送到电子作业看板上, 指导作业人员无纸化操作; 所有业务单据从 ERP 系统中自动提取,实现仓储电子标签系统与 WMS 数据的实时同步;创建独立的 数据库记录目前 WMS 不能记录的信息作为 待检信息显示 下一站 闪灯指引拣货 高亮度 三色灯 个性化定制显示模 板 超高频拣货使用流程 拣货任务 操作员输 入任务 点击出库 任务提交 后台 系统生产 交货单 入库位 标签刷新 闪烁 拣货 完成 下单:仓库操作人员收到出库任务单,操作人员确认 出库任务单,提交到后台系统,系统按照先进先出的 原则自动生成拣货单,此时对应物料的电子标签会自 动亮灯,并显示要拣货的物料信息、订单号及数量。 1 2 将物料拣 出 按 OK 键 确认拣货 完成 低频拣货使用流程 出库任务 操作员输 入任务 点击出库 任务提交 后台 系统生产 交货单 入库位 PTL 航 道 灯 闪烁 拣货 完成 下单:仓库操作人员收到出库任务单,操作人员使用 PDA 点击出库任务单,提交到后台系统,系统按照 先 进先出的原则自动生成拣货单,此时对应物料的 电子 标签会自动亮灯,并显示要拣货的物料信息、10 积分 | 44 页 | 12.82 MB | 4 月前3
低空智能—从感知推理迈向群体具身解决方案(38页)要 精细逻辑进行推理。 复杂环境下 ,低空推理决策面临语义稀密、空间难解与任务繁复的挑 战 感知 目标检测、 目标计数、 场景分类、 异常识别 理解 图像描述、 条件判断、 视觉定位、 高度预测 推理 物理推理、 因果推理、 情景推断、 反事实推理 决策 多机协同、 任务规划、 动作执行、 安全性评估 任务高度多样化 ,在输出结构、 知 识 深度与推理路径上差异巨大 , 需要 跨层次泛化推理能力。 斜拍视角进行位置判断与空间度量 任务间推理路径差异化 俯拍视角进行目标感知与属性理解 四维度多种任务形式 空间难解 任务繁复 复杂环境下 ,低空具身智能面临“不可靠” ,“不精准”和“不可控”的挑战 “ 目标理解不可靠” “ 动作生成不精准” “ 体系安全不可控” 行动路径撞上障碍物 动作生成误差导致机械臂需要执行 冗余动作才能完成任务 语言指令与场景理解不稳定 ,任务 目标识别易偏差 端到端决策难以解释 2020 年 大规模密集数据与 通用检测数据集 03 VTUAV 2020 年至 2023 年 多模态 动态感知数据集 02 DroneVehicle 04 低空环境感知数据呈现出多任务、 多模态和多源协同特性 以 VisDrone 数据集为代表 ,低空环境感知数据面临简单静态到动态复杂的演进。 AG-ReID UAV-123 现实空间推理 基于多源信息构建物理度量, 在真实环境中进行空间推理。10 积分 | 38 页 | 11.86 MB | 3 月前3
eVTOL低空经济低空无人机消防部署AI识别项目设计方案(185页 WORD)环境数据采集:通过气 体传感器和温湿度传感器,采集火灾现场的环境数据,为灭火决策 提供科学依据。 - 动态路径规划:无人机根据火情变化和现场环 境,自动规划最优飞行路径,确保监测和救援任务的高效执行。 - 数据实时传输与可视化:将采集到的火情数据、环境数据和视频流 实时传输至指挥中心,并通过可视化平台展示,辅助决策者快速响 应。 项目的技术架构分为三个层次:感知层、处理层和应用层。感 此外,AI 识别技术还可以与无人机自主飞行控制技术相结合, 实现无人机的智能避障和路径规划。在复杂的火灾现场环境中,无 人机能够根据 AI 的指令,自动避开障碍物,选择最优路径接近火 灾源,从而确保灭火任务的顺利进行。这种智能化的飞行控制不仅 提高了无人机的安全性,还大大降低了操作人员的负担。 综上所述,AI 识别技术在低空无人机消防部署中的应用,不仅 能够提升火灾监测和应急响应的效率,还能优化消防资源的调度和 实时火情监测与预警:利用无人机搭载的高清摄像头和红外传 感器,实时监测目标区域的火情动态,并通过 AI 算法快速识 别火源、烟雾等异常情况,实现早期预警。无人机能够在复杂 地形和恶劣环境下执行任务,确保监测的全面性和及时性。 2. 精准火源定位与态势评估:通过 AI 图像识别和数据分析技 术,无人机能够精确识别火源位置,并结合地理信息系统 (GIS)生成火势蔓延趋势图,为消防指挥中心提供科学的决10 积分 | 197 页 | 832.72 KB | 3 月前3
2026金融级智能应用实践指南:技术创新与行业落地全解析-应用现代化推进中心&云原生产业联盟学习模型的辅 助工具,功能局限于特定任务的自动化处理。而随着大模型与智能体 (Agent)技术的突破,智能应用正迈向更高阶形态一一它不再仅是 被动响应指令的执行单元,而是具备意图理解、自主规划、工具调用 与持续学习能力的主动服务主体,其主要应用技术为大模型与智能体 3沙丘社区,18个保险业大模型应用场景业务价值评估 自主决策 AI独立完成复杂任务,具 备推理与优化能力 AI辅助决策,但仍需人工 AI辅助决策,但仍需人工 04 主导 智能自治 AI能主动发现机会、提出 策略、持续进化 智能协同 功能集成 AI与人协作完成任务 嵌入AI能力(如OCR、语 音识别、机器学习模型) 图1AI原生应用发展阶段 值得注意的是,智能体虽为当前智能应用建设最具代表性的实践 形式,但引入智能体不意味着就实现了AI原生应用。仅以聊天界面 封装多个API的模式与具备自主感知-决策-执行闭环的智能体架构有 架构有 本质区别,更非以AI为核心驱动进行业务实现的AI原生应用。AI 原生的智能应用能够深度融入业务流程,在复杂、动态、多约束的真 实环境中,像人类专家一样思考、决策并协同完成端到端任务。其核 心价值不仅在于提升效率,更在于重构服务模式与业务逻辑。 金融作为国家经济命脉和风险高度敏感的行业,其对技术应用的 要求较其他行业更为严苛。真实意义的金融级智能应用,绝非简单地 将通用大模型接10 积分 | 81 页 | 14.81 MB | 18 天前3
共 546 条
- 1
- 2
- 3
- 4
- 5
- 6
- 55
