任务 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

具身智能科技前瞻探索（第3期）：多任务操作、第一人称世界模型、低光照与模糊感知

) 多任务操作、第一人称世界模型、低光照与模糊感知 2025/04/08/ 为产业发展和投资决策提供最前瞻视角。本期核心关注多任务操作、第一人称世界模型、低光照与模糊感知、仿真数据生成等六大前沿进展本期科技前瞻探索摘录来自港科大 ( 广州 ) 、上海交通大学、浙江大学等研究机构的 6 篇最新学术前沿成果 , 包括 MOE-ACT: 多任务双臂操作规模化学习框架、 : 1: 对具身智能学术研究前沿的影响 : 本文为多任务机器人模仿学习提供了轻量化的 MOE 融合方案 , 验证了稀疏专家激活机制在缓解多任务干扰上的有效性 , 其 FiLM 语言调制与多尺度注意力设计 , 可为后续 ACT 类策略的多任务优化提供可复用的技术路径 , 同时也为双臂操作场景的轻量化多任务学习研究提供了新的实证参考。 2: 对具身智能产业界发展的参考意义 GPU 完成实时推理 , 适配工业机器人、人形机器人的现场控制需求 ; 其多任务统一策略的优化方案 , 可降低工业场景多任务操作的模型训练与部署成本 , 为 3C 电子、汽车制造等场景的双臂机器人规模化落地 , 提供了轻量化、易部署的技术优化方向参考。主要贡献 : 1: 提出轻量化多任务双臂操作框架 MOE-ACT: 将稀疏 MOE 模块融入 ACT 的 Transformer

10 积分 | 25 页 | 1.12 MB | 18 天前
3
具身智能科技前瞻探索（第3期）：多任务操作、第一人称世界模型、低光照与模糊感知

10 积分 | 25 页 | 3.85 MB | 18 天前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

开创RL加持下强推理慢思考范式新边界 ➢ 得益于强大的推理能力与长文本思考能力，DeepSeek R1在复杂任务上表现卓越，成为开源领域的又一里程碑，标志着开源社区在与闭源大模型（如 OpenAI o1 系列）的竞争中迈出了关键性一步。 ➢ DeepSeek-R1 在数学代码任务上表现突出 ➢ Deepseek R1在AIME2024上获得了79.8%的成绩，略高于OpenAI-o1-1217。在MATH-500上，获得97 217。在MATH-500上，获得97.3% 的惊人成绩，表现与OpenAI-o1-1217相当。 ➢ 在编码相关的任务中表现出专家水平，在 Codeforces上获得了2029 Elo评级，在竞赛中表现优于96.3%的人类参与者 ➢ DeepSeek-R1 在知识类问答上推动科学探索边界： ➢ MMLU \ MMLU-Pro \ GPQA Diamond 等 STEM- related related 榜单上取得良好表现 ➢ R1 展现出强推理模型在 AI-Driven Research 的潜力 ➢ 在长文本依赖任务如 FRAMEs 和事实性推断任务 Simple-QA上表现突出 5 回顾：Pre-Training Scaling Law ➢ Pre-Training Scaling Laws: 预训练模型上广泛观察到的现象，协调了计算量C、模型参数量N和数据大小D之间的关系

10 积分 | 76 页 | 8.39 MB | 1 年前
3
DeepSeek大模型赋能高校教学和科研2025

M6 模型的参数量达 10 万亿。 3.1 大模型的概念训练数据量大计算资源需求高参数数量庞大大模型的设计和训练旨在提供更强大、更准确的模型性能，以应对更复杂、更庞大的数据集或任务。大模型通常能够学习到更细微的模式和规律，具有更强的泛化能力和表达能力学习能力强大模型可以从大量的数据中学习，并利用学到的知识和模式来提供更精准的答案和预测。这使得它大模型具有更强的上下文理解能力，能够理解更复杂的语意和语境。这使得它们能够产生更准确、更连贯的回答可迁移性高学习到的知识和能力可以在不同的任务和领域中迁移和应用。这意味着一次训练就可以将模型应用于多种任务，无需重新训练语言生成能力大模型可以生成更自然、更流利的语言，减少了生成输出时呈现的错误或令人困惑的问题 3.1 大模型的概念 3 这类模型通过在大规模图像数据上进行训练，可以实现各种视觉任务，如图像分类、目标检测、图像分割、姿态估计、人脸识别等。代表性产品包括 VIT 系列（ Google ）、文心 UFO 、华为盘古 CV 、 INTERN （商汤）等 3.4 大模型的分类通用大模型 L0 是指可以在多个领域和任务上通用的大模型。它们利用大算力、使用海量的开放数据与具有巨量参

10 积分 | 123 页 | 15.88 MB | 1 年前
3
英特尔-工业人工智能白皮书2025年版

法，构建预测模型，通过分析大量用户数据和市场趋势，洞察市场需求，预测未来趋势，精准定位产品的设计与迭代方向。 • 优化研发流程管理：基于当前项目状态和历史数据建立预测模型，预测每项任务的完成时间，并评估整个项目的完成时间，有助于提前发现潜在延迟风险，让团队合理分配时间和其他资源，保证项目按时或提前完成。 • 自动化代码编写与优化：AI 编程助手利用深度学习算法和在生产计划和排程方面，AI 算法可以优化生产计划和排程，最大程度地减少产线空闲时间，提高产品交付准时率。在生产资源分配方面，通过深度学习和大数据分析， AI 系统能够根据实时数据预测生产任务，自动调整生产参数，并合理地分配人力、设备、物料等生产资源，提高资源利用率，确保生产线始终保持在最佳工作状态，提高生产效率。在生产过程监控和优化方面，AI 算法通过分析生产线上的各种运行状态反馈数据和工艺参数，能够预 Model），是指具有大量参数和复杂结构的机器学习模型，能够处理海量数据、完成各种复杂的任务，如自然语言处理、计算机视觉、语音识别等。大模型通常包括大语言模型 (LLM)、视觉大模型 (CV)、多模态大模型等各种类型。大模型通过训练海量数据来学习复杂的模式和特征，具有更强大的泛化能力，可以对未见过的数据做出准确的预测，能够处理更加复杂的任务和数据。展开来讲，大模型技术有以下几项基本特征： 1. 普遍基于

0 积分 | 82 页 | 5.13 MB | 1 年前
3
AI跃迁派：2025年DeepSeek零基础完全指南

了突破性平衡：技术黑话翻译： ⚫ MoE 混合专家系统：像医院分诊台，遇到数学题自动转接“数学博士”，写诗转接 “文学教授” ⚫ MLA 多头潜在注意力：让 AI 像章鱼同时处理多任务，普通电脑也能流畅运行 ⚫ DualPipe 通信技术：优化 AI“脑细胞”之间的协作效率，响应速度提升 50% 2.功能模块：你的私人 AI 军团 DeepSeek 通过三大功获取路径： 1.微信搜索"DeepSeek"公众号 2.后台发送关键词【小程序】获取专属链接 ⚫ 优势：无需注册，微信一键登录，适合快速查询天气、新闻等简单任务 ⚫ 限制：高峰期可能响应延迟，建议复杂任务切换至 APP 或网页版 ④电脑版（专业场景必备）下载安装： 1.访问官网选择 Windows/macOS/Linux 版本 2.解压安装包后按向导完成部署（建议默认路径）

10 积分 | 21 页 | 1.01 MB | 1 年前
3
华为昇腾DeepSeek解决方案

Restricted Distribution 下一代 AI 技术 Mamba 、空间智能等算力 x 数据 x 思考模型效果低成本完美对标 OpenAI O1 ，突破精确语义理解及复杂推理任务 DeepSeek-V3 是一款 MoE 模型，总参数量 671B ，激活参数量 37B ，采用 2048 张 H800 （节点内 NVLink ，节点间 IB ，非超节点架构）在 14.8T token 架构创新工程奇迹开源生态 4 Huawei Proprietary - Restricted Distribution DeepSeek R1: 在 Reasoning 任务达到了世界水平（ OpenAI- o1 ）以 2 阶段 SFT+2 阶段 RL 完成，从而解决 R1-Zero 可读性差、多种语言混合问题本次开源同时发布了 6 个基于 DeepSeek-R1 级框盒、框框组网，适用于大规模及超大规模集群 3 、 AI 任务信息任务、通信域 … 1 、控制器获取网络拓扑，下发路径信息 2 、 AI 任务调度以全部通信关系和拓扑信息作为输入通过算法计算出最优结果，实现 AI 参数面全网负载均衡算网协同 • 网络级负载均衡：独家 NSLB 算法，算网协同调度，多任务节点非连续组网情况下，通信带宽提升 20% 、模型性能提升

0 积分 | 32 页 | 2.52 MB | 1 年前
3
山东大学：DeepSeek 应用与部署

，部分限时免费，涵盖文本生成等功能。 • 百度智能云：千帆 Model Builder 全面支持 DeepSeek - R1/V3 调用，且限时免费，其模型在百科知识、数学推理等任务表现突出。 • 英伟达：可通过特定接口调用 DeepSeek - R1 671B 全量模型，获取 API Key 后能进行相关操作。 DeepSeek API 调用 API 调用方法

10 积分 | 79 页 | 6.52 MB | 1 年前
3

共 8 条前往

页

分类

语言

格式