北京大学-DeepSeek原理和落地应用2025大模型相关术语 l 多模态 Ø 文本、图片、音频、视频 l AI工具(国内) Ø DeepSeek、 豆包、Kimi、腾讯元宝、智谱清言、 通义千问、秘塔搜索、微信搜索... l 通用模型 Ø 大语言模型(LLM,Large Language Model) Ø 视觉模型(图片、视频) Ø 音频模型 Ø 多模态模型 Ø …… l 行业模型(垂直模型、垂类模型) Ø 教育、医疗、金融等 •Transformer架构:可以并行矩阵计算(GPU),核心是注意力机制(Attention) •编码器(BERT):多数embedding模型,Ernie早期版本,……. •混合网络:T5、GLM •解码器(GPT):大语言模型(LLM),也是传统的多模态模型的核心 •生成式人工智能(GenAI):AIGC •DeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、…… •OpenAI •OpenAI GPT(ChatGPT)、Claude、Llama、Grok、…… •Diffusion架构:主要用于视觉模型(比如Stable Diffusion、DALLE),现在也开始尝试用于语言模型 •Diffusion+Transformer架构:例如Sora的DiT(加入Diffusion的视觉模型),部分新的多模态模型架构 大模型的发展阶段 生成模型 ref:中文大模型基准测评2024年度报告(202510 积分 | 57 页 | 9.65 MB | 5 月前3
2024年中国人工智能产业研究报告基础设施建设,并因地制宜出台特色政策。尽管GDP增速放缓,AI技术作为新质生产力,凭借 其在提升效率和推动产业升级方面的优势,展现出广阔发展前景,政府支持也为其提供了强劲 动能。资本市场持续关注AI,投资重点聚焦于语言与多模态模型应用、芯片、算力服务等领域, 基础层与应用层协同发展,不断完善产业生态。社会层面,生成式AI的普及加速了市场教育, 公 众 接 受 度 显 著 提 升 , 但 就 业 替 代 、 隐 私 4 目 录 CONTENTS 01 中国大模型产业宏观环境 政策、经济、社会、技术 02 中国大模型产业价值总览 基础层、模型层、应用层 03 中国大模型产业商业进程 语音、视觉、语言及多模态产品 04 中国大模型产业实践案例 典型产品、标杆厂商 05 中国大模型产业发展趋势 产业机遇、关键挑战 5 中国人工智能产业宏观环境 —— 当下,中国人工智能产业 在经济、政策、认知、技术维度的发展环境如何? www.iresearch.com.cn 中国人工智能产业资本环境 语言及多模态赛道目前最受瞩目,同时基础层厂商积极入局 来源:艾瑞咨询研究院自主研究绘制。 从投资轮次的分布情况着眼,战略及股权投资的数量及占比均呈现出显著的上升态势,其中股权投资事件占比高达77.9%。而在应用赛道 的投资分布方面,语言及多模态赛道目前已成为最受瞩目的投资领域。与此同时,以AI芯片、AI算力解决方案、算法架构等为代表的基础0 积分 | 51 页 | 3.35 MB | 5 月前3
2024年中国人工智能产业研究报告基础设施建设,并因地制宜出台特色政策。尽管GDP增速放缓,AI技术作为新质生产力,凭借 其在提升效率和推动产业升级方面的优势,展现出广阔发展前景,政府支持也为其提供了强劲 动能。资本市场持续关注AI,投资重点聚焦于语言与多模态模型应用、芯片、算力服务等领域, 基础层与应用层协同发展,不断完善产业生态。社会层面,生成式AI的普及加速了市场教育, 公 众 接 受 度 显 著 提 升 , 但 就 业 替 代 、 隐 私 4 目 录 CONTENTS 01 中国大模型产业宏观环境 政策、经济、社会、技术 02 中国大模型产业价值总览 基础层、模型层、应用层 03 中国大模型产业商业进程 语音、视觉、语言及多模态产品 04 中国大模型产业实践案例 典型产品、标杆厂商 05 中国大模型产业发展趋势 产业机遇、关键挑战 5 中国人工智能产业宏观环境 —— 当下,中国人工智能产业 在经济、政策、认知、技术维度的发展环境如何? www.iresearch.com.cn 中国人工智能产业资本环境 语言及多模态赛道目前最受瞩目,同时基础层厂商积极入局 来源:艾瑞咨询研究院自主研究绘制。 从投资轮次的分布情况着眼,战略及股权投资的数量及占比均呈现出显著的上升态势,其中股权投资事件占比高达77.9%。而在应用赛道 的投资分布方面,语言及多模态赛道目前已成为最受瞩目的投资领域。与此同时,以AI芯片、AI算力解决方案、算法架构等为代表的基础10 积分 | 51 页 | 3.35 MB | 6 月前3
2025年自动化人工智能报告第34-46页 第4-8页 01 双星大爆炸 02 你的面孔,在未来 04 新的学习循环 在不同界面看似相同的情况下进行差异 化。 人们与人工智能如何定义一个学习、领 导和创造的正向循环。 03 当大型语言模型 出现时 他们的身体 当人工智能呈指数级扩展时,系统 将会被打乱。 如何基础模型重新定义机 器人学 信任是否是人工智能无 限可能性的极限? 引言 人工智能:自主 宣言 从卡斯帕罗夫的比赛以来,几乎已经过去了30年,而现 在能够使Deep Blue看起来像是一个普通玩家的模型都 坐在每个人的口袋里。图灵测试,曾经被认为是机器智 能的最高标准,现在每天都被人们与大型语言模型(LL M)支持的客户服务机器人和销售人员交流中所打破。 今天的AI模型已经摆脱了过去深度但具体且线性的方法 ,并展示了前所未有的自主性—在他们如何学习、如何 处理任务以及最终能够做什么方面。他们将这种自主性 行业 这可能看起来像是行业内公司之间的通用框架和 通信协议,或者是编码界定行业大挑战的引擎——这 些模型将有助于我们增长对物理学、遗传学、运动等 方面理解。并且对于 国家 和 政府 它汇集了独特的知识、语言、文化、法 律和安全,以帮助行业、公司和公民参与。关键的是 ,这些认知数字大脑不会在孤岛中运作。当它们开始 在不同层面互动时,它们将创造一股上升的智能浪潮 ,提升所有参与方的能力。 认知数字大脑将10 积分 | 66 页 | 5.50 MB | 5 月前3
2025食品饮料行业AI转型白皮书-甲子光年-82页化升级、供应链不确定性加剧,叠加气候与资源约束,传统生 产模式和增长逻辑面临前所未有的挑战。 与此同时,以人工智能为核心的新一代数字技术,正穿透从田 间到餐桌的全产业链条,为行业打开效率跃迁与价值重塑的想 象空间。以大语言模型为代表的生成式AI技术取得了突破性进 展,从最初简单的文本生成,到如今能够生成高质量的图像、 音频、视频等多模态内容,其应用范围不断拓展,潜力也愈发 凸显。如何借助AI技术实现转型升级,已成为食品饮料行业发 的、本土化的落地指南。我们深知,在AI转型的道路上,企业 面临着诸多困惑和难题,需要有一份具有针对性和可操作性的 经验总结来引领方向。 第一章深入洞察了食品饮料行业的变化趋势,并简述了AI技术 的演变路径、大语言模型的技术原理,以及现阶段应用大模型 技术的主流路径,和未来通用人工智能的趋势。第二章遴选了 食品饮料行业的典型十大场景,用具体案例,详细描述了需求 场景、解决路径、应用成果和经验反思,为行业企业实践提供 遇到的问题 企业知识碎片化 需要一套领域专家知识库和智能问 答系统,实现企业级知识沉淀 查找资料过程繁琐 养殖员日常工作需要翻阅大量资料 解决操作问题,人工查找过程繁 琐,期望使用自然语言描述自己遇 到的问题 问题回答准确率 90% 奶牛养殖企业级知识库 降低学习成本 提升工作效率 简单快速地搜索相关养殖知识, 高效处理实际遇到的各类问题 赋能养殖员高效、快速学习大量10 积分 | 82 页 | 17.71 MB | 5 月前3
人形机器人标准化白皮书(2024版)能力的,可以执行移动、操控或定位任务,可编程的机械致动机构 (programmed actuated mechanism with a degree of autonomy to perform locomotion , manipulation or positioning , ISO 8373:2021)。 人形机器人既可以是工业机器人,其定义为:自动控制的、可重 复编程、多用途的操作机,可对三个或三个以上轴进行编程,它可以 复编程、多用途的操作机,可对三个或三个以上轴进行编程,它可以 是固定式或移动式,用于工业自动化;也可以是服务机器人,其定义 为:个人使用或专业用途下,可为人类或设备完成有用任务的机器人。 所以,人形机器人在不同的应用背景下,具有不同的概念和含义。 目前,国内主流科技咨询公司对人形机器人概念的观点主要如下: 1)人形机器人是具备人类外形特征和行动能力的智能机器人,以 双腿行走的方式,通过手臂和身体的协调完成功能,基于通用型算法 机器人的范畴压缩过窄。 此外,在关于人形机器人的众多观点中,有一种颇具代表性的看 法,即认为人形机器人应当是:外观、行动与人类相似,具有部分或 全部人类特征的机器人。人类特征包括躯干、头、肢体、语言、动作 和智力等。而该观点争议较大的地方是“具有部分或全部人类特征的 机器人”,因为如果是“具有部分人类特征”的话,很难看起来像“人”, 如只有一只手或一个头部等,该定义的范畴又扩展过宽。0 积分 | 93 页 | 3.74 MB | 5 月前3
2025具身机器人行业未来展望报告大脑半球,二者由神经纤维构成的胼胝体相连。脑干又可分为中脑、脑桥及延髓三部分。 部位 位置 功能 大脑 又称为端脑,位 于脑的最上部, 占人脑总体积的 约85%,分为左 右两个半球 高级认知:负责思维、记忆、语言、决策、情感灯 复杂功能 感觉与运动:处理视觉、听觉、触觉等信息、并控 制自主运动 小脑 位于大脑后下方, 紧贴脑干后方, 形似蝴蝶。 运动协调:调节肌肉张力、协调精细动作(如鞋子、 弹琴) 平衡与姿势:帮助维持圣体平衡与空间定位 驱动及算法监控部件的各类状态,保证机器人部件的基本运作能力。(2)传递信息的线束及网关,起到各个控制器,传感器信息交互通联的 作用。 部位 在人体中功能 在人形机器人中功能 机器人对应硬件 大脑 高级认知:负责思维、记忆、语言、决策、情感灯复杂功 能 感觉与运动:处理视觉、听觉、触觉等信息、并控制自主 运动 语义理解、环境信息理解、动 作决策等 目前为机器人中央控制器担任此角色, 但目前并未获得相应能力。后续可能 在此基础上进一步增加硬件及算力 但对于高级认知,信息处理能力尚未建立。展望未来,机器人大小脑有望实现分离,大脑算力进一步加强,小脑专注运动控制。 部位 在人体中功能 在人形机器人中功能 机器人对应硬件 大脑 高级认知:负责思维、记忆、语言、决策、情感灯复杂功 能 感觉与运动:处理视觉、听觉、触觉等信息、并控制自主 运动 语义理解、环境信息理解、动 作决策等 目前为机器人中央控制器担任此角色, 但目前并未获得相应能力。后续可能 在此基础上进一步增加硬件及算力0 积分 | 31 页 | 3.33 MB | 5 月前3
备份 中培伟业:2025年数字化转型与人才体系建设指南报告. 20250428 13-08-57从医疗健康到教育文化,数字化的触角 延伸至社会的每一个角落,重塑着我们的生活与工作方式。 大模型技术的兴起,将企业数字化转型推向了一个新的高潮。DeepSeek、ChatGPT、文 心一言等大语言模型的问世,为企业数字化转型提供了强大的技术支持和智力支撑。从智能客 服到自动化生产,从大数据分析到精准营销,AI 正逐步渗透到企业运营的各个环节,推动着 企业向智能化、高效化、个性化方向发展。 工作和思维方式。 在这种大环境下,培养数字化人才显得尤为重要。然而,在实际推进过程中,依然面临着许多 困难和挑战。 数字技术飞速发展,教育体系跟不上 随着数字化技术的不断创新,各种新的编程语言、工具和框架层出不穷,促使人才不断进 行学习和技术更新。传统的教育体系往往无法及时适应这种快速变化,教材老化、教学方法滞 后,导致其无法有效满足现代数字化人才的需求。教育与行业之间的脱节,使得毕业生所掌握 首先是数据解析与决策转化能力, 要求人才能够运用分析工具提炼价值信息;其次是数字化工具的系统性操作与协同应用能力, 需掌握主流技术平台的实践技能;此外,业务逻辑深度理解能力也至关重要,需能将技术语言 与商业需求进行有效衔接。 因此中培伟业针对数字化应用人才设计了“三大核心能力模型”,分别为数字化理念、数 字化实操以及数字化布局,内容涵盖了产品、敏捷、项目管理、数据分析、AI 办公等 1210 积分 | 53 页 | 6.10 MB | 5 月前3
信通院:“机器人+人工智能”工业应用研究报告2025进一步推动了算力需求的激增。当前,软硬件协同的方法正在不断提 升大规模智算训练效率。在硬件方面,高性能 GPU、专用 AI 芯片、 高速互联网络、大容量高速存储等技术,实现了大规模的算力供给, 为处理复杂、不规则的计算任务(如自然语言处理的长序列数据、计 算机视觉的多尺度图像特征)创造了条件;在软件方面,分布式训练 框架、预训练大模型、多模态数据处理等技术也通过精细化算力管理 提升了大模型的训练和推理速度,为机器人的大规模应用提供了基础 在工业领域,机器人的规模化应用正在从中度智能向高度智能过 渡。随着深度学习算法的优化以及多模态感知技术的融合,工业机器 人将具备更强大的感知、认知和决策能力,能够更加精准地识别复杂 环境中的物体、声音和图像,理解人类的语言和意图。同时,工业机 器人将具备更强的自主学习能力,能够根据环境变化和任务需求进行 自我调整和优化。从模型架构来看,结构相对简单、参数较少的机器 学习模型正在转化为多层级、大参数量的深度学习、强化学习模型, 机器视觉技术的识别类模型应用比较成熟,在机器人的操作取物、移 动避障等各类功能中应用广泛,部分企业甚至开始了针对表面缺陷、 产品特征识别、安全巡检等难度较高任务的深度学习探索;基于语音 交互技术的语言类模型虽然较为成熟,但是主要用于陪伴对话、教育 辅导、智能家居等服务型场景,而由于可靠性要求高、工业知识积累 6 不足等限制,尚未在工业中大规模应用。在推理决策方面,基于深度 学习、强化学习0 积分 | 37 页 | 2.06 MB | 5 月前3
2025年人形机器人应用场景洞察白皮书-工业场景篇与周边物体类型局限(桌椅电器等) • 工作任务:“交互”为基础,由简单搬运类 工作开始,在“指导下”逐步胜任复杂工作 • 工作任务演进逻辑: ✓ 有意义:情绪识别,递送物品,车辆充电 ✓ 有价值:拓展综合型家务,在语言+动作 指导下复刻动作,如平面清洁等 ✓ 有收益:替代清洁工/保姆 • 工作环境:高标准化环境+高标准化工具/零部件 • 工作任务:从单一重复性动作,链条较短任务开始,到胜任复杂工作 • 工作任务演进逻辑: 灵活的运动能力、物体与环境感知、 语音交互和视觉交互、可实现搭建、 维护、装配、实验等多种能力 灵活的移动能力、视觉/触觉/力 感知能力、远程控制、人机交互 语音、视觉识别,触摸感知能力,支持 多语言编程、执行复杂动作(如走路、 跑步、舞蹈等) 应用场景 家庭服务、工业生产、商业服务 家庭服务、工业生产、特种应用 工业生产、家庭服务、商业服务、 仓储物流、特种应用 家庭服务、商业服务、仓储物流 权,该等解释和修改将不定期的进行并发布。如果用户不接受M2觅途咨询的免责声明或对我们的服务有任何疑问 ,请随时与我们联系。 5. 本报告所有的数据由中文、英文或其他语言组成,除非本报告对语言进行特殊标注,否则用户应当基于对语言的上下文或其普通含义来理解。 6. 任何对本报告及其所使用的数据提起的任何争议均适用于中华人民共和国的法律法规。 7. 请用户确认已阅读、理解并接受所有的条款。如用户10 积分 | 33 页 | 2.38 MB | 5 月前3
共 30 条
- 1
- 2
- 3
