从DeepSeek探讨大语言模型在建筑及能源行业的应用趋势和技术方法日,王坚《无尽的计算: Al 和研究范式变革》的演讲: “ 我们目前已经进入计算科学时代,云计算在未来的研究中可以发挥重要作用。未来通过计算能力, 我们可以利用 Al 扩展人类的创造力,进一步探索世界。 " 新时代的核心动力: · 算力: 提 供 强大的计算能力,推动算法复杂性提升 · 算 法 :更加精准、高效的智能算法,支持决策优化 · 数据: 数据规模和质量驱动模型训练与性能优化 传统模式的局限性: 未来大语言模型的关键突破点二:世界模型 / 数字孪生 57/80 AlphaGo Zero 的成功不仅是算力 + 算法 + 数据,还有数字化的棋盘 ! 2017 年 10 月, AlphaGo Zero 在 3 天内 自我对弈 490 万盘,以 100:0 击败 AlphaGo 2016 年 3 月, AlphaGo 以 4:1 赢了人类围棋世界冠 军 一些学者坚信世界有一种「世界模型」 一些学者坚信世界有一种「世界模型」 , 并着力开发一 种 新的类似大脑的 Al 架构,是通过更真实地模拟现实世 界 ( 多模态输入训练 ) 来解决当前系统的局限性,例如幻 觉 和逻辑上的缺陷。这也是想要 Al 接近人类智力水平, 需要 像婴儿一样学习世界运作的方式。 世界模型 / 数字孪生:让大语言模型能够低成本虚拟演练 58/80 Real-Time Autonamous Adaptive10 积分 | 78 页 | 33.88 MB | 6 月前3
基于大模型的具身智能系统综述基于大模型的具身智能系统综述 王文晟 1 谭 宁 1 黄 凯 1 张雨浓 1 郑伟诗 1 孙富春 2 摘 要 得益于近期具有世界知识的大规模预训练模型的迅速发展, 基于大模型的具身智能在各类任务中取得了良好的 效果, 展现出强大的泛化能力与在各领域内广阔的应用前景. 鉴于此, 对基于大模型的具身智能的工作进行了综述, 首先, 介绍大模型在具身智能系统中起到的感知与理解作用; 且可以与物理环境进行信 息、能量交换的智能系统[2]. 虽然在过去的几十年 间, 离身智能取得了令人瞩目的成就, 但对于解决 真实世界的问题来说, “具身”的实现仍然是必要的, 与强调从经验中学习并泛化的离身智能方法相比, 具身智能更强调与环境的交互, 只有拥有物理身体 才能与世界进行互动, 更好地解决现实问题[3]. 当 前, 随着机器人技术和计算机科学的发展, 具身智 能受到更多的关注, 逐渐从概念走向实际应用 克风等传感器接受原始数据, 并解析数据信息, 形 成对环境的认知. 在处理此类信息时, 大模型有着 强大的优势, 能有效处理整合多模态的输入数据, 捕获各模态之间的关系, 提取为统一的高维特征, 形成对世界的理解. 如对大量无标签的互联网文本 和图像进行预训练的视觉模型, 能将图像与文本编 码到同样的向量空间中, 这种对齐不仅有利于对环 境的感知, 也有利于对用户自然语言指令的理解, 利于完成复杂的任务20 积分 | 19 页 | 10.74 MB | 2 天前3
基于大语言模型技术的智慧应急应用:知识管理与应急大脑具有跨模态知识挖掘和创新的潜能。如图 1 所示, 现实世界的信息、状态和变化通过不同的媒介和技 术手段,可以转化为文本、图片、音频、视频、信号 等符号描述,如果说文本数据是对现实世界在文字 符号规则下的一个投影,那么图片、视频、传感器信 号等不同数据都可以看作是现实世界在不同符号规 则下的多个投影,大语言模型技术具有在高维数字 空间融合不同符号世界信息的潜能,利用高维空间 的多模态知识表示,能促进不同符号世界信息的理 解、交流和融合,提供在一个更全面、完整、系统的 认知结构下对现实世界的事物,及其规律的新发现和 深入理解,从而推动知识结构的不断迭代与演进。 图1 基于大语言模型技术的多模态数据挖掘 Fig. 1 Multi-modal data mining based on large language models technologies 1.2.3 人机协同创新 大语言模型在获取语言知识的同时,也获得了语 言描述的关于世界的知识,从而让机器具有理解和生 成自然语言的能力,让人与机器在知识层面的有效交 互成为可能。基于大语言模型技术的人机协同创新 模式,将人的认知优势与计算机的计算与存储优势整 合起来,让人可以在更高层次、更广泛视角研究外部 环境,加深对客观世界规律的认识,并在人机交互中 将知识转移到机器上,提高机器智能 [18]。 2 智慧应急面临的挑战 应急管理信息化建设通过促进信息技术与应急 管理业务深度融合,为应急管理实战提供支撑保障。 一个典型的应急管理系统架构如图20 积分 | 8 页 | 3.21 MB | 2 天前3
信息服务-AI Agent(智能体):从技术概念到场景落地单智能体强化学习原理图 资料来源:CSDN,海通证券研究所 图4 多智能体强化学习原理图 资料来源:CSDN,海通证券研究所 CrewAI 是世界领先的多智能体框架之一,在多智能体领域用于协调角色扮演型自主 AI 智能体。通过促进协作智能,CrewAI 使智能体能够无缝协作并处理复杂任务。在编 写程序时,用户需要赋予每一位 Agent 角色、任务、以及背景故事。 AutoGen 模型的表 现略高于其他组合。3)ALFWorld(Adaptive Learning Framework World)研究: ALFWorld 是专门用于研究和开发智能体的仿真环境,在其虚拟世界中,包含了各种场 景、任务和智能体需要完成的挑战。ALFWorld 实验发现 3 个智能体的成功率高于 2 个 智能体,说明随着交互的智能体变多,智能体间互相纠错的能力有所提升。但对于 AutoGen 亿美元,2021 年到 2026 年期 间的 CAGR 超 20%。根据增长率计算,从 2022 年开始,每年市场规模会保持 20%左 右的稳定增长态势。根据澎湃新闻援引德勤统计,未来 2025 年世界人工智能市场规模 将超过 6 万亿美元,2017 年-2025 年期间复合增长率将超 30%。AI 高速发展中或利好 更多实体企业,专门提供智能体产品服务的厂商规模也将快速扩张。 图13 中国人工智能市场规模预测10 积分 | 33 页 | 4.71 MB | 2 天前3
DeepSeek洞察与大模型应用-人工智能技术发展与应用实践FP8混合精度训练、DualPipe流水线、MoE负载 均衡(提升训练效率,降低训练成本) DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和 世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 DeepSeek-V3 -4- • R1推出后,追平GPT-o1,迅速出圈海外。从 DeepSeek在美国下载排名从1月22日的201名,迅速 了与OpenAI-o1-1217相当的性能 DeepSeek-R1(对标GPT-o1)于2025年1月 20日推出,随后DeepSeek进一步出圈 DeepSeek-R1 -5- DeepSeek模型效果 (1/2):世界最顶尖模型的对比 大模型竞技场 (Chatbot Arena LLM Leaderboard, https://lmarena.ai/?leaderboard) 更新日期:2025-2-11 n 错误的内容,即“一本正经地胡说八道” 示例1:一篇根本不存在的参考文献(右图) n 大模型幻觉产生的原因 目前的大模型结构和训练机制:基于概率的生成模型,本质上没有理解 自己所学习的内容 缺乏对真实世界的有效建模方式和全息感知能力 训练数据的局限性:数据质量、重要数据的缺失、不同类型数据的比例 n 如何应对(用户角度) 建议1:建立“大模型结果不一定可信”的认知,根据自己的需要,对10 积分 | 37 页 | 5.87 MB | 6 月前3
埃森哲报告:AI赋能保险,三大应用场景如何重构价值链?pdf埃森哲报告:AI 赋能保险,三大应用场 景如何重构价值链? 人工智能(AI)使机器能够模拟和增强人类智能,它的出现正值保险和其他行业 数字化转型之际。尽管人工智能技术仍处于发展阶段,但在现实世界中,它 已应用于不同行业。人工智能正被用来解决各种各样的挑战,它使机器和系 统之间的交互更智能、更简单。 保险公司也逐渐进入这一领域,新一代人工智能技术有望帮助保险公司重新 定义其工作方式 三大应用场景:人力资源+流程管理+数据分析 “人工智能”一词包含许多不同的技术和能力。我们可以将人工智能定义为:能 够感知、理解、行动和学习的计算机系统。换句话说,一个系统可以感知它 周围的世界,分析和理解它接收到的信息,并在此基础上采取行动,通过学 习改进自己的性能。 通过利用机器与环境、人以及数据进行交互,这项技术可以提高人类和机器 的能力,使之远远超出了它们各自工作时的能力。10 积分 | 11 页 | 422.61 KB | 2 天前3
大模型技术深度赋能保险行业白皮书151页(2024)著 突破。合成数据的应用,有效克服了现实世界数据在获取难度、规模限制及多样性不足等 方面的挑战;图形处理单元(GPU)和张量处理单元(TPU)等高性能计算硬件的飞速发展, 为算力提升提供了强有力的保障;多模态模型的突破性进展,打破了传统人工智能(AI)技 术界限,实现了信息处理能力的全面升级;视频生成模型的显著进步,更是让创意与想象 在数字世界中自由翱翔;而混合专家系统(MoE)架构的广泛应用,则进一步提升了模型的 相关大模型, 排名不分先后 图1 大模型产业图谱 �� 大模型训练数据通常来自网络获取数据、外部付费/开源数据集、企业自有数据以及AI 合成数据。大模型训练和微调所需数据量快速增长,真实世界数据将在数年内被用尽。研 究机构Epoch估计,机器学习可能会在2026年前耗尽所有“高质量语言数据”。据Gartner 预测,2024年用于训练AI的数据中有60%将是合成数据。以Meta今年7月发布的 高质量的真实数据已逐渐无法满足大模型训练与精细微调的需要,这促使合成数据 作为真实数据的重要补充,在人工智能领域扮演着日益关键的角色。合成数据作为算法、 生成模型及模拟技术的产物,能够模仿现实世界数据的特征与模式,为大模型的训练与优 化提供丰富的数据资源。 以AlphaGeometry项目为例,该项目通过生成高达一亿个精准合成的数据点,为解决 复杂几何问题提供了强大的数据支撑,展现了合成数据在特定领域应用的巨大潜力。20 积分 | 151 页 | 15.03 MB | 2 天前3
Nacos3.0开源开发者沙龙·Agent & MCP杭州站 一个易于构建 AI Agent 应用的服务、配置和AI智能体管理平台(87页)未来规划 Nacos MCP Registry未来规划 05 Part 1 MCP & MCP Registry MCP 协议 和 MCP Registry MCP 协议浅析 模型与外部世界的标准化交互 通过统一的标准为模型提供 更加简单,可靠的数据交互 能力。 Official MCP Registry 的取舍 要解决的问题 1. 三方的registry无法提供完全的 MCP20 积分 | 87 页 | 11.66 MB | 2 天前3
人工智能技术及应用(56页PPT-智能咨询、智能客服)情报研究为目癿,关注 知识关联 • 资料来源多语种,对人 才要求较高 案 例 中 : 支 持 中 文 、 英语和俄文 ,还涉及到法语、 德语、 日语、 韩语和阿拉伯 语等世界军事强国癿语言。 案例 - 某国有大型企业知识库系 统 实斲斱案建议 用智慧发现信息价值 Discover information AppMaket Visulizaion & Discovery10 积分 | 55 页 | 5.54 MB | 2 天前3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT): 用大模型写邮件 大语言模型( LLM ) 可以接受输入 , 可以分析 & 推理、 规划任务、 输 出文字 \ 代码 \ 媒体。 然而 , 其无法像人类一样 , 拥有运用各种 工具与物 理世界互动 , 以及拥有人类的记忆能力。 智能体 (AI Agent) • LLM :接受输入、思考、规划任务、输出 • 人类: LLM (接受输入、思考、规划任务、输出) + 记忆 + 工具 Reflection20 积分 | 61 页 | 13.10 MB | 2 天前3
共 15 条
- 1
- 2
