上海科学智能研究院:2025年科学智能白皮书
2.74 MB
29 页
0 下载
21 浏览
0 评论
0 收藏
| 语言 | 格式 | 评分 |
|---|---|---|
中文(简体) | .pdf | 3 |
| 概览 | ||
第一章 序言 1. 定义与范式 2. 发展与态势 3. 数据分析 第二章 AI 前沿 1. 从大语言模型走向自主智能体 2. 具身智能 3. 脑机接口 4. AI 内生安全 第三章 数学 1. 基础理论 2. 优化 3. 统计 4. 科学计算 5. 复杂系统 第四章 物质科学 1. 物理 2. 化学 3. 材料 4. 能源 第五章 生命科学 1. 合成生物学 2. 医学 3. 神经科学 4. 医疗 5. 演化 第六章 地球与环境科学 1. 大气科学 2. 环境科学 3. 生态科学 第七章 工程科学 1. 通信 2. 遥感 3. 微电子 4. 空间信息 第八章 人文社会科学 1. 社会科学 2. 人文科学 3. AI 伦理治理 第九章 展望与政策 1. 未来挑战与研究方向 2. 政策框架 目录 3 4 5 12 13 14 15 18 18 19 20 21 24 25 26 27 30 31 32 33 34 37 38 39 42 42 44 45 48 49 50 51 51 1 第一章 徐增林 复旦大学、上海科学智能研究院 程 远 复旦大学、上海科学智能研究院 杨燕青 上海科学智能研究院 徐 燕 上海科学智能研究院 第二章 邱锡鹏 复旦大学 付彦伟 复旦大学 王守岩 复旦大学 杨 珉 复旦大学 邹 宏 复旦大学 第三章 陆 帅 复旦大学 石 磊 复旦大学 魏 轲 复旦大学 朱雪宁 复旦大学 高卫国 复旦大学 李颖洲 复旦大学 林 伟 复旦大学 杨 伟 复旦大学 第四章 向红军 复旦大学 季敏标 复旦大学 刘智攀 复旦大学 曹风雷 上海科学智能研究院 高 悦 复旦大学 第五章 应天雷 复旦大学 郁金泰 复旦大学 刘 雷 复旦大学 程 远 复旦大学、上海科学智能研究院 朱思语 复旦大学、上海科学智能研究院 彭汉川 复旦大学 徐书华 复旦大学 第六章 李 昊 复旦大学、上海科学智能研究院 张宏亮 复旦大学 赵 斌 复旦大学 第七章 迟 楠 复旦大学 徐 丰 复旦大学 刘 琦 复旦大学 曾 璇 复旦大学 杨 帆 复旦大学 高 跃 复旦大学 第八章 吴力波 复旦大学、上海科学智能研究院 唐世平 复旦大学 胡安宁 复旦大学 周葆华 复旦大学 吴肖乐 复旦大学 傅晓明 复旦大学 文少卿 复旦大学 杨庆峰 复旦大学 汤维祺 复旦大学 第九章 应天雷 复旦大学 颜 波 复旦大学 主席 金 力 复旦大学 委员(按姓氏拼音字母排序) 步文博 复旦大学 龚新高 复旦大学 金亚秋 复旦大学 彭慧胜 复旦大学 研究团队 内容支持 吴文婷 施普林格·自然 张嘉慧 施普林格·自然 Rebecca Dargie 施普林格·自然 John Pickrell 施普林格·自然 数据支持 巨 蓉 施普林格·自然 黄珏珺 施普林格·自然 陈佳怡 施普林格·自然 Vivek Aggarwal 施普林格·自然 项目协调 徐晓创 复旦大学 杨燕青 上海科学智能研究院 王晓夏 施普林格·自然 丁思嘉 施普林格·自然 张瑶瑶 施普林格·自然 排版设计 赵新武 施普林格·自然 Sou Nakamura 施普林格·自然 专家委员会 漆 远 复旦大学、上海科学智能研究院 沈维孝 复旦大学 吴力波 复旦大学、上海科学智能研究院 张人禾 复旦大学 科学智能白皮书 2025 2 3 第一章 序言 第一章 序言 1. 定义与范式 1.1 定义 面向科学研究的人工智能(AI) 创新和 人工智能驱动的科学研究的总和可被定义为 科学智能(AI for Science, AI4S),是体现 了人工智能创新与科学研究双向促进与深度 融合 1,从而变革科研范式。 1.2 范式 科学研究促进人工智能创新。传统科研 范式大致可分为经验归纳(实验科学)、理 论建模(理论科学)、计算模拟(计算科学) 以及数据密集型科学 2。实验科学由自然现 象和实验结果归纳出一般性规律,但没有抽 象出经验规律背后的普适理论。理论科学基 于自然现象或实验结果,提炼科学问题并形 成科学假设,然后运用逻辑推理和数学分析, 构建普适理论,但难以在复杂系统中实验验 证。计算科学以科学模型为基础,通过数值 方法模拟复杂系统,但需要简化模型以及提 高模拟精度,以解决模拟系统精度低且计算 成本高的挑战。随着技术的发展和数据规模 的增长,出现了数据密集型科学的研究范式。 这一范式利用机器学习方法,自动从数据中 发现统计关联,一定程度上避免了提出科学 假设,但无法发现因果关系,且难以分析低 质量数据和发现复杂系统中的规律。当前的 科学研究主要面临系统复杂性的挑战,相互 关联的自然、技术和人类系统受到跨时间和 空间尺度作用力的影响,导致复杂的相互作 用和涌现行为 1。传统科学研究方法难以应 对这些复杂性挑战,迫切需要新的科学研究 方法。针对复杂数据中的因果关系,发展了 一系列新的因果推断方法。针对高质量科学 数据缺乏问题,如大气数据、天文数据等, 发展了生成式人工智能技术,如扩散模型和 大语言模型。针对处理复杂系统的局限性, 发展了融合先验知识的深度学习,将先验知 识嵌入深度神经网络,在增强模型可解释性 的同时,显著提高模型的泛化能力,如物理 信息神经网络 3。 人工智能创新重塑传统科学研究过程, 加速科学发现。人工智能通过融合数据和先 验知识的模型驱动、假设生成与验证、自动 与智能化实验以及跨学科合作等方式,加速 科学发现。传统科学发现以实验观察和理论 建模为核心,提出科学假设并归纳一般规律, 如物理定律。人工智能则采用模型驱动的方 式,从大规模数据中自动发现隐藏的规律, ©️diyun Zhu / Moment / Getty 科学智能白皮书 2025 4 5 2. 发展与态势 2.1 最新进展 随着深度学习、生成模型与强化学习等 技术的突破,人工智能不仅能从海量数据中 识别人类难以察觉的复杂模式,更展现出自 主提出科学假设、设计实验方案、优化研究 路 径 的 惊 人 能 力。DeepMind 推 出 的 AlphaFold 31 突破性地实现了对几乎所有分 子类型的蛋白质结构预测,提高了蛋白 - 配 体相互作用预测的准确度,为新药研发、疫 苗 设 计 带 来 革 命 性 变 革。Google 的 GraphCast 模型 2、华为“盘古”大模型 3、 复旦大学“伏羲”大模型 4 等 AI 气象模型显 著提升了全球天气预报能力,实现更长时间 尺度、更高精度的天气预测。普林斯顿等离 子物理实验室利用强化学习优化等离子体控 制,解决撕裂不稳定性问题,加速核聚变能 源的实现 5。加州大学伯克利分校和劳伦斯 伯克利国家实验室利用机器人执行实验,机 器学习规划实验并结合主动学习优化实验过 程,研发用于无机粉末固态合成的自动实验 室 A-Lab,显著提高了材料合成效率 6。 2.2 前沿科学问题与突破路径 2.2.1 如何构建跨尺度的科学智能模型 科学研究涉及从原子尺度到宏观系统的 跨尺度建模,但当前 AI 模型通常仅适用于 单一尺度,缺乏有效的多尺度耦合机制。 为了解决这一挑战,可以从以下几个方 面寻找突破路径: 利用物理模型与 AI 的耦合建模,将已 知的物理规律嵌入到 AI 模型中构建跨尺度 关联,打造“灰盒模型”,提高模型的可信 度和计算效率。开发跨尺度、多模态统一的 神经网络架构,用于从微观到宏观的统一建 模。 2.2.2 如何提升 AI 模型在科学研究中的 泛化性 AI 模型依赖大规模训练数据,而高质量 的科学数据往往有限。在数据有限的情况下, 模型可能无法学习到有效的特征,难以适应 新的领域或任务,限制了其在实际科学问题 中的应用。 为了解决这一挑战,可以从以下几个方 面寻找突破路径: 利用生成式模型生成高质量科学数据, 补充数据稀缺领域的样本多样性。通过预训 练跨领域基础模型,结合小样本学习技术, 快速适应新任务或学科场景 2.2.3 如何利用 AI 拓展科学发现的创新 边界 AI 目前仍局限于已有知识的重组与推 理,主要通过对已有数据的模式识别和重组 来生成结果,而缺乏真正的创造性思维。科 学研究往往涉及跨学科的知识和数据,AI 模 型在整合不同领域的知识时存在困难。如何 使其真正参与科学假设的提出和验证,仍是 未解的难题。 为了解决这一挑战,可以从以下几个方 面寻找突破路径: 构建跨学科知识图谱、因果推理和生成 模型,整合多领域知识库,使 AI 能够从已 有知识中提取洞察并提出新颖的科学假设。 建立强化学习驱动的 AI 辅助实验设计、数 据分析、理论建模的闭环系统,实现自动化 科学发现。开发可视化工具与交互界面,将 AI 生成的假设映射为可解释的科学逻辑链, 支持领域专家进行修正与理论完善。 传统科学发现从大规模解空间中生成候选假 设并验证,效率低且难以找到高质量解 4。 人工智能凭借强大的数据处理和分析能力, 可以更有效地探索解空间,生成高质量的候 选假设。例如,在纯数学领域,机器学习可 以辅助数学家发现新的猜想和定理 5。科学 研究依赖于实验评估理论。传统的实验设计 和优化方法依赖人工经验和反复试错,成本 高且效率低,如材料合成以及核聚变。人工 智能与机器人技术结合可以实现实验的自动 化设计与执行,并根据实时数据调整实验参 数,优化实验流程和候选对象。 总之,人工智能可以有效整合不同学科 的数据和知识,打破学科壁垒,促进多学科 深度融合,解决学科的挑战性问题。跨学科 合作不仅拓展了各学科的研究边界,还催生 了计算生物学、量子机器学习、数字人文等 新兴学科。 1. P. Berens. et al. AI for science: an emerging agenda. arXiv Preprint, https://arxiv.org/abs/2303.04217v1 (2023). 2. T. Hey. et al. The Fourth Paradigm: Data-Intensive Discovery, Microsoft (2009). 3. Raissi, M. et al. Physics-informed neural networks: a deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations. J. Comput. Phys. 378, 686–707 (2019). 4. Griffin, C. et al. A new golden age of discovery: seizing the AI for science opportunity. Technical report, https://storage.googleapis.com/deepmind- media/DeepMind.com/Assets/Docs/a-new-golden- age-of-discovery_nov-2024.pdf (2024). 5. Davies, A. et al. Advancing mathematics by guiding human intuition with AI. Nature 600, 70-74 (2021). 1. Abramson, J. et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature 630, 493–500 (2024). 2. Remi Lam et al., Learning skillful medium-range global weather forecasting. Science 382,1416- 1421(2023). 3. Bi, K. et al. Accurate medium-range global weather forecasting with 3D neural networks. Nature 619, 533–538 (2023). 4. Chen, L. et al. FuXi: a cascade machine learning forecasting system for 15-day global weather forecast. npj Clim. Atmos. Sci. 6, 190 (2023). 5. Seo, J. et al. Avoiding fusion plasma tearing instability with deep reinforcement learning. Nature 626, 746–751 (2024). 6. Nathan, J. S. et al. An autonomous laboratory for the accelerated synthesis of novel materials Nature 624, 86–91 (2024). 第一章 序言 核心AI 地球与环境科学 工程科学 人文与社会科学 生命科学 数学 物质科学 总量 AI4S总量 308.87 330.57 367.86 414.58 466.41 648.57 753.50 821.57 907.42 954.50 198.93 214.27 236.44 263.21 295.94 468.78 538.64 583.09 638.17 672.23 0 100 200 300 400 500 600 700 800 900 1000 0 200 400 600 800 1000 1200 1400 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 图1.1|AI 出版物总量趋势与领域构成(2015-2024,单位:千篇) 0 200 400 600 800 1000 1200 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 印度 图1.2|AI 出版物(前五国家/ 地区)总量趋势(2015-2024,单位:千篇) 中国 欧盟 美国 英国 总量 3. 数据分析 本研究中,人工智能(AI)相关领域 可以划分为:AI 核心(如算法、机器学习等)、 数学、物质科学、生命科学、地球与环境 科学、工程科学、人文社会科学等七个领域。 AI 核心以外的六个领域,统称为科学智能 (AI4S)领域,后续章节将以上述领域划 分展开。 根 据 自 然 科 研 智 讯(Nature Research Intelligence)《自然》AI 相关 出版物数量、引用量以及自然指数(Nature Index) 期 刊 等 多 源 大 数 据, 可 以 对 2015-2024 年全球 AI 相关出版物进行了系 统性分析。数据结果显示,AI 和 AI4S 研 究正经历规模扩张与范式变革的双重突破。 3.1 全 球 AI 出 版 物 迅 猛 成 长,AI4S 加速井喷 2015 至 2024 年 间, 全 球 AI 核 心 和 AI4S 领 域 的 学 术 出 版 物 总 量 快 速 增 长。 AI4S 异军突起,2020 年后加速成长,有 力推动了 AI 研究整体的井喷态势。如图 1.1 所示,全球 AI 论文数量在过去十年间激增 近三倍——从 30.89 万篇增至 95.45 万篇, 年均增长率为 13.7%。2020 年是一个重要 加速点,前后相较,年均增长率从 10.9% 跃升至 16.0%。同期 AI 核心领域论文占比 从 44.5% 降至 38.0%,而 AI4S 占比相应 提升了 6.4 个百分点,这源于 AI4S 论文的 快 速 增 长,2020 前 年 均 增 长 10.5%, 2020 后年则以 19.3% 的速度扩张。其中, 工程科学和生命科学最为突出,年均增长 率 从 2020 年 前 的 8.8% 和 15.3%, 分 别 升至 16.1% 和 28.9%。 2015 年 至 2024 年 间, 全 球 AI 出 版 物排名前五的国家 / 地区格局发生了转变 (图 1.2)。中国增长势头尤为显著,出版 物 总 量 从 2015 年 的 6.01 万 篇 上 升 至 2024 年 的 27.39 万 篇, 占 全 球 总 量 的 28.7%。2018 年, 中 国 AI 出 版 物 总 量 超 越欧盟,居全球首位,2022 年超越欧盟和 美国的总和。印度也展现出明显的追赶态 势, 2015 年出版物总量为 1.82 万篇(仅 为美国的 1/3),2024 年提升至 8.51 万篇, 几乎与美国(8.57 万篇)齐平。 科学智能白皮书 2025 6 7 0 100 200 300 400 500 600 700 800 900 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 图1.3|自然指数AI 出版物引用总量(前五国家/ 地区)趋势 (2015-2024,单位:千篇) 中国 欧盟 美国 加拿大 英国 总量 0 20 40 60 80 100 120 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 中国 欧盟 美国 加拿大 英国 总量 图1.4|AI 出版物被专利、政策文档、临床试验的引用总量(前五国家/ 地区) (2015-2024,单位:千篇) 3.2 美国高质优势仍存,中国引领应用 创新 从科研质量上看,美国仍保持优势。如 图 1.3 所示,基于自然指数追踪的高质量前 沿研究期刊发表的 AI 相关论文引用量,美 国始终
| ||
下载文档到本地,方便使用
- 可预览页数已用完,剩余
27 页请下载阅读 -
文档评分


智慧应急在城市安全发展中的应用思考(24页PPT-急管理部国家安全科学与工程研究院 2024)