2025年智能之光:⼈机协作的经济管理研究新时代报告-北京大学中国经济研究中心胡诗云,易君健∗ 2025 年 6 月 摘要: 以 ChatGPT 和 DeepSeek 为代表的人工智能大语言模型(简称大模型),正在对知识工作者的生产方 式产生革命性的影响。本文面向经济管理学科的研究者,介绍大模型的技术原理、应用方式以及在科学研究全 流程中的应用。本文首先从社会科学和大语言模型的本质出发,分析了认知自动化的边界,指出围绕理论工作 的能力是人类科学家在人工智能时代的核心能力。 建议。大模型全面融入学术工作流程,不仅能通过自动化重复劳动提高研究效率,更能通过人机合作扩展人类 思维的广度和深度,经济管理研究即将走向人机协作的新时代。 关键词: 人工智能;经济学方法论;人机协同;大语言模型 JEL Codes: A11;B41;C45;D83 ∗胡诗云,北京大学国家发展研究院,博士研究生,电子邮箱:hushiyun@pku.edu.cn。易君健,北京大学国家发展研究院,教授,(联系方式)。作者 . . . . . . . . . . 9 3 祛魅 AI:大模型的基本原理 10 3.1 大语言模型的定义和历史 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.2 大语言模型的数学结构 . . . . . . . . . . . . . . . . . . . . .0 积分 | 62 页 | 2.45 MB | 1 天前3
大模型时代的AI教育_思考与实践(36页 PPT)):以模型为核心,是对真实世界的模拟和解释 • 用语言逻辑方法获取理论模型:模糊 • 用解析数学方法获取数学模型:精确 • 用计算数学方法获取数据模型:近似 • 用机器学习方法获取概率模型:复杂 • 用人工神经网络获取网络模型:黑盒 • 超过两层的神经网络可以逼近任意连续函数 人类智能 • 抽象(语言):概念,数字,理 念 • 逻辑(理性):归纳,演绎,类 专用任务模型: NLP 、 CV 、 Gaming…… 2. 通用任务模型: AIGC • Diffusion 、 transformer ◼ 从 NLU+NLG 到 LLM (大语言模型) 1. 语言逻辑和数据集蕴含了人类的认知智能 2. LLM 是人类的认知智能的实现方式之一 3. LLM 的原理很简单;工程很复杂;效果很神奇 3. 推理能力(涌现):一般需要 10B 以上, 时刻):表现是慢思考;本质是合成数 据 有些是产品能力,不是模型本身的能力: RAG Function Call 1. 语言能力: 一本正经地说话,语言顺畅, GPT 时达 到 • NLG+NLU :语言理解、语言表达(包括温度和情商) • 人类语言、代码语言、 XX 语言 2. 知识能力:海量公开知识,言之有物, GPT-2 时达 到 • 顺带学习(基座模型):文字中蕴含了知识20 积分 | 36 页 | 2.17 MB | 1 天前3
厦大团队:DeepSeek大模型赋能政府数字化转型更连贯的回答 可迁移性高 学习到的知识和能力可以在不同 的任务和领域中迁移和应用 。 这 意味着一次训练就可以将模 型应 用于多种任务,无需重新 训练 语言生成能力 大模型可以生成更自然 、更流 利 的语言,减少了生成输出时呈现 的错误或令人困惑的问题 1.1 大模型的概 念 1.2 大模型的发展历 程 大模型发展历经三个阶段 ,分别是萌芽期、 沉淀期和爆发 期 1 练模型包含了预训练大模型(可以简称为“大模型”) ,预训练大模型包含了预训练大语言模型(可以简称为“大语言模 型”) ,预训练大语言模型的典型代表包括 OpenAI 的 GPT 和百度的文心 ERNIE , ChatGPT 是基于 GPT 开发的大模型产 品, 预训练大模型 预训练 大语言模型 预训练大语言模型 GPT 文 心 ERNIE 1.3 人工智能与大模型的关 系 深度学习模型 文心一言是基于文心 ERNIE 开发的大模型产 品 语言大模型 是 指 在 自 然 语 言 处 理 ( Nat u ral La ng uage Processing , NLP )领域中的一类大 模型, 通常 用于处理文本数据和理解自然语言 。 这类大模型 的主要特点是它们在大规模语料库上 进行了训练, 以学习自然语言的各种语法 、语义 和语境规则 。 代表性产品包括10 积分 | 121 页 | 13.42 MB | 5 月前3
2024年汽车AI大模型TOP10分析报告(59页 PPT)Big-data Driven ,模型基于大规模语料训练而成; Multi-tasks Adaptive ,支持多种任务 ,包括自然 语言生成 NLG 和自然语言理解 NLU 类的任务; AI 大模型就是预训练语言模型 通过在大规模宽泛的数据上进行训练后能适应一系列下游任务的模 型 产业研究 战略规划 技术咨询 2 Few-shot (Zero-shot) ,在少甚至无标注样本的 条件下支持推理(自监督学习)。 将模型在下游各种自然语言处理任 务上的小规模有标注数据进行微调 得到适配模型 预训练语言模型 从海量数据中自动学习知识 将模型在大规模无标注数据上进 行自监督训练得到预训练模型 不同特定任务 有标注训练数 据 模型预训练 模型微调 最终模型 提出 Transformer 框架在机器翻译中取得显著进步 ,其分布式学习和强大编码能力受到广泛关注。 2018 年 Google 和 OpenAI 基于 Transformer 提出了预训练语言模型 BERT 和 GPT ,显著提高了 NLP 任务的性能 ,并展示出广泛的通 用性。 众多预训练模型相继涌现, OpenAI 以 GPT2 、 GPT-3 、 ChatGPT 等系列模型为代表,持续引领大模型时代的浪潮10 积分 | 59 页 | 27.94 MB | 1 天前3
第6章 典型工业机器人操作与编程【71页PPT】机器人编程,就是针对机器人为完成某项作业进行程序设计。 工业机器人编程是机器人技术的一个重要方面,它是与机器人所采 用的控制系统相一致的。为了用简单的方法描述作业、操控机器人, 机器人的语言应运而生。在本节中,主要详细介绍示教编程。 本 节 导 入 1 、示教编程 图 6-1 示教再现式机器人控制系统工作原理 示教盒 记忆装置 伺服放大 示教部分 再现部分 公共部分 工作装置 难以与其他操作同步 很难规划复杂的运动轨迹 以及准确的直线运动 难以与传感信息相配合 机器人语言编程是指采用专用的机器人语言来描述机器人的动作 轨迹。机器人语言编程实现了计算机编程,它具有良好的通用性,同 一种机器人语言可用于不同类型的机器人。此外,机器人编程语言可 解决多台机器人之间协调工作的问题。 2 、机器人语言编程 离线编程是在专门的软件环境支持下,用专用或通用程序在离线 情况下进行机器 两种情况 机器人语言提供一种通用的人与机器人之间的通信手段。它是一 种专用语言,用符号述机器人的运动,与常用的计算机编程语言相似。 1 、工业机器人语言的发展概况 1975 年 IBM 公司研制出 ML 语言 随后又研制出 AUTOPASS 语言 1974 年 在 WAVE 语言的基础上开 发了 AL 语言 1973 年 美国斯坦福大学开发了第一种 机器人语言—— WAVE10 积分 | 71 页 | 14.64 MB | 1 天前3
疾控工作者应该怎么利用DeepSeek等AI大模型提出“智能”的行为主义定义,即通过外在表现而非内在机制判 断 智能。 2. 技术目标: 1. 为早期人工智能研究提供了明确方向,例如自然语言处理和对话 系统的开发。 2. 启发了后来的聊天机器人 ( 如 ELIZA,ChatGPT) 和语言模型的 发 展。 一、人工智能发展简史了解 CDC 疾控 人 1.2 人工智能的诞生 人工智能的诞生可以追溯到 20 世纪 50 年代 可迁移性高 学习到的知识和能力可以在不同 的任务和领域中迁移和应用。这 意味着一次训练就可以将模型应 用于多种任务,无需重新训练 二、大模型:人工智能的前沿 语言生成能力 大模型可以生成更自然、更流利 的语言,减少了生成输出时呈现 的错误或令人困惑的问题 2.2 大模型的发展历程 萌芽期:模型小 ( 参数 <1 亿 ) 、任务单一、依赖人工设计规则。 突破期:标志事件是 可以更准确地解决难题,具有更广泛的常识和解决问题的能力。 2023 年 12 月,谷歌发布大模型 Gemini, 它可以同时识别文本、图像、音频、视频和代码五种类型信息,还可以 理解 并生成主流编程语言 ( 如 Python 、 Java 、 C++) 的高质量代码,并拥有全面的安全性评估。 2024 年 12 月, DeepSeek 迅速崛起,震撼全球,使得人工智能进入“普惠”时代20 积分 | 78 页 | 20.76 MB | 13 天前3
政务大模型通用技术与应用支撑能力要求应链攻击风险,保障整体系统可信性。 6.4 应用服务组装 6.4.1 应用管理 a) 应支持整合与处理来自不同领域、不同层面的知识,从而更好地满足来自多样化场景的需求。 将专业领域的知识与通用语言建模能力相结合,为用户提供高质量的内容和服务; b) 应预置政务场景大模型应用模板,如政策文件、政务问答、政务要素等,模板中需预置行业大 模型,大模型需具备政务行业属性,以实现快速构建政务大模型应用能力,同时支持用户自定 识别服务。 a) 应具备理解用户目的能力,意图识别服务能够通过对用户输入的文本进行分析,理解用户的意 图,从而为后续的对话处理提供明确的方向; b) 应具备自然语言交互的能力,意图识别服务可以支持自然语言交互,用户可以使用自然语言进 行提问和查询,无需特定格式或关键词,使得对话更加自然和便捷; c) 应具备多轮对话支持的能力,意图识别服务可以支持多轮对话,可以在对话过程中动态地调整 意图识别结果,从而更好地引导对话过程; 意图识别结果,从而更好地引导对话过程; d) 应具备强大的后端知识库,意图识别服务通常与强大的后端知识库相结合,可以提供更加全面 和准确的信息和服务; e) 宜具备自我学习和优化的能力,意图识别服务可以通过机器学习和自然语言处理技术进行自我 学习和优化,不断提高对话系统的效率和准确性。 6.4.2.2 检索组件 检索组件允许用户高效地查询和获取文档中的关键信息,提升信息获取的效率,进而提升工作和决 策的效能。 a)5 积分 | 23 页 | 500.64 KB | 1 天前3
预训练大模型与医疗:从算法研究到应用预训练大模型 (学习共性) 大数据(低成本无标注) 少量特定领域标注数据 (成本高) 微调小模型 (学习特性) ⑤ 数 基 生 命 1.模型角度:模型参数不再是随机初始化,而是通过一些任务(如语言模型)进行预训练; 2.数据角度:将训练任务拆解成共性学习和特性学习两个步骤。 CHIMA 20Pag2 Tsinghua Confidential | lvhairong@tsinghua.edu 用 ⑤ 数 基 生 命 ② 剖 析 大 模 型 ① 关 于 预 训 练 两类典型的大语言模型 BERT : Bidirectional Encoder Representations from Transformers 双向模型,同时考虑前文和后文 采用掩码语言模型( masked language model )和下一句 预测任务 ( next sentence lvhairong@tsinghua.edu.cn BERT 训 练 ③ 精 准 可 解 释 ④ 医 疗 应 用 ⑤ 数 基 生 命 ② 剖 析 大 模 型 ① 关 于 预 训 练 BERT 主要采用掩码语言模型( masked language model ,对应图 Mask LM )和下一句预测任务( next sentence prediction ,对应图 NSP )进行预训练,使得模型能够学习到上下文关系和词汇语义。预训练好的10 积分 | 52 页 | 28.32 MB | 6 月前3
金融保险行业场景AI大模型数智化应用方案(213页 WORD)先,在风险评估与定价方面,AI 大模型能够通过海量数据的分析与 建模,提升精算的准确性和效率,从而制定更加科学合理的保险产 品定价策略。其次,在客户服务与营销领域,AI 大模型可以通过自 然语言处理(NLP)技术实现智能客服、个性化推荐以及精准营 销,显著提升客户满意度与转化率。此外,在理赔处理与反欺诈方 面,AI 大模型能够快速识别异常行为,提高理赔效率并降低欺诈风 险。 根据麦肯锡的研究数据,AI 潜力尤为显著。首先,AI 大模型具备强大的数据处理能力,能够高 效处理海量的结构化与非结构化数据,这为保险公司在风险评估、 客户画像、理赔审核等核心业务环节提供了前所未有的精准度与效 率。其次,AI 大模型通过自然语言处理(NLP)技术,能够实现与 客户的自然交互,大幅提升客户服务体验。例如,智能客服可以通 过上下文理解客户需求,提供个性化建议,从而降低人工客服的工 作负担。此外,AI 大模型在预测分析方面表现卓越,通过对历史数 大模型在保险行业的定 义可以理解为一种基于海量数据训练的强大算法模型,能够处理复 杂的保险业务场景,包括风险评估、客户服务、理赔处理、产品设 计等。其核心功能主要集中于以下几个方面: 首先,AI 大模型通过自然语言处理(NLP)技术,能够实现智 能客服和自动化沟通。例如,客户可以通过语音或文本与 AI 进行 交互,快速获取保单信息、理赔进度或产品推荐。这种技术不仅减 少了人工客服的工作负担,还能够提供 24/710 积分 | 222 页 | 848.20 KB | 1 天前3
人工智能赋能医院智慧实验室的建设方案(50页 PPT)不同任务训练不同的模型,泛化 能力差 生成式 AI 2020- 硬件、算法、大数据全面突破 对话机器人 算法框架: Transformer 大规模无 监督预训练 多任务、多模态统一处理 自然语言理解、世界知识记忆、 逻辑推理 人工智能时代推动检验技术的发展 大数据 人工智能 物联网 云计算 自动化图像识别 高通量数据处理 检测智能化与自动化 个性化医疗 多指标联合分析 / 模型优化:性能最优模型进行指标优化 外部验证:独立数据进行模型验证 AI 生物标志物研究举例之自身免疫 病 AI 生物标志物科研成果的临床应 用 AI 生物标志物从 IDEA 到 APPLY 大语言模型的发展历程 Deepseek 横空出世 2023 年 7 月 DeepSeek 成立 2024 年 5 月 宣布开源第二代 MoE 大 模型 DeepSeekV2 2024 年 11 系统已接入,免输入一键结 果解读; Deepseek 、 QWQ 多模型选择。 报告单解读 标准化操作流程查询 大语言模型专业化 ( LLMSpecialization ); 标准化、流程化、数字 化、 AI 化。 忠于原文语义与结构; 注重语言的美学表达。 文献翻译 / 解 读 为医护打造的检验科 RAG ; 降低不合格标本比例; 医检沟通的好伙伴。30 积分 | 50 页 | 31.76 MB | 1 天前3
共 396 条
- 1
- 2
- 3
- 4
- 5
- 6
- 40
