基于大语言模型技术的智慧应急应用:知识管理与应急大脑的总体目标,强调要适应科技信息化发展大势,以信 息化推进应急管理现代化,提高监测预警、监管执 法、指挥决策、救援实战、社会动员等应急管理能力。 大语言模型是具有大规模参数的深度学习模 型,通过对海量文本的训练习得语言的统计规律, 从而具有理解和生成自然语言的能力,实现人机之 间的有效通信。自2018年双向编码表示模型(bidirec⁃ tional encoder representations from pre-trained transformer,GPT),人工智能领域 自然语言处理方向的重大突破,引领了大规模预训 练模型及应用研究的热潮。大语言模型技术的迅猛 进展正深刻地影响着机器系统智能化的轨迹,标志 着进入一个新的人工智能时代。从 BERT 到 GPT [1-2], 这些模型通过深度学习和海量数据训练,不仅推动了 自然语言处理技术的边界,也正在改变知识获取和创 新的模式,将对应急管理体系发展、能力要求以及实 金(20BZZ037), 广 东 省 哲 学 社 会 科 学 规 划 项 目 (GD24XGL075)资助 *通信作者简介 黄欢(1976— ), 男, 湖南常德人, 硕士, 助理研究员。 基于大语言模型技术的智慧应急应用: 知识管理与应急大脑 龚 晶 1 黄 欢 2,* (1. 暨南大学 公共管理学院/应急管理学院,广州 510632;2. 暨南大学 党委政治保卫部/人民武装部,广州 510632)20 积分 | 8 页 | 3.21 MB | 1 天前3
从DeepSeek探讨大语言模型在建筑及能源行业的应用趋势和技术方法从 DeepSeek 探讨大语言模型 在建筑及能源行业的应用趋势和技术方法 汇报人:赵阳 浙江大学能源学院制冷与低温研究所 2025.2.14 报 告 提 纲 临近奇点: AGI 将带来颠 覆 结论和展望 DeepSeek 等带来的新范 式 大语言模型应用的科研案例 能源领域传统 Al 发展困 境 当下 Al 到了哪种程 度 John J.Hopfield 报 告 提 纲 当下 Al 到了哪种程度 能源领域传统 AI 发展困境 … … … … DeepSeek 等带来的新范式 大语言模型应用的科研案例 · 临近奇点: AGI 将带来颠覆 结论和展望 …… 长期以来,能源领域人工智能止步于信息化阶段,发展范式陷入困境 15/80 口能源领域智能化目前大多停留在 环节是整个项目的天花板 2025 年 2 月,麻省理工学院何凯明指出: Al 正在悄然重塑全球科研生态:“过去,不同学科间的交流 像隔着一堵高墙;如今,人工智能正成为所有科学家都能听懂的通用语言 " 。 自动化 工程热物理 新能源 化工 软件 工程 人工 智能 范式困境主要原因三:周期长、链条多、人员配合难度大效率低 18/80 口需要多个 团队 深度长期协作,难度大成本高10 积分 | 78 页 | 33.88 MB | 5 月前3
打造自适应AI运维智慧体:大语言模型在软件日志运维的实践(29页 PPT)打造自适应 AI 运维智慧体: 大语言模型在软件日志运维的实践 刘逸伦 华为 2012 实验室 本科毕业于南开大学 ,硕士毕业于美国佐治亚理工学院。研究方向包括 AI 智能运维 ,大模型质量评估以及大模型提示策略 ,在相关领域以第一作者、 通讯作者身份在 ICDE 、 ICSE 、 IWQoS 等顶级国际会议 / 期刊发表 10 余篇 论文。 刘逸伦 华为 2012 文本机器翻译实验室工程 日志是机器语言:大规模网络、软件系统在运行过程中每天会产生 PB 级别的日志,这些日志是一些类自然语言的文本,实时描述了设备 的运行状态、异常情况。 (2) 传统网络运维是机器语言的人工翻译过程:为了维护网络的稳定,运维人员会持续监控设备的运行状态,希望准确、及时地检测异常和 突发事件。网络日志是设备运行维护最重要的数据源,运维人员通常会通过解读日志中的自然语言、语义信息来发现问题、分析根因。 分析根因。 (3) 自动日志分析是机器语言的自动翻译过程: 日志文本种类繁多、数量庞大,且多数日志为非结构化文本,无法通过人工方式监控和检测 全部的日志。更重要的是,分析设备日志需要丰富的领域知识,耗时耗力;简单的规则配置也无法理解文本的语义信息。 化⽂本 类 自 然 语 ⾔ 半 结 构 观点 1 :软件日志运维是从机器语言向自然语言的 转化 转化 表:一些网络基础设施20 积分 | 29 页 | 9.28 MB | 1 天前3
基于大模型的具身智能系统综述然后, 对不同具身智能系统架构进行介绍, 并总结了目前具身智能模型的数据来源, 包括 模拟器、模仿学习以及视频学习; 最后, 对基于大语言模型 (Large language model, LLM) 的具身智能系统面临的挑战与发 展方向进行讨论与总结. 关键词 大语言模型, 大型视觉模型, 基础模型, 具身智能, 机器人 引用格式 王文晟, 谭宁, 黄凯, 张雨浓, 郑伟诗, 孙富春. 基于大模型的具身智能系统综述 intelligence, AI) 技术提高具身智能的表 现则成为学界与产业界的关注重点. 最近的研究表 明, 通过扩大语言模型的规模, 可以显著提高其在 少样本学习任务上的表现, 以 GPT-3 (Generative pre-trained transformer 3)[4] 为代表的大语言模型 (Large language model, LLM) 在没有进行任何参 收稿日期 2024-08-01 仅通过文本交互来指定任 务和少样本示例就能很好地完成各类任务. 在此之 后, 具有优秀泛化能力与丰富常识的基础模型在计 算机视觉、自然语言处理等领域都展现出令人瞩目 的效果. GPT-4[5]、LLaMA[6]、LLaMA2[7]、Gemini[8]、 Gemini1.5[9] 等大语言模型能与人类进行流畅的对 话, 进行推理任务, 甚至进行诗歌和故事的创作; BLIP (Bootstrapping language-image20 积分 | 19 页 | 10.74 MB | 1 天前3
信息服务-AI Agent(智能体):从技术概念到场景落地结果。 图1 人类与 AI 的交互模式 资料来源:腾讯研究院,海通证券研究所 以 LLM 为核心,四模块铸造 AI Agent。从 OpenAI 的定义来看,智能体以大语言模 型为核心,其拥有长期和短期记忆、自主规划能力、能自动化执行复杂任务、能够使用 工具等四个特点。1)记忆模块:智能体像人类一样,能留存学到的知识以及交互习惯 等,这样的机制能让智能体在处理重复工 资料来源:CrewAI,CSDN,海通证券研究所 1.3 Prompt 提示词的艺术 Prompt 是一种基于自然语言处理的交互方式,它通过机器对自然语言的解析,实现 用户与机器之间的沟通。可以理解为是一段给定的文本或语句,用于启动和引导机器学 习模型生成类型、主题或格式的输出。在自然语言处理领域中,Prompt 通常由一个问 题或任务描述组成,例如“帮我写一篇有关人工智能的文章”,“帮我编写一段可以整理 数据的程序”等等。 一个优秀的 Prompt 应该包含 1)明确目标:能够定义任务,以及想要达到的效果; 2)具体指导:给予模型明确的指导和约束,举一些例子或明确回复边界;3)简洁明了: 使用简练、清晰的语言表达 Prompt;4)迭代优化:一次 Prompt 输出可能达不到想要 的结果,用户需要根据智能体的回答来改变提示词,持续调整优化。 2.应用场景:赋能两类实体领域,成本与效益的博弈 AI10 积分 | 33 页 | 4.71 MB | 1 天前3
DeepSeek在金融银行的应用方案2.1 深度学习与机器学习...........................................................................14 2.2 自然语言处理(NLP).......................................................................16 2.3 图像识别与处理...... 过引入 DeepSeek,金融银行不仅能够提升自身的核心竞争力,还 能在数字化转型的浪潮中占据先机,实现可持续发展。 1.1 DeepSeek 技术概述 DeepSeek 是一种基于深度学习和自然语言处理(NLP)技术 的先进人工智能平台,旨在通过高效的算法和海量数据训练,提升 金融银行业务的智能化水平。该技术通过多层次的神经网络模型, 能够自动提取、分析和处理复杂的金融数据,从而为银行和金融机 技术,DeepSeek 可以 从海量交易数据中识别潜在的风险因素,预测客户的信用违约概 率,从而帮助银行制定更加科学的风控策略。同时,在客户服务方 面,DeepSeek 的智能客服系统能够理解自然语言,提供 7*24 小 时的高效响应,显著提升客户满意度。 为了进一步提升 DeepSeek 技术在金融银行中的应用效果,以 下是一些关键的技术特点: 高精度预测:通过深度神经网络模型,DeepSeek10 积分 | 154 页 | 527.57 KB | 5 月前3
DeepSeek消费电子行业大模型新型应用最佳实践分享开发的一系列人工智能模型。 DeepSeek 通过持续的技术创 新 和市场拓展,在自然语言处理和大型语言模型方面取得了显著进展,在国际市场上获得 了 广泛认可。其中: ● DeepSeek-V3 是在 14.8 万亿高质量 token 上完成预训练的一个强大的混合专家 (MoE) 语言模型,拥有 6710 亿参数(激活参数 370 亿)。作为通用大语言模型,其在 在知识类任 务(知识问答、内容生成等)领域表现出色。 R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B R1-Distill-Qwen-1.5B DeepSeek 部署方案 DeepSeek 全系大语言模型支持服务部署 并行解码 模型量化 并行优化 Sampling 及 batch 优 化 CPU 及 传 统 GPU 算 力 按需按 量 服务管理 与运营 算力调度 容器调度 精调方案 DeepSeek 全系大语言模型支持 SFT • 全流程训推工具链,注重实战灵活性、扩展性 • 内置 Angel 加速能力,切实提升训推效率 • 训练过程白盒化、资源碎片监控、训练资源调度灵活可配, 切 实提升资源利用率 注重灵活性、扩展性的生产级大模型精调工具链 DeepSeek 蒸馏方案 DeepSeek 全系大语言模型支持 SFT 快速 直观 R110 积分 | 28 页 | 5.00 MB | 5 月前3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT)网络以及 Transformer 模型的多种技术模型积累 2019 年 GPT-2 BART RoBERTa ChatGPT 经过多类技术积累 ,最终形成针对人类反馈信息学习的大规模预训练语言模 型 2018 年 GPT-1 T5 BERT 2020 年 GPT-3 M2m- 100 XLM 进行海量数据学习训练 ,人类的反馈信息成 为模型学习的内容 OpenAI large-language-models 大语言模型易产生幻觉 ,在数学推理方面表现在推理能力严重不足, 体现在简单数值比较错误、 多步推理能力弱、推理不一致等 早期大模型在推理能力上存在明显短板 9.11>9.9? 简单数值比较错误 多步推理错 误 事实性幻觉问题 大语言模型易产生幻觉 ,在数学推理方面表现在推理能力严重不足, Mehrdad Farajtabar : "LLM 本质上是统计模式匹配工具,而非真正的 推 理系统 " 、 " 下一个词预测框架不足以产生真正的理解 " Yann LeCun : 自回归大型语言模型没有前途 Apple 提出 LLM 并非真正的推理系统 怀疑论 2023-2024 年,推理能力突破性进展: •20 积分 | 61 页 | 13.10 MB | 1 天前3
DeepSeek智能体开发通用方案.........................................................................................22 3.1 开发语言选择......................................................................................24 3.2 框架与库选择 智能体开发通用方案旨在构建一套高效、灵活且可 扩展的智能化解决方案,以满足企业在复杂业务场景中对智能决 策、自动化处理和数据分析的需求。该方案基于先进的人工智能技 术,结合深度学习、强化学习以及自然语言处理等核心技术,能够 实现对多样化数据的实时处理与智能化分析,从而提升企业的运营 效率与决策质量。 项目的核心目标是通过模块化设计和可配置策略,为企业提供 定制化的智能体开发服务。智能体将具备自主学习能力,能够根据 企业 提供一套标准化、模块化的智能体开发框架,帮助开发者快速构建 高效、可靠且可扩展的智能体系统。 当前市场上,智能体开发的主要痛点包括: - 技术栈复杂:智 能体开发涉及机器学习、自然语言处理、物联网等多个技术领域, 开发者需要具备跨学科知识。 - 可扩展性差:现有解决方案往往针 对特定场景设计,难以适应不同业务需求的变化。 - 维护成本高: 智能体系统在部署后需要持续优化和更新,缺乏统一的开发框架会0 积分 | 159 页 | 444.65 KB | 3 月前3
基于AI大模型Agent智能体商务应用服务设计方案(141页 WROD)...........................................................................................31 3. 自然语言处理(NLP)............................................................................................ 据分 析提供精准的商业洞察。因此,设计一套切实可行的商务 AI 智能 体应用服务方案,对于企业在数字化转型中保持领先地位显得尤为 重要。 首先,商务 AI 智能体的核心优势在于其能够通过自然语言处理 (NLP)和机器学习(ML)技术,实现对海量数据的快速处理与分 析。例如,在客户服务领域,AI 智能体可以通过分析客户的历史行 为和偏好,提供个性化的服务建议,从而提升客户满意度和忠诚度。 企业的实际需求和资源条件。以下是一些关键的设计原则和实施步 骤: 需求分析:明确企业在业务流程中的痛点和需求,确定 AI 智 能体的应用场景和目标。 技术选型:选择适合企业需求的 AI 技术和工具,如深度学习 框架、自然语言处理引擎等。 数据准备:收集和整理企业历史数据,确保数据的质量和完 整性,为 AI 智能体的训练和优化提供基础。 系统集成:将 AI 智能体集成到企业现有的 IT 系统中,确保其 能够与其他业务系统无缝对接。10 积分 | 141 页 | 647.35 KB | 1 天前3
共 33 条
- 1
- 2
- 3
- 4
