ppt文档 AI智能体行业案例(22页 PPT) VIP文档

1.02 MB 22 页 0 下载 3 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pptx
3
概览
AI 智能体行业案例 (待更新) 1 概述 2 法律行业案例 3 金融行业案例 4 教育行业案例 5 医疗行业案例 目录 10.1 概述 随着大模型技术的发展,如何利用 AI 智能体更好地赋能垂直行业是工 业界和学术界共同关注的问题,我们结合法律、金融和教育等行业背 景,搭建多种形式的智能体,并重点讨论在不同业务需求下的智能体 设计决策。 1 概述 2 法律行业案例 3 金融行业案例 4 教育行业案例 5 医疗行业案例 目录 10.2 法律行业案例 近年来,企业、高校和政府纷纷推出了法律行业大模型,包括阿里的通义法 睿、北京大学的 ChatLaw 和最高人民法院的法信法律基座大模型等。这些 法律大模型涵盖了法律咨询、文书生成、法律检索和合同审查等丰富的功能 解决了传统法律工作中存在的效率低下和信息分析不足的问题。 10.2.1 法律咨询智能体 在法律相关功能中,法律咨询尤为重要,其核实价值主要体现在以下几个方面。首先,许多人对法律知 识的了解相对有限,而律师咨询助手能够有效解答常见法律问题,帮助公众提升法律意识。其次,在线 咨询的便捷性使得用户可以随时随地获取法律建议,可以节省了宝贵的时间和精力。此外,与传统的面 对面咨询相比,在线咨询通常费用更低,适合预算有限的用户,具有较高的成本效益。然后,隐私保护 也是一个关键因素,很多人对面对面咨询可能存在顾虑,而在线咨询提供了更高的隐私保障。本节将围 绕法律咨询展开探讨,通过搭建单智能体并配置知识库,实现对特定法律问题的理解、法律条文的解释、 解决方案的提供以及行动建议等功能,其最终效果如下图 10.2.2 关键设计 尽管直接采用专用的法律行业大模型通常能够实现更高的性能和更精确的回答,但其成本远高于基于通用模型构建的智 能体方案。以通义法睿为例,其法律咨询功能的 API 调用费用为每次 0.7 元,而类似 DeepSeek-V3 等通用大模型的处理 成本,即便考虑百万 token 的输入量,也仅在 2 元以内。因此,从成本效益和部署灵活性等角度出发,基于通用模型构建 法律咨询助手的智能体在实际应用中具有很大的吸引力和推广价值。 与此同时,大模型在生成内容时常会出现“幻觉问题”(即生成虚假的或不准确的信息)这对法律领域的应用提出了严峻的 挑战。为了在降低成本的同时提高回答的可信度和准确性,我们采用( Retrieval-Augmented Generation )技术。具体 而言,将首先将法律条文、判例和相关知识整理并添加到知识库中。随后,在用户咨询过程中,通过语义检索技术定位 与问题相关的法律信息,并将检索到的内容作为上下文补充,最终交由大模型处理生成高质量的回复。这种方法不仅有 效缓解了大模型幻觉问题的影响,还进一步提升了法律咨询助手的实用性和可控性,为其在实际场景中的广泛应用奠定 了技术基础。 为了简化设计,本节仅考虑 2020 年颁布的《中华人民共和国民法典》(以下简称“民法典”),并设计一个面向民法典的 法律咨询智能体。感兴趣的读者可以进一步收集更全面的法律法规和裁判文书最高人民法院提供超过 1.5 亿篇裁判文书, 访问地址为 https://wenshu.court.gov.cn/ ,从而构建功能更加强大的法律行业智能体。一般地,在构建智能体时,通常需 要明确限定其预期具备的功能或技能,以便更精准地满足用户需求,从而生成更高质量的回复。对于本节的法律咨询智 能体,其预期具备的技能包括 1 )解答民法典问题;和 2 )分析民法典案例。此外,面向特定行业的咨询智能体一般还 需要拒绝回答与主题无关的问题,以确保回复内容的专业性和相关性。 10.2.3 智能体实现 单智能体的关键技术包括提示词设计和知识库设计。对于面向民法典的法律咨询单智能体,核心提示词包括, 1 )智能 体的人设(角色),即“一个专业的民法典咨询小助手”; 2 )智能体的技能,包括“解答民法典问题;分析民法典案例”; 3 )限制,包括要求拒绝回答无关问题并要求按格式回复。对于专业领域问答,一般还需要规定明确的回复格式,这可以 通过少样本提示完成。我们使用的民法典原文件是 PDF 格式,将在扣子中被转换成文本格式(大模型无法直接处理 Word 和 PDF 等格式的文档,需要转换成纯文本格式)在智能体配置的“知识”中选择“文本”,添加已有的知识库,在创建 知识库时,用户可以上传文档,并设置文档解析策略、过滤策略和分段策略等。对于简单应用,一般使用默认选项即可。 用户还能看到原始文档和分段后的对照信息,并能编辑、删除、新增分段;这些分段文字将在服务器进行嵌入等操作, 用于后续的搜索。在扣子的人设与回复逻辑面板,填入以下示例提示词,效果如下所示 1 概述 2 法律行业案例 3 金融行业案例 4 教育行业案例 5 医疗行业案例 目录 10.3 金融行业案例 金融行业因其与数据的高度相关性,成为最早应用传统人工智能技术的领域之一。近些年, 以技术驱动为特征的金融科技,依托人工智能、大数据分析和区块链等关键技术,极大地 提升了金融行业的服务效率。作为一种新型生产方式, AI 具有互补性、智能性、融合性、 创造性等技术经济特征。金融行业中大模型广泛应用,包括摩根大通的 AI 投资顾问、招商 银行的智能客服系统以及平安科技的风险管理平台等。这些金融大模型涵盖了客户服务、 信用评分、市场预测和合规监测等多种功能,有效解决了传统金融服务中存在的响应速度 慢和数据分析不够精准的问题。通过智能化的技术手段,这些大模型不仅提升了服务效率, 还增强了风险管理能力,为用户提供了更加个性化和高效的金融体验。 10.3.1 征信报告生成器智能体 风险管理在金融行业中非常重要,其主要体现在以下几个方面。首先,许多用户对企业信用的理解相对 有限,而该智能体能够有效解析征信报告中的各项指标,帮助用户全面了解某个企业的信用状况。其次, 自动化生成报告的便捷性使得用户可以快速获取所需信息,节省了大量的时间和精力。本节将围绕征信 报告生成展开探讨,通过搭建智能体,实现对企业信用状况信息的爬取与分析,其最终效果图如下所示 10.3.2 关键设计 在金融行业,专用的征信报告大模型如 Experian 和 FICO 的系统能提供极其精准的信用分析和风险估,但其高昂的使用 费用常常让用户感到很大压力。这些费用在需要频繁生成报告时,可能会迅速累积,带来不小的经济负担。相比之下, 许多金融科技公司开始利用通用模型来降低成本。例如, ZestFinance 利用开源的 AI 工具构建了自己的信用评分系统, 处理一份征信报告的成本显著低于传统模型。这样,他们能够每月为数千用户提供信用报告,显著降低了运营成本,同 时保持了良好的客户满意度。再比如, Kiva 利用机器学习模型来评估借款人的信用 worthiness ,借助这些通用模型的灵 活性,他们能够迅速适应不同市场的需求,提升客户体验。因此,从成本效益和灵活性来看,基于通用模型的征信报告 生成方案不仅能帮助金融机构节省开支,还能在市场竞争中迅速响应变化,提升客户体验和服务效率。这种灵活性和经 济性使得通用模型在征信领域的应用越来越受到青睐。 10.3.3 智能体实现 该智能体的关键技术是工作流的搭建,从人类的视角出发,思考我如何获取一个公司的征信基本信息。我会直接打开常 见的搜索引擎直接搜索该公司的全称或者去国家企业信用信息公示系统(国家企业信用信息公示系统涵盖了数百万家企 业的详细信息,访问地址为 https://www.gsxt.gov.cn/index.html )进行查询,那么工作流也是按照这个流程工作,为了简 化设计这里只在网页中搜索企业信息。用户输入企业名,调用 bingWebSearch 、 search 两个 " 插件 " (插件:可以通过 API 和外部数据与系统进行交互,能够增强模型能力),设置好这两个节点 10.3.3 智能体实现 在每个搜索节点执行完之后,需将这几个搜索节点的 url 合并起来,用来爬取其中的内容。拿到了不同搜索节点获取到的 链接,接下来添加一个 "LinkReaderPlugin" 插件,来获取网页内容(注意因为我们是一次传入一批 url 链接插件,所以在 参数设置中,选择 " 批处理 " 。接下来可能会因为各种原因,网络爬虫无法对每条 url 都返回结果,这些无法爬取的 url 的 结果在返回的时候是 None (空),不太方便后面批量处理,因此我们需要对上面 "LinkReaderPlugin" 节点的输出结果进 行过滤。接下来调用大模型节点(注意大模型节点也需要批处理),提示词设计如下: 1 概述 2 法律行业案例 3 金融行业案例 4 教育行业案例 5 医疗行业案例 目录 10.4 教育行业案例 大型语言模型在生成文本方面展现了显著的能力,使得区分人类创作与机器生成的文本变 得愈发困难。这种变化引发了在学术诚信、虚假新闻和在线信息验证等领域的担忧。因此, 确定一段文本是由 LLM 辅助生成还是完全由人类撰写变得至关重要。早在 2023 年,有 28 所英国大学宣布,明确禁止在论文和课程作业中使用 ChatGPT ,否则将被视为学术不端行 为,将面临开除的严重处分。在国内,学生的毕业论文除了传统的查重之外,也开始加入 了 AI 查重功能。为了应对这一挑战, GPTZero 等工具被相继推出,用于检测文本是否是 由 AI 生成。 10.4.1 学术论文原创性评价 尽管可以使用提示工程的方式检测文本是否由 AI 生成,但其准确率不佳。因此,我们将首先部署垂直 领域的模型,专门用于计算文本由 AI 生成的概率,并开放 API 。然后,进一步在扣子平台开发插件用 于调用该 API ,实现本地模型和远端智能体的协同工作,其最终效果图如下所示 10.4.2 关键设计 本节的智能体所依赖的模型是由复旦大学等团队研发的 ImBD 首先从 https://github.com/Jiaqi-Chen-00/ImBD 分别下载其 基座模型 gpt-neo.2.7B (约 10GB )和用于推理的微调适配器 ImBD-inference (约 15MB )。接下来,使用 perf 加载模 型,并通过 FastAPI 搭建服务用于扣子平台访问。该 API 的访问信息如下,其中参数 task 可选的是 generate (默认)、 rewrite 等,分别表示“生成”和“重写”。 此外,为了保证 API 的安全访问,上述请求需要在请求头添加密钥。下面是一个完整的请求示例: 上述请求的响应也是一个 JSON ,其中字段 probability (浮点数)表示输入文本是由 AI 生成的概率。 1 概述 2 法律行业案例 3 金融行业案例 4 教育行业案例 5 医疗行业案例 目录 10.5 医疗行业案例 通用领域的大语言模型 (LLM) ,例如 ChatGPT ,在遵循指令和产生类似人类响应方面 取得了显著的成功,这种成功间接促进了多模态大模型的研究和发展,如通用领域的多模 态大模型 MiniGPT-4 、 mPLUG-Owl 、 Multimodal-GPT 、 LLaVA 以及国产大模型豆 包等。 多模态( Multimodal )指的是在信息处理和交流中同时使用多种不同的模式或媒介,如 文本、图像、音频和视频等。其核心在于通过结合不同的表达方式,增强信息的传递效果 和理解深度。多模态的意义体现在多个方面:首先,它能够提供更丰富的信息,通过结合 文字、图片和视频等方式,帮助人们更好地理解复杂概念;其次,不同的人对信息的接收 方式各异,多模态能够满足不同学习风格或交流偏好的需求,从而提高理解和记忆效果。 此外,在人工智能和人机交互领域,多模态技术使计算机能够更自然地理解和响应人类的 交流方式,例如智能助手可以同时处理语音命令和视觉输入。多模态还能够增强表达能力, 在艺术和传播中通过多样化的表达方式提升创作的表现力和感染力。在数据科学和机器学 习中,多模态数据融合有助于提高模型的性能,例如在情感分析中结合文本和语音数据可 以更准确地判断情感状态。多模态通过整合不同的信息形式,帮助我们更有效地交流和理 解复杂的信息,广泛应用于教育、医疗、社交媒体和人工智能等领域。 10.5.1 CT 影像分析智能体 多模态大模型可以结合医学影像(如 X 光片、 CT 扫描、 MRI )和患者的临床数据(如病史、实验室结 果)进行综合分析,从而提高疾病诊断的准确性。例如,通过分析胸部 X 光片和患者的症状,模型可以 帮助识别肺炎或肺癌等疾病。这里我们以医疗领域为例,配置一个 ct 影像分析智能体。其最终效果图 如下所示 10.5.2 关键设计 该智能体主要是突出大模型多模态的特性,所以配置比较简单主要是在提示词上面的设计,如图所示
下载文档到本地,方便使用
- 可预览页数已用完,剩余 20 页请下载阅读 -
文档评分
请文明评论,理性发言.