DeepSeek大模型及其企业应用实践
16.82 MB
147 页
0 下载
42 浏览
0 评论
0 收藏
| 语言 | 格式 | 评分 |
|---|---|---|
中文(简体) | .pdf | 3 |
| 概览 | ||
DeepSeek大模型及其企业应用实践 林子雨 副教授 厦门大学 DeepSeek 厦门大学大数据教学团队作品 2025年3月3日 每个人都可以读懂的大模型科普报告(企业篇) 厦门大学大数据教学团队 团队联系方式:ziyulin@xmu.edu.cn 国内高校大数据教学的重要贡献者 团队负责人:林子雨 副教授 年轻力量:核心成员全部46周岁以下 结构合理:教学型、科研型、实验工程师 专注专业:从2013年至今,11年专注于大数据教学 团队特点:眼光前瞻、紧跟技术、创新实干、执行力强 影响力高:多项指标在国内高校大数据教学领域领先 • 教材数量 • 教材占有率 • MOOC课程学习人数 • 师资培养 • 教学研讨会 • 教学网站访问量 • 在线讲座观看人数 • …… 目录 1. 大模型:人工智能的前沿 2. 大模型产品 3. 大模型的行业应用 4. 企业大模型落地方案 5. 智能体的企业应用 6. 厂商提供的企业级大模型服务 7. 大模型典型应用案例 8. AIGC与企业应用实践 9. 大模型未来发展趋势 厦门大学大数据教学团队作品 1.大模型:人工智能的前沿 1.1 大模型的概念 1.2 大模型的发展历程 1.3 人工智能与大模型的关系 1.4 大模型分类 1.1 大模型的概念 大模型通常指的是大规模的人工智能模型,是一种基于深度学习技术,具有 海量参数、强大的学习能力和泛化能力,能够处理和生成多种类型数据的人 工智能模型。 通常说的大模型的“大”的特点体现在: 参数数量庞大 训练数据量大 计算资源需求高 2020年,OpenAI公司推出了GPT-3,模型参数规模达到了1750亿。 2023年3月发布的GPT-4的参数规模是GPT-3的10倍以上,达到1.8万亿, 2021年11月阿里推出的M6 模型的参数量达10万亿。 1.1 大模型的概念 大模型的设计和训练旨在提供更强大、更准确的模型性能,以应对更复杂、更庞大的数据集或任务。大模型通常能够学习到 更细微的模式和规律,具有更强的泛化能力和表达能力 大模型具有更强的上下文理解能 力,能够理解更复杂的语意和语 境。这使得它们能够产生更准确、 更连贯的回答 上下文理解能力 大模型可以从大量的数据中学习, 并利用学到的知识和模式来提供 更精准的答案和预测。这使得它 们在解决复杂问题和应对新的场 景时表现更加出色 学习能力强 大模型可以生成更自然、更流利 的语言,减少了生成输出时呈现 的错误或令人困惑的问题 语言生成能力 学习到的知识和能力可以在不同 的任务和领域中迁移和应用。这 意味着一次训练就可以将模型应 用于多种任务,无需重新训练 可迁移性高 1.2 大模型的发展历程 大模型发展历经三个阶段,分别是萌芽期、沉淀期和爆发期 1.2 大模型的发展历程 1.2 大模型的发展历程 大模型发展对算力的需求演变 1.3 人工智能与大模型的关系 人工智能包含了机器学习,机器学习包含了深度学习,深度学习可以采用不同的模型,其中一种模型是预训练模型,预训 练模型包含了预训练大模型(可以简称为“大模型”),预训练大模型包含了预训练大语言模型(可以简称为“大语言模 型”),预训练大语言模型的典型代表包括OpenAI的GPT和百度的文心ERNIE,ChatGPT是基于GPT开发的大模型产品, 文心一言是基于文心ERNIE开发的大模型产品 人工智能 机器学习 深度学习 深度学习模型 预训练模型 深度学习 预训练大模型 预训练 大语言模型 预训练大语言模型 GPT 文心ERNIE ... ChatGPT 文心一言 1.4 大模型的分类 语言大模型 视觉大模型 多模态大模型 是指在自然语言处理(Natural Language Processing,NLP)领域中的一类大模型,通常 用于处理文本数据和理解自然语言。这类大模型 的主要特点是它们在大规模语料库上进行了训练, 以学习自然语言的各种语法、语义和语境规则。 代表性产品包括GPT系列(OpenAI)、Bard (Google)、DeepSeek、文心一言(百度)等 是指在计算机视觉(Computer Vision,CV)领 域中使用的大模型,通常用于图像处理和分析。 这类模型通过在大规模图像数据上进行训练,可 以实现各种视觉任务,如图像分类、目标检测、 图像分割、姿态估计、人脸识别等。代表性产品 包括VIT系列(Google)、文心UFO、华为盘古 CV、INTERN(商汤)等 是指能够处理多种不同类型数据的大模型,例如 文本、图像、音频等多模态数据。这类模型结合 了NLP和CV的能力,以实现对多模态信息的综合 理解和分析,从而能够更全面地理解和处理复杂 的数据。代表性产品包括DingoDB多模向量数据 库(九章云极DataCanvas)、DALL-E(OpenAI)、 悟空画画(华为)、midjourney等 1.4 大模型的分类 按照应用领域的不同,大模型主要可以分为L0、L1、L2三个层级 是指可以在多个领域和任务上通用 的大模型。它们利用大算力、使用 海量的开放数据与具有巨量参数的 深度学习算法,在大规模无标注数 据上进行训练,以寻找特征并发现 规律,进而形成可“举一反三”的强 大泛化能力,可在不进行微调或少 量微调的情况下完成多场景任务, 相当于AI完成了“通识教育” 通用大模型L0 是指那些针对特定行业或领域的大 模型。它们通常使用行业相关的数 据进行预训练或微调,以提高在该 领域的性能和准确度,相当于AI成 为“行业专家” 行业大模型L1 是指那些针对特定任务或场景的大 模型。它们通常使用任务相关的数 据进行预训练或微调,以提高在该 任务上的性能和效果 垂直大模型L2 1.4 大模型的分类 大语言模型可以分为通用大模型和推理大模型 推理大模型的概念大规模传播应该开始于 2 0 2 4 年 9 月 份 。 2 0 2 4 年 9 月 1 2 日 , OpenAI官方宣布了OpenAI o1推理大模 型。 推理大模型 在OpenAI的官网上,OpenAI定义推理模 型是在回答之前进行思考,并在回复用户 之前,在内部生成一长串的思维链过程。 思维链是一种提示大语言模型进行逐步推 理的方法。它让模型在得出最终答案之前, 先显式地写出推理的中间步骤。这就像人 类解决复杂问题时会先把思考过程写下来 一样。 OpenAI定义推理模型 也就是说,如果模型在回复你之前有一长 串的思考过程(这个过程必须可以显示输 出),探索了很多不同的路径之后给出答 案,那么有这个能力的大模型就是推理大 模型。推理模型的核心在于处理那些需要 多步骤逻辑推导才能解决的复杂问题。 推理模型的核心 1.4 大模型的分类 n 推理大模型DeepSeek R1的对话效果 1.4 大模型的分类 Sebastian Raschka博士(Lightning AI的首席教育学家): 将“推理”定义为通过生成中间步骤来回答复杂问题的过程 2个简单的例子: 非推理问题: ”法国的首都是哪里?” (答案直接、无需推导) 推理问题: ”一列火车以每小时60英里的速度行驶3小时,行驶距离是多少?” (需先理解”距离=速度×时间”的关系,再分步计算) 通用的大语言模型(LLM)可能直接输出简短答案(如”180英里”) 推理模型的特点在于显式展示中间推导过程 1.4 大模型的分类 在应用方面二者各有擅长的领域,而不是简单的谁强谁弱问题 n 如果你需要完成数据分析、逻辑推理、代码生成等逻辑性较强且较为复杂的任务,请选择推理大模型 n 如果你面临创意写作、文本生成、意图识别等发散性较强且较为创意多样的任务,请选择通用大模型 特性 推理大模型 通用大模型 适用场景 复杂推理、解谜、数学、编码难题 文本生成、翻译、摘要、基础知识问答 复杂问题解决能力 优秀,能进行深度思考和逻辑推理 一般,难以处理多步骤的复杂问题 运算效率 较低,推理时间较长,资源消耗大 较高,响应速度快,资源消耗相对较小 幻觉风险 较高,可能出现“过度思考”导致的错误答案 较低,更依赖于已知的知识和模式 泛化能力 更强,能更好地适应新问题和未知场景 相对较弱,更依赖于训练数据 擅长任务举例 解决复杂逻辑谜题,编写复杂算法,数学证明 撰写新闻稿,翻译文章,生成产品描述,回答 常识问题 成本 通常更高 通常更低 2. 大模型产品 2.1 国外的大模型产品 2.2 国内的大模型产品 2.3 主流大模型“幻觉”评测 厦门大学大数据教学团队作品 2.1 国外的大模型产品 n ChatGPT ChatGPT是一种由OpenAI训练的大语言模型。它是基于Transformer架构,经过大量文本数据训练而成,能够生成自然、 流畅的语言,并具备回答问题、生成文本、语言翻译等多种功能 ChatGPT的应用范围广泛,可以用于客服、问答系统、对话生成、文本生成等领域。它能够理解人类语言,并能够回答各 种问题,提供相关的知识和信息。与其他聊天机器人相比,ChatGPT具备更强的语言理解和生成能力,能够更自然地与人 类交流,并且能够更好地适应不同的领域和场景。ChatGPT的训练数据来自互联网上的大量文本,因此,它能够涵盖多种 语言风格和文化背景 2.1 国外的大模型产品 n Gemini Gemini是谷歌发布的大模型,它能够同时处理多种类型的数据和任务,覆盖文本、图像、音频、视频等多个领域。Gemini 采用了全新的架构,将多模态编码器和多模态解码器两个主要组件结合在一起,以提供最佳结果 Gemini包括三种不同规模的模型:Gemini Ultra、Gemini Pro和Gemini Nano,适用于不同任务和设备。2023年12月6日, Gemini的初始版本已在Bard中提供,开发人员版本可通过Google Cloud的API获得。Gemini可以应用于Bard和Pixel 8 Pro智能手机。Gemini的应用范围广泛,包括问题回答、摘要生成、翻译、字幕生成、情感分析等任务。然而,由于其复杂 性和黑箱性质,Gemini的可解释性仍然是一个挑战 2.1 国外的大模型产品 n Sora 2024年2月16日,OpenAI再次震撼全球科技界,发布了名为Sora的文本 生成视频大模型,只需输入文本就能自动生成视频。这一技术的诞生, 不仅标志着人工智能在视频生成领域的重大突破,更引发了关于人工智 能发展对人类未来影响的深刻思考。随着Sora的发布,人工智能似乎正 式踏入了通用人工智能(AGI:Artificial General Intelligence)的时代。 AGI是指能够像人类一样进行各种智能活动的机器智能,包括理解语言、 识别图像、进行复杂推理等。Sora大模型能够直接输出长达60秒的视频, 并且视频中包含了高度细致的背景、复杂的多角度镜头,以及富有情感 的多个角色。这种能力已经超越了简单的图像或文本生成,开始触及到 视频这一更加复杂和动态的媒介。这意味着人工智能不仅在处理静态信 息上越来越强大,而且在动态内容的创造上也展现出了惊人的潜力 2.1 国外的大模型产品 n Sora 右图是Sora根据文本自动生成的视频画面,一位戴着 墨镜、穿着皮衣的时尚女子走在雨后夜晚的东京市区 街道上,抹了鲜艳唇彩的唇角微微翘起,即便带着墨 镜也能看到她的微笑,地面的积水映出了她的身影和 灯红酒绿的霓虹灯,热闹非凡的唐人街正在进行舞龙 表演,熙熙攘攘的人群目光都聚焦在跃动的彩龙身上, 整个环境的喜庆氛围仿佛令人身临其境 2.1 国外的大模型产品 n OpenAI o3 2024年12月20日,OpenAI发布推理模型o3,无论在软件工程、编写代码,还是竞赛数学、掌握人类博士级别的自然科学 知识能力方面,o3都达到了很高的水平 2.2 国内的大模型产品 大模型 图标 指标排名 DeepSeek 能力测评第一 豆包 用户数量第一 Kimi 文本处理第一 即梦AI 作图能力第一 通义万相 视频生成第一 智谱清言 文档归纳第一 2025年1月国内大模型排行榜 2.2 国内的大模型产品 n DeepSeek(深度求索) 2024年12月26日,杭州一家名为“深度求索”(DeepSeek)的中国初创公司, 发布了全新一代大模型DeepSeek-V3。在多个基准测试中,DeepSeek-V3的 性能均超越了其他开源模型,甚至与顶尖的闭源大模型GPT-4o不相上下,尤 其在数学推理上,DeepSeek-V3更是遥遥领先。DeepSeek-V3以多项开创性 技术,大幅提升了模型的性能和训练效率。DeepSeek-V3在性能比肩GPT- 4o的同时,研发却只花了558万美元,训练成本不到后者的二十分之一。因 为表现太过优越,DeepSeek在硅谷被誉为“来自东方的神秘力量”。 2025年1月20日,DeepSeek-R1正式发布,拥有卓越的性能,在数学、代码 和推理任务上可与OpenAI o1媲美。 DeepSeek创始人 梁文峰 2.2 国内的大模型产品 n 通义千问 通义千问是阿里云推出的一个超大规模的语言模型,它具备多轮对话、文 案创作、逻辑推理、多模态理解、多语言支持的能力。通义千问这个名字 有“通义”和“千问”两层含义,“通义”表示这个模型能够理解各种语 言的含义,“千问”则表示这个模型能够回答各种问题。通义千问基于深 度学习技术,通过对大量文本数据进行训练,从而具备了强大的语言理解 和生成能力。它能够理解自然语言,并能够生成自然语言文本 n 字节跳动豆包 豆包是字节跳动基于云雀模型开发的 AI,能理解你的需求并生成高质量回 应。它知识储备丰富,涵盖历史、科学、技术等众多领域,无论是日常问 题咨询,还是深入学术探讨,都能提供准确全面的信息。同时,具备出色 的文本创作能力,能撰写故事、诗歌、文案等各类体裁。并且擅长语言交 互,交流自然流畅,就像身边的知心伙伴,耐心倾听并给予恰当反馈。 2.2 国内的大模型产品 n 文心一言 文心一言是由百度研发的知识增强大模型,能够与人对话互动、回答问题、 协助创作,高效便捷地帮助人们获取信息、知识和灵感 文心一言基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和 大规模知识中融合学习,具备知识增强、检索增强和对话增强的技术特色。 文心一言具有广泛的应用场景,例如智能客服、智能家居、移动应用等领域。 它可以与用户进行自然语言交互,帮助用户解决各种问题,提供相关的知识 和信息 n Kimi Kimi是月之暗面科技 2023 年推出的 AI 助手,可处理 200 万字超长文本,支持多 格式文件解读、互联网信息搜索整合、多语言对话等,能用于办公、学习、创作等 场景,有网页版、APP、微信小程序等使用方式。 2.3 主流大模型“幻觉”评测 大模型幻觉,也被称为 AI 幻觉,是指大型语言模 型在生成内容时,产生与事实不符、逻辑错误或 无中生有等不合理信息的现象。 比如在回答历史事件时,可能会编造不存在的细 节或人物;在进行科学知识讲解时,给出错误的 理论或数据。 其产生原因主要包括:模型训练数据存在偏差、 不完整或错误,导致在学习过程中引入了不准确 的信息;模型基于概率分布生成内容,在某些情 况下会选择一些看似合理但实际错误的路径。大 模型幻觉会影响信息的准确性和可靠性,在信息 传播、学术研究等领域可能带来不良影响。因此, 在使用大模型时,需要对其输出内容进行仔细验 证和甄别。 3. 大模型的行业应用 3.1 大模型的行业应用领域 3.2 DeepSeek大模型的应用场景 3.3 大模型与其他技术在企业中的融合应用 厦门大学大数据教学团队作品 3.1 大模型的行业应用领域 大模型的应用领域非常广泛,涵盖了自然语言处理、计算机视觉、语音识别、推荐系统、医疗健康、金融风控、工业制造、 生物信息学、自动驾驶、气候研究等多个领域 (1)自然语言处理 大模型在自然语言处理领域具有重要的应用,可以用于文本生成 (如文章、小说、新闻等的创作)、翻译系统(能够实现高质量的 跨语言翻译)、问答系统(能够回答用户提出的问题)、情感分析 (用于判断文本中的情感倾向)、语言生成(如聊天机器人)等 (2)计算机视觉 大模型在计算机视觉领域也有广泛应用,可以用于图像分类(识别图 像中的物体和场景)、目标检测(能够定位并识别图像中的特定物 体)、图像生成(如风格迁移、图像超分辨率增强)、人脸识别(用 于安全验证和身份识别)、医学影像分析(辅助医生诊断疾病)等 3.1 大模型的行业应用领域 (3)语音识别 大模型在语音识别领域也有应用,如语音识别、语音合成等。通过 学习大量的语音数据,大模型可以实现高质量的跨语言翻译和语音 识别以及生成自然语音 (4)推荐系统 大模型可以用于个性化推荐、广告推荐等任务。通过分析用户的历史 行为和兴趣偏好,大模型可以为用户提供个性化的推荐服务,提高用 户满意度和转化率 3.1 大模型的行业应用领域 大模型可以用于自动驾驶中的感知、决策 等任务。通过学习大量的驾驶数据,大模 型可以实现对车辆周围环境的感知和识别, 以及进行决策和控制,提高自动驾驶的安 全性和效率 自动驾驶 大模型可以用于医疗影像诊断、疾病预测 等任务。通过学习大量的医学影像数据, 大模型可以辅助医生进行疾病诊断和治疗 方案制定,提高医疗水平和效率 医疗健康 大模型可以用于信用评估、欺诈检测等任 务。通过分析大量的金融数据,大模型可 以评估用户的信用等级和风险水平,以及 检测欺诈行为,提高金融系统的安全性和 稳定性 金融风控 3.1 大模型的行业应用领域 工业制造 大模型可以用于质量控制、故障诊断等任 务。通过学习大量的工业制造数据,大模 型可以辅助工程师进行产品质量控制和故 障诊断,提高生产效率和产品质量 气候研究 在气候研究领域,大模型可以处理气象数 据,进行天气预测和气候模拟。它们能够 分析复杂的气象现象,提供准确的气象预 报,帮助人们做出应对气候变化的决策 生物信息学 在生物信息学领域,大模型可以用于基因 序列分析(识别基因中的功能元件和变异 位点)、蛋白质结构预测(推测蛋白质的 二级和三级结构)、药物研发(预测分子 与靶点的相互作用)等 3.1 大模型的行业应用领域 实例:百度大模型应用 3.2 DeepSeek大模型的应用场景 3.2 DeepSeek大模型的应用场景 n 客户服务与支持(高频应用) 自动回复客户咨询:电商平台使用DeepSeek自动回答 客户关于订单状态、退货政策等问题 自动处理订单:外卖平台使用DeepSeek自动处理用户 订单和配送请求 自动处理投诉:电信公司使用DeepSeek自动处理客户 关于网络和账单的投诉 情感支持:心理健康应用使用DeepSeek为用户提供情 感支持和心理辅导 客户反馈分析:企业使用DeepSeek分析客户反馈,改 进产品和服务 多渠道客服支持:企业使用DeepSeek在网
| ||
下载文档到本地,方便使用
共 147 页, 还有
1 页可预览,
继续阅读
文档评分


基于DeepSeek AI大模型CRM客户关系管理系统应用方案(156页 WORD)
DeepSeek大模型赋能高校教学和科研2025