ppt文档 DeepSeek大模型赋能高校教学和科研2025 VIP文档

15.88 MB 123 页 0 下载 33 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pptx
3
概览
DeepSeek 每个人都可以读懂的大模型科普报告(高校篇) DeepSeek 大模型赋能高校教学和科 研 厦门大学大数据教学团队作品 2025 年 2 月 25 日 厦门大学 林子雨 副教授 国 内 高 校 大 数 据 教 学 的 重 要 贡 献 者 团队负责人 :林子雨 副教授 年轻力量: 核心成员全部 46 周岁以下 结构合理: 教学型、 科研型、 实验工程师 专注专业: 从 2013 年至今 , 11 年专注于大数据教学 团队特点: 眼光前瞻、 紧跟技术、 创新实干、 执行力 强 影响力高: 多项指标在国内高校大数据教学领域领 先 • 教材数量 • 教材占有率 • MOOC 课程学习人数 • 师资培养 • 教学研讨会 • 教学网站访问量 • 在线讲座观看人数 • …… 团队联系方式: ziyulin@xmu.edu.cn 厦门大学大数据教学团队 1. 人工智能发展简史 2. 人工智能思维 3. 大模型: 人工智能的前沿 4. 高校本地部署 DeepSeek 大模 型 5. AIGC 应用与实践 6. 基于大模型的智能体 7. AI 赋能高校科研 8. AI 赋能高校教学 目录 厦门大学大数据教学团队作品 2025 年 2 月 1.1 图灵测试 1.2 人工智能的诞生 1.3 人工智能的发展阶段 1.4 未来人工智能发展的五个阶 段 1. 人工智能发展简 史 厦门大学大数据教学团队作品 1950 年 , “计算机之父”和“人工智能之父”艾伦 · 图灵( Alan M. Turing ) 发表了论文《计算机器与智能》 ,这篇论文被誉 为人工智能科学的开山之作。 在论文的开篇 , 图灵提出了一个引人深思的问题: “机器能思考吗? ”。这个问题激发了人们 无尽的想象 , 同时也奠定了人工智能的基本概念和雏形 在这篇论文中 ,图灵提出了鉴别 机 器是否具有智能的方法 ,这就是 人 工智能领域著名的“图灵测试”。 如图所示 ,其基本思想是测试者 在 与被测试者(一个人和一台机 器) 隔离的情况下 ,通过一些装 置(如 键盘)向被测试者随意提 问。进行 多次测试后 ,如果被测 试者机器让 平均每个测试者做出 超过 30% 的误 判 ,那么这台机器 就通过了测试 , 并被认为具有人 类智能 1.1 图灵测试 人工智能的诞生可以追溯到 20 世纪 50 年代。 当时 ,计算机科学刚刚起步 ,人们开始尝试通过计算机程序来模拟人类的思维 和 行为。 在这个背景下 , 一些杰出的科学家和工程师们开始研究如何使计算机具备更高级的功能 1956 年 8 月 ,在美国达特茅斯学院举办的人工智能夏季研讨会 ,是人工智能领域具有里程碑意义的一次重要会议。 这次会 议汇 聚了众多杰出的科学家和工程师 ,他们共同探讨和研究人工智能的发展和应用前景 这次会议的主题围绕着人工智能的定义、 研究方法和应用场景展开。 与会者们深入探讨了人工智能的基本概念、 算法和技术, 以及其在各个领域的应用潜力。 他们共同认识到 ,人工智能的研究和发展将为人类带来巨大的变革和进步 1.2 人工智能的诞 生 在这次会议上 , “人工智能”这个词汇被约翰 . 麦卡锡( John McCarthy ) 首次提出。 与会者们不仅对人工智能的研究和应 用 前景进行了深入探讨 ,还提出了许多重要的观点和思路 ,为人工智能的发展奠定了基础。 这次会议的召开标志着人工智能作 为一个独立学科的正式诞生 , 因此 ,达特茅斯会议被称为“人工智能的开端” , 1956 年也被称为“人工智能元年”。这次会 议不仅为人工智能的研究和发展奠定了基础 ,还为人类带来了巨大的变革和进步 1.2 人工智能的诞 生 1.3 人工智能的发展阶 段 从 1956 年人工智能元年至今 ,人工智能的发展历程经历了漫长的岁月 ,大致可以划分为以下 6 个 阶段 OpenAI Operator DeepSeek R1 1.4 未来人工智能发展 5 个阶 段 2. 人工智能思维 厦门大学大数据教学团队作品 拥有和人工智能协作的能力, 懂得如何运用人工智能 2. 人工智能思 维 具备区分人的能力 和机器的能力 协作 区分 了解 每个人都应了解人工智能 的基础运行模式 2024 年 12 月 , 人工智能教母级人物、 斯坦福大 学终 身教授李飞飞在公开演讲中说道: “斯坦福应 该录 取最会用 ChatGPT 的前 2000 名学生”。 2025 年 1 月 , 互联网知名企业家周鸿祎发表观点 ”未来擅长使用 AI 的人会淘汰不会使用 AI 的人 “。 2. 人工智能思 维 3.1 大模型的概念 3.2 大模型的发展历程 3.3 人工智能与大模型的关 系 3.4 大模型分类 3. 大模型:人工智能的前 沿 3.5 大模型原理 3.6 大模型产品 3.7 大模型应用领 域 厦门大学大数据教学团队作品 大模型通常指的是大规模的人工智能模型 ,是一种基于深度学习技术 ,具 有 海量参数、强大的学习能力和泛化能力 ,能够处理和生成多种类型数据的 人 工智能模型。 通常说的大模型的“大”的特点体现在: 2020 年 , OpenAI 公司推出了 GPT-3 ,模型参数规模达到了 1750 亿。 2023 年 3 月发布的 GPT-4 的参数规模是 GPT-3 的 10 倍以上 ,达到 1.8 万 亿, 2021 年 11 月阿里推出的 M6 模型的参数量达 10 万亿。 3.1 大模型的概 念 训练数据量大 计算资源需求高 参数数量庞大 大模型的设计和训练旨在提供更强大、 更准确的模型性能 , 以应对更复杂、 更庞大的数据集或任务。 大模型通常能够学习 到 更细微的模式和规律 ,具有更强的泛化能力和表达能力 学习能力强 大模型可以从大量的数据中学习, 并利用学到的知识和模式来提供 更精准的答案和预测 。这使得它 们在解决复杂问题和应对新的 场 景时表现更加出色 上下文理解能力 大模型具有更强的上下文理解能 力 ,能够理解更复杂的语意和语 境 。这使得它们能够产生更准确、 更连贯的回答 可迁移性高 学习到的知识和能力可以在不同 的任务和领域中迁移和应用 。 这 意味着一次训练就可以将模 型应 用于多种任务,无需重新 训练 语言生成能力 大模型可以生成更自然 、更流 利 的语言,减少了生成输出时 呈现 的错误或令人困惑的问题 3.1 大模型的概 念 3.2 大模型的发展历 程 大模型发展历经三个阶段 ,分别是萌芽期、 沉淀期和爆发 期 3.2 大模型的发展历 程 3.2 大模型的发展历 程 大模型发展对算力的需求演变 人工智能包含了机器学习 ,机器学习包含了深度学习 ,深度学习可以采用不同的模型 , 其中一种模型是预训练模型 ,预训 练模型包含了预训练大模型(可以简称为“大模型”) ,预训练大模型包含了预训练大语言模型(可以简称为“大语言模 型”) ,预训练大语言模型的典型代表包括 OpenAI 的 GPT 和百度的文心 ERNIE , ChatGPT 是基于 GPT 开发的大模型 产品, 文心一言是基于文心 ERNIE 开发的大模型产品 人工智能 机器学习 深度学习 预训练大模型 预训练 大语言模型 预训练大语言模型 GPT 文 心 ERNIE ... 3.3 人工智能与大模型的关 系 深度学习模型 预训练模型 文心一言 ChatGPT 语言大模型 是 指 在 自 然 语 言 处 理 ( Nat u ral La ng uage Processing , NLP )领域中的一类大 模型, 通常 用于处理文本数据和理解自然语言 。 这类大模型 的主要特点是它们在大规模语料库上 进行了训练, 以学习自然语言的各种语法 、语义和语境规则 。 代表性产品包括 GPT 系列 ( OpenA I ) 、 Bard ( Google ) 、 DeepSeek 、文心一言 (百度)等 多模态大模型 是指能够处理多种不同类型数据的大模型,例如 文本 、 图像 、音频等多模态数据 。这类模型结 合 了 NLP 和 CV 的能力, 以实现对多模态信息 的综合 理解和分析,从而能够更全面地理解和 处理复杂 的数据 。代表性产品包括 DingoDB 多模向量数据 库(九章云极 DataCanvas ) 、 DALL-E(OpenAI) 、 悟空画画(华 为) 、 midjourney 等 视觉大模型 是指在计算机视觉( Computer Vision , CV )领 域中使用的大模型 ,通常用 于图像处理和分析 。 这类模型通过在大规模图 像数据上进行训练, 可 以实现各种视觉任务 , 如图像分类 、 目标检测 、 图像分割 、姿态估计 、人脸识别等 。代表性产品 包括 VIT 系列 ( Google ) 、文心 UFO 、华为盘古 CV 、 INTERN (商汤)等 3.4 大模型的分 类 通用大模型 L0 是指可以在多个领域和任务上通用 的大模型 。 它们利用大算力、使 用 海量的开放数据与具有巨量参 数的 深度学习算法,在大规模无 标注数 据上进行训练, 以寻找特 征并发现 规律 ,进而形成可“举一 反三” 的强 大泛化能力 ,可在不 进行微调或少 量微调的情况下完 成多场景任务 , 相当于 AI 完成 了“通识教育” 行业大模型 L1 是指那些针对特定行业或领域的大 模型 。 它们通常使用行业相关的 数 据进行预训练或微调, 以提高 在该 领域的性能和准确度,相当 于 AI 成 为“行业专家” 垂直大模型 L2 是指那些针对特定任务或场景的大 模型 。 它们通常使用任务相关的 数 据进行预训练或微调, 以提高 在该 任务上的性能和效果 3.4 大模型的分 类 按照应用领域的不同 ,大模型主要可以分为 L0 、 L1 、 L2 三个 层级 推理大模型 推理大模型的概念大规模传播应该开始于 2 0 2 4 年 9 月 份 。 2 0 2 4 年 9 月 1 2 日 , OpenAI 官方宣布了 OpenAI o1 推 理大模 型。 OpenAI 定义推理模型 在 OpenAI 的官网上 , OpenAI 定义推理模 型是在回答之前进行思考 , 并在回复用户 之前 ,在内部生成一长串的思维链过程。 思维链是一种提示大语言模型进行逐步推 理的方法。它让模型在得出最终答案之前 , 先显式地写出推理的中间步骤。这就像人 类解决复杂问题时会先把思考过程写下来 一样。 推理模型的核心 也就是说 ,如果模型在回复你之前有一 长 串的思考过程(这个过程必须可以显 示输 出) ,探索了很多不同的路径之后 给出答 案 ,那么有这个能力的大模型就 是推理大 模型。推理模型的核心在于处 理那些需要 多步骤逻辑推导才能解决的 复杂问题。 3.4 大模型的分 类 大语言模型可以分为通用大模型和推理大模型 3.4 大模型的分 类 n 推理大模型 DeepSeek R1 的对话效果 非推理问题 : ” 法国的首都是哪里 ? ” (答案直接 、 无需推导 ) 推理问题: ” 一列火车以每小时 60 英里的速度行驶 3 小时 , 行驶距离是多少? ” (需先理解 ”距离 = 速度 × 时间 ” 的关系 , 再分步计算) Sebastian Raschka 博士( Lightning AI 的首席教育学家) 将“推理”定义为通过生成中间步骤来回答复杂问 题的过程 通用的大语言模型( LLM ) 可能直接输出简短答案(如” 180 英里”) 推理模型的特点在于显式展示中间推导过程 3.4 大模型的分 类 特性 推理大模型 通用大模型 适用场景 复杂推理、 解谜、 数学、 编码难题 文本生成、 翻译、 摘要、 基础知识问答 复杂问题解决能力 优秀 ,能进行深度思考和逻辑推理 一般 ,难以处理多步骤的复杂问题 运算效率 较低 ,推理时间较长 ,资源消耗大 较高 , 响应速度快 ,资源消耗相对较小 幻觉风险 较高 , 可能出现“过度思考”导致的错误答案 较低 ,更依赖于已知的知识和模式 泛化能力 更强 ,能更好地适应新问题和未知场景 相对较弱 ,更依赖于训练数据 擅长任务举例 解决复杂逻辑谜题 ,编写复杂算法 ,数学证明 撰写新闻稿 ,翻译文章 , 生成产品描述 , 回 答 常识问题 成本 通常更高 通常更低 在应用方面二者各有擅长的领域 , 而不是简单的谁强谁弱问题 n 如果你需要完成数据分析、 逻辑推理、 代码生成等逻辑性较强且较为复杂的任务 ,请选择推理大模 型 n 如果你面临创意写作、 文本生成、 意图识别等发散性较强且较为创意多样的任务 ,请选择通用大模 型 3.4 大模型的分 类 大模型是基于 Transformer 架构的 ,这种架构是一种专门用于自然语言处理的“编码 - 解码器”架构。 在训练过程中 ,大模 型将输入的单词以向量的形式传递给神经网络 ,然后通过网络的编码解码以及自注意力机制 ,建立起每个单词之间联系的 权 重。大模型的核心能力在于将输入的每句话中的每个单词与已经编码在模型中的单词进行相关性的计算 ,并把相关性又 编码 叠加在每个单词中。 这样 ,大模型能够更好地理解和生成自然文本 , 同时还能够表现出一定的逻辑思维和推理能力 3.5 大模型的基本原 理 具有大量参数的 神经网络模型 大量的数据和计算资源 基于深度学习 不断地调整 模型参数 大模型 训练 利用 3.5 大模型的基本原 理 3.6.1 国外的大模型产品 3.6.2 国内的大模型产品 3.6.3 主流大模型“幻觉”评 测 3.6 大模型产 品 厦门大学大数据教学团队作品 n ChatGPT ChatGPT 是一种由 OpenAI 训练的大语言模型。 它是基于 Transformer 架构 ,经过大量文本数据训练而成 ,能够生成自 然、 流畅的语言 ,并具备回答问题、 生成文本、 语言翻译等多种功能 ChatGPT 的应用范围广泛 , 可以用于客服、 问答系统、 对话生成、 文本生成等领域。 它能够理解人类语言 ,并能够回 答各 种问题 ,提供相关的知识和信息。 与其他聊天机器人相比 , ChatGPT 具备更强的语言理解和生成能力 ,能够更自 然地与人 类交流 ,并且能够更好地适应不同的领域和场景。 ChatGPT 的训练数据来自互联网上的大量文本 , 因此 , 它 能够涵盖多种 3.6.1 国外的大模型产 品 语言风格和文化背景 n Gemini Gemini 是谷歌发布的大模型 , 它能够同时处理多种类型的数据和任务 , 覆盖文本、 图像、 音频、 视频等多个领域。 Gemini 采用了全新的架构 ,将多模态编码器和多模态解码器两个主要组件结合在一起 , 以提供最佳结果 Gemini 包括三种不同规模的模型: Gemini Ultra 、 Gemini Pro 和 Gemini Nano , 适用于不同任务和设备。 2023 年 12 月 6 日, Gemini 的初始版本已在 Bard 中提供 ,开发人员版本可通过 Google Cloud 的 API 获得。 Gemini 可以应用于 Bard 和 Pixel 8 Pro 智能手机。 Gemini 的应用范围广泛 ,包括问题回答、 摘要生成、 翻译、 字幕生成、 情感分析等任务。 然而 , 由于其 复杂 性和黑箱性质 , Gemini 的可解释性仍然是一个挑战 3.6.1 国外的大模型产 品 2024 年 2 月 16 日 , OpenAI 再次震撼全球科技界 ,发布了名为 Sora 的 文本 生成视频大模型 ,只需输入文本就能自动生成视频。 这一技术的诞生, 不仅标志着人工智能在视频生成领域的重大突破 ,更引发了关于人工智 能发展对人类未来影响的深刻思考。 随着 Sora 的发布 ,人工智能似乎正 式踏入了通用人工智能( AGI : Artificial General Intelligence ) 的时 代。 AGI 是指能够像人类一样进行各种智能活动的机器智能 ,包括理解语言、 识别图像、 进行复杂推理等。 Sora 大模型能够直接输出长达 60 秒的视 频 , 并且视频中包含了高度细致的背景、 复杂的多角度镜头 , 以及富有 情感 的多个角色。 这种能力已经超越了简单的图像或文本生成 ,开始 触及到 视频这一更加复杂和动态的媒介。 这意味着人工智能不仅在处 理静态信 息上越来越强大 而且在动态内容的创造上也展现出了惊人的潜力 3.6.1 国外的大模型产 品 n Sora n Sora 右图是 Sora 根据文本自动生成的视频画面 , 一位戴 着 墨镜、 穿着皮衣的时尚女子走在雨后夜晚的东京市区 街道上 ,抹了鲜艳唇彩的唇角微微翘起 , 即便带着墨 镜也能看到她的微笑 ,地面的积水映出了她的身影 和 灯红酒绿的霓虹灯 ,热闹非凡的唐人街正在进行 舞龙 表演 ,熙熙攘攘的人群目光都聚焦在跃动的彩 龙身上, 整个环境的喜庆氛围仿佛令人身临其境 3.6.1 国外的大模型产 品 n OpenAI o3 2024 年 12 月 20 日 , OpenAI 发布推理模型 o3 ,无论在软件工程、 编写代码 ,还是竞赛数学、 掌握人类博士级别的自 然科学 知识能力方面 , o3 都达到了很高的水平 3.6.1 国外的大模型产 品 大模型 图标 指标排名 DeepSeek 能力测评第一 豆包 用户数量第一 Kimi 文本处理第一 即梦 AI 作图能力第一 通义万相 视频生成第一 智谱清言 文档归纳第一 3.6.2 国内的大模型产 品 2025 年 1 月国内大模型排行 榜 2024 年 12 月 26 日 ,杭州一家名为“深度求索”( DeepSeek ) 的中国初创公 司, 发布了全新一代大模型 DeepSeek-V3 。 在多个基准测试中 , DeepSeek-V3 的 性能均超越了其他开源模型 , 甚至与顶尖的闭源大模型 GPT-4o 不相上下 , 尤 其在数学推理上 , DeepSeek-V3 更是遥遥领先。 DeepSeek-V3 以多项 开创性 技术 ,大幅提升了模型的性能和训练效率。 DeepSeek-V3 在性能比 肩 GPT- 4o 的同时 ,研发却只花了 558 万美元 , 训练成本不到后者的二十分之一。 因 为表现太过优越 , DeepSeek 在硅谷被誉为“来自东方的神秘力量”。 2025 年 1 月 20 日 , DeepSeek-R1 正式发布 ,
下载文档到本地,方便使用
共 123 页, 还有 1 页可预览, 继续阅读
文档评分
请文明评论,理性发言.