DeepSeek大模型赋能高校教学和科研2025更连贯的回答 可迁移性高 学习到的知识和能力可以在不同 的任务和领域中迁移和应用 。 这 意味着一次训练就可以将模 型应 用于多种任务,无需重新 训练 语言生成能力 大模型可以生成更自然 、更流 利 的语言,减少了生成输出时 呈现 的错误或令人困惑的问题 3.1 大模型的概 念 3.2 大模型的发展历 程 大模型发展历经三个阶段 ,分别是萌芽期、 沉淀期和爆发 期 3 ) ,预训练大模型包含了预训练大语言模型(可以简称为“大语言模 型”) ,预训练大语言模型的典型代表包括 OpenAI 的 GPT 和百度的文心 ERNIE , ChatGPT 是基于 GPT 开发的大模型 产品, 文心一言是基于文心 ERNIE 开发的大模型产品 人工智能 机器学习 深度学习 预训练大模型 预训练 大语言模型 预训练大语言模型 GPT 文 心 ERNIE 深度学习模型 预训练模型 文心一言 ChatGPT 语言大模型 是 指 在 自 然 语 言 处 理 ( Nat u ral La ng uage Processing , NLP )领域中的一类大 模型, 通常 用于处理文本数据和理解自然语言 。 这类大模型 的主要特点是它们在大规模语料库上 进行了训练, 以学习自然语言的各种语法 、语义和语境规则 。 代表性产品包括 GPT10 积分 | 123 页 | 15.88 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 北大对齐小组 陈博远 北京大学2022级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero的关键启示 ➢ 传统RLHF背景下,SFT通常被认为是不可或缺的一步,其逻辑先用大量人工标注的数据来让模型 初步掌握某种能力(如对话或者语言风格),然后再用RL来进一步优化性能 ➢ DeepSeek-R1 系列跳过对于大规模人工标注数据的依赖 ➢ 无需构建和维护高质量的SFT数据集,而是让模型直接在RL环境中进行探索 ➢ 类比:初 languagemodels.co/p/the-illustrated-deepseek-r1 15 DeepSeek-R1 技术 Pipeline 总览 ➢ DeepSeek-R1 Zero 的问题:长推理过程可读性差、语言混合,帮助性低 ➢ Research Questions: ➢ 能否在Zero基础上兼顾推理性能的同时,提升模型的帮助性和安全性?例如产生 Clear & Coherent CoT 并且展现出通用能力的模型10 积分 | 76 页 | 8.39 MB | 5 月前3
山东大学:DeepSeek 应用与部署DeepSeek 应用与部 署 听听真我数字人讲 DeepSeek AIGC 发展历 程 AIGC 2014-2024 自然语言处理与语言模型 大语言模型 LLM : 2018 — 2024 DeepSeek 介 绍 DeepSeek : 2023 — DeepSeek : 技术创新——模型架构 | V2 ( Multi-Head Latent Attention ) 提示词工程 Deepseek 十类提示 词 • 1. 内容生成类 :文本生成、代码生成、创 意生成和数据模拟。 • 2. 信息处理类 :文本摘要、信息抽取、 情感分析和多语言翻译。 • 3. 对话交互类 :角色扮演、多轮对话、 反问引导。 • 4. 技能应用类 :数学计算、代码解释、 逻辑推理。 • 5. 个性化定制类 :风格迁移、知识库绑 ='deepseek-chat' 即可调用 DeepSeek-V3 model ='deepseek-reasoner' ,即可调用 DeepSeek-R1 。 Token 用量计算 • token 是模型用来表示自然语言文本的基本单位 , 也是我们的计费单元 , 可 以直观的理解为“字 ”或“词 ” ; 通常 1 个中文词语、 1 个英文单词、 1 个数字 或 1 个符号计为 1 个 token 。 • 一般情况下模型中10 积分 | 79 页 | 6.52 MB | 5 月前3
英特尔-工业人工智能白皮书2025年版......................................................................................38 2.3.1 大语言模型赋能工业机械手臂 ........................................................................................ 产效率、优化资源配置、增强质量控制和实现生产过程 的自动化与智能化。具体包括: • 设备管理: 在设备入库管理方面,AI 通过深度学习识别设备上的 条形码、二维码或设备特征,自动读取设备信息如型 号、序列号等;AI 的自然语言处理功能,可以自动 提取设备手册或标签上的文字信息,获取设备规格、 性能指标等关键参数。这些都能显著提升设备入库管 理的效率和准确性。 在设备运维管理方面,利用机器学习算法,对部署在 设备 监控物流配送过程,提高配送效率、降低成本。 • 财务与人力管理:通过训练模型,可以自动读取发 票和收据,将其转换为数字格式,直接导入会计系 统,减少了数据录入和处理的时间和错误 。使用自 然语言处理 (NLP) 和机器学习算法,能快速分析候 选人简历,识别出与职位相关的教育背景、工作经历 等关键信息,快速筛选出符合条件的候选人,提高招 聘效率。 05 01 工业人工智能 (AI)0 积分 | 82 页 | 5.13 MB | 5 月前3
华为昇腾DeepSeek解决方案效率与成本双突破 NLP 全面普及 2015 Resnet 效率与成本双突破 CV 全面普及 AI 模型算法: DeepSeek 国家战略清晰 技术创新依赖资本投入 NLP 自然语言处理 双轮驱动互锁 战略坚定 + 技术创新 CV 计算机视觉 3 Huawei Proprietary - Restricted Distribution 下一代 AI DeepSeek R1: 在 Reasoning 任务达到了世界水平( OpenAI- o1 ) 以 2 阶段 SFT+2 阶段 RL 完成,从而解决 R1-Zero 可读性差、 多种 语言混合问题 本次开源同时发布了 6 个基于 DeepSeek-R1 蒸馏的更小稠密模 型 ( Qwen/LLaMa 1.5B 7B 14B 32B 70B ) DeepSeek-R1 Huawei Proprietary - Restricted Distribution 15 昇腾 AI 基础软硬件架构全面创新,使能行业场景化应用 行业场景化应用 视图分析、检索聚类、搜索推荐、自然语言处理、智能语音、自动驾驶 AI 计算框架 昇思 MindSpore PyTorch / TensorFlow / Caffe...... 异构计算架构 CANN Atlas 及昇腾伙伴系列硬件0 积分 | 32 页 | 2.52 MB | 5 月前3
AI跃迁派:2025年DeepSeek零基础完全指南《DeepSeek 零基础完全指南》 公众号“AI 跃迁派”出品 一、DeepSeek 全景认知 1.颠覆性定义:人人都能用的认知引擎 DeepSeek(深度求索)是中国首个全栈开源的大语言模型,由杭州深度求索人工智能 公司研发,定位为“认知智能引擎”。简单来说,它是一个能像人类一样思考、学习和解 决问题的超级 AI 工具。 核心能力: ⚫ 复杂推理:像学霸解数学题一样处理逻辑难题(R1 适用人群:学生、白领、自媒体创作者 核心技能: ⚫ 文案生产:3 分钟生成周报/演讲稿/小红书爆款文案(带 Emoji 和话题标签) ⚫ 知识管家:自动整理会议录音→生成思维导图→提炼待办事项 ⚫ 语言翻译:支持 42 种语言互译,自动适配文化差异(如把“摆烂”翻译成 “quietquitting”) 局限:复杂逻辑问题需升级至 R1 版本 模块 2:深度思考(R1)——决策智囊团 技术突破: 文化传承:通过多模态 AI 还原失传技艺,如成功复现唐代青瓷秘法 ②星际探索联盟 地外智能体:搭载 DeepSeek 的探测器可自主分析火星地质,决策效率提升 1000 倍 宇宙语言库:构建跨物种沟通系统,为接触地外文明做准备 ③意识融合实验 ⚫ 记忆上传:临终患者可将人生经历转化为 AI 数字生命 ⚫ 伦理边界:立法禁止“完全意识复制”,保留人类独特性10 积分 | 21 页 | 1.01 MB | 5 月前3
共 6 条
- 1
