DeepSeek大模型赋能高校教学和科研2025模型。推理模型的核心在于处 理那些需要 多步骤逻辑推导才能解决的 复杂问题。 3.4 大模型的分 类 大语言模型可以分为通用大模型和推理大模型 3.4 大模型的分 类 n 推理大模型 DeepSeek R1 的对话效果 非推理问题 : ” 法国的首都是哪里 ? ” (答案直接 、 无需推导 ) 推理问题: ” 一列火车以每小时 60 英里的速度行驶 3 小时 , 行驶距离是多少? ” (需先理解 ”距离 Transformer 架构 ,经过大量文本数据训练而成 ,能够生成自 然、 流畅的语言 ,并具备回答问题、 生成文本、 语言翻译等多种功能 ChatGPT 的应用范围广泛 , 可以用于客服、 问答系统、 对话生成、 文本生成等领域。 它能够理解人类语言 ,并能够回 答各 种问题 ,提供相关的知识和信息。 与其他聊天机器人相比 , ChatGPT 具备更强的语言理解和生成能力 ,能够更自 然地与人 媲美。 3.6.2 国内的大模 型产品 n DeepSeek (深度求索) DeepSeek 创始人 梁文峰 n 通义千问 通义千问是阿里云推出的一个超大规模的语言模型 , 它具备多轮对话、 文 案创作、 逻辑推理、 多模态理解、 多语言支持的能力。 通义千问这个名 字 有“通义”和“千问”两层含义 , “通义”表示这个模型能够理解各种语 言 的含义 , “千问”则表示这个模型能够回答各种问题。10 积分 | 123 页 | 15.88 MB | 5 月前3
山东大学:DeepSeek 应用与部署词 • 1. 内容生成类 :文本生成、代码生成、创 意生成和数据模拟。 • 2. 信息处理类 :文本摘要、信息抽取、 情感分析和多语言翻译。 • 3. 对话交互类 :角色扮演、多轮对话、 反问引导。 • 4. 技能应用类 :数学计算、代码解释、 逻辑推理。 • 5. 个性化定制类 :风格迁移、知识库绑 定、偏好记忆。 • +silconflow 邀请码: z0sI0urY 邀请链接: https://cloud.siliconflow.cn/i/z0sI0urY 通过创建 API key 调 用 模型微调工程 u 对话模型微调 u 生图模型微调 华为云模型微调 老师模型 模型蒸馏工程 DeepSeek : 推理模型 | 推理能力 蒸馏 DeepSeek 蒸馏模 型 学生模型 小模型:相当于一枚小学生 ,选中要上传的文档 ,点击移动到工作区 ,再点击“ Save and Embed” ,对文档进行切分和词向量化。 完成后 • ,点击图钉按钮 ,将文档设置为当前对话的背景文档 ,即可在聊 天窗口基于上传的文档内容与模型进行对话 本地部署方法 Ollama+Deepseek LM Studio+DeepSeek Anything LM+Ollama+Deepseek + 向量模型( Embessing10 积分 | 79 页 | 6.52 MB | 5 月前3
AI跃迁派:2025年DeepSeek零基础完全指南搜索"DeepSeek"(蓝色鲸鱼 LOGO) ⚫ 安卓:应用商店搜索下载或官网直接获取安装包 核心功能: ⚫ 语音输入:长按麦克风图标口述问题(适合通勤场景) ⚫ 离线缓存:断网时可查看历史对话记录 避坑指南:若遇安装失败,检查存储空间是否充足,或关闭杀毒软件后重试 ③微信小程序(轻量化入口) 获取路径: 1.微信搜索"DeepSeek"公众号 2.后台发送关键词【小程序】获取专属链接 3.常见问题速查 Q1:为什么联网搜索时断时续? 原因:服务器负载过高或网络波动 解决方案:避开晚高峰使用,或切换至深度思考模式本地处理 Q2:如何导出对话记录? 操作路径:网页版/APP 端点击对话历史→右键选择“导出为 Markdown” Q3:上传文件后 AI 无法识别内容? 排查步骤: 1.检查文件是否受损(重新保存后上传) 2.确认图片清晰度(建议 意识延续:临终者将“思维印记”存入 AI 实现数字永生 ⚫ 伦理铁律:立法禁止“完全意识复制”,保留人类生物独特性 当我们在深夜与 DeepSeek 对话时,不仅是向机器提问,更是在与人类文明的未来对 谈——这场对话没有终点,因为每一次技术进步都在重新定义可能性的边界。10 积分 | 21 页 | 1.01 MB | 5 月前3
华为昇腾DeepSeek解决方案DeepSeek-R1-Distill-Qwen-7B 模型参数: 671B+ 满血版 DeepSeek V3/R1 模型参数: 70B DeepSeek-R1-Distill-Llama-70B AI 编程 智能对话 金融研报 文本创作 营销文案 内容检测 Atlas 800I A2 (1024GB) 金融 电力 交通 政务 制造 油气 …… 教育 Huawei Proprietary - Restricted Proprietary - Restricted Distribution 网络控制器 45%+ 层内通信并行 L 层 19 n … … 场景 / 应用 测试模型 测试结果 对话搜索 DB-200B 0.94x A800 客服、文生图场景; 金融助手 SDXL 3.48~3.63x A10 Llama2-7B 1.41~2.72x A10 Llama2-13B 10 积分 | 32 页 | 2.52 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero的关键启示 ➢ 传统RLHF背景下,SFT通常被认为是不可或缺的一步,其逻辑先用大量人工标注的数据来让模型 初步掌握某种能力(如对话或者语言风格),然后再用RL来进一步优化性能 ➢ DeepSeek-R1 系列跳过对于大规模人工标注数据的依赖 ➢ 无需构建和维护高质量的SFT数据集,而是让模型直接在RL环境中进行探索 ➢ 能力之外帮助性和安全性 ➢ 对于reasoning data, 可以用基于规则的奖励 ➢ 对于general data, 可以用奖励模型来建模人类偏好意图 ➢ 成效:最终版本的 R1 不仅在推理和对话能力上达到了高水平, 还具备更安全的交互性能。 拒绝采样和全领域SFT 600k 推理数据 (Rule-based+Generative 奖励) 200k 通用数据 (Writing \10 积分 | 76 页 | 8.39 MB | 5 月前3
英特尔-工业人工智能白皮书2025年版4 行业应用 1.4.1 汽车行业 汽车造型 辅助设计 车身漆面 质量检测 零部件及 整车智能 制造 工业大模型可广泛应用于汽车造型设计等领域。例如,在汽车造型设计中,设计师可通过对话、画图等方式与大模 型交互,完善创意灵感,生成 3D 汽车数字模型,并能对模型进行风格调整、零部件编辑及颜色更换等操作。这能 使原本需要 1-2 年的设计周期大幅缩短。 车身表面的涂漆质量是衡0 积分 | 82 页 | 5.13 MB | 5 月前3
共 6 条
- 1
