DeepSeek大模型赋能高校教学和科研2025DeepSeek 每个人都可以读懂的大模型科普报告(高校篇) DeepSeek 大模型赋能高校教学和科 研 厦门大学大数据教学团队作品 2025 年 2 月 25 日 厦门大学 林子雨 副教授 国 内 高 校 大 数 据 教 学 的 重 要 贡 献 者 团队负责人 :林子雨 副教授 年轻力量: 核心成员全部 46 周岁以下 结构合理: 教学型、 科研型、 实验工程师 专注专业: 从 们在解决复杂问题和应对新的 场 景时表现更加出色 上下文理解能力 大模型具有更强的上下文理解能 力 ,能够理解更复杂的语意和语 境 。这使得它们能够产生更准确、 更连贯的回答 可迁移性高 学习到的知识和能力可以在不同 的任务和领域中迁移和应用 。 这 意味着一次训练就可以将模 型应 用于多种任务,无需重新 训练 语言生成能力 大模型可以生成更自然 、更流 利 midjourney 等 视觉大模型 是指在计算机视觉( Computer Vision , CV )领 域中使用的大模型 ,通常用 于图像处理和分析 。 这类模型通过在大规模图 像数据上进行训练, 可 以实现各种视觉任务 , 如图像分类 、 目标检测 、 图像分割 、姿态估计 、人脸识别等 。代表性产品 包括 VIT 系列 ( Google ) 、文心 UFO 、华为盘古 CV 、 INTERN10 积分 | 123 页 | 15.88 MB | 10 月前3
华为昇腾DeepSeek解决方案是一款 MoE 模型,总参数量 671B ,激活参数量 37B ,采用 2048 张 H800 (节点内 NVLink ,节点间 IB ,非超节点架构) 在 14.8T token 数据集上基 于自 研 HAI-LLM 训练系统总计训练了 1394h ( 58.08 天) 性能优 数学、科学和代码等领域领先业界, 成为业界公认的 LLM 的领先模型 来源: DeepSeek 模型测试数据 s ri t d, DM istriLb ti可 o n 以 将 K V C a c h e 降 低 为 = 1 . 7 % 只需存储图中的 c v, K 即可; 考虑到矩阵乘法结合律,具体实现过程中 W UK可以与 WUQ 融合、 WUV可 以与 Wo融合,从而无需为每个 query 计算 key-value 值。 MTP 模块的损失函数加权平均得到最终训练目标 ③ 关键作用 • 提升每批训练数据的使用效率 ,强化训练信号 • 优化模型表达能力 ,提升 next-token 的预测效果 • 可参考投机采样改造 MTP 模块 ,加速推理效率 MTP : Multi-Token Prediction 多 token 预测提升模 型效果 • MTP 模块仅在训练中使用,提升模型训练效果,推理阶段可以不使用0 积分 | 32 页 | 2.52 MB | 10 月前3
英特尔-工业人工智能白皮书2025年版具有强大的泛化能力, 能够有效处理多种从未见过的数据或新任务,甚至能处理一些与训练数据截然不同的任务。这使得大模型能应用于多种任 务和场景,具有广泛的适用性。 4. 灵活性和可定制性。大模型通常具有灵活的架构和可定制的参数,可以根据特定需求对通用大模型进行定制和优化。通过 微调 (Fine-tuning) 技术,预训练的大模型可以快速适应新的任务和数据集,而无需从头开始训练。此外,还可以通过添 利用大模型对于自然语言的理解能力,能理解和识 别用户意图,使员工能通过自然语言就能与机器进 行交互;另外通过为大模型外挂知识库,增强知识 检索能力,可以提升知识获取和共享效率。这些能 力在工业领域可普遍应用于智能客服、知识管理、 教学与培训、工业文档检索与统计等场景中,大幅 提升工作效率,减少人力劳动和成本。 还可以基于行业大模型提供知识问答/异常诊断/产 线维护/排产建议,大幅提升制造效率,降低运维 第二,创作与内容生成能力,如工业运控软件代码、 设计模型、应用文档的生成。 在模型具备语言理解的基础之上,工业大模型具备 了内容创作与生成的能力,这种内容生成的能力可 大幅提高内容生成效率,提升员工工作效率。其与 工业设备及系统的自然交互及推理的能力,可助力 基于 LLM 工业代码的快速生成、优化与调试,大大 促进工业应用的生成与落地。 尽管目前工业大模型的应用已经渗透到工业的多个环节,应用场景较多0 积分 | 82 页 | 5.13 MB | 10 月前3
山东大学:DeepSeek 应用与部署model ='deepseek-reasoner' ,即可调用 DeepSeek-R1 。 Token 用量计算 • token 是模型用来表示自然语言文本的基本单位 , 也是我们的计费单元 , 可 以直观的理解为“字 ”或“词 ” ; 通常 1 个中文词语、 1 个英文单词、 1 个数字 或 1 个符号计为 1 个 token 。 • 一般情况下模型中 token 和字数的换算比例大致如下: 行搭建 模型服务基础设施 ,且具备负载均衡和自动扩缩容机制 ,保障 API 调用稳定性。搭配 Chatbox 可视 化界面客户端 ,进一步简化了调用流程 ,无需在命令行中操作 ,通过图形化界面即 可轻松配置和使用 https://chatboxai.app/zh#downl oad DeepSeek 模型。 DeepSee k DeepSeek-R1 - Ditill-Qwen-32B Ditill-Qwen- 1.5B DeepSeek- V3 DeepSeek- R1 腾讯云部署流程 • Cloud Studio :登录腾讯云官网 ,进入 Cloud Studio ,可一键部署 ,即开即用 ,能快速体验 7B 以下 DeepSeek - R1 蒸馏模型。 • 云原生构建:登录腾讯云 ,云原生构建相关服务 ,一键体验 DeepSeek ,无需等待下载10 积分 | 79 页 | 6.52 MB | 10 月前3
AI跃迁派:2025年DeepSeek零基础完全指南竞品监控:自动生成友商产品功能对比表 ⚫ 风险预警:识别企业年报中的 34 种财务异常信号 ⚫ 生活助手:比价全网购物平台,推荐性价比最高商品 3.技术普惠:让 AI 像水电一样触手可及 DeepSeek 通过两大革新打破技术壁垒: 1.白菜价训练:用 2000 块国产昇腾芯片就能训练专业模型,大学生也能参与 AI 开发 2.手机端运行:1.5B 压缩版模型在千元机上流畅运行,山区医生可用 注册方式:手机号/微信/邮箱三选一,接收验证码完成认证 ⚫ 安全提示:建议设置“字母+数字+符号”组合密码,定期更换 ②核心功能切换 ③文件交互技巧 支持格式:PDF(需文字可复制)、Word、Excel、图片(JPG/PNG) 高阶用法: ⚫ 文档对比:上传 A/B 两份文件,输入“分析市场策略差异” ⚫ 数据提取:从实验报告 PDF 中自动整理温度数据表格 ①学生党:从题海战术到精准学习 ⚫ 论文润色:上传论文草稿→输入“优化学术表达,确保符合 APA 格式”→10 分钟完 成专业级修改 ⚫ 知识点图谱:输入“用思维导图整理高中生物遗传学核心概念”→生成可打印的学习 框架 ⚫ 解题思路:拍摄数学题照片→R1 模式自动分步解析,错误点用红框标注 ②职场人:效率提升 300%的办公神器 ③创业者:零成本搭建专业团队 ⚫ 商业计划书:输入“智能家居赛道10 积分 | 21 页 | 1.01 MB | 10 月前3
浙江大学-DeepSeek模型优势:算力、成本角度解读2025草绳、石子 算盘、算筹 ▶ 计算器、计算机 ■ 原生算力:大脑 ( 可处理复杂逻辑,但不能高速处理简单运算 ) ■ 外部算力工具: ■ 草绳、石子 ■ 算盘 ■ 计算机:算力提供者 ( 可高速简单运算,不能处理复杂逻 辑 ) 算力的发展 “I think there is a10 积分 | 23 页 | 7.53 MB | 10 月前3
从智慧教育到智慧课堂:理论、规范与实践网络服务能够提供协作和生产 效率 基于虚拟桌面的课堂、实 验室和手机接入 弱功能客户机和移动设备为用 户提供便捷式接入系统 虚拟云服务:为分布式校 园和课堂提供集中式支持。 作为一种选择, IBM 可 以承担传递服务 开放资源和电子学习 & 电 子档案袋、课件、内容和 服务 商务智能为学生绩效提供新的 视角 利用开放资源,虚拟旧计 算机桌面应用和服务,降 低成本 智慧课堂:利用 使用简单,师生能够快速适应新环境 小步子逐步实施,保证教育生态平衡发展 互动型未来教室 构建基于一对一的教学环境,学习者能够有序开展小组合作 学习、项目学习等多样互动的学习方式。教师可基于教学环 境开展深度互动教学,引导学习者创造性学习、体验做中学 的乐趣。 优势 教学内容富媒体呈现 创设适应性虚拟学习环境 个性化学习环境 大数据学习分析 智慧型未来教室 10 积分 | 74 页 | 10.39 MB | 10 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 北大对齐小组 陈博远 北京大学2022级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 生成的高质量链式思考 (Chain-of-Thought, CoT)数据,部分样本长度达到 10,000 Token ➢ 成效:提供一些 Human Prior \ 显著提升了语言的语义连贯性、可 读性和基本推理能力。 ➢ 推理为中心RL Reasoning-Oriented RL ➢ 增加了大规模的RL训练过程:和DeepSeek-R1 Zero 基本一致,主 要是提升Reasoning的能力,包括coding 理由 奖惩 改进 无 一条理由轨迹/问题 无轨迹,只有多个结果 微调 过滤数据 微调 多理由轨迹/问题 多轮ORM验证 自主纠错 • 使用同一个模型:生成理由→RM奖惩→迭代改进 • 可与奖惩/生成机制的新技术相结合,形成完整方案 2025-强推理&模态穿透 强推理赋能 智能体 Agentic 模态穿透 多模态潜力进一步发掘 全模态场景下模态穿透与统一 ①③ ③④⑤ ②③⑤10 积分 | 76 页 | 8.39 MB | 10 月前3
共 8 条
- 1
