可研 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

DeepSeek大模型赋能高校教学和科研2025

DeepSeek 每个人都可以读懂的大模型科普报告（高校篇） DeepSeek 大模型赋能高校教学和科研厦门大学大数据教学团队作品 2025 年 2 月 25 日厦门大学林子雨副教授国内高校大数据教学的重要贡献者团队负责人：林子雨副教授年轻力量：核心成员全部 46 周岁以下结构合理：教学型、科研型、实验工程师专注专业：从们在解决复杂问题和应对新的场景时表现更加出色上下文理解能力大模型具有更强的上下文理解能力，能够理解更复杂的语意和语境。这使得它们能够产生更准确、更连贯的回答可迁移性高学习到的知识和能力可以在不同的任务和领域中迁移和应用。这意味着一次训练就可以将模型应用于多种任务，无需重新训练语言生成能力大模型可以生成更自然、更流利 midjourney 等视觉大模型是指在计算机视觉（ Computer Vision ， CV ）领域中使用的大模型，通常用于图像处理和分析。这类模型通过在大规模图像数据上进行训练，可以实现各种视觉任务，如图像分类、目标检测、图像分割、姿态估计、人脸识别等。代表性产品包括 VIT 系列（ Google ）、文心 UFO 、华为盘古 CV 、 INTERN

10 积分 | 123 页 | 15.88 MB | 1 年前
3
华为昇腾DeepSeek解决方案

是一款 MoE 模型，总参数量 671B ，激活参数量 37B ，采用 2048 张 H800 （节点内 NVLink ，节点间 IB ，非超节点架构）在 14.8T token 数据集上基于自研 HAI-LLM 训练系统总计训练了 1394h （ 58.08 天）性能优数学、科学和代码等领域领先业界，成为业界公认的 LLM 的领先模型来源： DeepSeek 模型测试数据 s ri t d， DM istriLb ti可 o n 以将 K V C a c h e 降低为 = 1 . 7 % 只需存储图中的 c v, K 即可；考虑到矩阵乘法结合律，具体实现过程中 W UK可以与 WUQ 融合、 WUV可以与 Wo融合，从而无需为每个 query 计算 key-value 值。 MTP 模块的损失函数加权平均得到最终训练目标 ③ 关键作用 • 提升每批训练数据的使用效率，强化训练信号 • 优化模型表达能力，提升 next-token 的预测效果 • 可参考投机采样改造 MTP 模块，加速推理效率 MTP ： Multi-Token Prediction 多 token 预测提升模型效果 • MTP 模块仅在训练中使用，提升模型训练效果，推理阶段可以不使用

0 积分 | 32 页 | 2.52 MB | 1 年前
3
英特尔-工业人工智能白皮书2025年版

具有强大的泛化能力，能够有效处理多种从未见过的数据或新任务，甚至能处理一些与训练数据截然不同的任务。这使得大模型能应用于多种任务和场景，具有广泛的适用性。 4. 灵活性和可定制性。大模型通常具有灵活的架构和可定制的参数，可以根据特定需求对通用大模型进行定制和优化。通过微调 (Fine-tuning) 技术，预训练的大模型可以快速适应新的任务和数据集，而无需从头开始训练。此外，还可以通过添利用大模型对于自然语言的理解能力，能理解和识别用户意图，使员工能通过自然语言就能与机器进行交互；另外通过为大模型外挂知识库，增强知识检索能力，可以提升知识获取和共享效率。这些能力在工业领域可普遍应用于智能客服、知识管理、教学与培训、工业文档检索与统计等场景中，大幅提升工作效率，减少人力劳动和成本。还可以基于行业大模型提供知识问答/异常诊断/产线维护/排产建议，大幅提升制造效率，降低运维第二，创作与内容生成能力，如工业运控软件代码、设计模型、应用文档的生成。在模型具备语言理解的基础之上，工业大模型具备了内容创作与生成的能力，这种内容生成的能力可大幅提高内容生成效率，提升员工工作效率。其与工业设备及系统的自然交互及推理的能力，可助力基于 LLM 工业代码的快速生成、优化与调试，大大促进工业应用的生成与落地。尽管目前工业大模型的应用已经渗透到工业的多个环节，应用场景较多

0 积分 | 82 页 | 5.13 MB | 1 年前
3
山东大学：DeepSeek 应用与部署

model ='deepseek-reasoner' ，即可调用 DeepSeek-R1 。 Token 用量计算 • token 是模型用来表示自然语言文本的基本单位，也是我们的计费单元，可以直观的理解为“字 ”或“词 ” ；通常 1 个中文词语、 1 个英文单词、 1 个数字或 1 个符号计为 1 个 token 。 • 一般情况下模型中 token 和字数的换算比例大致如下：行搭建模型服务基础设施，且具备负载均衡和自动扩缩容机制，保障 API 调用稳定性。搭配 Chatbox 可视化界面客户端，进一步简化了调用流程，无需在命令行中操作，通过图形化界面即可轻松配置和使用 https://chatboxai.app/zh#downl oad DeepSeek 模型。 DeepSee k DeepSeek-R1 - Ditill-Qwen-32B Ditill-Qwen- 1.5B DeepSeek- V3 DeepSeek- R1 腾讯云部署流程 • Cloud Studio ：登录腾讯云官网，进入 Cloud Studio ，可一键部署，即开即用，能快速体验 7B 以下 DeepSeek - R1 蒸馏模型。 • 云原生构建：登录腾讯云，云原生构建相关服务，一键体验 DeepSeek ，无需等待下载

10 积分 | 79 页 | 6.52 MB | 1 年前
3
AI跃迁派：2025年DeepSeek零基础完全指南

竞品监控：自动生成友商产品功能对比表 ⚫ 风险预警：识别企业年报中的 34 种财务异常信号 ⚫ 生活助手：比价全网购物平台，推荐性价比最高商品 3.技术普惠：让 AI 像水电一样触手可及 DeepSeek 通过两大革新打破技术壁垒： 1.白菜价训练：用 2000 块国产昇腾芯片就能训练专业模型，大学生也能参与 AI 开发 2.手机端运行：1.5B 压缩版模型在千元机上流畅运行，山区医生可用注册方式：手机号/微信/邮箱三选一，接收验证码完成认证 ⚫ 安全提示：建议设置“字母+数字+符号”组合密码，定期更换 ②核心功能切换 ③文件交互技巧支持格式：PDF（需文字可复制）、Word、Excel、图片（JPG/PNG）高阶用法： ⚫ 文档对比：上传 A/B 两份文件，输入“分析市场策略差异” ⚫ 数据提取：从实验报告 PDF 中自动整理温度数据表格 ①学生党：从题海战术到精准学习 ⚫ 论文润色：上传论文草稿→输入“优化学术表达，确保符合 APA 格式”→10 分钟完成专业级修改 ⚫ 知识点图谱：输入“用思维导图整理高中生物遗传学核心概念”→生成可打印的学习框架 ⚫ 解题思路：拍摄数学题照片→R1 模式自动分步解析，错误点用红框标注 ②职场人：效率提升 300%的办公神器 ③创业者：零成本搭建专业团队 ⚫ 商业计划书：输入“智能家居赛道

10 积分 | 21 页 | 1.01 MB | 1 年前
3
浙江大学-DeepSeek模型优势：算力、成本角度解读2025

草绳、石子算盘、算筹 ▶ 计算器、计算机 ■ 原生算力：大脑 ( 可处理复杂逻辑，但不能高速处理简单运算 ) ■ 外部算力工具： ■ 草绳、石子 ■ 算盘 ■ 计算机：算力提供者 ( 可高速简单运算，不能处理复杂逻辑 ) 算力的发展 “I think there is a

10 积分 | 23 页 | 7.53 MB | 1 年前
3
从智慧教育到智慧课堂：理论、规范与实践

网络服务能够提供协作和生产效率 基于虚拟桌面的课堂、实验室和手机接入 弱功能客户机和移动设备为用户提供便捷式接入系统 虚拟云服务：为分布式校园和课堂提供集中式支持。 作为一种选择， IBM 可以承担传递服务 开放资源和电子学习 & 电子档案袋、课件、内容和服务 商务智能为学生绩效提供新的视角 利用开放资源，虚拟旧计算机桌面应用和服务，降低成本智慧课堂：利用使用简单，师生能够快速适应新环境  小步子逐步实施，保证教育生态平衡发展互动型未来教室  构建基于一对一的教学环境，学习者能够有序开展小组合作学习、项目学习等多样互动的学习方式。教师可基于教学环境开展深度互动教学，引导学习者创造性学习、体验做中学的乐趣。  优势 教学内容富媒体呈现 创设适应性虚拟学习环境 个性化学习环境 大数据学习分析智慧型未来教室 

10 积分 | 74 页 | 10.39 MB | 1 年前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

DeepSeek-R1 \ Kimi 1.5 及类强推理模型开发解读北大对齐小组陈博远北京大学2022级“通班” 主要研究方向：大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 生成的高质量链式思考（Chain-of-Thought, CoT）数据，部分样本长度达到 10,000 Token ➢ 成效：提供一些 Human Prior \ 显著提升了语言的语义连贯性、可读性和基本推理能力。 ➢ 推理为中心RL Reasoning-Oriented RL ➢ 增加了大规模的RL训练过程：和DeepSeek-R1 Zero 基本一致，主要是提升Reasoning的能力，包括coding 理由奖惩改进无一条理由轨迹/问题无轨迹，只有多个结果微调过滤数据微调多理由轨迹/问题多轮ORM验证自主纠错 • 使用同一个模型：生成理由→RM奖惩→迭代改进 • 可与奖惩/生成机制的新技术相结合，形成完整方案 2025-强推理&模态穿透  强推理赋能智能体 Agentic  模态穿透多模态潜力进一步发掘全模态场景下模态穿透与统一 ①③ ③④⑤ ②③⑤

10 积分 | 76 页 | 8.39 MB | 1 年前
3

共 8 条前往

页

分类

语言

格式