DeepSeek大模型赋能高校教学和科研2025DeepSeek 每个人都可以读懂的大模型科普报告(高校篇) DeepSeek 大模型赋能高校教学和科 研 厦门大学大数据教学团队作品 2025 年 2 月 25 日 厦门大学 林子雨 副教授 国 内 高 校 大 数 据 教 学 的 重 要 贡 献 者 团队负责人 :林子雨 副教授 年轻力量: 核心成员全部 46 周岁以下 结构合理: 教学型、 科研型、 实验工程师 专注专业: 从 2013 年至今 研究方法和应用场景展开。 与会者们深入探讨了人工智能的基本概念、 算法和技术, 以及其在各个领域的应用潜力。 他们共同认识到 ,人工智能的研究和发展将为人类带来巨大的变革和进步 1.2 人工智能的诞 生 在这次会议上 , “人工智能”这个词汇被约翰 . 麦卡锡( John McCarthy ) 首次提出。 与会者们不仅对人工智能的研究和应 用 前景进行了深入探讨 ,还提出了许多重要的观点和思路 ,为人工智能的发展奠定了基础。 因此 ,达特茅斯会议被称为“人工智能的开端” , 1956 年也被称为“人工智能元年”。这次会 议不仅为人工智能的研究和发展奠定了基础 ,还为人类带来了巨大的变革和进步 1.2 人工智能的诞 生 1.3 人工智能的发展阶 段 从 1956 年人工智能元年至今 ,人工智能的发展历程经历了漫长的岁月 ,大致可以划分为以下 6 个 阶段 OpenAI Operator DeepSeek R110 积分 | 123 页 | 15.88 MB | 6 月前3
从智慧教育到智慧课堂:理论、规范与实践高等教育入学率每年增加 4 百万。 智慧体现在什么地方 ? 企业信息门户具有促进协作的能力。 在专业课程中增加了 Web 2.0 内 容。 智慧教育成果 基于角色的、为所有学生学习和资 新加坡职业学院自从 1954 年以来, 已培养了 14.5, 万毕业生。 智慧课堂:智慧工作,实现可达性学习 与学生一起工作:将团队、学习者和教师连接在一起。 将个体需求融合到团队需求中:有利于培养创新能力。10 积分 | 74 页 | 10.39 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版能、潜在故障等,预测产品性能表现,进一步指导 设计改进。 1.2 工业 AI 的应用范畴 04 01 工业人工智能 (AI) 行业观察 生产过程管控 在生产过程管控方面,AI 技术的应用主要集中在提高生 产效率、优化资源配置、增强质量控制和实现生产过程 的自动化与智能化。具体包括: • 设备管理: 在设备入库管理方面,AI 通过深度学习识别设备上的 条形码、二维码或设备特征,自动读取设备信息如型 1.3.2 工业大模型 07 01 工业人工智能 (AI) 行业观察 汽车制造作为制造业皇冠上的明珠,也是 AI 技术落地应用的重要领域。目前,AI 技术已经渗透到汽车制造中繁多复杂的生 产流程中,从汽车零部件的质量检测、到生产物流运输、装配生产线的自动化、再到整车质量检测等众多环节,AI 技术的 使用都显著提高了生产效率和产品质量。 1.4 行业应用 1.4.1 汽车行业 精度成像系统相结合,更快速地识别出产品图像中的缺陷及 种类,满足生产线对检测精度和速度的要求。 锂电池的质量直接关乎电动车的安全性,因此锂电对质检要求严苛。锂电生产过程中的检测工序繁多,包括原料生 产中的隔膜缺陷检测,前段工序中的极片表面缺陷检测、涂布外观缺陷检测,中段工序中的密封钉焊道缺陷检测、 电池包蓝膜后缺陷检测,后段工序中的 Busbar 焊后检测等。目前锂电检测的主要痛点在于:如何以接近0 积分 | 82 页 | 5.13 MB | 5 月前3
华为昇腾DeepSeek解决方案低成本完美对标 OpenAI O1 ,突破精确语义理解及复杂推理任务 DeepSeek-V3 是一款 MoE 模型,总参数量 671B ,激活参数量 37B ,采用 2048 张 H800 (节点内 NVLink ,节点间 IB ,非超节点架构) 在 14.8T token 数据集上基 于自 研 HAI-LLM 训练系统总计训练了 1394h ( 58.08 天) 性能优 数学、科学和代码等领域领先业界, o 及 6 个蒸馏模 型 基于昇腾开箱即用,配套版本已上线各大开源 社区 DeepSeek 发布两周, 3 大社区全系列模型上线 40+ 客户 / 伙伴基于昇腾已上线, 15+ 测试中(预计两周内全部上 线) 12 Huawei Proprietary - Restricted Distribution 编程辅助 智能客服 … 个性化学习辅导 创意写作 … 个人知识管理 高阶融合算子库 硬件层算网协同 提升有效吞吐 NLSB 网络级负载均衡实现网络 动态路由,有效吞吐达 98% 控 制器 全 局集 中 算路 自 动生 成 路径 并 动态下 发网络 获取网络拓扑 网络局部计算选路 Hash 冲 突 导 致 有 效 吞 吐 不 足 50% 拥塞0 积分 | 32 页 | 2.52 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告GRPO核心思想是通过构建多个模型输出的群组,并计算群组内的相对奖励来估计基线,从而避免 了传统策略优化算法中需要使用与策略模型大小相同的评论模型。 ➢ 大幅度降低 RL 训练的计算成本,同时还能保证模型能够有效地学习到策略。 ➢ 具体来说,在传统的 RL 训练中,评论模型需要与策略模型具有相同的大小,增加计算资源的 消耗。而 GRPO 算法利用群组内的相对信息来估计基线,避免了使用Critic Model的需要。 对于每个问题q,从旧策略模型𝜋𝜃𝑜𝑙𝑑采样一组输出 {𝑜1, 𝑜2, 𝑜3, … , 𝑜𝐺},奖励模型为 每个输出生成奖励{𝑟1, 𝑟2, 𝑟3, … , 𝑟𝐺} 。随后,奖励通过减去组内均值并除以标准差进行归一化。结果监督将 归一化后的奖励分配给每个输出的末尾词元,并将所有词元的优势设为该归一化奖励; ➢ 基于过程监督的GRPO: 结果监督仅提供输出末尾的奖励,对复杂数学任务的策略指导不足 :通过构建多个模型输出的群组,并计算群组内的相对奖励来 估计基线,从而避免了传统策略优化算法中需要使用与策略模型大小相同的评论模型 ➢ 降低 RL 训练的计算成本 \保证模型能够有效地学习到策略 ➢ 奖励机制的设计:兼顾推理能力和语言一致性 ➢ 准确率奖励和格式奖励,从而保证模型不仅能够正确地解决问题,还能够以规范、易读的方 式输出答案 ➢ 格式奖励:用于强制模型将推理过程放置在特定的标签内,用10 积分 | 76 页 | 8.39 MB | 6 月前3
山东大学:DeepSeek 应用与部署邀请码: z0sI0urY 邀请链接: https://cloud.siliconflow.cn/i/z0sI0urY 通过创建 API key 调 用 模型微调工程 u 对话模型微调 u 生图模型微调 华为云模型微调 老师模型 模型蒸馏工程 DeepSeek : 推理模型 | 推理能力 蒸馏 DeepSeek 蒸馏模 型 学生模型 小模型:相当于一枚小学生 ,知识面非常有限 其中较小的模型( “学生模型” )被训练来模仿 较大、 预训练模型( “教师模型” ) 的行为。 • 1. 数据蒸馏 在数据蒸馏中 ,教师模型生成合成数据或伪标签 ,然后这些数据用于训练学 生 模型。 • 2. Logits 蒸馏 在 logits 蒸馏中 ,学生模型被训练来匹配教师模型的 logits ,而不仅仅是 最 终的预测。这种方法保留了更多关于教师模型置信水平和决策过程的信息。 复杂实体关系的应用程序。 • 2. Cognita :官网: https://cognita.truefoundry.com/ • 功能:模块化框架 ,提供定制化管道 ,用于构建可扩展且生 产就绪的 RAG 应用程序 ,适合企业大规模 AI 应用。 • 3. LLMWare :官网: https://llmware.ai/ • 功能:提供统一框架构建基于 LLM 的应用10 积分 | 79 页 | 6.52 MB | 5 月前3
AI跃迁派:2025年DeepSeek零基础完全指南商业计划书:输入“智能家居赛道 BP 模板,包含市场规模、竞品矩阵、融资计划” →生成投资人青睐的文档框架 ⚫ 市场调研:输入“2025 年中国宠物食品消费趋势预测”→自动抓取电商平台数据生 成报告 ⚫ 法律风控:上传合伙协议→输入“检测股权分配风险点”→标注条款漏洞并提供修改 建议 2.进阶赋能:从工具使用到系统重构 DeepSeek 正在引发更深层次的生产力变革:10 积分 | 21 页 | 1.01 MB | 6 月前3
浙江大学-DeepSeek模型优势:算力、成本角度解读2025反斜面坑道 ( 战术穿插 ) 范弗利特弹药量 ( 地毯轰 炸 ) 大资金、大算力、大模型 “ 大模型” 》 上 甘 岭 ” 国 际 国 内 发布时间 G P U 时 ( 小 时 ) 训练成本 ( 美元 ) Llama 3.1 2024 年 7 月 3.1*107 6.2*107 DeepSeek v3 2024 年 12 月10 积分 | 23 页 | 7.53 MB | 5 月前3
共 8 条
- 1
