山东大学:DeepSeek 应用与部署DeepSeek 应用与部 署 听听真我数字人讲 DeepSeek AIGC 发展历 程 AIGC 2014-2024 自然语言处理与语言模型 大语言模型 LLM : 2018 — 2024 DeepSeek 介 绍 DeepSeek : 2023 — DeepSeek : 技术创新——模型架构 | V2 ( Multi-Head Latent Attention ) DeepSeek 的能力层级 • 1. 基础能力层 多模态数据融合与结构化理解 ,包括跨模态语义对齐(文本、 图像、 音频、 视频、 代 码、传感器数据统一语义) 和动态数据治理(解决数据缺失、 噪音干扰、 概念飘逸等) , 支持 200 多 种数据格式自动解析。 • 2. 中级能力层 领域问题建模与复杂推理 ,包括领域自适应学习(建立医、 教育、 金融垂直应用于 累托最有解) 。 • 3. 高级能力层 复杂系统建模与自主决策 ,包括数字孪生仿真系统(构建物理于数字融合虚拟环境 模拟天气等) 、 多智能体协同优化(将每个个体作为智能体通过联邦学习模拟群体行为) 和元认 知调 控机制(实施监控自身决策、 动态分配资源、 自动触发行为) 。 • 4. 终极能力层 自主进化与创造性突破 ,包括概念空间探索(通过对抗网络探索新合金成分等)10 积分 | 79 页 | 6.52 MB | 5 月前3
从智慧教育到智慧课堂:理论、规范与实践赵建华 教授、博导 南方科技大学高等教育研究中心、联合国教科文组织国际高等教育创新中心 Email: zhaojh@sustc.edu.cn 从智慧教育到智慧课堂: 理论、规范与实践 智慧教育的内涵与特征 3 智慧战略引重视 • 2008 年 IBM 提 出智慧地球战略 智慧教 育 已 成 共 识 新加坡 2006 年iN2015 计划 智慧教育计划 提出 建立学习者为中 2010 年将所有学 校都转型为智能学 校 台湾桃源县 “ 智慧台湾 U 桃园 计划” 从 e 化教育向 u 化 教育(泛在教育) 美国 IBM 智慧教育解决 方案:教育数据的 收集、管理与分析, 为学习者提供独特 的学习体验,教学 制度优化 7 智慧教 育 智 慧 教 育 什么是智慧教育? 在信息化基础之上建构的信息时代的教育新秩序,是信 息时代的教育新形态、教育的“新常态”,是信息化元素充分 智慧教育资源 智慧评价(教、学) 智慧服务 智慧教室 智慧校园 智慧平台 智慧教育方式 10 信息技术 与学科教 学深度融 合 全球教育 资源无缝 整合共享 无处不在 的开放、 按需学习 基于大数 据的科学 分析与评 价 绿色高效 的教育管 理 技 术 特 征 情景感知 无缝连接 可视化 按需推送 智慧 教育 核心 特征 全向交互 智能管控10 积分 | 74 页 | 10.39 MB | 6 月前3
DeepSeek大模型赋能高校教学和科研2025cn 厦门大学大数据教学团队 1. 人工智能发展简史 2. 人工智能思维 3. 大模型: 人工智能的前沿 4. 高校本地部署 DeepSeek 大模 型 5. AIGC 应用与实践 6. 基于大模型的智能体 7. AI 赋能高校科研 8. AI 赋能高校教学 目录 厦门大学大数据教学团队作品 2025 年 2 月 1.1 图灵测试 1.2 人工智能的诞生 发表了论文《计算机器与智能》 ,这篇论文被誉 为人工智能科学的开山之作。 在论文的开篇 , 图灵提出了一个引人深思的问题: “机器能思考吗? ”。这个问题激发了人们 无尽的想象 , 同时也奠定了人工智能的基本概念和雏形 在这篇论文中 ,图灵提出了鉴别 机 器是否具有智能的方法 ,这就是 人 工智能领域著名的“图灵测试”。 如图所示 ,其基本思想是测试者 在 与被测试者(一个人和一台机 、文心 UFO 、华为盘古 CV 、 INTERN (商汤)等 3.4 大模型的分 类 通用大模型 L0 是指可以在多个领域和任务上通用 的大模型 。 它们利用大算力、使 用 海量的开放数据与具有巨量参 数的 深度学习算法,在大规模无 标注数 据上进行训练, 以寻找特 征并发现 规律 ,进而形成可“举一 反三” 的强 大泛化能力 ,可在不 进行微调或少 量微调的情况下完 成多场景任务10 积分 | 123 页 | 15.88 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版更全面地了解 AI 技术如何为工业制造的各 个环节赋予怎样的智能化能力,以及英特尔在帮助企业落地部署 AI 技术方面所能提供的产品、平台和 系统性支持与服务以及成功案例。 本白皮书中包括了工业 AI 和工业大模型的概念介绍、当前的市场规模与市场增长潜力、工业 AI 和工业 大模型能为汽车、消费电子、新能源锂电、半导体制造等重点行业所带来的赋能创新机会,以及当前 大模型在工业领域落地应用所面临的挑战和英特尔针对工业 生态系统,推动制造业向智能制造转型升级,赋能 新质生产力。 — 张宇博士 英特尔中国区网络与边缘事业部首席技术官 前言 目录 01 02 工业人工智能 (AI) 行业观察 .......................................................01 1.1 工业 AI — 市场规模与增长潜力 ................................. .................................................................................09 1.5 工业 AI 与工业大模型落地应用面临的挑战 .............................................................................10 英特尔®0 积分 | 82 页 | 5.13 MB | 5 月前3
华为昇腾DeepSeek解决方案时代 2012 AlexNet 模型能力突破 开启 CV 时代 1998 LeNet 首个 CNN 架构模型 2025 DeepSeek 效率与成本双突破 NLP 全面普及 2015 Resnet 效率与成本双突破 CV 全面普及 AI 模型算法: DeepSeek 国家战略清晰 技术创新依赖资本投入 NLP 自然语言处理 双轮驱动互锁 战略坚定 + 技术创新 性能优 数学、科学和代码等领域领先业界, 成为业界公认的 LLM 的领先模型 来源: DeepSeek 模型测试数据 & 互联网 硬件级优化 绕过 GUDA 进行 PTX 编程 计算与通信优化,性能提升 30% GRPO :群体进化的智慧筛选器 自我验证机制: AI 的 " 错题本系 统 " 混合专家模型的 " 智能路由器“ 多头潜在注意力 MLA :空间压缩术 训练框架加速: K V C a c h e 降 低 为 = 1 . 7 % 只需存储图中的 c v, K 即可; 考虑到矩阵乘法结合律,具体实现过程中 W UK可以与 WUQ 融合、 WUV可 以与 Wo融合,从而无需为每个 query 计算 key-value 值。 t R t K 相比于 MHA , MLA 每 token 的 KV Cache 量大幅减少,且精度更高。0 积分 | 32 页 | 2.52 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 北大对齐小组 陈博远 北京大学2022级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 的认可 ➢ 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力? ➢ 得益于纯大规模强化学习,DeepSeek-R1 具备强大推理能力与长文本思考能力,继开源来备受关注。 ➢ DeepSeek R1-Zero 和 R1的出现再次证明了强化学习的潜力所在: ➢ R1-Zero 从基础模型开始构建,完全依赖强化学习,而不使用人类专家标注的监督微调(SFT); 随着推理路径增长,模型表现出自我修复和启发式搜索的能力; 4 DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ 得益于强大的推理能力与长文本思考能力,DeepSeek R1在复杂任务上表现卓越,成为开源领域的又 一里程碑,标志着开源社区在与闭源大模型(如 OpenAI o1 系列)的竞争中迈出了关键性一步。 ➢ DeepSeek-R1 在数学代码任务上表现突出 ➢ Deepseek10 积分 | 76 页 | 8.39 MB | 6 月前3
AI跃迁派:2025年DeepSeek零基础完全指南1.白菜价训练:用 2000 块国产昇腾芯片就能训练专业模型,大学生也能参与 AI 开发 2.手机端运行:1.5B 压缩版模型在千元机上流畅运行,山区医生可用 AI 辅助诊断 三、安装与使用全攻略 1.多端部署指南:全平台无障碍接入 DeepSeek 提供网页版、APP、微信小程序、电脑版四大入口,满足不同场景需求: ①网页版(零门槛即用) 访问方式:浏览器输入`https://chat 接入:开发者可调用接口集成至办公系统(需申请密钥) ⚫ 批量处理:同时上传多个文件进行交叉分析(如对比 10 份合同条款) 2.新手必学操作:3 分钟成为熟练用户 ①账号注册与登录 ⚫ 注册方式:手机号/微信/邮箱三选一,接收验证码完成认证 ⚫ 安全提示:建议设置“字母+数字+符号”组合密码,定期更换 ②核心功能切换 ③文件交互技巧 支持 3.流程拆解: “分三步解释如何拍摄星空照片:设备准备→参数设置→后期处理” 五、全民生产力革命 1.高频场景:AI 赋能日常生活 DeepSeek 通过技术普惠,正在重塑个人与组织的生产力模式,以下是三大用户群体的 典型应用场景: ①学生党:从题海战术到精准学习 ⚫ 论文润色:上传论文草稿→输入“优化学术表达,确保符合 APA 格式”→10 分钟完 成专业级修改10 积分 | 21 页 | 1.01 MB | 6 月前3
浙江大学-DeepSeek模型优势:算力、成本角度解读2025HBM 芯片 光刻机: 2024 年限制荷兰 ASML 出口 7nm 光刻机到 中国 时代背景:算力卡脖子 deepsee k DeepSeek 等国内大模型的“上甘岭”时刻 Al 算法与系统协同深度优化 反斜面坑道 ( 战术穿插 ) 范弗利特弹药量 ( 地毯轰 炸 ) 大资金、大算力、大模型 “ 大模型” 》10 积分 | 23 页 | 7.53 MB | 5 月前3
共 8 条
- 1
