DeepSeek大模型赋能高校教学和科研2025身教授李飞飞在公开演讲中说道: “斯坦福应 该录 取最会用 ChatGPT 的前 2000 名学生”。 2025 年 1 月 , 互联网知名企业家周鸿祎发表观点 ”未来擅长使用 AI 的人会淘汰不会使用 AI 的人 “。 2. 人工智能思 维 3.1 大模型的概念 3.2 大模型的发展历程 3.3 人工智能与大模型的关 系 3.4 大模型分类 3. 大模型:人工智能的前 沿 3 DataCanvas ) 、 DALL-E(OpenAI) 、 悟空画画(华 为) 、 midjourney 等 视觉大模型 是指在计算机视觉( Computer Vision , CV )领 域中使用的大模型 ,通常用 于图像处理和分析 。 这类模型通过在大规模图 像数据上进行训练, 可 以实现各种视觉任务 , 如图像分类 、 目标检测 、 图像分割 、姿态估计 、人脸识别等 。代表性产品 AI 完成 了“通识教育” 行业大模型 L1 是指那些针对特定行业或领域的大 模型 。 它们通常使用行业相关的 数 据进行预训练或微调, 以提高 在该 领域的性能和准确度,相当 于 AI 成 为“行业专家” 垂直大模型 L2 是指那些针对特定任务或场景的大 模型 。 它们通常使用任务相关的 数 据进行预训练或微调, 以提高 在该 任务上的性能和效果 3.4 大模型的分 类 按照应用领域的不同10 积分 | 123 页 | 15.88 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版性。利用大数据分析和机器学习优化配送路线,实时 监控物流配送过程,提高配送效率、降低成本。 • 财务与人力管理:通过训练模型,可以自动读取发 票和收据,将其转换为数字格式,直接导入会计系 统,减少了数据录入和处理的时间和错误 。使用自 然语言处理 (NLP) 和机器学习算法,能快速分析候 选人简历,识别出与职位相关的教育背景、工作经历 等关键信息,快速筛选出符合条件的候选人,提高招 聘效率。 05 01 工业人工智能 合分析多种格式的数据,实现跨格式的信息转换与分 析。在工业应用中,大模型能同时处理包括设备运行 数据、业务数据和管理决策数据在内的多种数据类 型,为企业的运营和决策提供更为全面和精确的数据 支持。 工业大模型,是指在工业生产中使用的大型模型。工业大模型在满足大模型技术基本特征的同时,具备在各个工业领域及工 业各环节进行应用的能力,或在工业装备、软件等融合中赋能的模型。 相较于工业专用小模型而言,工业大模型泛化性强,可以单 汽车制造作为制造业皇冠上的明珠,也是 AI 技术落地应用的重要领域。目前,AI 技术已经渗透到汽车制造中繁多复杂的生 产流程中,从汽车零部件的质量检测、到生产物流运输、装配生产线的自动化、再到整车质量检测等众多环节,AI 技术的 使用都显著提高了生产效率和产品质量。 1.4 行业应用 1.4.1 汽车行业 汽车造型 辅助设计 车身漆面 质量检测 零部件及 整车智能 制造 工业大模型可广泛应用于汽车造型设计等领0 积分 | 82 页 | 5.13 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告具备强大推理能力与长文本思考能力,继开源来备受关注。 ➢ DeepSeek R1-Zero 和 R1的出现再次证明了强化学习的潜力所在: ➢ R1-Zero 从基础模型开始构建,完全依赖强化学习,而不使用人类专家标注的监督微调(SFT); ➢ 随着训练步骤增加,模型逐渐展现出长文本推理及长链推理能力; ➢ 随着推理路径增长,模型表现出自我修复和启发式搜索的能力; 4 DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ 准确率奖励 Accuracy Rewards: 判断答案是否是正确的 ➢ 格式奖励Format Rewards: 规劝模型生成答案的过程是和 ➢ 没有使用Reward Model, 因为ORM和PRM等基于神经网络的都可能遭受reward hacking 而retraining reward model 需要大量的计算资源,可能会复杂化整个流程 直觉,后期RL探索过程进一步挖掘激活 ➢ 大规模RL起到了激活和发掘预训练阶段积累的知识和推理能力的作用 ➢ DeepSeek-V3 低成本(5,576,000美元 )带来惊艳效果 ➢ MoE 架构 671B 激活37B \ 使用 Multi-head Latent Attention (MLA) 架构 ➢ 2048张 H800 计算: ~54天 21 DeepSeek-R1 技术剖析:RL 加持下的 Length 泛化&推理范式涌现10 积分 | 76 页 | 8.39 MB | 6 月前3
山东大学:DeepSeek 应用与部署模型服务基础设施 ,且具备负载均衡和自动扩缩容机制 ,保障 API 调用稳定性。搭配 Chatbox 可视 化界面客户端 ,进一步简化了调用流程 ,无需在命令行中操作 ,通过图形化界面即 可轻松配置和使用 https://chatboxai.app/zh#downl oad DeepSeek 模型。 DeepSee k DeepSeek-R1 - Ditill-Qwen-32B DeepSeek-R1 Windows WSL2 Python 3.8+ ,推荐使用 Anaconda/Mini cond a 管理环境 DeepSeek 本地部署 - 硬件环境准 备 DeepSeek 本地部署 - 部署办法 方法 1 :使用 Hugging Face Transformers 方法 2 :使用 vLLM 加速推 理 方法 3 : Docker 部 署 ,保证了数据的安全性和隐 私 性。 • Embedding Preference (嵌入偏好):使用 AnythingLLM Embedder 嵌入工具 ,文档文本会在 AnythingLLM 的 实例上私密嵌入 ,文本数据的处理和转换在本地进行 ,不会泄露给第三方。 • Vector Database (向 量数据库):使用 LanceDB 作为向量数据库, 向量和文档文本都存储在 AnythingLLM10 积分 | 79 页 | 6.52 MB | 5 月前3
华为昇腾DeepSeek解决方案模型算法: GPT 、 LLaMA AI 框架: PY 、 TF 异构计算架构: CUDA 互联技术: NV Link AI 芯片: NV 、 AMD • DS 对强化学习的创新使用, 可以让大模型便捷的获 得 通用性 + 专用性, 可以满足各应用场景需求 • DS 对通过从模型结构到训推全流程的极致工程优化, 大幅提升 AI 的计算效率, 提升模型落地经济性 • 压缩后宽度ℎ′ ≪ 隐藏层宽度ℎ MLA 架构: 1 )分别对 Query 、 Key-Value pair 进行低秩压缩; 2 )使 用 RoPE 获得位置信息; 3 )使用 MHA 计算得到输出。 对 6DeepSH wkevi r而 opr言 iet ryn- s ri t d, DM istriLb ti可 关键作用 • 提升每批训练数据的使用效率 ,强化训练信号 • 优化模型表达能力 ,提升 next-token 的预测效果 • 可参考投机采样改造 MTP 模块 ,加速推理效率 MTP : Multi-Token Prediction 多 token 预测提升模 型效果 • MTP 模块仅在训练中使用,提升模型训练效果,推理阶段可以不使用 MTP 模块,基础模型能够独立完成正常推0 积分 | 32 页 | 2.52 MB | 5 月前3
AI跃迁派:2025年DeepSeek零基础完全指南1.白菜价训练:用 2000 块国产昇腾芯片就能训练专业模型,大学生也能参与 AI 开发 2.手机端运行:1.5B 压缩版模型在千元机上流畅运行,山区医生可用 AI 辅助诊断 三、安装与使用全攻略 1.多端部署指南:全平台无障碍接入 DeepSeek 提供网页版、APP、微信小程序、电脑版四大入口,满足不同场景需求: ①网页版(零门槛即用) 访问方式:浏览器输入`https://chat 中自动整理温度数据表格 避坑指南:超过 50 页的长文档建议拆分处理,避免解析超时 3.常见问题速查 Q1:为什么联网搜索时断时续? 原因:服务器负载过高或网络波动 解决方案:避开晚高峰使用,或切换至深度思考模式本地处理 Q2:如何导出对话记录? 操作路径:网页版/APP 端点击对话历史→右键选择“导出为 Markdown” Q3:上传文件后 AI 无法识别内容? 个国内城市并说明交通和住宿方案” 4.专业术语滥用 错误:“用 MoE 架构优化输出”→普通人难以理解 修正:“让不同专家模块共同解决这个问题” 5.过度依赖 错误:直接使用 AI 生成的医学诊断建议 修正:要求“提供相似病例和检查建议,需医生复核” 4.高阶技巧:解锁 AI 的隐藏能力 ①数据直通车 操作流程: 1.粘贴 Excel 销售数据→输入“分析10 积分 | 21 页 | 1.01 MB | 6 月前3
从智慧教育到智慧课堂:理论、规范与实践出智慧地球战略 智慧教 育 已 成 共 识 新加坡 2006 年iN2015 计划 智慧教育计划 提出 建立学习者为中 心的个性化学习 空间 建设国家范围的 教育基础设施 使新加坡成为全 球教育领域使用 信息技术的创新 中心 5 智慧教 育 已 成 韩国 " 智 慧 教 育 推 进 战 略 " 2011 年 数字教科书的普及推广 核心 6 智慧教 育 已 成 马来西亚 1999 教育环境、资源、管理与服务的智能管理是智慧教 育的核心特征。 智能控制 智能诊断 智能分析 智能调节 智能调度 18 按需推 送 智能教育要达成“人人教、人人学”的美好愿望,教育 资源可以按需获取和使用,教与学可以按需开展。 • 按需推送资源 • 按需推送活动 • 按需推送服务 • 按需推送工具 • 按需推送人际资源 19 可视化 可视化是信息时代数据处理与显示的必然趋势,是 智慧 从利用技术帮助学习,转变为利用技术回答问 题:学生学习到了什么?我可以为他提供什么 帮助? 利用开放式学习工具对资源社区进 行管理 教师能够更加关注学习结果。 教育者开发并使用工具。 降低成本 集中化设施更加易于维护; 软件易于升级维护 基本可以放弃桌面端的支持需求。 提高可靠性、利用性和产出。 有能力运行最新的应用 控制、安全、集中放置。10 积分 | 74 页 | 10.39 MB | 6 月前3
共 7 条
- 1
