Deepseek - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

华为昇腾DeepSeek解决方案

把握 DeepSeek 时刻，携手同行华为昇腾 AI 解决方案汇报 2025 年 2 月 DeepSeek 洞察及昇腾适配进展华为昇腾 AI 基础软硬件介绍 CO NT E NTS 目录 2 1 Huawei Proprietary - Restricted Distribution 2 训练资源 • 随着 DeepSeek 提供了一种高效率训练的方法，同等提供了一种高效率训练的方法，同等算力规模可以探索更强的模型能力 • 在竞争背景下，头部玩家仍将追逐 Scaling Law ，坚定 AI 算力的战略投资，加速探索下一代 AI 技术 DeepSeek 是 AI 发展史上的一个关键里程碑，但远未达到 AI 终点 AI 模型算法： GPT 、 LLaMA AI 框架： PY 、 TF 异构计算架构： CUDA 互联技术： AI 框架：昇思、飞桨 … 异构计算架构： CANN … 互联技术：灵衢 AI 芯片：昇腾、寒武纪 … DeepSeek-R1 进一步验证“算力即性能” Scaling Law 升级，模型能力 = 算力 x 数据 x 思考 + 逻辑推理 DeepSeek-V3/R1 OpenAI-o1/o3 算力 x 数据重新定义 Scaling Law 延续智能涌现的方向 2017

0 积分 | 32 页 | 2.52 MB | 10 月前
3
山东大学：DeepSeek 应用与部署

DeepSeek 应用与部署听听真我数字人讲 DeepSeek AIGC 发展历程 AIGC 2014-2024 自然语言处理与语言模型大语言模型 LLM ： 2018 — 2024 DeepSeek 介绍 DeepSeek ： 2023 — DeepSeek ：技术创新——模型架构 | V2 （ Multi-Head Latent Attention ）） DeepSeek ：技术创新—模型架构 | V3 PPO ： Proximal Policy Optimization GRPO ： Group Relative Policy Optimization 强化学习让智能体（ Agent ）在环境（ Environment ）中不断尝试、学习，并优化自己的策略（ Policy ），最终获得最大化的奖励（（ Reward ）。 DeepSeek ：技术创新—推理模型 | RL DeepSeek 应用场景 DeepSeek 的能力层级 • 1. 基础能力层多模态数据融合与结构化理解，包括跨模态语义对齐（文本、图像、音频、视频、代码、传感器数据统一语义）和动态数据治理（解决数据缺失、噪音干扰、概念飘逸等），支持 200 多种数据格式自动解析。 •

10 积分 | 79 页 | 6.52 MB | 10 月前
3
DeepSeek大模型赋能高校教学和科研2025

DeepSeek 每个人都可以读懂的大模型科普报告（高校篇） DeepSeek 大模型赋能高校教学和科研厦门大学大数据教学团队作品 2025 年 2 月 25 日厦门大学林子雨副教授国内高校大数据教学的重要贡献者团队负责人：林子雨副教授年轻力量：核心成员全部 46 周岁以下结构合理：教学型、科研型、实验工程师专注专业：从团队联系方式： ziyulin@xmu.edu.cn 厦门大学大数据教学团队 1. 人工智能发展简史 2. 人工智能思维 3. 大模型：人工智能的前沿 4. 高校本地部署 DeepSeek 大模型 5. AIGC 应用与实践 6. 基于大模型的智能体 7. AI 赋能高校科研 8. AI 赋能高校教学目录厦门大学大数据教学团队作品 2025 人工智能的诞生 1.3 人工智能的发展阶段从 1956 年人工智能元年至今，人工智能的发展历程经历了漫长的岁月，大致可以划分为以下 6 个阶段 OpenAI Operator DeepSeek R1 1.4 未来人工智能发展 5 个阶段 2. 人工智能思维厦门大学大数据教学团队作品拥有和人工智能协作的能力，懂得如何运用人工智能 2. 人工智能思维具备区分人的能力

10 积分 | 123 页 | 15.88 MB | 10 月前
3
AI跃迁派：2025年DeepSeek零基础完全指南

《DeepSeek 零基础完全指南》公众号“AI 跃迁派”出品一、DeepSeek 全景认知 1.颠覆性定义：人人都能用的认知引擎 DeepSeek（深度求索）是中国首个全栈开源的大语言模型，由杭州深度求索人工智能公司研发，定位为“认知智能引擎”。简单来说，它是一个能像人类一样思考、学习和解决问题的超级 AI 工具。核心能力： ⚫ 复杂推理：像学霸解数学题一样处理逻辑难题（R1 混合专家系统：遇到问题自动召唤“专业团队”，比如数学题找数学专家模块，写诗找创意模块 ⚫ 强化学习驱动：通过“试错+奖励”机制自我进化，类似游戏 AI 自学通关 2.划时代意义：中国 AI 的破局之战 DeepSeek 的诞生不仅是技术突破，更是国家战略级的里程碑：成本革命： ⚫ 训练成本仅 558 万美元（仅为美国同类模型的 1/20） ⚫ 推理速度提升 3 倍，生成文字速度从 20 块国产昇腾芯片完成训练 ⚫ 构建自主技术生态：带动华为昇腾、寒武纪等国产芯片产业发展 3.功能定位：你的全能数字助手 DeepSeek 不是冷冰冰的工具，而是能融入生活的智能伙伴： 4.技术普惠：AI 民主化的中国方案 DeepSeek 通过两大创新让 AI 技术“飞入寻常百姓家”： 1.开源开放：代码和模型权重全部公开，学生也能用个人电脑跑 AI 2.知识蒸馏：把

10 积分 | 21 页 | 1.01 MB | 10 月前
3
浙江大学-DeepSeek模型优势：算力、成本角度解读2025

DeepSeek 模型优势：算力、成本角度解读 2025 年 2 月 ■ 什么算力 ?“ 对信息数据进行计算，实现目标结果的能力” ■ 传统算力：信息计算力 ■ 现代算力：信息计算力、数据存储力、网络运载力算力的基本概念大脑草绳、石子算盘、算筹 ▶ 计算器、计算机 ■ 原生算力：大脑 ( 可处理复杂逻辑，但不能高速处理简单运算 7nm 工艺的国内芯片存力： 2024 年禁止 HBM 芯片光刻机： 2024 年限制荷兰 ASML 出口 7nm 光刻机到中国时代背景：算力卡脖子 deepsee k DeepSeek 等国内大模型的“上甘岭”时刻 Al 算法与系统协同深度优化反斜面坑道 ( 战术穿插 ) 范弗利特弹药量 ( 地毯轰炸 ) 大资金、大算力、大模型 6.2*107 DeepSeek v3 2024 年 12 月 2.8*106 5.6*106 DeepSeek V3 公开的单次极低预训练成本 DeepSeek 全部训练单次成本： 5,576,000 美元单张 H800 GPU 每小时租赁成本： 2 美元泛大模型 / 指标 DeepSeek V1 DeepSeek V2 DeepSeek V3 Llama

10 积分 | 23 页 | 7.53 MB | 10 月前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

DeepSeek-R1 \ Kimi 1.5 及类强推理模型开发解读北大对齐小组陈博远北京大学2022级“通班” 主要研究方向：大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero Zero 及 R1 技术剖析 ➢ Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 ➢ RL 算法的创新：GRPO及其技术细节 ➢ DeepSeek-R1 背后的Insights & Takeaways：RL加持下的长度泛化 \ 推理范式的涌现 ➢ DeepSeek-R1 社会及经济效益 ➢ 技术对比探讨 ➢ STaR-based Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全：形式化验证 Formal Verification \ 审计对齐 Deliberative Alignment ➢ 补充拓展：DeepSeek-V3 解读 3 DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ OpenAI o1 开启后训练 Post-Training 时代下的RL新范式：后训练扩展律 Post-Training Scaling

10 积分 | 76 页 | 8.39 MB | 10 月前
3

共 6 条前往

页

分类

语言

格式

华为昇腾DeepSeek解决方案

山东大学：DeepSeek 应用与部署

DeepSeek大模型赋能高校教学和科研2025

AI跃迁派：2025年DeepSeek零基础完全指南

浙江大学-DeepSeek模型优势：算力、成本角度解读2025

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告