AI跃迁派:2025年DeepSeek零基础完全指南公众号“AI 跃迁派”出品 一、DeepSeek 全景认知 1.颠覆性定义:人人都能用的认知引擎 DeepSeek(深度求索)是中国首个全栈开源的大语言模型,由杭州深度求索人工智能 公司研发,定位为“认知智能引擎”。简单来说,它是一个能像人类一样思考、学习和解 决问题的超级 AI 工具。 核心能力: ⚫ 复杂推理:像学霸解数学题一样处理逻辑难题(R1 模型) ⚫ ⚫ 多模态融合:能理解文字、图片、文件等多种信息(未来还将支持语音和视频) ⚫ 超长上下文:一口气读完 3-4 万字的长文档(64Ktoken 容量) 技术架构: ⚫ MLA 多头潜在注意力:像多线程处理信息,显存占用降低 50%,适合普通电脑运 行 ⚫ MoE 混合专家系统:遇到问题自动召唤“专业团队”,比如数学题找数学专家模 块,写诗找创意模块 ⚫ 强化 种语言互译,自动适配文化差异(如把“摆烂”翻译成 “quietquitting”) 局限:复杂逻辑问题需升级至 R1 版本 模块 2:深度思考(R1)——决策智囊团 技术突破: ⚫ 思维链可视化:像老师写板书一样展示推理步骤(如解方程时先分解条件再推 导) ⚫ 反事实推演:模拟“如果特斯拉降价 10%”对产业链的 6 级影响 实战场景: ⚫ 医疗诊断:输入症状自动关联相似病例,生成检查建议(需医生复核)10 积分 | 21 页 | 1.01 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告开创RL加持下强推理慢思考范式新边界 ➢ OpenAI o1 开启后训练 Post-Training 时代下的RL新范式:后训练扩展律 Post-Training Scaling Law ➢ DS-R1 独立发现了一些通往o1路上的核心理念,并且效果还好到受到了OpenAI 的认可 ➢ 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力? ➢ 得益 DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ 得益于强大的推理能力与长文本思考能力,DeepSeek R1在复杂任务上表现卓越,成为开源领域的又 一里程碑,标志着开源社区在与闭源大模型(如 OpenAI o1 系列)的竞争中迈出了关键性一步。 ➢ DeepSeek-R1 在数学代码任务上表现突出 ➢ Deepseek R1在AIME2024上获得了79.8%的成绩,略高于OpenAI- Test-Time 计算量 (例如Test-Time Search)的增长,模型性能(例如数学推理能力)也会随之提升 ➢ Post-Training Scaling Laws 下 训练时计算量 多了一个新的变量:Self-Play 探索时 LLM Inference 的计算量 [1] https://openai.com/index/learning-to-reason-with-llms/10 积分 | 76 页 | 8.39 MB | 5 月前3
DeepSeek大模型赋能高校教学和科研2025为人工智能科学的开山之作。 在论文的开篇 , 图灵提出了一个引人深思的问题: “机器能思考吗? ”。这个问题激发了人们 无尽的想象 , 同时也奠定了人工智能的基本概念和雏形 在这篇论文中 ,图灵提出了鉴别 机 器是否具有智能的方法 ,这就是 人 工智能领域著名的“图灵测试”。 如图所示 ,其基本思想是测试者 在 与被测试者(一个人和一台机 器) 隔离的情况下 ,通过一些装 置(如 键盘)向被测试者随意提 50 年代。 当时 ,计算机科学刚刚起步 ,人们开始尝试通过计算机程序来模拟人类的思维 和 行为。 在这个背景下 , 一些杰出的科学家和工程师们开始研究如何使计算机具备更高级的功能 1956 年 8 月 ,在美国达特茅斯学院举办的人工智能夏季研讨会 ,是人工智能领域具有里程碑意义的一次重要会议。 这次会 议汇 聚了众多杰出的科学家和工程师 ,他们共同探讨和研究人工智能的发展和应用前景 这次会议的主题围绕着人工智能的定义、 McCarthy ) 首次提出。 与会者们不仅对人工智能的研究和应 用 前景进行了深入探讨 ,还提出了许多重要的观点和思路 ,为人工智能的发展奠定了基础。 这次会议的召开标志着人工智能作 为一个独立学科的正式诞生 , 因此 ,达特茅斯会议被称为“人工智能的开端” , 1956 年也被称为“人工智能元年”。这次会 议不仅为人工智能的研究和发展奠定了基础 ,还为人类带来了巨大的变革和进步10 积分 | 123 页 | 15.88 MB | 5 月前3
英特尔-工业人工智能白皮书2025年版编委会: 主编:刘 俊、马小龙、朱永佳 编委:方辛月、高 畅、高杨帆、胡 杨、刘 波、吕晓峰、邱丽颖、单 娜、张 恒、张心宇 * 编辑按姓名首字母排序 人工智能 (AI) 技术的快速发展掀起了新一轮工业革命浪潮,通用大模型的出现让 AI 技术从专用化迈向 了通用化。AI 技术正在步入工业领域的千行百业,帮助企业实现从传统的劳动密集型、资源密集型企 业,向技术密集型、知识密集型的高端化、智能 优化产品结构与应用模拟:通过形态识别技术,将 产品外形及特征转化为数据,辅助设计师不断优化 迭代。利用收集到数据构建数字孪生产品模型,模 拟产品的各种实际应用场景,如正常操作、极限性 能、潜在故障等,预测产品性能表现,进一步指导 设计改进。 1.2 工业 AI 的应用范畴 04 01 工业人工智能 (AI) 行业观察 生产过程管控 在生产过程管控方面,AI 技术的应用主要集中在提高生 产效率、优化资源配置、增强质量控制和实现生产过程 质量管理:产品缺陷检测是质量管理的重要一环,尤 其是对于金属等高反光产品、薄膜产品的划痕、裂 纹、凹坑、气孔、污染等非常难检出的外观缺陷,利 用传统视觉算法,对工业相机采集到的图像经过预处 理,基于图像分割等深度学习模型,高效且较为准确 地检出缺陷,为传统的视觉检测技术赋予高度智能 化。质量检测也是目前 AI 技术在工业领域落地应用 较多、较为成功的一个方向。 • 智能生产管理: 在生产计划和排程方面,AI0 积分 | 82 页 | 5.13 MB | 5 月前3
华为昇腾DeepSeek解决方案Distribution 2 训练资源 • 随着 DeepSeek 提供了一种高效率训练的方法,同等 算力规模可以探索更强的模型能力 • 在竞争背景下,头部玩家仍将追逐 Scaling Law ,坚定 AI 算力的战略投资,加速探索下一代 AI 技术 DeepSeek 是 AI 发展史上的一个关键里程碑,但远未达到 AI 终点 AI 模型算法: GPT 、 LLaMA 重新思考中美技术路线的选择 泛化性和经济性大幅提升 LLM 进入“ CV Resnet 时刻” 补齐最后一块自主创新的版图 真正形成中美两条 AI 技术路 线 AI 框架:昇思、飞桨 … 异构计算架构: CANN … 互联技术:灵衢 AI 芯片:昇腾、寒武纪 … DeepSeek-R1 进一步验证“算力即性能” Scaling Law 升级,模型能力 = 算力 x 数据 x 思考 + Huawei Proprietary - Restricted Distribution 下一代 AI 技术 Mamba 、空间智能 等 算力 x 数据 x 思 考 模 型 效 果 低成本完美对标 OpenAI O1 ,突破精确语义理解及复杂推理任务 DeepSeek-V3 是一款 MoE 模型,总参数量 671B ,激活参数量 37B ,采用 2048 张 H800 (节点内 NVLink0 积分 | 32 页 | 2.52 MB | 5 月前3
山东大学:DeepSeek 应用与部署DeepSeek 应用场 景 DeepSeek 的能力层级 • 1. 基础能力层 多模态数据融合与结构化理解 ,包括跨模态语义对齐(文本、 图像、 音频、 视频、 代 码、传感器数据统一语义) 和动态数据治理(解决数据缺失、 噪音干扰、 概念飘逸等) , 支持 200 多 种数据格式自动解析。 • 2. 中级能力层 领域问题建模与复杂推理 ,包括领域自适应学习(建立医、 1 个英文单词、 1 个数字 或 1 个符号计为 1 个 token 。 • 一般情况下模型中 token 和字数的换算比例大致如下: • 1 个英文字符 ≈ 0.3 个 token 。 • 1 个中文字符 ≈ 0.6 个 token 。 • 但因为不同模型的分词不同 , 所以换算比例也存在差异 , 每一次实际处 理 token 数量以模型返回为准 ,您可以从返回结果的 usage 中查看。 DeepSeek 模型。百炼平台的 API 提供标准化接口 ,无需自 行搭建 模型服务基础设施 ,且具备负载均衡和自动扩缩容机制 ,保障 API 调用稳定性。搭配 Chatbox 可视 化界面客户端 ,进一步简化了调用流程 ,无需在命令行中操作 ,通过图形化界面即 可轻松配置和使用 https://chatboxai.app/zh#downl oad DeepSeek 模型。 DeepSee k10 积分 | 79 页 | 6.52 MB | 5 月前3
从智慧教育到智慧课堂:理论、规范与实践学生主体作用和教师主导作用充分发挥; 智能管理情境; 自动感知环境。 46 智慧课堂:促进学生成功的新智能 在校学生的绩效数据增长非常快 46 智慧体现在什么地方? 将学生的绩效数据集成在一起,以更好 支撑对学生学习过程的理解。 了解学生参与习惯,实现对学生施加具 有针对性的干预策略。 智慧教育结果 掌握学生每年的进步情况 早期诊断学生学习中遇到的困难,并施 加补救措施。 智慧教育成果 基于角色的、为所有学生学习和资 新加坡职业学院自从 1954 年以来, 已培养了 14.5, 万毕业生。 智慧课堂:智慧工作,实现可达性学习 与学生一起工作:将团队、学习者和教师连接在一起。 将个体需求融合到团队需求中:有利于培养创新能力。 实现参与性和交互性用户体验:通过 Web 2.0 实现 在学习中充分利用开放资源工具 : 桌面应用和环境 Client OS / App Image 在一个刀片上(每个刀片上具有 10-12 个桌 面图像)支持多种操作系统 对于新的桌面体验来讲,用户需要最小的适 应性。 虚拟桌面架构 通过分享应用环境,每个刀片 支持 50-100 个用户 需要用户适应新的桌面体验 终端服务 基于 1:1 理念,每位学习者拥有一台 PC 或者服务器 桌面超薄式设备 流操作形态和应用10 积分 | 74 页 | 10.39 MB | 5 月前3
浙江大学-DeepSeek模型优势:算力、成本角度解读20252020 ■ 大型机时代:数字化未开始,算力需求潜力未发掘 ■ PC 时代:一个应用只需一台电脑,算力够 ■ 云计算时代:应用需要超过一台机器的算力,算力基本够 ■ 人工智能时代:算力开始不足,需大量高性能 Al 加速器 计算机算力的发展 人工智能大模型算力估计 ■ 人工智能大模型算力估计 ■ 110 积分 | 23 页 | 7.53 MB | 5 月前3
共 8 条
- 1
