AI跃迁派:2025年DeepSeek零基础完全指南家模 块,写诗找创意模块 ⚫ 强化学习驱动:通过“试错+奖励”机制自我进化,类似游戏 AI 自学通关 2.划时代意义:中国 AI 的破局之战 DeepSeek 的诞生不仅是技术突破,更是国家战略级的里程碑: 成本革命: ⚫ 训练成本仅 558 万美元(仅为美国同类模型的 1/20) ⚫ 推理速度提升 3 倍,生成文字速度从 20 字/秒提升至 60 字/秒 字/秒 行业重塑: ⚫ 迫使国际巨头降价(如 AnthropicClaude 降价 30%) ⚫ 首款登顶全球 140 国应用榜的国产 AI 模型 国家战略: ⚫ 突破“卡脖子”技术:仅用 2000 块国产昇腾芯片完成训练 ⚫ 构建自主技术生态:带动华为昇腾、寒武纪等国产芯片产业发展 3.功能定位:你的全能数字助手 DeepSeek 不是冷冰冰的工具,而是能融入生活的智能伙伴: 万开发者,形成中美双极化的 AI 生态格局 二、核心能力图谱 1.技术特性:AI 界的“六边形战士” DeepSeek 之所以成为现象级 AI 工具,关键在于它在效率、成本、能力三大维度实现 了突破性平衡: 技术黑话翻译: ⚫ MoE 混合专家系统:像医院分诊台,遇到数学题自动转接“数学博士”,写诗转接 “文学教授” ⚫ MLA 多头潜在注意力:让 AI 像章鱼同时处理多任务,普通电脑也能流畅运行10 积分 | 21 页 | 1.01 MB | 6 月前3
华为昇腾DeepSeek解决方案构 模 型 2023 ChatGPT 模型能力突破 开启 NLP 时代 2012 AlexNet 模型能力突破 开启 CV 时代 1998 LeNet 首个 CNN 架构模型 2025 DeepSeek 效率与成本双突破 NLP 全面普及 2015 Resnet 效率与成本双突破 CV 全面普及 AI 模型算法: DeepSeek 国家战略清晰 Proprietary - Restricted Distribution 下一代 AI 技术 Mamba 、空间智能 等 算力 x 数据 x 思 考 模 型 效 果 低成本完美对标 OpenAI O1 ,突破精确语义理解及复杂推理任务 DeepSeek-V3 是一款 MoE 模型,总参数量 671B ,激活参数量 37B ,采用 2048 张 H800 (节点内 NVLink ,节点间 IB ,非超节点架构) Proprietary - Restricted Distribution MindFormers MindSpeed 系列赋能 CANN 28 硅基流动基于昇腾底座, 一周实现用户增长 8 倍、突破 150 万 + 24 年 12 月 26 日 25 年 1 月 27 日0 积分 | 32 页 | 2.52 MB | 5 月前3
浙江大学-DeepSeek模型优势:算力、成本角度解读2025算力受限,近几年咬住会更难 ( 大家宽容些 ) ■ 突破工艺卡脖子,实现“战术穿插” +“ 火力覆盖” ■ 中芯国际等硬核大厂突破工艺卡脖子 ■ 华为等算力公司提供高算力密度 ■ 个人预测 Al 竞赛结果 ■ 以中国的工业化水平,站着把 Al 的钱给挣了。 ■ “健身可以让 SB 跟你好好说话”→ ■“ 突破模型、算力卡脖子可以让 A 国跟咋们好好说话” DeepSeek10 积分 | 23 页 | 7.53 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告从文本模态到多模态 ➢ 其他讨论:Over-Thinking 过度思考等 ➢ 未来方向分析探讨 ➢ 模态穿透赋能推理边界拓展:Align-DS-V ➢ 合成数据及Test-Time Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全:形式化验证 Formal Verification \ 审计对齐 Deliberative Alignment ➢ 补充拓展:DeepSeek-V3 解读 3 Scaling-Law ? ➢ 随着模型尺寸逐渐增大,预训练阶段参数 Scaling Up 带来的边际收益开始递减;如果想要深度提升模 型推理能力和长程问题能力,基于RL的 Post-Training 将会成为下一个突破点。 ➢ 自回归模型在数学推理问题上很难进步的一点在于没有办法进行回答的自主修正,如果仅是依靠生成 式方法和扩大参数规模,那么在数学推理任务上带来的收益不会太大。所以需要寻找额外的 Scaling 带来了几个很重要的启示: ➢ 需要足够强的基座模型:基座模型 (DeepSeek-V3 Base) 超过了某个质量和能力阈值 (671B 在14.8T 高质量Token上训练)(基座模型知识帮助突破推理上界,也有一些 工作利用小模型复现 Aha Moment 得益于大规模RL和高质量推理数据); ➢ 大规模强化学习加持:GRPO 对于强化学习训练的优化; ➢ 规则化奖励:绕过奖励攻陷问题10 积分 | 76 页 | 8.39 MB | 6 月前3
DeepSeek大模型赋能高校教学和科研20252 月 16 日 , OpenAI 再次震撼全球科技界 ,发布了名为 Sora 的 文本 生成视频大模型 ,只需输入文本就能自动生成视频。 这一技术的诞生, 不仅标志着人工智能在视频生成领域的重大突破 ,更引发了关于人工智 能发展对人类未来影响的深刻思考。 随着 Sora 的发布 ,人工智能似乎正 式踏入了通用人工智能( AGI : Artificial General , 而市面上的 “本地部署” 方案多为参数量大幅缩水的蒸馏版 ,在本地小规模硬件上运行满血版 DeepSeek-R1 被认 为几乎不可能 n 此次 KTransformers 项目更新带来重大突破 , 支持在 24G 显存( 4090D ) 的设备上本地运行 DeepSeek- R1 、 V3 的 671B 满血版。 其预处理速度最高可达 286 tokens/s ,推理生成速度最高能达 形成专属知识库。 课程平台对其解析生成知识切片 , 建设课 程垂直 模型 , 提升 AI 工具能力。 同时 , 依托课程平台可以实现 线上线下资 源联动 ,满足学生差异化学习需求。 智能学伴助力学生自我突破: 智能学伴通过即时答疑、 提供学 习建 议、个性化学习帮助以及启发创意表达 ,全方位助力学生高效 学习、 培养创新思维与解决问题的能力。 学生学习效果显著提升: 借助智能学伴 , 学生在学习过程中10 积分 | 123 页 | 15.88 MB | 6 月前3
山东大学:DeepSeek 应用与部署、 多智能体协同优化(将每个个体作为智能体通过联邦学习模拟群体行为) 和元认 知调 控机制(实施监控自身决策、 动态分配资源、 自动触发行为) 。 • 4. 终极能力层 自主进化与创造性突破 ,包括概念空间探索(通过对抗网络探索新合金成分等) 、 范式转移预警(监控跨领域知识流、 识别技术革命前兆) 和自编程能力(自动模块设计、 代码编 写、 测试用例) 。 " 恨聪明10 积分 | 79 页 | 6.52 MB | 5 月前3
英特尔-工业人工智能白皮书2025年版将会以基础大模型为技术底座,融合工业细 分行业的数据和专家经验,形成垂直化、场景化、专业化的工业大模型。工业大模型相对基础大模型具有参数量少、专业度 高、落地性强等优势,可以为工业垂直领域的技术突破、产品创新、生产变革等提供低成本解决方案。 尽管传统 AI 技术和大模型在解决各种工业问题方面,从理论上讲存在诸多明显优势,但是要将 AI 技术和大模型真正成功落 地应用,依然有很多具有挑战性的问题亟待解决。0 积分 | 82 页 | 5.13 MB | 5 月前3
共 7 条
- 1
