浙江大学-DeepSeek模型优势:算力、成本角度解读2025DeepSeek 模型优势:算力、成本角度 解读 2025 年 2 月 ■ 什么算力 ?“ 对信息数据进行计算,实现目标结果的能力” ■ 传统算力:信息计算力 ■ 现代算力:信息计算力、数据存储力、网络运载力 算力的基本概念 大脑 草绳、石子 算盘、算筹 ▶ 计算器、计算机 ■ 原生算力:大脑 ( 可处理复杂逻辑,但不能高速处理简单运算 可处理复杂逻辑,但不能高速处理简单运算 ) ■ 外部算力工具: ■ 草绳、石子 ■ 算盘 ■ 计算机:算力提供者 ( 可高速简单运算,不能处理复杂逻 辑 ) 算力的发展 “I think there is a world market for maybe five computers." ( 我想全世界只需要五台电脑 ) --Thomas --Thomas Watson,IBM 创始人, 1943 ■ 大型机时代:数字化未开始,算力需求潜力未发掘 大型机时代 1940- 1980 计算机算力的发展 大型机时代 PC 时 代 云计算时代 人工智能时代 1940- 1980-10 积分 | 23 页 | 7.53 MB | 5 月前3
DeepSeek大模型赋能高校教学和科研2025的错误或令人困惑的问题 3.1 大模型的概 念 3.2 大模型的发展历 程 大模型发展历经三个阶段 ,分别是萌芽期、 沉淀期和爆发 期 3.2 大模型的发展历 程 3.2 大模型的发展历 程 大模型发展对算力的需求演变 人工智能包含了机器学习 ,机器学习包含了深度学习 ,深度学习可以采用不同的模型 , 其中一种模型是预训练模型 ,预训 练模型包含了预训练大模型(可以简称为“大模型”) ,预训练大模型 合 了 NLP 和 CV 的能力, 以实现对多模态信息 的综合 理解和分析,从而能够更全面地理解和 处理复杂 的数据 。代表性产品包括 DingoDB 多模向量数据 库(九章云极 DataCanvas ) 、 DALL-E(OpenAI) 、 悟空画画(华 为) 、 midjourney 等 视觉大模型 是指在计算机视觉( Computer Vision , CV ( Google ) 、文心 UFO 、华为盘古 CV 、 INTERN (商汤)等 3.4 大模型的分 类 通用大模型 L0 是指可以在多个领域和任务上通用 的大模型 。 它们利用大算力、使 用 海量的开放数据与具有巨量参 数的 深度学习算法,在大规模无 标注数 据上进行训练, 以寻找特 征并发现 规律 ,进而形成可“举一 反三” 的强 大泛化能力 ,可在不 进行微调或少10 积分 | 123 页 | 15.88 MB | 6 月前3
华为昇腾DeepSeek解决方案Restricted Distribution 2 训练资源 • 随着 DeepSeek 提供了一种高效率训练的方法,同等 算力规模可以探索更强的模型能力 • 在竞争背景下,头部玩家仍将追逐 Scaling Law ,坚定 AI 算力的战略投资,加速探索下一代 AI 技术 DeepSeek 是 AI 发展史上的一个关键里程碑,但远未达到 AI 终点 AI 模型算法: 异构计算架构: CANN … 互联技术:灵衢 AI 芯片:昇腾、寒武纪 … DeepSeek-R1 进一步验证“算力即性能” Scaling Law 升级,模型能力 = 算力 x 数据 x 思考 + 逻辑推理 DeepSeek-V3/R1 OpenAI-o1/o3 算力 x 数据 重新定义 Scaling Law 延续智能涌现的 方向 2017 谷歌发布首个 Transformer 技术创新 CV 计算机视觉 3 Huawei Proprietary - Restricted Distribution 下一代 AI 技术 Mamba 、空间智能 等 算力 x 数据 x 思 考 模 型 效 果 低成本完美对标 OpenAI O1 ,突破精确语义理解及复杂推理任务 DeepSeek-V3 是一款 MoE 模型,总参数量 671B ,激活参数量 37B0 积分 | 32 页 | 2.52 MB | 5 月前3
英特尔-工业人工智能白皮书2025年版技术从专用化迈向 了通用化。AI 技术正在步入工业领域的千行百业,帮助企业实现从传统的劳动密集型、资源密集型企 业,向技术密集型、知识密集型的高端化、智能化、绿色化方向转型升级,打造依托于人工智能、大 数据、云计算等现代信息技术的新质生产力。 工业 AI 和大模型的应用,已经渗透到工业生产的产品设计、企业流程管理规划、智能化生产、设备预 测性维护、供应链优化、创新服务、绿色制造、智能客服等众多环节,它通过处理和分析海量工业数 署需要根据用户特征对模型进行差异化增强。为了保护数据隐私,与用户隐私相关的应用模型的训练,将在端侧而 非云上进行,这也对边缘端的算力提出了更高要求。 09 01 工业人工智能 (AI) 行业观察 新材料的 快速筛选 加速设计 锂电池未来的技术核心竞争点在于材料。快速筛选出高能效的材料,是掌握竞争优势的关键。大模型通过高通量计 算与数据库构建、分子生成模型和高通量筛选策略等步骤,能从数百万种材料中,快速筛选出具有高能效潜力的材 速做出响应。将场景应用端的数据再传输到云端处 理,庞大的数据量会造成带宽拥挤,影响处理的时效 性。采用边缘计算方案来缓解时效性问题,但是这对 边缘端计算硬件的实时处理能力提出了挑战。 第二,算力问题。 无论是训练 AI 算法还是各种工业大模型,都需要强 大的算力支撑。工业大模型动辄参数规模都在十亿、 百亿甚至千亿级别,需要庞大的计算资源进行训练。 这种训练过程涉及海量的数据运算,对 CPU、GPU 或 NPU 等加速计算硬件提出了极高的要求。0 积分 | 82 页 | 5.13 MB | 5 月前3
山东大学:DeepSeek 应用与部署Distill - Llama - 70B 等 ,在推理能力上表现出色。 • 阿里云百炼: 提供多个 DeepSeek 系列模型 ,如 DeepSeek - V3 、 DeepSeek - R1 - Distill - Qwen - 1.5B 等 , 部分限时免费 ,涵盖文本生成等功能。 • 百度智能云: 千帆 Model Builder 全面支持 DeepSeek - R1/V3 调用 ≈ 0.6 个 token 。 • 但因为不同模型的分词不同 , 所以换算比例也存在差异 , 每一次实际处 理 token 数量以模型返回为准 ,您可以从返回结果的 usage 中查看。 阿里云部署 Deepseek 以 DeepSeek-R1 满血版为例进行演示 ,通过百炼模型服务进行 DeepSeek 开源模型调用 ,可以 根 据实际需求选择其他参数规模的 DeepSeek 模型。百炼平台的 Ditill-Qwen- 1.5B DeepSeek- V3 DeepSeek- R1 腾讯云部署流程 • Cloud Studio :登录腾讯云官网 ,进入 Cloud Studio ,可一键部署 ,即开即用 ,能快速体验 7B 以下 DeepSeek - R1 蒸馏模型。 • 云原生构建:登录腾讯云 ,云原生构建相关服务 ,一键体验 DeepSeek ,无需等待下载 ,支持10 积分 | 79 页 | 6.52 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告设成本激增,这在近期美股科技股的震荡中得以集中体现;而从长期来看,行业将陷入 算力军备竞赛的循环,每一轮技术突破和应用场景扩展都将催生新的算力需求与资源投 入,持续重塑行业竞争格局。 ➢ 资源优化:随着模型使用方案的平民化,中小企业和个人开发者得以将有限资源聚焦于 场景创新与技术优化,无需在基础能力建设或算力消耗上投入过多成本。 ➢ 市场激活:这种高性价比、低门槛的大模型服务模式,将吸引更多初创团队涌入赛道, 更多初创团队涌入赛道, 催生多元化的应用场景和技术路径,推动行业生态的繁荣发展。 ➢高效创新:在有限算力资源支持下,算法创新模式,突破了算力的“卡脖子”限制 28 技术对比讨论:Kimi K1.5 Moonshot Kimi K1.5 Main Result Kimi K1.5 Long2Short Result K1.5 专注于用长文本CoT 解决推理时Scaling问题 ➢ 利用 RL 它允许模型自然地探索到验证、回溯、总结、 反思的行为模式,这些对于提高模型在推理任务中的表现至关重要。 ➢ 后训练Pipeline对于提升模型推理能力的重要性不可忽视。 ➢ 随着测试阶段算力和训练阶段探索算力的增加,根据后训练Scaling Law,模型的表现将持续得到改善。 ➢ 理想的数据构建应当覆盖广泛的类别,并且难度分级明确,这有利于实现类似课程学习的效果,逐步提高模 型的能力。 ➢10 积分 | 76 页 | 8.39 MB | 6 月前3
从智慧教育到智慧课堂:理论、规范与实践计划 智慧教育计划 提出 建立学习者为中 心的个性化学习 空间 建设国家范围的 教育基础设施 使新加坡成为全 球教育领域使用 信息技术的创新 中心 5 智慧教 育 已 成 韩国 " 智 慧 教 育 推 进 战 略 " 2011 年 数字教科书的普及推广 核心 6 智慧教 育 已 成 马来西亚 1999 年“智慧学校 计划” 2010 年将所有学 校都转型为智能学 校 U 桃园 计划” 从 e 化教育向 u 化 教育(泛在教育) 美国 IBM 智慧教育解决 方案:教育数据的 收集、管理与分析, 为学习者提供独特 的学习体验,教学 制度优化 7 智慧教 育 智 慧 教 育 什么是智慧教育? 在信息化基础之上建构的信息时代的教育新秩序,是信 息时代的教育新形态、教育的“新常态”,是信息化元素充分 融入教育以后,在“时代催化剂”的作用下教育发生的“化学反 可视化是信息时代数据处理与显示的必然趋势,是 智慧教育观摩、巡视、监控的必备功能,是智慧教 育系统的重要特征。 • 可视化监控 • 可视化呈现 • 可视化操作 智慧技术创新应用 21 物联网 大数据 云计算 泛在网络 ① ② ③ ④ 23 物联网 创 新 学生体质健康 监测 学习情境数 据采集 拓展课外教 学活动 教育安全监 控与危机快 速处理 教学设备管 理 05/06/202510 积分 | 74 页 | 10.39 MB | 6 月前3
AI跃迁派:2025年DeepSeek零基础完全指南电脑跑 AI 2.知识蒸馏:把 70B 参数大模型压缩到 1.5B,手机都能运行专业级 AI 5.国际影响:技术出海的东方智慧 ⚫ 在东南亚、中东等地区,DeepSeek 成为数智主权建设工具,帮助发展中国家摆脱 对西方技术的依赖 ⚫ 开源策略吸引全球 20 万开发者,形成中美双极化的 AI 生态格局 二、核心能力图谱 1.技术特性:AI 界的“六边形战士”10 积分 | 21 页 | 1.01 MB | 6 月前3
共 8 条
- 1
