浙江大学-DeepSeek模型优势:算力、成本角度解读2025DeepSeek 模型优势:算力、成本角度 解读 2025 年 2 月 ■ 什么算力 ?“ 对信息数据进行计算,实现目标结果的能力” ■ 传统算力:信息计算力 ■ 现代算力:信息计算力、数据存储力、网络运载力 算力的基本概念 大脑 草绳、石子 算盘、算筹 ▶ 计算器、计算机 ■ 原生算力:大脑 ( 可处理复杂逻辑,但不能高速处理简单运算 可处理复杂逻辑,但不能高速处理简单运算 ) ■ 外部算力工具: ■ 草绳、石子 ■ 算盘 ■ 计算机:算力提供者 ( 可高速简单运算,不能处理复杂逻 辑 ) 算力的发展 “I think there is a world market for maybe five computers." ( 我想全世界只需要五台电脑 ) --Thomas --Thomas Watson,IBM 创始人, 1943 ■ 大型机时代:数字化未开始,算力需求潜力未发掘 大型机时代 1940- 1980 计算机算力的发展 大型机时代 PC 时 代 云计算时代 人工智能时代 1940- 1980-10 积分 | 23 页 | 7.53 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告\ Kimi 1.5 及 类强推理模型开发解读 北大对齐小组 陈博远 北京大学2022级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 及 R1 技术剖析 ➢ Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 ➢ RL 算法的创新:GRPO及其技术细节 ➢ DeepSeek-R1 背后的Insights & Takeaways:RL加持下的长度泛化 \ 推理范式的涌现 ➢ DeepSeek-R1 社会及经济效益 ➢ 技术对比探讨 ➢ STaR-based Methods vs. RL-based \ o-series) ➢ 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及Takeaways ➢ PRM & MCTS 的作用 ➢ 从文本模态到多模态 ➢ 其他讨论:Over-Thinking 过度思考等 ➢ 未来方向分析探讨 ➢ 模态穿透赋能推理边界拓展:Align-DS-V ➢ 合成数据及Test-Time Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全:形式化验证10 积分 | 76 页 | 8.39 MB | 6 月前3
华为昇腾DeepSeek解决方案年 2 月 DeepSeek 洞察及昇腾适配进展 华为昇腾 AI 基础软硬件介绍 CO NT E NTS 目 录 2 1 Huawei Proprietary - Restricted Distribution 2 训练资源 • 随着 DeepSeek 提供了一种高效率训练的方法,同等 算力规模可以探索更强的模型能力 • 在竞争背景下,头部玩家仍将追逐 在竞争背景下,头部玩家仍将追逐 Scaling Law ,坚定 AI 算力的战略投资,加速探索下一代 AI 技术 DeepSeek 是 AI 发展史上的一个关键里程碑,但远未达到 AI 终点 AI 模型算法: GPT 、 LLaMA AI 框架: PY 、 TF 异构计算架构: CUDA 互联技术: NV Link AI 芯片: NV 、 AMD • 异构计算架构: CANN … 互联技术:灵衢 AI 芯片:昇腾、寒武纪 … DeepSeek-R1 进一步验证“算力即性能” Scaling Law 升级,模型能力 = 算力 x 数据 x 思考 + 逻辑推理 DeepSeek-V3/R1 OpenAI-o1/o3 算力 x 数据 重新定义 Scaling Law 延续智能涌现的 方向 2017 谷歌发布首个 Transformer0 积分 | 32 页 | 2.52 MB | 5 月前3
DeepSeek大模型赋能高校教学和科研2025年轻力量: 核心成员全部 46 周岁以下 结构合理: 教学型、 科研型、 实验工程师 专注专业: 从 2013 年至今 , 11 年专注于大数据教学 团队特点: 眼光前瞻、 紧跟技术、 创新实干、 执行力 强 影响力高: 多项指标在国内高校大数据教学领域领 先 • 教材数量 • 教材占有率 • MOOC 课程学习人数 • 师资培养 • 教学研讨会 • 教学网站访问量 • 在线讲座观看人数 并利用学到的知识和模式来提供 更精准的答案和预测 。这使得它 们在解决复杂问题和应对新的 场 景时表现更加出色 上下文理解能力 大模型具有更强的上下文理解能 力 ,能够理解更复杂的语意和语 境 。这使得它们能够产生更准确、 更连贯的回答 可迁移性高 学习到的知识和能力可以在不同 的任务和领域中迁移和应用 。 这 意味着一次训练就可以将模 的错误或令人困惑的问题 3.1 大模型的概 念 3.2 大模型的发展历 程 大模型发展历经三个阶段 ,分别是萌芽期、 沉淀期和爆发 期 3.2 大模型的发展历 程 3.2 大模型的发展历 程 大模型发展对算力的需求演变 人工智能包含了机器学习 ,机器学习包含了深度学习 ,深度学习可以采用不同的模型 , 其中一种模型是预训练模型 ,预训 练模型包含了预训练大模型(可以简称为“大模型”) ,预训练大模型10 积分 | 123 页 | 15.88 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版边缘 AI 驱动, 助力新质生产力 英特尔® 工业人工智能白皮书 2025 年版 Intel® Industrial AI Playbook 2025 Edition 编委会: 主编:刘 俊、马小龙、朱永佳 编委:方辛月、高 畅、高杨帆、胡 杨、刘 波、吕晓峰、邱丽颖、单 娜、张 恒、张心宇 * 编辑按姓名首字母排序 人工智能 (AI) 技术的快速发展掀起了新一轮工业革命浪潮,通用大模型的出现让 数据、云计算等现代信息技术的新质生产力。 工业 AI 和大模型的应用,已经渗透到工业生产的产品设计、企业流程管理规划、智能化生产、设备预 测性维护、供应链优化、创新服务、绿色制造、智能客服等众多环节,它通过处理和分析海量工业数 据,帮助企业在上述各个环节中做出最优的智能化决策,从而在多个环节全方位实现提质、增效、降 本,增强竞争力。 在日趋激烈的工业市场竞争中,寻求部署新技术来提升综合竞争力,是企业的生存之道。而引领工业 道。而引领工业 革命浪潮的 AI 技术和大模型,是企业从多维度重塑自身生产方式、实现新质生产力的关键。 通过这本白皮书,工业领域的企业和合作伙伴可以更系统、更全面地了解 AI 技术如何为工业制造的各 个环节赋予怎样的智能化能力,以及英特尔在帮助企业落地部署 AI 技术方面所能提供的产品、平台和 系统性支持与服务以及成功案例。 本白皮书中包括了工业 AI 和工业大模型的概念介绍、当前的市场规模与市场增长潜力、工业0 积分 | 82 页 | 5.13 MB | 5 月前3
山东大学:DeepSeek 应用与部署本地部署蒸馏小模型 第三方 UI 客户管接入服务 云端网站接入服 务 Deepseek 模型及蒸馏模 型 Chatbox API 及网络调 用 Chatbox API 及网络调 用 API 及蒸馏模 型 API 及蒸馏模 型 本地网络调用 API 接 入 DeepseeK 替代部署方案 • 本地部署蒸馏小模型: 可通过 o llama 平台、 ,一键体验 DeepSeek ,无需等待下载 ,支持 1.5b/7b/8b/14b/32b 多款模型。 • TI 平台:登录腾讯云 TI 平台 ,提供专属算力、多种尺寸模型、 0 代码模型部署等功能。 • HAI :登录腾讯云 HAI 控制台 ,新建 DeepSeek - R1 应用 ,创建完成后可通过站内信获取密码 ,选择可 视化 界面( ChatbotUI ,可在自己的应用或程序中通过调用 API 来 实现 DeepSeek 模型的搜索功能。 腾讯云 API 调用 开发者首选, DeepSeek 部署简单、直观、高效! HAI 提供 GPU 算力和 o llama 环境 ,支持 1.5B, 7B, 8B, 32B 等多个 DeepSeek-R1 蒸馏模 型。 企业级首选 , DeepSeek 部署稳定、 安全、 易用! 腾讯云智能全栈10 积分 | 79 页 | 6.52 MB | 5 月前3
AI跃迁派:2025年DeepSeek零基础完全指南多模态融合:能理解文字、图片、文件等多种信息(未来还将支持语音和视频) ⚫ 超长上下文:一口气读完 3-4 万字的长文档(64Ktoken 容量) 技术架构: ⚫ MLA 多头潜在注意力:像多线程处理信息,显存占用降低 50%,适合普通电脑运 行 ⚫ MoE 混合专家系统:遇到问题自动召唤“专业团队”,比如数学题找数学专家模 块,写诗找创意模块 ⚫ 强化学习驱动:通过“试错+奖励”机制自我进化,类似游戏 工具,关键在于它在效率、成本、能力三大维度实现 了突破性平衡: 技术黑话翻译: ⚫ MoE 混合专家系统:像医院分诊台,遇到数学题自动转接“数学博士”,写诗转接 “文学教授” ⚫ MLA 多头潜在注意力:让 AI 像章鱼同时处理多任务,普通电脑也能流畅运行 ⚫ DualPipe 通信技术:优化 AI“脑细胞”之间的协作效率,响应速度提升 50% 2.功能模块:你的私人 AI 军团 竞品监控:自动生成友商产品功能对比表 ⚫ 风险预警:识别企业年报中的 34 种财务异常信号 ⚫ 生活助手:比价全网购物平台,推荐性价比最高商品 3.技术普惠:让 AI 像水电一样触手可及 DeepSeek 通过两大革新打破技术壁垒: 1.白菜价训练:用 2000 块国产昇腾芯片就能训练专业模型,大学生也能参与 AI 开发 2.手机端运行:1.5B 压缩版模型在千元机上流畅运行,山区医生可用10 积分 | 21 页 | 1.01 MB | 6 月前3
从智慧教育到智慧课堂:理论、规范与实践息时代的教育新形态、教育的“新常态”,是信息化元素充分 融入教育以后,在“时代催化剂”的作用下教育发生的“化学反 应”。 信息化 教育 时代催化剂 智慧教育” 智慧教育体系 智慧教师 智慧管理 智慧学习者及智慧学习 智慧课程 智慧教学 智慧教育资源 智慧评价(教、学) 智慧服务 智慧教室 智慧校园 智慧平台 智慧教育方式 10 信息技术 与学科教 65” 互动电视 65” 互动电视 65” 互动电视 分组 桌椅 3 分组 桌椅 5 分组 桌椅 1 分组 桌椅 2 分组 桌椅 4 投影机 充电柜 OPS box 网络孔及电源 无障碍 坡道 分 离 式 冷 气 分 离 式 冷 气 讲桌 160” 触控电子白 板 退缩 空间 退缩 空间 退缩 空间 投影机 案例一:多功能教室整体设备配置图 案例二:合作探究学习情境10 积分 | 74 页 | 10.39 MB | 6 月前3
共 8 条
- 1
