浙江大学-DeepSeek模型优势:算力、成本角度解读20252019-21 年融资 20 亿美元 2, 购买最新 GPU ■ 例子:购买 2.5 万 A100 GPU ( 英伟达挣钱 ) ■ 3, 用最新 GPU 训练性能领先的大模型 ■ 例子: 2023 年出 ChatGPT, 垄断市场 (290 亿美元估值 ) ■ 4, 用训练的 GPU 给客户提供高质量模型服务 ■ 例子:营收小、整体亏钱 2025 年特朗普的“星际之门”为 OpenAl 4, 用训练的 GPU 给客户提供高质量模型服务 ■ 可行性分析:国内做工业化低成本有绝对优势 2, 购买最新 GPU 可行性分析:美国可以发禁令 美国政府对我国的禁令 现成成熟算力: 2023 年禁止出口高端 Al 芯片 ■ A100 、 H00 、 H800 、 A800 等数据中心 GPU ■ 运力: 2022 年限制 Al 加速器的互联带宽 算力: 2024 年禁止台积电代工10 积分 | 23 页 | 7.53 MB | 5 月前3
华为昇腾DeepSeek解决方案DeepSeek-V3/R1 OpenAI-o1/o3 算力 x 数据 重新定义 Scaling Law 延续智能涌现的 方向 2017 谷歌发布首个 Transformer 架 构 模 型 2023 ChatGPT 模型能力突破 开启 NLP 时代 2012 AlexNet 模型能力突破 开启 CV 时代 1998 LeNet 首个 CNN 架构模型 2025 出现平权现象,引发新一波的“百模千态” 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 2025 2026 训练的算力需求将持续增长,算力结构从“预训练为主” 走向 “预训练 + 后训练 / 二次训练” 关注高效、稳定、开放的底座 • 极致性能、稳定可靠的0 积分 | 32 页 | 2.52 MB | 5 月前3
DeepSeek大模型赋能高校教学和科研2025海量参数、强大的学习能力和泛化能力 ,能够处理和生成多种类型数据的 人 工智能模型。 通常说的大模型的“大”的特点体现在: 2020 年 , OpenAI 公司推出了 GPT-3 ,模型参数规模达到了 1750 亿。 2023 年 3 月发布的 GPT-4 的参数规模是 GPT-3 的 10 倍以上 ,达到 1.8 万 亿, 2021 年 11 月阿里推出的 M6 模型的参数量达 10 万亿。 3.1 大模型的概 念 ,将多模态编码器和多模态解码器两个主要组件结合在一起 , 以提供最佳结果 Gemini 包括三种不同规模的模型: Gemini Ultra 、 Gemini Pro 和 Gemini Nano , 适用于不同任务和设备。 2023 年 12 月 6 日, Gemini 的初始版本已在 Bard 中提供 ,开发人员版本可通过 Google Cloud 的 API 获得。 Gemini 可以应用于 Bard 和 Pixel 检索增强和对话增强的技术特色。 文心一言具有广泛的应用场景 ,例如智能客服、 智能家居、 移动应用等领域。 它可以与用户进行自然语言交互 , 帮助用户解决各种问题 ,提供相关的知识 Kimi 是月之暗面科技 2023 年推出的 AI 助手 , 可处理 200 万字超长文本 ,支 持多 格式文件解读、 互联网信息搜索整合、 多语言对话等 ,能用于办公、 学习、 创作 等 场景 ,有网页版、 APP 、 微信小程序等使用方式。10 积分 | 123 页 | 15.88 MB | 6 月前3
山东大学:DeepSeek 应用与部署DeepSeek AIGC 发展历 程 AIGC 2014-2024 自然语言处理与语言模型 大语言模型 LLM : 2018 — 2024 DeepSeek 介 绍 DeepSeek : 2023 — DeepSeek : 技术创新——模型架构 | V2 ( Multi-Head Latent Attention ) DeepSeek : 技术创新—模型架构 | V310 积分 | 79 页 | 6.52 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告需要依赖于强推理模型反思、长程规划、Tool Use 工具调用等能力 ➢ 内存和记忆模块的挑战需要克服,小模型如何获得强推理效果? [1] https://lilianweng.github.io/posts/2023-06-23-agent/ ➢ RLHF这类对齐算法可以提升模型性能,并确保与人类意图和价值相一致。 ➢ 然而,这些对齐微调是否真正修改并对齐了模型的内部表征? ➢ 经过安全对齐的模型可以在经过最小化的微调后再次变得不安全; 境中不仅要短期安全,还要确保 长期行为的安全性,例如对操作 环境造成影响的安全性。 VLA系统安全的独特挑战 68 总结 基于复杂推理慢思考+强化学习新技术范式,通过高质量数据驱动产生强推理模型 2023-快思考 2024-慢思考 无标注数据 有标注数据 验证数据集 学习人类偏好 测试效果 人机对齐模型 奖励模型 生成更多“对齐”数据 Test-Time Compute10 积分 | 76 页 | 8.39 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版AI,是 AI 技术在工业领域的应用,它通过机器学习、深度学习、计算机视觉等先进的计算智能方法,实现对工业生产 过程的优化和智能化,最终帮助企业提高生产效率、降低成本、提升产品质量,实现数字化转型。 2023 年 12 月,由信通院牵头、多家单位联合编制的《工业大模型技术应用与发展报告》指出,AI 与大模型将加速赋能新型 工业化,预计从 2022 年至 2032 年,工业 AI 市场规模将以 46% Generation,RAG) 技术应运而生。RAG 在优化 LLM 方面,相 较于其他方法具有显著的优势【Shuster et al., 2021; Yasunaga et al., 2022; Wang et al., 2023c; Borgeaud et al., 2022】: RAG 作为一种关键的方法,通过有效地结合了大模型的能力和外部知识库的丰富性,提高了大语言模型在各种任务上的表 现,尤其是在需要最新信息和 使工程师免于繁琐的手动离线检查。 49 03 成功案例 3.2 美的楼宇科技美控: 楼宇 AI 节能解决方案 背景与挑战 解决方案 随着全球对可持续发展的呼声日益高涨,建筑行业正面临前所未有的转型挑战。据《2023 中国建筑与城市基础设施碳排放 研究报告》显示,建筑运行阶段的碳排放占据了全国碳排放总量的 21.9%,其中暖通空调系统能耗占据了建筑能耗的近半壁 江山。而在暖通空调系统能耗中,基于暖通空调业务数据测算,制冷机房系统能耗占据0 积分 | 82 页 | 5.13 MB | 5 月前3
共 6 条
- 1
