2023 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

浙江大学-DeepSeek模型优势：算力、成本角度解读2025

2019-21 年融资 20 亿美元 2, 购买最新 GPU ■ 例子：购买 2.5 万 A100 GPU ( 英伟达挣钱 ) ■ 3, 用最新 GPU 训练性能领先的大模型 ■ 例子： 2023 年出 ChatGPT, 垄断市场 (290 亿美元估值 ) ■ 4, 用训练的 GPU 给客户提供高质量模型服务 ■ 例子：营收小、整体亏钱 2025 年特朗普的“星际之门”为 OpenAl 4, 用训练的 GPU 给客户提供高质量模型服务 ■ 可行性分析：国内做工业化低成本有绝对优势 2, 购买最新 GPU 可行性分析：美国可以发禁令美国政府对我国的禁令现成成熟算力： 2023 年禁止出口高端 Al 芯片 ■ A100 、 H00 、 H800 、 A800 等数据中心 GPU ■ 运力： 2022 年限制 Al 加速器的互联带宽算力： 2024 年禁止台积电代工

10 积分 | 23 页 | 7.53 MB | 1 年前
3
华为昇腾DeepSeek解决方案

DeepSeek-V3/R1 OpenAI-o1/o3 算力 x 数据重新定义 Scaling Law 延续智能涌现的方向 2017 谷歌发布首个 Transformer 架构模型 2023 ChatGPT 模型能力突破开启 NLP 时代 2012 AlexNet 模型能力突破开启 CV 时代 1998 LeNet 首个 CNN 架构模型 2025 出现平权现象，引发新一波的“百模千态” 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 2025 2026 训练的算力需求将持续增长，算力结构从“预训练为主” 走向 “预训练 + 后训练 / 二次训练” 关注高效、稳定、开放的底座 • 极致性能、稳定可靠的

0 积分 | 32 页 | 2.52 MB | 1 年前
3
DeepSeek大模型赋能高校教学和科研2025

海量参数、强大的学习能力和泛化能力，能够处理和生成多种类型数据的人工智能模型。通常说的大模型的“大”的特点体现在： 2020 年， OpenAI 公司推出了 GPT-3 ，模型参数规模达到了 1750 亿。 2023 年 3 月发布的 GPT-4 的参数规模是 GPT-3 的 10 倍以上，达到 1.8 万亿， 2021 年 11 月阿里推出的 M6 模型的参数量达 10 万亿。 3.1 大模型的概念，将多模态编码器和多模态解码器两个主要组件结合在一起，以提供最佳结果 Gemini 包括三种不同规模的模型： Gemini Ultra 、 Gemini Pro 和 Gemini Nano ，适用于不同任务和设备。 2023 年 12 月 6 日， Gemini 的初始版本已在 Bard 中提供，开发人员版本可通过 Google Cloud 的 API 获得。 Gemini 可以应用于 Bard 和 Pixel 检索增强和对话增强的技术特色。文心一言具有广泛的应用场景，例如智能客服、智能家居、移动应用等领域。它可以与用户进行自然语言交互，帮助用户解决各种问题，提供相关的知识 Kimi 是月之暗面科技 2023 年推出的 AI 助手，可处理 200 万字超长文本，支持多格式文件解读、互联网信息搜索整合、多语言对话等，能用于办公、学习、创作等场景，有网页版、 APP 、微信小程序等使用方式。

10 积分 | 123 页 | 15.88 MB | 1 年前
3
山东大学：DeepSeek 应用与部署

DeepSeek AIGC 发展历程 AIGC 2014-2024 自然语言处理与语言模型大语言模型 LLM ： 2018 — 2024 DeepSeek 介绍 DeepSeek ： 2023 — DeepSeek ：技术创新——模型架构 | V2 （ Multi-Head Latent Attention ） DeepSeek ：技术创新—模型架构 | V3

10 积分 | 79 页 | 6.52 MB | 1 年前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

需要依赖于强推理模型反思、长程规划、Tool Use 工具调用等能力 ➢ 内存和记忆模块的挑战需要克服，小模型如何获得强推理效果？ [1] https://lilianweng.github.io/posts/2023-06-23-agent/ ➢ RLHF这类对齐算法可以提升模型性能，并确保与人类意图和价值相一致。 ➢ 然而，这些对齐微调是否真正修改并对齐了模型的内部表征？ ➢ 经过安全对齐的模型可以在经过最小化的微调后再次变得不安全；境中不仅要短期安全，还要确保长期行为的安全性，例如对操作环境造成影响的安全性。 VLA系统安全的独特挑战 68 总结基于复杂推理慢思考+强化学习新技术范式，通过高质量数据驱动产生强推理模型 2023-快思考 2024-慢思考  无标注数据 有标注数据  验证数据集  学习人类偏好  测试效果  人机对齐模型  奖励模型生成更多“对齐”数据  Test-Time Compute

10 积分 | 76 页 | 8.39 MB | 1 年前
3
英特尔-工业人工智能白皮书2025年版

AI，是 AI 技术在工业领域的应用，它通过机器学习、深度学习、计算机视觉等先进的计算智能方法，实现对工业生产过程的优化和智能化，最终帮助企业提高生产效率、降低成本、提升产品质量，实现数字化转型。 2023 年 12 月，由信通院牵头、多家单位联合编制的《工业大模型技术应用与发展报告》指出，AI 与大模型将加速赋能新型工业化，预计从 2022 年至 2032 年，工业 AI 市场规模将以 46% Generation，RAG) 技术应运而生。RAG 在优化 LLM 方面，相较于其他方法具有显著的优势【Shuster et al., 2021; Yasunaga et al., 2022; Wang et al., 2023c; Borgeaud et al., 2022】： RAG 作为一种关键的方法，通过有效地结合了大模型的能力和外部知识库的丰富性，提高了大语言模型在各种任务上的表现，尤其是在需要最新信息和使工程师免于繁琐的手动离线检查。 49 03 成功案例 3.2 美的楼宇科技美控：楼宇 AI 节能解决方案背景与挑战解决方案随着全球对可持续发展的呼声日益高涨，建筑行业正面临前所未有的转型挑战。据《2023 中国建筑与城市基础设施碳排放研究报告》显示，建筑运行阶段的碳排放占据了全国碳排放总量的 21.9%，其中暖通空调系统能耗占据了建筑能耗的近半壁江山。而在暖通空调系统能耗中，基于暖通空调业务数据测算，制冷机房系统能耗占据

0 积分 | 82 页 | 5.13 MB | 1 年前
3

共 6 条前往

页

分类

语言

格式

浙江大学-DeepSeek模型优势：算力、成本角度解读2025

华为昇腾DeepSeek解决方案

DeepSeek大模型赋能高校教学和科研2025

山东大学：DeepSeek 应用与部署

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

英特尔-工业人工智能白皮书2025年版