民生证券-DeepSeek系列报告之AI+教育DeepSeek 系列报告之 AI+教育 2025 年 02 月 12 日 ➢ DeepSeek 发布开源大模型 R1,迅速出圈月活破 3000 万。2025 年 1 月 20 日,DeepSeek 正式发布 DeepSeek-R1,并同步开源模型权重。DeepSeek- R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下, 极大提升了模型推理能 公司月活达到 1.13 亿人,而单季度收入达到 1.9 亿 美金创下新高。 ➢ 国产模型升级利好 AI 教育落地。DeepSeek 横空出世,一方面大幅提升了 国产模型的能力,另一方面通过开源和推理成本的优化,有望加速国内 AI 应用 的落地进程。而无论海内外,教育天然是 AI 落地的重要场景,国内 AI+教育厂 商均在自身的优势领域推出了 AI 产品(例如科大讯飞在 G/C 端布局,佳发教育 投资建议:DeepSeek 引领国产大模型突围,字节豆包、阿里通义、Kimi 等 近期都发布了重磅更新,国产大模型呈现百花齐放的良好态势。而 DeepSeek 崛 起,一方面大幅提升国产模型的性能;另一方面开源与成本大幅降低,也有望加 速国内 AI 应用落地的进程。而聚焦 AI+教育,梳理海外龙头 Duolingo 的快速 发展,以及其最新推出的 AI 产品,能够看到 AI 在教育领域落地的潜力,而国内0 积分 | 15 页 | 2.14 MB | 5 月前3
《元宇宙超入门》方军-281页and autonomous as to be indistinguishable from living things”。 第三章 你所知的第一个元宇宙:维 基知识之城 埃里克·雷蒙德 开源软件观念引领者、《大教堂与集市》作者 如果开发协调者至少有一个像互联网这样好的沟通媒介, 并且知道如何不靠强制来领导,那么多人合作必然强于单兵作 战。 斯蒂芬·茨威格 《人类的群星闪耀时》作者 都能分享所有知识的世界。” 从技术发展路径上讲,从由专家编写、专家审核的Nupedia 转向社群中每个人都可以参与编写的维基百科,几乎是一种必 然。推动互联网发展的人们相信嘈杂又充满活力的集市模式。 在引领开源软件运动的观念之作《大教堂与集市》中,埃里克 ·雷蒙德(Eric Raymond)讲述了两种软件开发模型:一种是 “自上而下”的大教堂模型,体系严谨规范;另一种是“自下 而上”的集市模型,嘈杂又充满活力。维基百科所采用的正是 做大做强、获取超额盈利的公司,而是一家非营利的基金会。 它靠众人的小额捐助支持软件开发与服务器等基础设施的运 转。 现在,众多开源软件都是用基金会机制来运作的。Linux操 作系统背后是Linux基金会,华为的鸿蒙操作系统源代码捐献给 了开放原子开源基金会。在区块链领域中,如以太坊等公链的 机制略有不同,它的平台系统与社群带有所谓的“内部资本” (internal capital),但在法律实体结构上现在管理它的也20 积分 | 281 页 | 8.16 MB | 1 天前3
DeepSeek华为云AI解决方案月成立持续走开源道路, 24 年底发布 AI 核弹级产品震 惊全球 DeepSeek-V3 发布 671B 亿参数, 仅 55 天训练 ,十分之 一 的成本,( 558 万美元) ,超越 Llama 3.1 和 Qwen 2.5 ,与 GPT - 4 O 相当。 发 布 首 个 模 型 DeepSeek coder , 免 费供 商 业使 用 且完 全 开源 推 出 ,突破精确语义理解及复杂推理任务 数学 + 编程领域大幅领先, DeepSeek-V3 训练成本不足 Meta/OpenAI 的 10% , DeepSeek-R1 推理成本仅为 OpenAI o1 的 3% ,成为开源模型 SOTA 。 低成本 性能优 缩, 通信降低 89% • 推理加速:预加载,动态批处理 等 • 模型、数据、工具链、部署全开 源 • 蒸馏技术使能第三方模型性能 DeepSeek 大模型解读: 通过系统优化实现极致性能, 完全开源 + 免费商用,挑战 A 国 AI 霸权 硬件级、算法级、架构级、工程级、开 源生态 5 大技术创新,轰动全球 绕过 CUDA 挖掘 FP8 硬件潜力 , MOE 和 MLA 技术实现不到10 积分 | 16 页 | 850.86 KB | 5 月前3
规划和自然资源行业应对DeepSeek浪潮的思考模型,通过智能导办、工单处理、公文写作等场景创新,推动政务服务从“人工 密 集型 ” 向 “数据智能型 ” 转型。 1 、 DeepSeek 赋能政务效率提 升 DeepSeek 大模型正以“低成本、高性能、开源化 ” 的创新路径,打破技术垄 断壁垒,推动 AI 从巨头专属走向全民共享。其技术突破不仅重塑了全球 AI 竞争 格 局,更通过生态赋能为发展中国家提供了技术追赶的新机遇。 2 、技术普惠:让 多模态、 中文理解、 开源生 态 轻量化、垂直领域适配 适用场景 政务审批 、 灾害预警 、 矿 产 勘探 矿业分析、水环境监测、空 间规划 政策问答 、 数据核验 、 报 告生成 硬件需求 中等(支持 CPU/GPU 部署) 较高(需多卡 GPU ,尤其 72B 版本) 低(轻量化,支持边缘设 备) 开源支持 完全开源 ,支持商用 开源( Apache Apache 2.0 ) ,生 态 活跃 开源( MIT), 但生态较弱 推理速度 快(优化架构 + 量化技术) 中等(依赖硬件配置) 快(轻量化设计) 在选择基座模型时,应综合考虑业务场景和安全合规要求,评估模型的多模态处理能 力、长文本分析性能以及安全合规性。同时,结合项目规模、预算,选择最适合的基 座模型。 3 、基座选型—— 核心模型构 建 根据奇安信等安全机构的监测,近九成部署 DeepSeek10 积分 | 62 页 | 12.36 MB | 5 月前3
腾讯云:2025年解码DeepSeek构建医药行业新质生产力报告数学、代码⽣成和逻辑推断等复杂推理任务上表现优异 更低的研发成本* 更⾼效资源利⽤ $5.5M%vs.%OpenAI’s%$100M+ 使⽤~2,000%GPUs,%竞品使⽤% 10,000+%GPUs 开源模型⽐肩头部闭源 60%+%指标优于 Llama3.1 Claude-3.5%GPT-4o% 打破⼤模型技术壁垒 重挫美国科技公司股价,英伟达 市值下跌5,900亿 AI的斯普特尼克时刻 技术震撼 • 算法、训练范式、推理、 算⼒利⽤全⽅⾯创新 • DeepSeek&V3&通过快速 迭代新技术,⼤幅降低 了训练和推理的成本。 ⽽且它是个拥有推理能 ⼒的模型,全球可⽤ 开源引爆 • 开源的论⽂和库,以及提供 简易的蒸馏⽅式,让世界上 不管⼤⼩的实验室,快速掌 握OpenAI原来封闭的顶尖 模型推理能⼒ • MIT许可证,商⽤权限吸引 开发者 垂直适配 从编程辅助(DeepSeek- 地能⼒ 9 DeepSeek天然适合医疗⾏业 ⼤模型发展的⼏⼤“基⽯” 01 DeepSeek极致成本降低,显著降低本地化部署的 成本,极⼤激活本地数据 计算资源 02 DeepSeek是最开源的⼤模型,便于医疗⾏业 开发者使⽤和优化,垂类⼩模型不输于⼤模型 算法框架 03 医疗⾏业拥有⼤量数据资源,是⼤模型训练 和应⽤的重要⽀撑 数据资源 04 医疗信息化⼚家数千家,为⼤模型应⽤提供10 积分 | 32 页 | 14.20 MB | 5 月前3
2025年网络安全十大创新方向1)全面的应用资产梳理。通过组件识别、流量分析等方式,完整解构应用框架、组 件、API等应用资产。 2)应用供应链风险检测是特色。除应用资产存在的弱口令、漏洞、配置风险等问题 发现,还提供对应用组件的SBOM源污染、开源漏洞、开源许可风险的检测。 3)多维度的应用运行时威胁监测。方案从应用内调用、应用外运行交互、应用流量 侧交互多维度进行入侵检测。 4)集成式响应能力。提供应用内函数级拦截、应用外命令执行、文件操作、数据库 供应链攻击已从“代码注入”升级为“全链路渗透”,统计显示,2020-2023 年开源仓库中的恶意组件大规模出现,2024 年又出现针对知名开源项目的编译链劫持和模型权重 投毒。硬件侧同样告急,首个专门针对 Linux 的 UEFI 启动套件于 2024 年曝光,固件级植入进入常态化威胁。2025年,供应链安全聚焦于物联网设备硬件安全、开源组件治理、 源码保护等核心领域,供应链安全产品正从单点扫描演进为“生成 3、 远程度量与固件健康证明 4、 开源组件安全管控 5、 源码安全与知识产权保护 1、 基础设施固件完整性监控 2、 开源软件治理 3、 软件开发与交付 4、 云服务供应链安全管理 5、 关键信息基础设施全链路防护 1、 HBOM、SBOM 格式碎片化 2、 闭源固件与第三方IP黑盒 3、 多级供应商管理缺位 4、 开源组件漏洞泛滥 5、 物联网设备供应链复杂性30 积分 | 34 页 | 8.48 MB | 1 天前3
浙江大学:DeepSeek的本地化部署与AI通识教育之未来DeepSeek是什么 高性能、低成本的、国产开源大模型! • DeepSeek-R1发布开源,擅长处 理复杂且在训练阶段大规模使用 了强化学习技术,在仅有极少标 注数据的情况下,极大提升模型 推理能力。 • DeepSeek-R1在数学、代码、自 然语言推理等任务上,性能比肩 OpenAl o1正式版。 • 目前大模型主流榜单开源模型 DeepSeek-V3 位列榜首,与世 DeepSeek Coder V2 和 DeepSeek V2 Chat ) 2024.12.13: 发布DeepSeek-VL2 2024.12.26: 正式上线DeepSeek-V3首个版本并同步开源 2025.1.31: DeepSeek-R1模型登陆英伟达 NVIDIA NIM,同时:接入亚马逊、微软... 2025 2024 2025.2.5: DeepSeek-R1、V3、Coder 训练 DeepSeek- R1- Zero DeepSeek- R1 蒸馏 满血版 DeepSeek-V3 671b 17 DeepSeek破圈席卷全球 1.DeepSeek简介 开源AI大模型和相关技术火爆全球,DeepSeek一度在140 多个国家的应用商店下载排行首位。 DeepSeek—有史以来最快获得1亿注册用 户的APP。 18 DeepSeek多场景全面接入10 积分 | 57 页 | 38.75 MB | 5 月前3
面向审计行业DeepSeek 大模型操作指南(27页 WORD)DeepSeek-R1 是最先进的大语言模型,亚马逊和微软也接入 DeepSeek-R1 模型。 DeepSeek 大模型在多个基准测试中表现优异,尤其是在代码和数学任务 上,超 越了其他开源模型,甚至与领先的闭源模型(如 GPT-4 和 Claude-3.5- Sonnet ) 不相上下。 DeepSeek 被业界认为“ 以高性价比著称的 AI 模型服务商”,原因是这家公 Janus Pro 2025-1-28 7B 多模态(文本+ 图像+表 格) 理解与生成 票据识别、图表数据关联 分析、可视化报告 这三个版本原始模型权重已经在 hugging face 上开源,用户可以免费下载。 国 内 使 用 可 以 通 过 其 镜 像( https://hf-mirror.com/ ) 获 取 。DeepSeek-V3 和 DeepSeek-R1 的模型参数量较大,达到了 baidu.com/product-s/qianfan_modelbuilder。 图 7 百度智能云会话界面 4.2.5 火山引擎 火山引擎支持 V3/R1 等不同规模的 DeepSeek 开源模型,用户可以通过两种 方式使用这些模型。一是在火山引擎机器学习平台 veMLP 中部署,适用于自己 进行模型定制、部署、推理的企业;二是在火山方舟中调用模型,适用于期望 通 过 API0 积分 | 27 页 | 829.29 KB | 1 天前3
英特尔-教育行业AI实战手册2024体系。 而当校园内部课程、资源已无法满足学生下一阶段人工智能学 习所需时,利用这一灵活可扩展的架构,教育机构可进一步打 通与公有云教学资源的连接,利用互联网浩瀚的资源优势,如 接入一些先进的开源深度学习平台项目等,来有效提升人工智 能教学效率。 此外,基于这一架构部署的人工智能教学实训方案,也能帮助 落后、边远地区的学生有机会开展人工智能教学。通过与公有 云的连接,边远地区的学生可以远端接入本地实训系统,同本 端” 人工智能教育实训环境 基础实训边缘 平台搭建 少量实训 终端加入 供其他学校 AI 实训接入 实训规模扩展,增 加平台 / 终端数量 与校内数据中心、 IT 系统数据打通 接入公有云 开源 AI 资源 以利用双路英特尔® 至强® 金牌 6240R 处理器(每处理器包含 24 个物理核,系统共包含 48 个物理核)系统实现 48 个学生 课堂实训为例,通过 NUMA 架构分配计算资源如下表 出于校园实训环境建设方案的 差异,同一项人工智能任务可能需要在不同硬件平台,例如 CPU、FPGA 等上执行,如何避免或减少因硬件平台差异带来 的影响,也需要在方案设计时予以考虑。 由英特尔开源的 OpenVINO™ 工具套件能够为以上两种挑战 提供应对方案。这一工具套件产品通过模型优化器(Model Optimizer)和推理引擎(Inference Engine)这两个核心组件,10 积分 | 40 页 | 4.85 MB | 5 月前3
DeepSeek冲击下,AI产业对国内电力行业的变与不变DeepSeek R1 开源模型于 1 月 20 日发布,在更低的成本下实现和 OpenAI o1 相当的数学、代码、自然语言推理能力,不仅推动国内 AI 产业对海外的 快速追赶,也为 AI 相关行业带来较大变化。我们认为 DeepSeek 带来 AI 行业三个变化:成本变革,训练成本和 Token 调用价格不到海外模型的 30%; 技术变革,突破 CUDA 依赖,支持多样化 GPU;生态变革,开源模型,打 数据中心或持续拉动电力需求增长并促进新能源消纳 AI 数据中心或带动 2024-26 年 6~9GW/年新增负荷,拉动全国用电量 0.4~0.6pct/年 算力需求东升西降,DeepSeek 开源有望带动我国 AI 建设和相关算力电力需求启航。我们 认为 DeepSeek 的成功代表全球算力发展范式的转变。一方面,DeepSeek 不依赖高性能 GPU 的特性,使其在计算效率上实现了显著提升,且降低对供给紧张的外部 因为训练追求精确计算;推理算力用于快速处理预训练好的 AI 模型,对应的推理卡以英伟 达 L20 为代表,浮点运算能力要求较训练卡低,更关注整数精度(INT8)来大幅提高计算 效率和降低功耗。DeepSeek 的发布和开源大幅缩进了模型层面差距,使 AI 发展重心从训 练模型向应用落地倾斜,应用侧的推理算力需求相应上升。推理更注重能效比,即单位能 耗下的计算能力,使其更适合大规模部署和长期运行,我们认为在智能算力需求上行,且10 积分 | 25 页 | 2.88 MB | 5 月前3
共 33 条
- 1
- 2
- 3
- 4
