浙江大学-DeepSeek模型优势:算力、成本角度解读2025DeepSeek 全部训练单次成本: 5,576,000 美 元 单张 H800 GPU 每小时租赁成本: 2 美 元 泛大 模型 / 指标 DeepSeek V1 DeepSeek V2 DeepSeek V3 Llama 3.1 发布时间 2024 年 1 月 2024 年 6 月 2024 年 12 月 2024 年 7 月 训练 Token 2 T 8.1 T 14.8 T10 积分 | 23 页 | 7.53 MB | 5 月前3
山东大学:DeepSeek 应用与部署2014-2024 自然语言处理与语言模型 大语言模型 LLM : 2018 — 2024 DeepSeek 介 绍 DeepSeek : 2023 — DeepSeek : 技术创新——模型架构 | V2 ( Multi-Head Latent Attention ) DeepSeek : 技术创新—模型架构 | V3 PPO : Proximal Policy Optimization10 积分 | 79 页 | 6.52 MB | 5 月前3
共 2 条
- 1
