积分充值
首页
上传文档
发布文章
登录账户
综合
文档
文章
无数据
分类
全部
人工智能
(
1
)
技术工具
(
1
)
语言
全部
中文(简体)
(
1
)
格式
全部
PPT
(
1
)
本次搜索耗时
0.008
秒,为您找到相关结果约
1
个.
全部分类
全部
人工智能
技术工具
全部语言
全部
中文(简体)
全部格式
全部
PPT
默认排序
默认排序
最新排序
页数排序
大小排序
全部时间
全部时间
最近一天
最近一周
最近一个月
最近三个月
最近半年
最近一年
浙江大学-DeepSeek模型优势:算力、成本角度解读2025
Latent cO 0 OO00 1 ■ DeepSeek V3 模 型 参 数 ? 671B 参数 (GPT-3:175B 、 GPT-4:1.76T?) ■ 每个 token 激
活
3 7B 参数 (~5.5%), 降低计算 量 MoE: 1 共享专家 + 256 路由专家 MLA: 低秩压缩 DeepSeek v3 模型参 数 L=61 层 oo
10 积分 | 23 页 | 7.53 MB
| 5 月前
3
共 1 条
1
前往
页
相关搜索词
浙江
大学
浙江大学
DeepSeek
模型
优势
算力
成本
角度
解读
2025