华为昇腾DeepSeek解决方案4940 Token/s@32B 7500 Token/s@14B 730 Token/s@14B 956 Token/s@8B 956 Token/s@7B 80 路 @14B 115 路 @8B 115 路 @7B 昇腾 DeepSeek 一体机: 大吞吐 + 高并发, 加速行业模型落地 模型参数: 14B/32B DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill-Llama-8B 8B INT8 Atlas 300I Duo 1*Duo 96GB PCIE 956 115 DeepSeek-R1-Distill-Qwen-7B 7B INT8 Atlas 300I Duo 1*Duo 96GB PCIE 956 115 DeepSeek-R1-Distill-Qwen-1.5B 1.5B INT8 Atlas 300V 1*300V 24GB0 积分 | 32 页 | 2.52 MB | 5 月前3
共 1 条
- 1
