阿里 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

山东大学：DeepSeek 应用与部署

Tokens ，提供多个基于 DeepSeek - R1 蒸馏训练的模型，如 DeepSeek - R1 - Distill - Llama - 70B 等，在推理能力上表现出色。 • 阿里云百炼：提供多个 DeepSeek 系列模型，如 DeepSeek - V3 、 DeepSeek - R1 - Distill - Qwen - 1.5B 等，部分限时免费，涵盖文本生成等功能。个中文字符 ≈ 0.6 个 token 。 • 但因为不同模型的分词不同，所以换算比例也存在差异，每一次实际处理 token 数量以模型返回为准，您可以从返回结果的 usage 中查看。阿里云部署 Deepseek 以 DeepSeek-R1 满血版为例进行演示，通过百炼模型服务进行 DeepSeek 开源模型调用，可以根据实际需求选择其他参数规模的 DeepSeek 模型。百炼平台的

10 积分 | 79 页 | 6.52 MB | 10 月前
3
DeepSeek大模型赋能高校教学和科研2025

公司推出了 GPT-3 ，模型参数规模达到了 1750 亿。 2023 年 3 月发布的 GPT-4 的参数规模是 GPT-3 的 10 倍以上，达到 1.8 万亿， 2021 年 11 月阿里推出的 M6 模型的参数量达 10 万亿。 3.1 大模型的概念训练数据量大计算资源需求高参数数量庞大大模型的设计和训练旨在提供更强大、更准确的模型性能，以应对更复杂、更庞大的数据集或任务。代码和推理任务上可与 OpenAI o1 媲美。 3.6.2 国内的大模型产品 n DeepSeek （深度求索） DeepSeek 创始人梁文峰 n 通义千问通义千问是阿里云推出的一个超大规模的语言模型，它具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持的能力。通义千问这个名字有“通义”和“千问”两层含义， “通义”表示这个模型能够理解各种语可广泛应用于写作辅助、内容创作、智能客服等多个领域。通过不断迭代和优化，为用户提供更加智能、高效的内容生成解决方案 Kimi 百度文心一言字节跳动豆包 DeepSeek 科大讯飞的讯飞星火阿里的通义千问 OpenAI 的 ChatGPT AIGC 大模型的提示词（ Prompt ）是指用户向大模型输入的文本内容，用于触发大模型的响应并指导其如何生成或回应这些提示词可以是一个问题、

10 积分 | 123 页 | 15.88 MB | 10 月前
3
华为昇腾DeepSeek解决方案

、 … 开箱即用的一体机，加速大模型应用落地华为云移动云电信天翼云联通云京东云基础模型 (DeepSeek/ Llama/Qwen/…) 少量行业数据腾讯云阿里云亚马逊 AWS 微软 Azure 部署更高效月级调优周 / 天级优化数据依赖降低高质量数据生成数据算法依赖降低高端人才开源 + 蒸

0 积分 | 32 页 | 2.52 MB | 10 月前
3

共 3 条前往

页

山东东大大学山东大学 DeepSeek 应用部署模型赋能高校教学科研 2025 华为解决方案解决方案

分类

语言

格式

山东大学：DeepSeek 应用与部署

DeepSeek大模型赋能高校教学和科研2025

华为昇腾DeepSeek解决方案