积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(6)技术工具(6)

语言

全部中文(简体)(6)

格式

全部PPT文档 PPT(4)PDF文档 PDF(2)
 
本次搜索耗时 0.017 秒,为您找到相关结果约 6 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PPT文档 PPT
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    逻辑先用大量人工标注的数据来让模型 初步掌握某种能力(如对话或者语言风格),然后再用RL来进一步优化性能 ➢ DeepSeek-R1 系列跳过对于大规模人工标注数据的依赖 ➢ 无需构建和维护高质量的SFT数据集,而是让模型直接在RL环境中进行探索 ➢ 类比:初学者在没有老师指导的情况下,通过不断的尝试和错误来掌握一门新的技能。 ➢ 这种自主学习的方式,不仅节省了大量的标注成本; ➢ 更 ➢ 需要足够强的基座模型:基座模型 (DeepSeek-V3 Base) 超过了某个质量和能力阈值 (671B 在14.8T 高质量Token上训练)(基座模型知识帮助突破推理上界,也有一些 工作利用小模型复现 Aha Moment 得益于大规模RL和高质量推理数据); ➢ 大规模强化学习加持:GRPO 对于强化学习训练的优化; ➢ 规则化奖励:绕过奖励攻陷问题,但是得益于推理问题可以进行自动化标记和验证 Questions: ➢ 能否在Zero基础上兼顾推理性能的同时,提升模型的帮助性和安全性?例如产生 Clear & Coherent CoT 并且展现出通用能力的模型 R1; ➢ 能否利用一些高质量反思数据集做 Cold Start 从而加速RL的收敛或帮助提升推理表现 16 DeepSeek-R1 技术 Pipeline 总览 DeepSeek-v3-Base (671B) DeepSeek-R1-Zero
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    ,通过对大量文本数据进行训练 ,从而具备了强大的语言理解 和生成能力。 它能够理解自然语言 ,并能够生成自然语言文本 n 字节跳动豆包 豆包是字节跳动基于云雀模型开发的 AI , 能理解你的需求并生成高质量 回 应。 它知识储备丰富 , 涵盖历史、 科学、 技术等众多领域 , 无论是日 常问 题咨询 , 还是深入学术探讨 , 都能提供准确全面的信息。 同时 , 具备 出色 的文本创作能力 能撰写故事 于安全验证和身份识别)、医学影像分析(辅助医生诊断疾 病)等 ( 1 ) 自然语言处理 大模型在自然语言处理领域具有重要的应用 ,可以用于文本生成 (如文章、小说、新闻等的创作)、翻译系统(能够实现高质量 的 跨语言翻译)、问答系统(能够回答用户提出的问题)、情感 分析 (用于判断文本中的情感倾向)、语言生成(如聊天机器 人)等 大模型的应用领域非常广泛 ,涵盖了自然语言处理、 计算机视觉、 ,大模型可以为用户提供个性化的推荐服务 ,提高 用 户满意度和转化率 ( 3 )语音识别 大模型在语音识别领域也有应用 ,如语音识别、语音合成等。通 过 学习大量的语音数据 ,大模型可以实现高质量的跨语言翻译和 语音 识别以及生成自然语音 3.7 大模型的应用领 域 金融风控 自动驾驶 医疗健康 大模型可以用于信用评估、欺诈检测等任 务 。通过分析大量的金融数据 ,大模型 可 以评估用户的信用等级和风险水平,
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
  • ppt文档 浙江大学-DeepSeek模型优势:算力、成本角度解读2025

    ( 英伟达挣钱 ) ■ 3, 用最新 GPU 训练性能领先的大模型 ■ 例子: 2023 年出 ChatGPT, 垄断市场 (290 亿美元估值 ) ■ 4, 用训练的 GPU 给客户提供高质量模型服务 ■ 例子:营收小、整体亏钱 2025 年特朗普的“星际之门”为 OpenAl 筹 5000 亿美元 Al 基础设施 ! 国际人工智能企业 OpenAI 的商业模 式 ■ 国内人工智能商业模式 可行性分析:资金没问题,尤其优质生产力领域 2, 购买最新 GPU ■ 可行性分析:美国可以发禁令 3 , 用 GPU 训练性能领先的大模型 ■ 可行性分析:国内 Al 人才没问题 ■ 4, 用训练的 GPU 给客户提供高质量模型服务 ■ 可行性分析:国内做工业化低成本有绝对优势 国内人工智能的发展模式、可行性分析 美国限制中国 AI 发展的策略 Y ■ 国内人工智能商业模式 ( 循环以下四步 ) ■ 1, 国内融资 ( 亿美金 ) 可行性分析:资金没问题,尤其优质生产力领域 ■ 3 , 用 GPU 训练性能领先的大模型 ■ 可行性分析:国内 Al 人才没问题 ■ 4, 用训练的 GPU 给客户提供高质量模型服务 ■ 可行性分析:国内做工业化低成本有绝对优势 2, 购买最新 GPU 可行性分析:美国可以发禁令 美国政府对我国的禁令 现成成熟算力: 2023 年禁止出口高端 Al 芯片 ■
    10 积分 | 23 页 | 7.53 MB | 5 月前
    3
  • ppt文档 华为昇腾DeepSeek解决方案

    AWS 微软 Azure 部署更高效 月级调优 周 / 天级优 化 数据依赖降低 高质量数据 生成数据 算法依赖降低 高端人才 开源 + 蒸 馏 监督微调 SFT NVIDIA Hugging Face GitHub 更多行业 高质量数据生成 强化学习 主流云服务商已支持 DS 覆盖公 / 私有云部署 模型蒸馏 - 模型小型化
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • ppt文档 从智慧教育到智慧课堂:理论、规范与实践

    开放资源和电子学习 & 电 子档案袋、课件、内容和 服务 商务智能为学生绩效提供新的 视角 利用开放资源,虚拟旧计 算机桌面应用和服务,降 低成本 智慧课堂:利用 21 世纪技术提高质量、提高接入和降低成本 工作需求 信息服务 广播系统 工业标准框架 为资源管理和支持学习提供管 理服务 智慧课堂:利用 21 世纪技术( IBM 及其伙伴) 虚拟架构、计入虚拟客 户端解决方案
    10 积分 | 74 页 | 10.39 MB | 6 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    可扩展:提供访问活跃的合作伙伴生态系统,帮助构建和扩展您的解决方案。 43 02 英特尔 ® 技术方案 OPEA 为客户提供了 RAG 参考 pipeline,其架构如下图所示。 OPEA 使用微服务为企业创建高质量的 GenAI 应用程序,简化生产环境中的扩展和部署流程。这些微服务利用一个服务组合 器将它们组装成一个巨大的服务,从而创建出真实世界的企业人工智能应用程序。OPEA 为客户提供了 RAG 参考 pipeline, (CAD) 软件对产品设计的创新和生产流程的效率起着决定性作用。面对 市场快速变化,企业亟需适应新的设计理念和客户需求,这对 CAD 软件提出了更高的挑战。传统的设计方法已难以满足高 效率和高质量的双重要求,企业急需新技术的支持以提升竞争力。 华泰软件结合英特尔® 至强® MAX 和酷睿™ Ultra 处理器的强大计算能力,开发了《智能化图纸生成管家》产品,该产品 通过自然语言和表格数据 策难以做到精准和高效,难以 实现资源的最优配置。此外,随着技术的发展和设备的复杂性增加,运维成本不断攀升,给企业带来了经济压力。最后,传 统的被动服务模式导致运维服务体验度差,无法满足客户对于高质量服务的期待。面对这些挑战,企业迫切需要一种能够提 前预测设备潜在问题并进行预防性维护的智能解决方案,以提高设备的可靠性和生产效率,降低维护成本。 解决方案 联想基于 AIoT 的设备预防性维护解决方案,通过在边缘进行计算乃至
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
共 6 条
  • 1
前往
页
相关搜索词
2025DeepSeekR1Kimi1.5及类推理模型推理模型开发解读报告赋能高校教学科研浙江大学浙江大学优势算力成本角度华为解决方案解决方案智慧教育课堂理论规范实践英特特尔英特尔工业人工智能人工智能白皮皮书白皮书年版
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩