积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(5)技术工具(5)

语言

全部中文(简体)(5)

格式

全部PPT文档 PPT(3)PDF文档 PDF(2)
 
本次搜索耗时 0.012 秒,为您找到相关结果约 5 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PPT文档 PPT
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    (test-time computation increasing) ➢ DeepSeek-R1-Zero 自主涌现学会重新评测原来的方法、反思和主动探索其他的路径 ➢ 多阶段训练下的冷启动让RL训练更加稳定,避免初期不稳定、加速收敛、提升思维链可读性 ➢ 未来后训练的重心会逐步倾向于RL,但是少量训练用于SFT可能还是必须的 ➢ 强化学习技术不只局限在基于规则的数学、算法代码等容易提供奖励的领域,它还可以创造性 推理等现象 ➢ 模型在准确率奖励和格式奖励下自然探索到 验证、回溯、总结、反思 的行为范式 ➢ 如何控制来保证最后的response 长度能够稳定上升,可能会出现反复重复验证、或者验 证时间过晚的情况; (REINFORCE 系列更快;PPO训练稳定但是慢) ➢ 多语言可能是因为预训练数据是多语言的,“一视同仁”被 Tokenization,不同的领域的不 同语言编码是否有不同优势? DS-R1 算资源的 消耗。而 GRPO 算法利用群组内的相对信息来估计基线,避免了使用Critic Model的需要。 ➢ 此外,GRPO 算法还引入了一些额外的优化策略(奖励缩放和策略裁剪),提升训练的稳定性。 ➢ From PPO to GRPO: ➢ PPO 作为 Actor-Critic 算法被广泛运用于 Post-Training, 核心目标是最大化下面的目标函数 ➢ 其中, 𝜋𝜃和
    10 积分 | 76 页 | 8.39 MB | 5 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    五年产品供应和软件支持 • 多种操作系统支持,包括 Linux、Windows client、 Windows 10 LTSC • 转为嵌入式使用设计的 SKU 满足更高的可靠性要求 • 定期、稳定的驱动程序发布 • 支持 PCIe 4.0,适用于 PCIe 和 MxM • 提供带有现代软件用户界面的控制软件 • 高性能选项(功率 195W – 225W)可提供最高 236 INT8 Optimization Implementation(英特尔® COVI)是一个一站式资源库,其中包括最佳实践方法 (BKMs)、指导手册和样例代码,专为全面优化英特尔® 平台上工业机器视觉的性能和稳定性而设计。该平台整合了英特尔® 的多种软件技术,如 OneAPI、OneVPL 等,以支持客户在英特尔® 产品上部署机器视觉解决方案。 图像接入 图像预处理 • Template Matching 算子,深度学习模型,编码等 向量化 并行化 硬件加速 流程性能优化 CV 算子性能 优化 混合架构调度 PNG/JPEG 图片编码加速 流程分析 内存拷贝 BKM 性能稳定性 优化 … BKM(方法论, 参考代码, 优化算子) 基础软件 & SDKs 平台数据 优化方法论 38 02 英特尔 ® 技术方案 大语言模型操控机械臂的技术解决方案架构如下图所示:
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • ppt文档 山东大学:DeepSeek 应用与部署

    开源模型调用 ,可以 根 据实际需求选择其他参数规模的 DeepSeek 模型。百炼平台的 API 提供标准化接口 ,无需自 行搭建 模型服务基础设施 ,且具备负载均衡和自动扩缩容机制 ,保障 API 调用稳定性。搭配 Chatbox 可视 化界面客户端 ,进一步简化了调用流程 ,无需在命令行中操作 ,通过图形化界面即 可轻松配置和使用 https://chatboxai.app/zh#downl 部署简单、直观、高效! HAI 提供 GPU 算力和 o llama 环境 ,支持 1.5B, 7B, 8B, 32B 等多个 DeepSeek-R1 蒸馏模 型。 企业级首选 , DeepSeek 部署稳定、 安全、 易用! 腾讯云智能全栈 AI 服务上架 DeepSeek 系列模 型 创建应用 华为云 +silconflow 邀请码: z0sI0urY 邀请链接: https://cloud
    10 积分 | 79 页 | 6.52 MB | 5 月前
    3
  • ppt文档 华为昇腾DeepSeek解决方案

    2023 2024 2025 2026 训练的算力需求将持续增长,算力结构从“预训练为主” 走向 “预训练 + 后训练 / 二次训练” 关注高效、稳定、开放的底座 • 极致性能、稳定可靠的 AI 集群 • 深度开放的平台和生态 • 极致的端到端性能效率优化 关注便捷、易用、性价比的平台 • 开箱即用的强化学习套件 • 兼顾成本与性能的蒸馏
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    金融风控 自动驾驶 医疗健康 大模型可以用于信用评估、欺诈检测等任 务 。通过分析大量的金融数据 ,大模型 可 以评估用户的信用等级和风险水平, 以及 检测欺诈行为,提高金融系统的安 全性和 稳定性 大模型可以用于医疗影像诊断、疾病预测 等任务 。通过学习大量的医学影像数据 , 大模型可以辅助医生进行疾病诊断和治 疗 方案制定,提高医疗水平和效率 型可以实现对车辆周围环境的感知和识别,
    10 积分 | 123 页 | 15.88 MB | 5 月前
    3
共 5 条
  • 1
前往
页
相关搜索词
2025DeepSeekR1Kimi1.5及类推理模型推理模型开发解读报告英特特尔英特尔工业人工智能人工智能白皮皮书白皮书年版山东东大大学山东大学应用部署华为解决方案解决方案赋能高校教学科研
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩