积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(6)技术工具(6)

语言

全部中文(简体)(6)

格式

全部PDF文档 PDF(3)PPT文档 PPT(3)
 
本次搜索耗时 0.012 秒,为您找到相关结果约 6 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 AI跃迁派:2025年DeepSeek零基础完全指南

    超长上下文:一口气读完 3-4 万字的长文档(64Ktoken 容量) 技术架构: ⚫ MLA 多头潜在注意力:像多线程处理信息,显存占用降低 50%,适合普通电脑运 行 ⚫ MoE 混合专家系统:遇到问题自动召唤“专业团队”,比如数学题找数学专家模 块,写诗找创意模块 ⚫ 强化学习驱动:通过“试错+奖励”机制自我进化,类似游戏 AI 自学通关 2.划时代意义:中国 1.技术特性:AI 界的“六边形战士” DeepSeek 之所以成为现象级 AI 工具,关键在于它在效率、成本、能力三大维度实现 了突破性平衡: 技术黑话翻译: ⚫ MoE 混合专家系统:像医院分诊台,遇到数学题自动转接“数学博士”,写诗转接 “文学教授” ⚫ MLA 多头潜在注意力:让 AI 像章鱼同时处理多任务,普通电脑也能流畅运行 ⚫ DualPipe 通信技术:优化 建议中做出最优决策) ⚫ 情感智慧(弥补 AI 的情感计算短板) ②组织形态进化 ⚫ DAO(去中心化自治组织): 通过智能合约+AI 协作平台,万人团队实现零管理成本运作 ⚫ 人机混合团队: AI 成员拥有独立数字身份,参与绩效考核与利润分配 ③终身学习范式 ⚫ 技能更新周期:从 5 年缩短至 3 个月 ⚫ 学习方式: 脑机接口+AI 知识直输,1 小时掌握外语听说能力
    10 积分 | 21 页 | 1.01 MB | 9 月前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    co/p/the-illustrated-deepseek-r1 15 DeepSeek-R1 技术 Pipeline 总览 ➢ DeepSeek-R1 Zero 的问题:长推理过程可读性差、语言混合,帮助性低 ➢ Research Questions: ➢ 能否在Zero基础上兼顾推理性能的同时,提升模型的帮助性和安全性?例如产生 Clear & Coherent CoT 并且展现出通用能力的模型 Length 泛化&推理范式涌现 ➢ 大规模RL的加持下,DeepSeek-R1 Zero 表现出在推理任务上思维链长度的自然增长和涌现 ➢ 反思深度逐层加深,出现标记不明确的步骤、保持中间结论、验证、混合语言推理等现象 ➢ 模型在准确率奖励和格式奖励下自然探索到 验证、回溯、总结、反思 的行为范式 ➢ 如何控制来保证最后的response 长度能够稳定上升,可能会出现反复重复验证、或者验 证时间过晚的情况; 定的训练状态; ➢ 有效地加速 RL 训练的收敛,缩短训练时间; ➢ 提高模型输出的可读性,减少不同语言混合使用的情况。 26 DeepSeek-R1 Takeaways 总结 Part II ➢ 推理为中心的RL训练: ➢ 语言一致性奖励,以解决模型在多语言环境中进行推理时,出现语言混合的问题。 ➢ 对推理链的质量进行细致的评估,并通过奖励机制引导模型生成更加合理、准确的推理过程。 ➢
    10 积分 | 76 页 | 8.39 MB | 9 月前
    3
  • ppt文档 华为昇腾DeepSeek解决方案

    模型测试数据 & 互联网 硬件级优化 绕过 GUDA 进行 PTX 编程 计算与通信优化,性能提升 30% GRPO :群体进化的智慧筛选器 自我验证机制: AI 的 " 错题本系 统 " 混合专家模型的 " 智能路由器“ 多头潜在注意力 MLA :空间压缩术 训练框架加速: 16 到 3 的量化压 缩, 通信降低 89% 推理加速:预加载,动态批处理等 模型、数据、工具链、部署全开源 DeepSeek R1: 在 Reasoning 任务达到了世界水平( OpenAI- o1 ) 以 2 阶段 SFT+2 阶段 RL 完成,从而解决 R1-Zero 可读性差、 多种 语言混合问题 本次开源同时发布了 6 个基于 DeepSeek-R1 蒸馏的更小稠密模 型 ( Qwen/LLaMa 1.5B 7B 14B 32B 70B ) DeepSeek-R1 以 token 推理倍级提升 FP16/BF16 1 前 1 后单流水 需要裁判模型评估 1 次 1token 预测 MHA/GQA 分组共享减少缓存 GPT4 16 专家选 2 FP8 混合精度 双向流水并行 新老策略组队评估 1 次多 Token 预 测 MLA 低秩压缩减少缓存 DeepSeekMoE 更稀疏 256 选 8+1 训练精度 PP 并行算法 强化学习 Attention
    0 积分 | 32 页 | 2.52 MB | 9 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    13 02 英特尔 ® 技术方案 2.1 硬件 第 12 代英特尔® 酷睿™ 移动处理器为物联网部署创造更多价值,采用全新高性能混合架构,大幅提 升单线程和多线程性能,其高性能小尺寸的设计兼顾了图形密度和 AI 加速功能。 首款采用高性能混合架构的英特尔® 酷睿™ 处理器 创新的芯片设计将专注于主要工作负载的 P-core(性能核)与专为多任务处理而建构的 E-core(能效核)相结合。英特尔® 12 代 英特尔® 酷睿™ 移动处理器 14 02 英特尔 ® 技术方案 主要特性 性能和效率 • 英特尔® 7 制程工艺 • 多达 14 个核心和 20 个线程,具有高性能混合架构 • Intel® Thread Director6 使您的核心与工作负载相匹配 • 高达 24 MB Intel® 智能缓存 确定性实时性 • 利用英特尔® TCC 进行实时计算 • 制,帮助操作系统合理调度内核线程,以提高性能或能效。 17 02 英特尔 ® 技术方案 主要特性 性能 • 基于 EUV 光刻技术的英特尔 4 制程工艺 • 采用英特尔® 酷睿™ 处理器的高性能混合架构,配备 英特尔® 硬件线程调度器 5 • 多达 16 个内核和 22 条线程 • 多达 24 MB 的英特尔® 智能高速缓存 • 15 W 至 45 W 的处理器基础功耗范围 加速
    0 积分 | 82 页 | 5.13 MB | 9 月前
    3
  • ppt文档 从智慧教育到智慧课堂:理论、规范与实践

    冷 气 讲桌 160” 触控电子白 板 退缩 空间 退缩 空间 退缩 空间 投影机 案例一:多功能教室整体设备配置图 案例二:合作探究学习情境 案例三 : 未来教室环境 案例四:混合式课堂与实验室 智慧课堂的教学优势 学生在“一对一” 环境中开展学习, 人手一台平板电 脑。 教室利用教室墙 开展教学活动 基于新技术的未来学习 未来教室环境的支撑技术 环境创设:利用技术手段,为基于
    10 积分 | 74 页 | 10.39 MB | 9 月前
    3
  • ppt文档 山东大学:DeepSeek 应用与部署

    Langchain+Deepseek API 业务流工程 • 1. R2R :官网: https://r2r-docs.sciphi.ai/ • 功能:用于开发本地 RAG 应用程序 ,支持多模态内容摄取、 混合搜索、知识图谱构建、 GraphRAG ,具备用户管理、 可 观测性、配置及可视化交互等功能 ,适用于处理动态数 据和 复杂实体关系的应用程序。 • 2. Cognita :官网: https://cognita
    10 积分 | 79 页 | 6.52 MB | 9 月前
    3
共 6 条
  • 1
前往
页
相关搜索词
AI跃迁2025DeepSeek基础完全指南R1Kimi1.5及类推理模型推理模型开发解读报告华为解决方案解决方案英特特尔英特尔工业人工智能人工智能白皮皮书白皮书年版智慧教育课堂理论规范实践山东东大大学山东大学应用部署
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 - 2026 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩