积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(5)技术工具(5)

语言

全部中文(简体)(5)

格式

全部PDF文档 PDF(3)PPT文档 PPT(2)
 
本次搜索耗时 0.017 秒,为您找到相关结果约 5 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 华为昇腾DeepSeek解决方案

    算力规模可以探索更强的模型能力 • 在竞争背景下,头部玩家仍将追逐 Scaling Law ,坚定 AI 算力的战略投资,加速探索下一代 AI 技术 DeepSeek 是 AI 发展史上的一个关键里程碑,但远未达到 AI 终点 AI 模型算法: GPT 、 LLaMA AI 框架: PY 、 TF 异构计算架构: CUDA 互联技术: NV Link AI 芯片: 得 通用性 + 专用性, 可以满足各应用场景需求 • DS 对通过从模型结构到训推全流程的极致工程优化, 大幅提升 AI 的计算效率, 提升模型落地经济性 • 中国 AI 公司首次以关键创新贡献者的身份加入到全 球 AI 竞争中,冲击美国 AI 霸权 • 打破 NV+OpenAI 的资金、技术、人才的垄断,全球 重新思考中美技术路线的选择 泛化性和经济性大幅提升 LLM ② 训练策略 • 每个 MTP 模块输出预测 token 的概率分布 • 每个 MTP 模块计算对应的交叉熵损失函数 • 多个 MTP 模块的损失函数加权平均得到最终训练目标 ③ 关键作用 • 提升每批训练数据的使用效率 ,强化训练信号 • 优化模型表达能力 ,提升 next-token 的预测效果 • 可参考投机采样改造 MTP 模块 ,加速推理效率 MTP
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    开创RL加持下强推理慢思考范式新边界 ➢ 得益于强大的推理能力与长文本思考能力,DeepSeek R1在复杂任务上表现卓越,成为开源领域的又 一里程碑,标志着开源社区在与闭源大模型(如 OpenAI o1 系列)的竞争中迈出了关键性一步。 ➢ DeepSeek-R1 在数学代码任务上表现突出 ➢ Deepseek R1在AIME2024上获得了79.8%的成绩,略高于OpenAI-o1-1217。在MATH-500上,获得97 探索其他方法 RL驱动下自然涌现 Long-CoT 能力 “Aha”Moment 11 DeepSeek-R1 技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero的关键启示 ➢ 传统RLHF背景下,SFT通常被认为是不可或缺的一步,其逻辑先用大量人工标注的数据来让模型 初步掌握某种能力(如对话或者语言风格),然后再用RL来进一步优化性能 ➢ DeepSeek-R1 ➢ 更重要的是,它让模型能够自由地探索解决问题的路径,而不是被预先设定的模式所束缚。 12 DeepSeek-R1 技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero的关键启示 ➢ 跳过SFT阶段,直接运用纯强化学习拓展推理能力边界实际上也带来了几个很重要的启示: ➢ 需要足够强的基座模型:基座模型 (DeepSeek-V3 Base) 超过了某个质量和能力阈值
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • pdf文档 AI跃迁派:2025年DeepSeek零基础完全指南

    ⚫ 开源策略吸引全球 20 万开发者,形成中美双极化的 AI 生态格局 二、核心能力图谱 1.技术特性:AI 界的“六边形战士” DeepSeek 之所以成为现象级 AI 工具,关键在于它在效率、成本、能力三大维度实现 了突破性平衡: 技术黑话翻译: ⚫ MoE 混合专家系统:像医院分诊台,遇到数学题自动转接“数学博士”,写诗转接 “文学教授” ⚫ MLA 离线缓存:断网时可查看历史对话记录 避坑指南:若遇安装失败,检查存储空间是否充足,或关闭杀毒软件后重试 ③微信小程序(轻量化入口) 获取路径: 1.微信搜索"DeepSeek"公众号 2.后台发送关键词【小程序】获取专属链接 ⚫ 优势:无需注册,微信一键登录,适合快速查询天气、新闻等简单任务 ⚫ 限制:高峰期可能响应延迟,建议复杂任务切换至 APP 或网页版 ④电脑版(专业场景必备) 年市场策略”→生成可交互的 3D 知识网络 ⚫ 企业智慧大脑: 销售数据+客服录音+生产日志多源融合→自动生成经营决策建议( ②流程自动化矩阵 ⚫ 智能工作流: 邮件接收→AI 提取关键信息→自动创建待办事项→生成执行方案→推送进度提醒 ⚫ 跨平台协作: Excel 表格+微信聊天记录+邮件内容→自动整合为 CRM 客户档案 3.社会影响:重新定义工作边界 DeepSeek
    10 积分 | 21 页 | 1.01 MB | 6 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    降 本,增强竞争力。 在日趋激烈的工业市场竞争中,寻求部署新技术来提升综合竞争力,是企业的生存之道。而引领工业 革命浪潮的 AI 技术和大模型,是企业从多维度重塑自身生产方式、实现新质生产力的关键。 通过这本白皮书,工业领域的企业和合作伙伴可以更系统、更全面地了解 AI 技术如何为工业制造的各 个环节赋予怎样的智能化能力,以及英特尔在帮助企业落地部署 AI 技术方面所能提供的产品、平台和 左右。Gartner 预测,到 2027 年,中国制造业的 AI 使 用渗透率将以 10% 的年复合增长率上升。 随着技术的不断进步和应用场景的拓展,我们认为工业 AI 有望成为推动工业 4.0 和智能制造发展的关键力量。 1.1 工业 AI — 市场规模与增长潜力 03 01 工业人工智能 (AI) 行业观察 AI 技术在工业领域的应用,已经贯穿于产品设计、生产、管理、服务等众多环节,它主要通过各种方式收集海量数据,然后 在设备入库管理方面,AI 通过深度学习识别设备上的 条形码、二维码或设备特征,自动读取设备信息如型 号、序列号等;AI 的自然语言处理功能,可以自动 提取设备手册或标签上的文字信息,获取设备规格、 性能指标等关键参数。这些都能显著提升设备入库管 理的效率和准确性。 在设备运维管理方面,利用机器学习算法,对部署在 设备上的温度、压力、振动等各种传感器给出的监测 数据进行处理分析,实时监控设备运行状态,并可通
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    2 月 19 日 ,郑州大学国家超级计算中心、 计算机与人工智能学院、 信息化办公室携手攻坚 ,成功在超算中心设备上部 署本 地化“满血版” DeepSeek-R1 大模型( 671B ) 。在多个关键应用领域 , DeepSeek-R1 大模型展现出强大的实力 4.2 国产 AI 大模型 DeepSeek 走入高 校 知识问答 提 郑州大学 DeepSeek-R1 系列大模型正在对接学校统一身份认证平台 n AIGC 的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过 训练模型和大量数据的学习 , AIGC 可以根据输入的条件或指导 ,生成与之 相 关的内容。例如 ,通过输入关键词、描述或样本 , AIGC 可以生成与之 相匹配 的文章、图像、音频等 n AIGC 技术不仅可以提高内容生产的效率和质量 ,还可以为创作者提供更多的 灵感和支持。在文学创作、艺术设计、游戏开发等领域 简洁明确 示例驱动 考虑受众 明确角色 分解复杂任务 遵守规则 使用肯定性指令 自然语言回答 通用模型 n 需显式引导推理步骤(如通过“思 维链” 提示) ,否则可能跳过关键 逻辑。 n 依赖提示语补偿能力短板(如要求 分步思考、提供示例)。 n 提示语更简洁 ,只需明确任务目标 和需求(因其已内化推理逻辑)。 n 无需逐步指导
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
共 5 条
  • 1
前往
页
相关搜索词
华为DeepSeek解决方案解决方案2025R1Kimi1.5及类推理模型推理模型开发解读报告AI跃迁基础完全指南英特特尔英特尔工业人工智能人工智能白皮皮书白皮书年版赋能高校教学科研
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩