积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(6)技术工具(6)

语言

全部中文(简体)(6)

格式

全部PDF文档 PDF(3)PPT文档 PPT(3)
 
本次搜索耗时 0.020 秒,为您找到相关结果约 6 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 华为昇腾DeepSeek解决方案

    大模 型 核心 收益效果 Huawei Proprietary - Restricted Distribution DeepSeek 9 大模型从技术摸高走向技术摸高 + 工程创新并行 ,训练需求持续增 长 ① 技术摸高:头部玩家将战略坚定投入预训练基础模型创新,丰富模型组合,追逐 Scaling Law ,加速探索 AGI ② 工程创新:新的范式降低后训练和蒸馏门槛,模型效果大幅提升, DeepSeek-R1-Distill-Qwen-1.5B (蒸馏后较原模型能力提升 10%+ ) BERT-Large Transformer ● 2 工程创新 新一轮百模千态 1 技术摸高 新一轮技术竞争 GPT-4/4o GPT-3/3.5 175B . Huawei Proprietary - Restricted Distribution PalM(540B) . 730 Token/s@14B 956 Token/s@8B 956 Token/s@7B 80 路 @14B 115 路 @8B 115 路 @7B 昇腾 DeepSeek 一体机: 大吞吐 + 高并发, 加速行业模型落地 模型参数: 14B/32B DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill-Qwen-14B
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    25 日 厦门大学 林子雨 副教授 国 内 高 校 大 数 据 教 学 的 重 要 贡 献 者 团队负责人 :林子雨 副教授 年轻力量: 核心成员全部 46 周岁以下 结构合理: 教学型、 科研型、 实验工程师 专注专业: 从 2013 年至今 , 11 年专注于大数据教学 团队特点: 眼光前瞻、 紧跟技术、 创新实干、 执行力 强 影响力高: 多项指标在国内高校大数据教学领域领 先 • GPT-4 的参数规模是 GPT-3 的 10 倍以上 ,达到 1.8 万 亿, 2021 年 11 月阿里推出的 M6 模型的参数量达 10 万亿。 3.1 大模型的概 念 训练数据量大 计算资源需求高 参数数量庞大 大模型的设计和训练旨在提供更强大、 更准确的模型性能 , 以应对更复杂、 更庞大的数据集或任务。 大模型通常能够学习 到 更细微的模式和规律 ,具有更强的泛化能力和表达能力 学习能力强 们在解决复杂问题和应对新的 场 景时表现更加出色 上下文理解能力 大模型具有更强的上下文理解能 力 ,能够理解更复杂的语意和语 境 。这使得它们能够产生更准确、 更连贯的回答 可迁移性高 学习到的知识和能力可以在不同 的任务和领域中迁移和应用 。 这 意味着一次训练就可以将模 型应 用于多种任务,无需重新 训练 语言生成能力 大模型可以生成更自然 、更流 利 的语言,减少了生成输出时
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    英特尔® 工业人工智能白皮书 2025 年版 Intel® Industrial AI Playbook 2025 Edition 编委会: 主编:刘 俊、马小龙、朱永佳 编委:方辛月、高 畅、高杨帆、胡 杨、刘 波、吕晓峰、邱丽颖、单 娜、张 恒、张心宇 * 编辑按姓名首字母排序 人工智能 (AI) 技术的快速发展掀起了新一轮工业革命浪潮,通用大模型的出现让 AI 技术从专用化迈向 技术在工业领域的应用推向了新的发展阶段。其具体落地将会以基础大模型为技术底座,融合工业细 分行业的数据和专家经验,形成垂直化、场景化、专业化的工业大模型。工业大模型相对基础大模型具有参数量少、专业度 高、落地性强等优势,可以为工业垂直领域的技术突破、产品创新、生产变革等提供低成本解决方案。 尽管传统 AI 技术和大模型在解决各种工业问题方面,从理论上讲存在诸多明显优势,但是要将 AI 技术和大模型真正成功落 html 20 02 英特尔 ® 技术方案 2.1.3 英特尔® 至强® Max 系列 & 英特尔® 至强® 6 处理器 英特尔® 至强® Max 系列处理器 作为唯一一款基于 x86 的高带宽内存 (HBM) 处理器,英特尔® 至强® Max 系列处理器 可最大程度提高带宽。英特尔® Max 系列 CPU 在架构设计上大幅增强采用 HBM 的 英特尔® 至强® 平台的性能,相较于竞品,其针对实际工作负载的性能提升了
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    rStar-Math, SoS 都可以用类似的思路来理解。 ➢ 本质上,STaR一类的方法是希望模型能够学习到MetaCoT, 即问题到答案映射 过程背后的深入规律 ➢ 但是对于问题的结构要求性高,对于复杂数学推理任务可能难以自我迭代 ➢ 难以融入 Rule-Based Reward for RL训练 ➢ PureRL加持下,业界的技术实践更多Focus on 直接利用RL激活基座模型的推理潜 的奖励优化,赋能长思维链安全的验证 44 技术对比讨论:Over-Thinking ➢ 强推理模型存在Overthinking的行为 ➢ 过多的语气词,例如 Wait 等 ➢ 一些模型经常会不分场合使用一些高 端词汇,典型的如量子纠缠(会用在 各个领域) ➢ 对于一些简单的数学问题例如 2+3 =? 也会过多思考 ➢ 看似有反思范式,重复Pattern多,可能会 导致更好的表现,但是会带来training txt),从而避开了应当通过漏洞利 用的安全挑战。 ➢ 模型利用错误配置的基础设施,跳过了原本设计的任务步骤,实现了任务目标。 ➢ Anthropic :语言模型在面对奖励设计时,可以通过不正当的方式获得高奖励,甚至通 过 “奖励篡改” 修改自己的奖励机制,来避开设置的难点。 [1] Sycophancy to Subterfuge: Investigating Reward-Tampering in
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • ppt文档 浙江大学-DeepSeek模型优势:算力、成本角度解读2025

    成本:低 ( 战术穿插 ) ■ 算力受限,近几年咬住会更难 ( 大家宽容些 ) ■ 突破工艺卡脖子,实现“战术穿插” +“ 火力覆盖” ■ 中芯国际等硬核大厂突破工艺卡脖子 ■ 华为等算力公司提供高算力密度 ■ 个人预测 Al 竞赛结果 ■ 以中国的工业化水平,站着把 Al 的钱给挣了。 ■ “健身可以让 SB 跟你好好说话”→ ■“ 突破模型、算力卡脖子可以让 A 国跟咋们好好说话”
    10 积分 | 23 页 | 7.53 MB | 5 月前
    3
  • pdf文档 AI跃迁派:2025年DeepSeek零基础完全指南

    ⚫ 量子退火算法:解决传统计算机无法处理的组合优化问题(如全球物流路径规 划) ⚫ 超导量子比特:训练速度提升 1000 倍,模型参数突破百万亿级 应用场景: ⚫ 1 小时优化全国高铁时刻表,减少 30%能源消耗 ⚫ 破解蛋白质折叠难题,加速癌症药物研发 ②多模态深度对齐 ⚫ 跨模态理解:通过神经符号系统实现图文音统一编码(如从建筑设计图生成施工 解说视频)
    10 积分 | 21 页 | 1.01 MB | 6 月前
    3
共 6 条
  • 1
前往
页
相关搜索词
华为DeepSeek解决方案解决方案模型赋能高校教学科研2025英特特尔英特尔工业人工智能人工智能白皮皮书白皮书年版R1Kimi1.5及类推理推理模型开发解读报告浙江大学浙江大学优势算力成本角度AI跃迁基础完全指南
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩