积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(6)技术工具(6)

语言

全部中文(简体)(6)

格式

全部PDF文档 PDF(3)PPT文档 PPT(3)
 
本次搜索耗时 0.020 秒,为您找到相关结果约 6 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    文 案创作、 逻辑推理、 多模态理解、 多语言支持的能力。 通义千问这个名 字 有“通义”和“千问”两层含义 , “通义”表示这个模型能够理解各种语 言 的含义 , “千问”则表示这个模型能够回答各种问题。 通义千问基于深 度 学习技术 ,通过对大量文本数据进行训练 ,从而具备了强大的语言理解 和生成能力。 它能够理解自然语言 ,并能够生成自然语言文本 n ,为用户提供高质量、高效率、高个性化的内容服务 5.1.1 什么是 AIGC 大模型与 AIGC 之间的关系可以说是相辅相成、 相互促进的。 大模型为 AIGC 提供了强大的技术基础和支撑, 而 AIGC 则进一步推动了大模型的发展和应用 大模型和 AIGC 的结合 , 也带来了广泛的应用前 景 AIGC 的需求也推动了大 模型的发展 大模型为 AIGC 提供了丰 富的数据资源和强大的 计 i nd 软 件 , 通 过 文 件 - 导 入 - Ma rkdow n 进 行 文 件 的 导 入 , 最 后 就 能 马 上 渲 染 出 一 个 非 常 完 美 的 思 维 脑 图 。 将 我 们 准 备 好 的 电 子 书 上 传 到 Dee p Seek , 并 输 入 提 示 词 : 现 在 我 需 要 做 一 个 x m i nd 思 维 导 图 , 请 帮 这 份 文 档 输
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
  • ppt文档 浙江大学-DeepSeek模型优势:算力、成本角度解读2025

    L=(Cmin/2.3·108) )-0.050 10-3 10-1 Compute PF-days,non-embedding 大模型指导法则 Scaling Law: 富则火力覆盖 数据集 模型参数量 7 6 5 4 3 ---- 2+ 10-9 Dataset Size tokens Parameters non-embedding GQA MLA MLA N.A 上下文长度 4K 128K 128K 128K 训练成本 (GPU Hours) 300.6K 172.8K 2.788 M 30.84 M 发展历程:穷则战术穿插 DeepSe ek DeepSeekMoE Routed Expert Shared Expert Feed-Forward Network Router hll Top-K, OOO0 … … OOOO Input Hidden ut ■ 核心技术 DeepSeekMoE: 显者减少计算量 ( 穷则战术穿插 ) ■ 针对美国的算力禁令 ■ 核心思想: 1 共享专家 +256 路由专家,激活 8 个路由专家 ■ 共享专家: 捕获通用知识、降低知识冗余 ■ 路由专家: 量大、细粒度、灵活组合、方便知识表达
    10 积分 | 23 页 | 7.53 MB | 5 月前
    3
  • pdf文档 AI跃迁派:2025年DeepSeek零基础完全指南

    知识管家:自动整理会议录音→生成思维导图→提炼待办事项 ⚫ 语言翻译:支持 42 种语言互译,自动适配文化差异(如把“摆烂”翻译成 “quietquitting”) 局限:复杂逻辑问题需升级至 R1 版本 模块 2:深度思考(R1)——决策智囊团 技术突破: ⚫ 思维链可视化:像老师写板书一样展示推理步骤(如解方程时先分解条件再推 导) ⚫ 反事实推演:模拟“如果特斯拉降价 典型应用场景: ①学生党:从题海战术到精准学习 ⚫ 论文润色:上传论文草稿→输入“优化学术表达,确保符合 APA 格式”→10 分钟完 成专业级修改 ⚫ 知识点图谱:输入“用思维导图整理高中生物遗传学核心概念”→生成可打印的学习 框架 ⚫ 解题思路:拍摄数学题照片→R1 模式自动分步解析,错误点用红框标注 ②职场人:效率提升 300%的办公神器 ③创业者:零成本搭建专业团队
    10 积分 | 21 页 | 1.01 MB | 6 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    技术的应用正为工业领域带来前所未有的创新性变革。而且,工业领域对 AI 技术的部署,正在随着 AI 技术本 身的发展和工业应用复杂性的增加,日渐从传统的 AI 技术向更加复杂的工业大模型过渡。 传统 AI 技术则主要基于规则和知识库实现智能工作,它通常使用神经网络结构,通过大量数据进行训练,来获得较好的性 能。传统 AI 具有较强的实时性,能在特定场景下快速解决问题。但是,对于更加复杂的多样化应用场景,比如需要处理文 处理器在全范围工作负载上表现出色,其主流系列产品拥有 8-86 个内核,在基于双 CPU 的 系统中,网络和存储外接卡拥有多达 176 个 PCIe 5.0 通道,而基于单 CPU 的系统中,单插槽产品则拥有 136 个 PCIe 通道。 所有英特尔® 至强® 6 处理器都能随着服务器利用率的增加而提供可扩展的每瓦性能,在整个负载线路上提供近乎线性的功 耗-性能消耗,这凸显了所有英特尔® 至强® 6 Interconnect, 英特尔® UPI)2.0 的跨插槽内带宽速度高达 24 GT/s, 与上一代产品相比提升高达 20%。 • 双路服务器拥有多达 178 条 PCIe Gen 5 通道,单路服务 器则多达 136 条,可以支持重要的 I/O 附加组件,包括加 速器、网络适配器、存储控制器和存储。 • 多达 64 条 Compute Express Link (CXL) 2.0 通道,每 条通道的数据传输速率高达
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • ppt文档 华为昇腾DeepSeek解决方案

    网络级负载均衡实现网络 动态路由,有效吞吐达 98% 控 制器 全 局集 中 算路 自 动生 成 路径 并 动态下 发网络 获取网络拓扑 网络局部计算选路 Hash 冲 突 导 致 有 效 吞 吐 不 足 50% 拥塞 空闲 超大集群线性度 90%+ L2 层 下发路 径 L1 层 分布式并行 风险评估、法律文档 审核、智能流程 智能问答、文本摘要、 法律 / 医疗咨询 智慧政务、金融风控、 医疗辅助、 企业办公、知识问答、 思维导图 …… 教育科研、办公应用 19+ 生态伙伴基于昇腾推出一体机方案,满足不同行业场景 需求 OEM 伙伴 APN 智能客服、内容创 作、医疗影像 AI PC 工作站,本 地办公应用
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    程,以确保答案的准确性。 ➢ 反思是指模型会回溯检查自己之前的推理过程,并根据检查的结果进行修正,相当于一个学 生在复习时,会反思自己之前的错误,以便下次不再犯同样的错误。 ➢ 而长链推理能力则让模型能够处理更复杂、更需要多步骤思考的问题。这种能力对于解决一 些需要跨越多个逻辑步骤才能找到答案的问题至关重要,例如复杂的数学题或逻辑谜题。 ➢ 冷启动让RL训练更加稳定: ➢ 避免 RL ,首先利用一些带有推理过程的 Few-Shot Examples 来 Prompt 模型对于数据集中的问题生成对应的推理过程和答案。 ➢过滤:如果生成的答案正确,则将推理过程加入到原有的数据集中;如果生成的答案错误,则尝试 在给出正确答案的前提下再次生成推理过程。将最终生成正确答案的推理收集,构建一个构建一个 微调数据集 [Question, Rationale, Answer ] 进行微调。 ➢迭代:重复这一
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
共 6 条
  • 1
前往
页
相关搜索词
DeepSeek模型赋能高校教学科研2025浙江大学浙江大学优势算力成本角度解读AI跃迁基础完全指南英特特尔英特尔工业人工智能人工智能白皮皮书白皮书年版华为解决方案解决方案R1Kimi1.5及类推理推理模型开发报告
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩