DeepSeek洞察与大模型应用-人工智能技术发展与应用实践MLA多头潜在注意力机制(降低显存占用) • MTP多token预测(提升效果、提升推理速度) • FP8混合精度训练、DualPipe流水线、MoE负载 均衡(提升训练效率,降低训练成本) DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和 世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 DeepSeek-V3 -4- a不会因此减少AI支 出:“我仍然认为,从长远来看,大力投入资本支出和基础设施建设将成为一种战略优势。” 卷积神经网络之父Yann LeCun: “与其说中国AI正在追赶美国,不如说开源模型正在超越 闭源”。 Anthropic CEO达里奥·阿莫迪:我认为一个公平的说法是“ DeepSeek 生产的模型接近 7-10 个月前美国模型的性能,成本要低得多(但远不及人们建议的比例) ” 配和生态方面还有显著差距 vs. -15- 中美在AI领域的对比:头部大模型 n 在模型效果上,中国大大缩小了与美国的差 距,呈现与美国平分秋色的格局 n 模型开源领域:DeepSeek超越Meta,成 为效果最好的开源模型,阿里巴巴千问系列 模型下载量超过Meta的Llama系列 模型厂商 国家 代表性模型及竞技场排名 是否开放 模型权重 谷歌(Google) 美国 Gemini-210 积分 | 37 页 | 5.87 MB | 7 月前3
基于大语言模型技术的智慧应急应用:知识管理与应急大脑BERT)的能力,来调整多层神经网络 模型的内部大量神经元连接权重参数,实现对知识 的获取。这一参数调优过程在连续平滑数值空间进 行,与符号化表示的知识获取中的离散符号操作相 比,可以捕捉更为复杂和细致的规律,实现对过往 经验的超越。 1.1.4 知识分布式隐式表示 与符号化知识表示不同,模型获取的知识内嵌 于神经网络模型的海量参数中,无需对其进行显式 表示,这种分布式隐式表示能够处理符号化知识表 示无法处理的情况,例如,无法言明的复杂知识。 可能,打破了传统知识壁垒,有利于知识的连接和 融合,促进了应急知识的创新。相比较于知识的符 号化表示,数值表示的知识能反映更复杂、更细微 的事物本质及其变化规律,能通过数值空间的向量 操作来完成特定知识任务,这使得应急知识的应用 能超越过往经验。根据新的应用场景进行适应性调 整,对于理解和处理复杂的应急管理情境至关重要, 能极大地促进应急知识的应用场景创新[26]。 3.1.2 知识共享 依赖于大模型的自然语言处理能力,用户可以 利用大语言模型技术建设应急管理知识生产网 络中的超级节点,将各领域的行业专家、各学科的 专业学者、各应急部门的专业人员等各类应急知识 生产者有机联合起来,参与每一轮问题解决中,最 大化网络中节点联结密度,超越跨学科知识生产中 知识生产场所和应用场景的物理局限,实现知识生 产的人机协作。应急知识生产超级节点作为网络中 联结密度最高的节点,扮演了一个交流中心的角色, 在与知识生产者交互中加深认识、产生联想、激发20 积分 | 8 页 | 3.21 MB | 1 月前3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT)的表现超过人类水平。 大模型能力不断增长 Source: https://lifearchitect.ai/timeline/ 大模型发展迅速,参数量从百亿到万亿规模 大模型能力涌现,多个任务上性能超越人类水平 1000 Billion 开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率 横空出世: OpenAI o1/o3 、 DeepSeek- R1 等 o1 在数学和代码问题上的水平大幅提升 ,超越人类专 家 开源大模型 DeepSeek R1 匹敌 OpenAI o1 DeepSeek 的 “ aha moment” 这种深度推理能力是如何实现的?是单纯的规模扩展结果,还是有其他关键因素?20 积分 | 61 页 | 13.10 MB | 1 月前3
从DeepSeek探讨大语言模型在建筑及能源行业的应用趋势和技术方法Jumper muwirotons nika s emenod David Baker hustralans; niklas emehed DeepSeek 横空出世,各项指标逼近或超越 ChatGPT o1 9/80 口核心意义:打破 AI 垄断,带来 AI 平权,尤其是中文 Al 普惠,激发大众创造力 多 源 数 据 深 度 挖 掘 融合建筑领域各类数据,联动设备 智能化变革,为未来的可持续发展提 供了 强大动力 口对于即将到来的 AGI, 无论是 OpenAl 还是 DeepSeek, 以及这个世界,都 还没 有做好充分准备 口这些人工智能在数量和质量上都将超越人类,会以前所未有的速度处理信息,并 生成超出人类理解的新解决方案。 口有可能在短短的 10 年内,人工智能就会复杂和超级智能到我们甚至无法理解 它 是如何运作的地步。 口和届时的 AGI10 积分 | 78 页 | 33.88 MB | 7 月前3
金融-DeepSeek银行部署加速,AI金融应用迎来跃迁结合了优化的训练策略,扩展了训练数据集和模型规模。通过这些改进, Janus-Pro 在多模态理解和文本到 图像的指令跟踪功能方面都取得了重大进步,同时还增强了文本到图像生成的稳定性。 n 作为在 GenEval 等评测中超越 DALL-E 3 和 Stable Diffusion 3-Medium 的开源模型, Janus-Pro 也展现出了更多应用潜力。 图表: Janus-Pro 多模态理解和视觉生成表现 资料来源:10 积分 | 25 页 | 1.44 MB | 1 月前3
人工智能大模型保险行业应用评测报告(21页 PPT)保险常识问答能力指数 应用能力评测:保险专业知识问答 知识问答主要评测大模型的交互性、准确性等基础能力。国内外头部大模型在基础知识问答能力上的表现整体较好,国内头 部大模型基于中文语境优势,能力指数已实现超越 法律知识问答能力指数 医疗知识问答能力指数 文心一言 清华智谱 GPT- 4 ** 大模型 ** 大模型 ** 大模型 ** 大模型 ** 大模型 ** 大模型 ** 大模型 文心一言20 积分 | 20 页 | 3.47 MB | 1 月前3
实现自主智能供应链:2035年企业竞争的新高地并致力于实现全新方式的人机协作,则有望引领 一场全面重塑。 通过奠定坚实的数据基础、投资技术赋能, 并提升员工能力,企业将拥有开启持续价值创造 征程所必需的基础设施。更重要的是,自主化智 能系统提供了推动供应链超越传统职能范畴的 契机,进而实现整个业务端到端的彻底重塑。 实现自主智能供应链 26 实现自主智能供应链 在当今日新月异的商业环境中,要保持领先地位,就需要拥抱创新,并用好新兴技术。无论您处于0 积分 | 28 页 | 2.74 MB | 4 月前3
大模型技术深度赋能保险行业白皮书151页(2024)复杂数学问题上具有天然的优势,这使得量子计算在未来有可能成为大模型训练的重要 工具,有望为大模型的训练提供新的解决方案。例如,IBM和Google等公司已经在量子计 算领域取得了一些初步的成果,展示了量子计算机在特定算法上超越传统计算机的潜力。 (4)云计算资源的扩展 云计算平台如AWS、Azure和Google Cloud不断扩展其计算资源,提供了更灵活、更 强大的计算服务。这些平台的支持使得研究人员和企业能够更容易地访问到高性能的计 的里程碑。 今年9月,面壁智能再度发力,推出了MiniCPM 3.0基座模型,该模型以仅40亿参数的规 模,在自然语言理解、知识问答、代码生成、数学推理等多个核心能力上实现对GPT-3.5的 超越,同时在与Qwen2-7B、Phi-3.5、GLM4-9B、LLaMa3-8B等国际知名模型的对比中脱颖 而出,展现了其卓越的“以小博大”能力,进一步巩固了面壁智能在端侧AI领域的领先地 位。这 保险 能力的测评框架,对保险公司大模型研发团队及应用项目团队,为优化模型和场景应用提 供了相对全面的视角。 图7 S-Eval评测层级 �� �� 大模型在保险行业等多个领域内已展现出超越传统方法的能力水平,为理赔定损、 客户服务、销售支持等方面带来了革命性的改变。然而,纵观技术发展史,每一次新技术 的革命性飞跃都伴随着社会的深刻变革与潜在的不确定性。随着大模型在保险行业应用20 积分 | 151 页 | 15.03 MB | 1 月前3
信息服务-AI Agent(智能体):从技术概念到场景落地风险提示;智能体商业化不成熟,智能体下游需求不足。 4.8 字节跳动:豆包聊天助手 在中国的 AI 聊天机器人竞争中,字节跳动已抢占先机。其最新推出的 AI 对话服务 豆包在下载量和活跃用户数上均超越了百度的文心一言。根据华尔街见闻援引互联网分 析公司 Sensor Tower 的数据,自去年 8 月推出至今年 4 月,豆包在 iOS 系统上的下载 量近 900 万次,领先于文心一言的 800 万次。在月活跃用户数方面,豆包在10 积分 | 33 页 | 4.71 MB | 1 月前3
基于大模型的具身智能系统综述成功地在现实世界中模拟动物行为 并穿越复杂障碍, 在设计好的多智能体追逐游戏中 展示出类似动物的策略和敏捷性. 5 结束语 具身智能作为未来智能系统的关键发展方向, 通过与物理环境的紧密互动, 正逐步展现出超越传 统离身智能的潜力. 本综述聚焦于揭示基础模型如 何推动具身智能的演进. 在感知与理解方面, 端到 端模型实现了对复杂环境的深入理解与动态适应; 在规划层面, 从需求级到动作级, 大模型通过生成 任务计划和序列化动作20 积分 | 19 页 | 10.74 MB | 1 月前3
共 11 条
- 1
- 2
