2025年超节点发展报告-华为&中国信通院CONTENTS 目录 超节点发展报告 02 当我们站在人工智能大模型技术飞速发展的十字路口,一个清晰的趋势已然浮现:大模型正沿着 “规模定律”不断演进,从预训练扩展到覆盖预训练、后训练、逻辑推理的全流程,其参数与集群 规模实现“双万” 跨越,行业模型落地需求专业化。 传统的服务器集群架构在这场变革中瓶颈愈发明显。千亿级模型一次梯度同步产生的 TB 级数据 让传统以太网带宽难以承受 超节点并非简单的硬件堆砌,它的实现离不开基础技术、系统能力与可落地性的三方协同。基础 技术是超节点的根基,其具备超高带宽互联、内存统一编址等技术特征,通过近乎无阻塞的高带宽 互联,将数百上千个 AI 处理器编织为一个逻辑统一的高密度计算体,为高效计算提供了底层支撑。 系统能力则是超节点高效运转的保障,它需要具备大规模、高可靠、多场景等系统特征。大规模的 组网能力突破了单机扩展的硬件限制,为大规模算力聚合提供架构支撑;高可靠的运行特性化解了 维管理深度融合,锻造出高性能、高效率、高可靠的 单一逻辑实体。它标志着一个全新时代的开启——智算基础设施正从松散组合的算力堆叠阶段,迈 入软硬协同、全局优化的超节点阶段,旨在有效破解超大规模 AI 训练与推理中所面临的扩展性瓶颈、 效率损耗与能耗墙难题,为 AI 的持续创新提供坚实、高效、绿色的算力基座。 为系统分析超节点技术的发展逻辑、技术创新、产业价值以及未来趋势,我院与华为及相关单位20 积分 | 31 页 | 4.79 MB | 2 天前3
DeepSeek如何加速金融业数字化转型?cn SAC 编 ÷ : S1440522070001 分析师:亓良宸 qi liangchen@csc.com.cn SAC 编 ÷:S1440524080005 本报告的核心逻辑 如何理解 DeepSeek 的出现对于国内金融业数字化转型的价值与意义 ? 一、低成本、高性能。 DeepSeek 通用及推理模型在性能不输头部同类大模型的基础上,成本相较于头部大模型下降至数十 落地,将竞争焦点从技术壁垒转向金融数据价值挖掘,推动 AI 能力与金融场景深 度融合, 以数据闭环体系巩固金融领域的场景化优势。 金融机构如何应用好大模型 ? 不断动态沉淀的本地数据及业务逻辑是金融机构利用大模型加速数字化转型的核心胜负手 ; “AI+ 金融”竞争力将取决于能否持续积累吸收高质量业务数据、深化垂直场景认知,并通过迭代形成“数据 - 模型 - 业务”的正向 循 部分以数字营销、海外投顾及保险数字化 三个场 景为例探讨大模型赋能金融业务的模式,第四部分归纳总结 DeepSeek 推动金融机构数字化转型的核心逻辑,最后一部分对券 商、保险、 信贷、供应链金融及其他金融科技机构业务逻辑的痛点和数字化价值进行深入探讨,以期对金融行业的智能化和数字化转型 提供参考。 核心观点 : Deepseek 的出现将加速金融机构的数字化转型 Deepseek10 积分 | 77 页 | 16.76 MB | 6 月前3
2025年智能化时代数据库自主可靠运维白皮书-腾讯云�� �� �� �.� AI对传统运维的影响 �.� AI在运维实践中的挑战 �.� 运维应当如何拥抱AI 第二章:稳定可靠运维面临的挑战 �.� 数据快速增长挑战 �.� 需求、逻辑实现不可控挑战 �.� 复杂技术栈挑战 �.� 应急体系建设挑战 �.� 数据安全、合规挑战 第三章:可靠运维服务体系能力建设分析 �.� 建设自主可控的运维团队 �.�.� 运维面临的挑战 第二章 随着数智化转型推进,海量数据爆发式增长,数据库作为数据底座,重要性越发凸显。对数据库可 靠性、灾备体系能力建设、故障恢复响应速度等提出了更高的要求。 数据库稳定可靠运维面临需求、逻辑实现不可控的挑战。 数据库稳定运行的最大挑战就是需求的合理性。一方面,在源头需求上,可能存在多个需求互斥、 技术无法实现或不合理等问题,无效以及不合理需求会让数据库高负荷运行,还可能引发类似 SQL注入的风险,威胁数据库安全。另一方面在需求设计上,常因无设计、业务人员设计、非专业 开发人员设计,误解需求或设计不合理,没有考虑实现路径和实现代价,导致慢SQL,增加数据库 负担。 此外,逻辑实现上有较大差异,能否选择合适的算法和实现路径,降低逻辑实现复杂度提升性能 面临挑战。 企业业务变得复杂多元,引入了新的数据技术,伴随着云、AI等新技术快速发展,以及国产化逐渐 深入,企业技术栈变得复杂多元,增加了数据库可靠运维的复杂度、难度和成本。20 积分 | 89 页 | 2.06 MB | 2 天前3
清华大学:DeepSeek赋能家庭教育) 。 2. 系统目标 长期目标 独立人格 、社会适应力 、终身学习(如培养责任感) 。 短期目标 解决具体问题:行为矫正(如拖延症) 、学业支持。 分领域目标 价值观(诚信) 、认知发展(逻辑思维) 、生活技能(自理) 、身心健康(情绪管理) 。 3. 系统内容 显性教育 学科辅导 、技能训练(编程 / 乐器) 、规则制定(作息时间) 。 隐性教育 家庭文化(餐桌礼仪) 、情感联结(亲子共读) 小时独立操 作 AI , 期间未 进行任何互动交流 孩子陷入机械操作, 失去人际学习中的 思维碰撞机会, 解题逻辑停留在工具依 赖层面 l 设定单次 AI 使用不超过 45 分钟 l 要求孩子每完成 3 个步骤必须 口头复述逻辑 l 家长每周至少参与 1 次 AI 协同 解题 2. 角色混淆 父亲用 DeepSeek 润色系统批改作文 对回答进行补充 家长可参与深度讨论, 形成多方对 话 需要家长指导信息甄别能 力, 培养媒体素养 学习效果 适合知识点巩固 、基础练习, 但 不适合深度理解培养 有助于培养分析能力 、逻辑思维和 创新思考 培养信息检索 、评估和综 合能力, 符合现代教育理 念 在家庭教育场景中,理想的做法是根据不同学习目标,灵活运用以上三种模式: • 日常作业辅导和基础知识巩固10 积分 | 89 页 | 9.10 MB | 5 月前3
AIGC+教育行业报告2024所助益,如教师侧的备课规划、作 业生成和批改,学生侧的自主学习、辅助练习、测试评估等,新技术与古老教育场景的结合,总会 产生令人欣喜的化学反应。然而,商业实践的落地是受到现实和周期限制的。从落地逻辑而言,当 前产品基本是原有教学场景和产品的替代,原有技术功能的优化迭代,而少有新场景的迸发;就落 地速度而言,尚不成熟的教育大模型落地,仍需学生思考和辨别能力的加持、以及相对明确统一的 评估标 打开了通向通用人工智能(AGI)之路,帮助师生大幅提升教学效率,推动大规模的因材施教逐步落地。 来源:公开资料,艾瑞咨询研究院自主研究及绘制。 1954 1956 1960 1965 1970 1973 推理期 将逻辑推理能力 赋予计算机系统 知识期 总结人类知识 教授给计算机系统 1982 1992 1996 2006 2012 2014 2016 2019 2022 2023 新行为主义 学习理论创 吻合 AIGC技术与现代教育,在教学内容、师资配置、交互方式方面有着巧妙的吻合之处,彰显着技术落地的必要性。现在的教育模式基本是 在工业革命进程中形成的,规模化和标准化是其基本特征,基于社会分工的逻辑,旨在为社会各行各业的发展培养可用之才。与此相对 应的,便是分专业的学科式架构、分级分班的规模化教学。AIGC技术应用下,大规模的通用数据与教育各学科的垂类数据并存,通识 教育和专业教育所需的内容均10 积分 | 55 页 | 3.32 MB | 6 月前3
华农财险全流程数字化研发管理实践com HOW&WHAT:保险数智化经营逻辑 初始条件 也是大多数中小险企的状 态 同质化 各公司虽业务方向不同,但经营模式和组织形式是高度同质化的 短期化 KPI导向的短期主义,缺乏核心能力沉淀 保险经营 底层逻辑 客户逻辑 客户获取,如何为客户解决问题、创造价值? 行业逻辑 做风险买卖的生意,拼的是对风险的识别/定价/ 管理 商业逻辑 降本增效,公司生存的关键! 构建核心能力0 积分 | 35 页 | 6.24 MB | 5 月前3
DeepSeek大模型及其企业应用实践也就是说,如果模型在回复你之前有一长 串的思考过程(这个过程必须可以显示输 出),探索了很多不同的路径之后给出答 案,那么有这个能力的大模型就是推理大 模型。推理模型的核心在于处理那些需要 多步骤逻辑推导才能解决的复杂问题。 推理模型的核心 1.4 大模型的分类 n 推理大模型DeepSeek R1的对话效果 1.4 大模型的分类 Sebastian Raschka博士(Lightning 强谁弱问题 n 如果你需要完成数据分析、逻辑推理、代码生成等逻辑性较强且较为复杂的任务,请选择推理大模型 n 如果你面临创意写作、文本生成、意图识别等发散性较强且较为创意多样的任务,请选择通用大模型 特性 推理大模型 通用大模型 适用场景 复杂推理、解谜、数学、编码难题 文本生成、翻译、摘要、基础知识问答 复杂问题解决能力 优秀,能进行深度思考和逻辑推理 一般,难以处理多步骤的复杂问题 运算效率 较高,响应速度快,资源消耗相对较小 幻觉风险 较高,可能出现“过度思考”导致的错误答案 较低,更依赖于已知的知识和模式 泛化能力 更强,能更好地适应新问题和未知场景 相对较弱,更依赖于训练数据 擅长任务举例 解决复杂逻辑谜题,编写复杂算法,数学证明 撰写新闻稿,翻译文章,生成产品描述,回答 常识问题 成本 通常更高 通常更低 2. 大模型产品 2.1 国外的大模型产品 2.2 国内的大模型产品 2.3 主流大模型“幻觉”评测10 积分 | 147 页 | 16.82 MB | 6 月前3
2025年智启未来·险见新机-人保寿险大模型探索及实践(33页 PPT)作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论 优势领域 函数调用、信息抽取、文本生成、创意写作、多轮对话、复杂角色扮演、打标、开放性问题,多样性高的 任务 数学推导、逻辑分析、代码生成、复杂问题拆解,逻辑密度高的任务 提示语 需显式引导推理步骤 提示语更简洁,只需明确任务目标和需求 适用场景 (功能点粒度) • 客服场景:做话术理解与意图分类,以及简单问题的回答;且时效性要求高 对 于机器智能输出的高效利用与转化 。 此理念倡导在 AI 技术的辅助下, 人类应持续深化提问的质量与深度, 充分利用 AI 的数据挖掘与模式识别能力, 探寻数据与知识 背 后的深层逻辑与规律 。 同时, 人类需对 AI 的输出进行精准解读, 并迅速转化为具有实际操作性的策略与行动, 以实现人机协同 的最大 化效益 。 问 探索性:“ 问 ”体现了对知识的主动探求,尤其是在使用 自动生成测试用例、 复 杂逻辑生成 • 寿险科技团队千人使用 ,周活跃人数数百人 ,并呈上涨趋势 • 累计采纳代码 百万行 • 开发任务繁重:伴随公司业务的快速扩展 ,开发团队面临着越来越多的任务和项 目 ,传统的手动编码方式已难以满足高效开发的需求 • 提升效率与质量:手动编写代码容易出现拼写错误、逻辑错误等问题 ,影响项目10 积分 | 33 页 | 2.82 MB | 2 天前3
大模型时代的AI教育:思考与实践2024为核心,是对真实世界的模拟和解释 人类智能 • 抽象(语言):概念,数字,理念 • 逻辑(理性):归纳,演绎,类比 • 计算(模型):科学方法 • 基于观测经验,发现规律 • MIT:一切问题都是模型问题 • 模型:一个映射,一个函数 科学范式 • 用语言逻辑方法获取理论模型:模糊 • 用解析数学方法获取数学模型:精确 • 用计算数学方法获取数据模型:近似 1. 专用任务模型:NLP、CV、Gaming…… 2. 通用任务模型:AIGC • Diffusion、transformer ◼ 从NLU+NLG到LLM(大语言模型) 1. 语言逻辑和数据集蕴含了人类的认知智能 2. LLM是人类的认知智能的实现方式之一 3. LLM的原理很简单;工程很复杂;效果很神奇 01 对AI技术的认知:大模型的能力边界 用人工神经网络获 文字处理:翻译、摘要、判别、生成等 • 人机界面:指令、信息、prompt 2. 知识助手场景:语言能力+知识能力 • 知识压缩、知识提取、知识组织 • 智能问答 3. 任务执行场景:语言能力+知识能力+逻辑能力 • 任务分解、任务执行 • 操作外部工具或软件接口 • Agent 三种应用类型 1. 模型增强:FT;MaaS;产品包装(ChatGPT) 2. AI赋能:用AI提高原有流程和工具的效率10 积分 | 36 页 | 4.04 MB | 6 月前3
未来网络发展大会:2025面向Web3.0的数字实体互联白皮书拥塞)、介质访问控 制(解决多设备共享同一传输介质的冲突)等。 为了实现数据能跨二层网络传输,网络层(也被称为三层网络)将数据抽象 为数据包(Packet),主要功能包括:基于 IP 协议进行逻辑寻址(如 IP 地址)、 路由选择(确定最佳路径)等,实现跨网络通信。三层网络与具体的网络介质无 关,极大扩展了网络互通的范围。 三层网络解决多个二层网络互联互通的问题,作为通信终端的主机之间的传 在实践层面,首先需要将非结构化数据转化为标准化的 RDF 图,这个过程通常 涉及实体识别、关系抽取等自然语言处理技术。领域本体(如医疗领域的 SNOMED CT)的构建则需要领域专家与知识工程师的深度协作。推理引擎基 于描述逻辑(Description Logic)实现自动化的知识发现。 该架构使机器能够理解"北京是中国的首都"这类陈述中的实体关系,而非仅 面向 Web3.0 的数字实体互联白皮书 13 将其视为字 能。Linked Data 项目证明,语义 网方法可使跨机构数据查询效率提升 40%以上。 4.问题与挑战 语义网的规模化应用面临三重障碍:技术层面,RDF/OWL 等标准学习曲线 陡峭,且逻辑推理存在性能瓶颈,难以满足实时需求。生态建设方面,数据标注 与应用开发陷入"先有鸡还是先有蛋"的困境,加之现有 Web 内容缺乏平滑迁移 路径,导致采用率低迷。架构设计上,过度集中的标准体系难以适应领域需求,10 积分 | 38 页 | 1.25 MB | 2 天前3
共 46 条
- 1
- 2
- 3
- 4
- 5
