中科海光:2025年深算智能:海光DCU行业实战手册小步快跑发版节奏 满足快速变化需求 开源开放 打造开源开放社区 加速DCU生态建设 DAS(DCU AI Software Stack)提供AI算子优化库、AI模版库、AI编译器、基础AI框架、推理框架和三方套件,并通过OpenDAS 以开源方式提供AI扩展套件服务。 DAS与 ModelZoo、镜像仓库、创空间、开发者社区、AI 平台等构成一套完整的人工智能基础设施,全栈全场景赋能用户AI应用研 PyTorch/TensorFlow/JAX/Paddle/� 精度检测工具 LayerCheck 图优化组件 GraphRay 通用推理框架 ONNXRuntime/MIGraphx/� 融合算子库 LightOP 算子模板库 CUTLASS AI编译 Triton/XLA 大模型训练组件 大模型推理组件 通用训练组件 Apex Torchvision PyTorch Scatter MMCV ... Torchaudio 预定义组件 MCP调用 DAP 大模型 平台 云原生AI平台 模型推理服务 大模型 推理加速 大模型 分布式推理 模型 纳管 模型微调 微调 算法 模型 评估 模型训练加速 大模型 训练加速 大模型 分布式训练 数据处理 模型微服务 数据 标注 多数据 源支持 数据 批处理 标准API 高效推理引擎 优化的模型 容器化部署 DAP人工智能应用平台定位于企业级大模型开发10 积分 | 25 页 | 13.99 MB | 20 天前3
基于DeepSeek AI大模型CRM客户关系管理系统应用方案(156页 WORD)化处理,确保数据质量满足大模型的训练和推理需求。具体步骤包 括去除重复数据、填补缺失值、数据归一化以及通过正则表达式处 理文本数据。对于非结构化数据(如客户反馈、邮件内容),将使 用自然语言处理(NLP)技术进行分词、词性标注和情感分析。 接下来,DeepSeek 大模型的部署将采用容器化技术,通过 Docker 和 Kubernetes 实现模型的高可用性和可扩展性。模型训 练和推理任务将在 GPU 集群上运行,以提升计算效率。同时,模 智能推荐接口:根据客户历史行为和当前情境,提供个性化产 品和服务推荐。 情感分析接口:分析客户反馈和评论,输出情感评分和改进建 议。 性能优化是确保系统稳定运行的关键。通过对模型进行量化、 剪枝和蒸馏等技术处理,将其推理速度提升 30%以上。同时,引入 缓存机制(如 Redis)以减少重复计算,并利用负载均衡技术动态 分配计算资源。为监控系统性能,将部署 Prometheus 和 Grafana 进行实时监控和告警。 最后,为确保方案的可维护性和可扩展性,技术架构设计采用 微服务模式,每个功能模块独立部署和管理。以下是模块划分: 数据采集模块:负责从多渠道收集客户数据。 模型训练模块:定期更新和优化 DeepSeek 大模型。 推理服务模块:提供实时预测和分析服务。 监控运维模块:保障系统稳定性和性能。 通过以上技术方案,CRM 系统将能够充分利用 DeepSeek 大 模型的强大能力,提升客户服务质量和管理效率。20 积分 | 166 页 | 536.03 KB | 13 天前3
软件工程智能化标准体系建设指南(2025年)开源模型构建工具,底 层核心算法(如语义理解、代码推理)可控性不足,引发性能瓶颈和 安全风险。同时,工具输出格式不兼容,多源异构数据因协议割裂形 成孤岛,开发、测试、运维等环节数据独立存储,格式互斥,严重阻 碍企业协同与产业合力形成,制约软件工程智能化的规模化发展。最 终形成“智能注入越深,技术债务累积越快”的恶性循环。 2.动态推理能力不足已成为大模型在软件工程领域落 地的核心技术瓶颈 地的核心技术瓶颈 尽管当前大模型的上下文窗口已扩展至数万甚至百万级 token, 但在涉及多步骤状态转移和复杂逻辑推理的场景中仍存在显著局限 性。研究表明,对于需要递归回溯的编程任务(如调试、算法优化), 大模型的解决方案通过率显著低于人类开发者的平均水平,且错误类 型集中于状态追踪失误和逻辑断层。 软件工程智能化标准体系建设指南(2025 年) 8 3.数学建模与算法设计的理论基础不足仍是制约 验证等场景,其生成结果的准确性普遍低于人类专家水平。即便结合 知识图谱的 RAG 可有效降低幻觉风险,但在涉及形式化数学证明的关 键环节,仍需人工介入进行逻辑校验和修正。研究表明,在需要严格 数学推理的代码生成任务中,LLM 的验证通过率远低于人类开发者, 且错误类型主要集中在数学假设不成立和边界条件处理缺失。 (二)工程侧痛点:人机协作的实践困境 1.智能组件“悬浮式”嵌入现象普遍,全生命周期呈现0 积分 | 39 页 | 1.76 MB | 20 天前3
2025年智能驱动增长:人工智能客户关系管理(AI CRM)系统研究报告合 等方向演进。 (二)智能化核心能力演进 通过引入 AI 技术,CRM 系统的智能化核心能力正经历从辅助工 具到智能中枢的转变。当前,AI 赋能下的 CRM 系统已具备感知、理 解、推理、决策等多元能力,呈现出以个性化、自动化、预测性和轻 便化为核心特征的整体能力结构全面提升。 1.智能洞察与个性化演进 AI 技术显著提升了 CRM 系统对客户的理解与个性化响应能力。 在 API 来转录销售电话,调用情感分析 API 来判断客户邮件的情绪, 或者集成一个独立的 AI 工具来进行销售预测。在此架构下,CRM 平 台主要承担数据源供给与结果展示功能,AI 核心计算及模型推理环 节则由外部独立系统完成。 该技术路线的核心优势体现在战术层面的快速响应与灵活部署 能力。当企业面临具体业务痛点时,可直接采购成熟 AI 工具进行集 成,通常能在短期内实现问题解决与效果验证。对单一应用场景而言, API 驱动的云端大模型核心实现范式:CRM 应用将用户 自然语言指令、待处理文本(如电子邮件、通话记录)或需分析的数 据片段封装处理后,经 API 调用传输至第三方通用大模型;大模型在 云端完成推理,并将生成结果返回给 CRM 系统,最终由 CRM 系统 在完成数据处理后向用户呈现结果。在这一架构下,CRM 平台承担 用户交互界面与任务编排层功能,真正的智能中枢则完全外置于第三 方服务商的云端。20 积分 | 71 页 | 1.91 MB | 13 天前3
金融业AI大模型智算网络研究报告方式下,高负载链路利用率:低负载链路利用率达7:1,即流量 无法有效hash,高负载链路堵点概率极大。因此对网络负载均衡 4 调优、无损传输等提出了更高要求。同时大模型的训练和推理也 对网络的可靠性提出了更高要求,任何网络中断都可能导致训练 失败或推理错误,降低集群算力的效率。 三是高可维网络挑战。大模型单次训练时间在数天-月级。 训练期间如果出现网络不稳定的问题,会影响整个训练任务的进 度。且大模型训 OPT-175B训练,故障定位平均时长约11小时,复杂应用故 障定位长达80小时。因此需要一套具备精细化监控、端网一体化 的,且可一键故障定界、定位及自愈的技术手段,来提升智算网 络易用性。 四是高安全模型保障。在推理和训练的各个阶段,大模型都 可能成为网络攻击的对象,因此需要采取额外的安全措施来保护 模型不受侵害,保障数据的保密性和完整性,防止数据泄露和滥 用。此外,大模型基础设施在端到端供应链的安全性、稳定性和 赖于高性能和高可用的网络。在分布式计算环境中,多个计算节 点需要频繁地交换数据和模型参数,这一过程的流畅与否直接关 6 乎集群计算效率。高性能的网络能够确保数据快速传输,减少节 点间的等待时间,从而加速训练或推理过程;高可用的网络使得 AI 任务并行处理更加稳定高效,从而优化网络通信瓶颈。因此, 高性能、高可用,且具备高效运维的网络是 AI 大模型训练的重 要条件。 (二)业界智算网络方案 围绕着智算网络提升10 积分 | 33 页 | 1.70 MB | 1 天前3
2024全球计算产业应用案例汇编(GMVPS)工业物联网关AI Agent由大语言模型(LLM)、规划技能、记忆系统和工具基础架构所构成。首先, 大语言模型(LLM)为Agent提供强大的自然语言理解和生成能力,使其能够理解复杂的语言指令、推理 用户意图并生成流畅、准确的回应。其次,规划技能使Agent能够根据任务的目标和要求制定合理的行动 计划,协调和优化多步骤的决策过程,从而有效地执行更为复杂的任务。第三,记忆系统使Agent能够存 AT9508 G3训推一体机专为模型推理、高密度标卡训练、渲染及HPC等场景量身定制解决方 案,在金融、政府、运营商等行业的典型业务场景有广泛应用。 案例亮点 case HigHligHts 1 技术领先:支持10张双宽或20张单宽AI加速卡,训推一体场景无忧。 2 生态适配广:支持第三方主流AI加速卡,满足多样算力需求。 3 深入AI场景:支持推理、训练、渲染、HPC等,满足多元化AI应用需求。 华鲲振宇HuaKun AT9508 G3训推一体机为业界首款基于国产鲲鹏处理器底座并支持昇腾AI卡以及第 三方卡的AI服务器。 1、高密度AI算力支持:支持多达10张全高全长双宽或20张单宽AI卡,在AI训练、推理等场景下的算 力性能行业领先,满足了用户对极致算力的追求。 2、安全可靠自主可控:基于国产鲲鹏处理器底座,处理器通过严苛的安全可靠测评,结合故障核在 线隔离与提前预测等技术,构建了全方位的安全10 积分 | 141 页 | 8.88 MB | 6 月前3
具身智能标准化研究与评测方法探索在三维空间中实现环境感知、动态决策与自主行动, 构建起“感知—决策—执行”的闭环智能系统。该理 念可追溯至 1986 年 Rodney Brooks 提出的“包容式架 构” [1],它颠覆了传统 AI 对符号推理的依赖,主张智能 应通过身体与环境的实时交互自然涌现。2025 年北 京亦庄人形机器人半程马拉松赛事中参赛机型展现 出的环境适应能力,在一定程度上标志着具身智能已 从实验室验证迈向产业化落地。 多模态人机交互与社会行为感知 具身智能 核心技术 语义同步成功率 通信时延 空间语义建图 模型识别率 迁移成功率 历史知识保持率 自然语言理解率 意图识别精度 合规性 隐私数据隔离 因果推理准确率 任务规划成功率 动作精度 执行能耗 模块操作失败率 平台兼容性 魏家馨,马瑞涛,滕一阳,王 芃 具身智能标准化研究与评测方法探索 本期专题 Monthly Topic 49 [17]。当前主流系统普遍采用层级架构, 将语言理解、策略生成与运动控制分层解耦,提升智 能体的泛化能力与场景适应性。该核心技术的代表 性标准及评测指标包括任务规划成功率、因果推理准 确率、路径最优性、响应时延、推理链完整度等,典型 场景包括服务机器人、自主巡检系统等。 c)形态驱动的行为生成与低功耗控制。具身智 能强调形态结构与控制策略的耦合,例如通过柔性材 料、可变刚度结构实现的顺应行为控制10 积分 | 7 页 | 1.41 MB | 1 天前3
具身智能的基础知识(68页 PPT)行动 闭环,智能通过身体与世界的互动动态形成。 > 离身智能 (Disembodied Intelligence) : 指不依赖物理身体,主要在虚拟或符号空间中通过计算和算法 处 理信息、进行推理的智能形式 . > 反身智能 (Reflexive!Intelligence) : 指智能体能够监控、评估并调整自身的内部状态、决策过程和行为 策 略,具备某种程度的“自我意识”和反思能力。 大模型结合强化学习 视 觉语高动作楼型 VLAS 人机交互 多机交互 环境重建 位 定 位 状态盖测 行 为 规 划 动作规划 … … 关键技术层 仿真合成数据 任务规划算法 任务规划 推理分析 碱知增强 决莱优化 位置导练 物体探作 动作控制算法 数 据层 交互 视觉 物理交互 行动适应 听觉 压力 觉 计算机视觉 如摄像头、激光雷达、触觉传感器 ) 收集环境信息。感知模块需要整合多模 态数 据,生成对环境的全面理解。 · 决策模块:基于感知数据,利用大模型 ( 如 LLM 、 VLM) 进行任务规划和推理。决策模块需要 将抽 象任务 分解为具体的子任务,并生成可执行的行动序列 , · 行动模块:执行决策结果,如移动、抓取、操作等。行动模块需要结合环境的物理特性和智能体的运动 能 力,生成精确的控制指令。10 积分 | 68 页 | 1.83 MB | 1 天前3
Lindorm一站式车联网数据平台解决方案(14页 PPT)如何动态增加字段? 架构如何跟随业务迭代 ? 技术栈复杂 多产品组合 多条数据链路 存储碎片化 产品数据冗余 Lindorm SQL( 兼容 MySQL 协议 ) 宽表:点查 + 搜索 列存索引 推理 分析 BLOB 向量化 非结构化数据存储 ( 文本、文档、图片、图像等 ) — 一 向量引擎 A P S A R A 云 栖 大 会 Lindorm 一站式车联网数据平台 多模态 Lindorm HDFS Hive Spark 推理引擎 Prometheus ElasticSearch 流 引 擎 (CEP+UDF) 故障预警 模型训练 电池分析 报表分析 数据标注 详单查询 车联网应用 OpenTSDB10 积分 | 14 页 | 1.62 MB | 1 天前3
智能财务——财务智能化任务需要知识,建立知识间 的关联关系,如智能翻译 ※NLP 与知识图谱的使用场景一致,相互支持。知识图谱的构建离不开 NLP 对自然语言信息抽 取,而 NLP 的应用也需要知识图谱的关联分析和推理能力 应用层 —— 是 AI 技术在各行业中的实践应用,是技术和场景结合的落地环节。应用层公司的 产品覆盖了行业的方方面面,包括安防、金融、教育、医疗、交通、零售、农业、广告营销、商务服务、机器人。 技术在智慧审计中的应用 NLP 提取合 同文本信息 利用算法将合 同信息与外部 信息对比 判断合同 条款是否 符合规定 识别出高风 险的进行重 点审计 —— 知识图谱对知识进行学习和开展推理能力,建立复杂的关系 网络和实现更高效的关联查询 3.3 知识图谱协助供应商管理 招标阶段 利用知识图谱,自动审查投标企业 的基础信用,排除不合格企业 追溯历史交易记录、股权关系等,识别招10 积分 | 42 页 | 29.46 MB | 6 月前3
共 23 条
- 1
- 2
- 3
