阿里云:2025年阿里云百炼安全白皮书核心:贯穿生命周期的数据安全与隐私保护 73 2.3 扩展:支持客户弹性、灵活地应对外部攻击 78 3 阿里云百炼关键场景安全实践 82 3.1 场景一:发布并调用一个线上模型推理服务 82 3.2 场景二:使用私有数据微调一个专属模型 85 3.3 场景三:构建并运行一个 AI Agent/MCP 应用 88 4 构建可验证的信任:阿里云百炼的 90 安全承诺与未来愿景 4.1 当下的承诺:安全可信的五大基石 策略限定允许使用的加密协议版本和加密套件,防止低安全性协议被误用, 从而进一步提升整体链路的安全等级。 ● 存储加密:阿里云为各类云上产品提供落盘数据加密能力,确保静态数据(如 RAG 知识库文档、模型微调数据集等)在存储层面的安全性。核心存储类产品(如云 盘 EBS、关系型数据库 RDS、对象存储 OSS)均支持一键开启加密功能,无需额外配 置即可满足大规模数据的加密存储需求。此外,部分产品也支持 算力指数级扩展需求。 ● 平台层优化实现算力资源的极致利用。阿里云大模型平台能够实现万卡级弹性调 度,AI 算力有效利用率超 96%,可稳定运行千卡任务 5 周以上。DeepGPU 增强工具 包在 LLM 微调场景实现 80% 性能跃升,视觉生成任务推理效率提高 60%。通过全栈 优化,阿里云 AI 基础设施的模型算力利用率提升 20% 以上,在 MLPerf 基准测试中 取得显存优化领先成绩。 220 积分 | 59 页 | 45.36 MB | 1 天前3
医疗健康大模型伦理与安全白皮书(93页 WORD)医疗健康行业大模型专业性的提升方式 5.2.1.医疗数据的微调与任务定向优化 5.2.2.意图识别与分发优化 5.2.3. RAG 技术的应用 5.2.4.多轮对话与上下文管理机制 5.2.5.内容生成的精准与个性化 5.2.6.后台运营干预与人机协同 5.2.7.架构协同优化 5.3 医疗健康行业大模型伦理与法规对齐方式 5.3.1.医疗伦理与法规准则嵌入 5.3.2.伦理对齐微调与动态反馈 5.3.3.内容生成风险分级与安全管理 根 据已有的前文信息逐词预测下一个词语的概率分布,从而实现高质量的文本生成。与传统的监 督学习方法相比,生成式预训练模型的优势在于它们可以在大规模未标注语料库上进行预训练,然 后通过少量有标签数据的微调来适应特定任务。这种方法极大地降低了对大量人工标注数据的依 赖,同时也加速了模型的迭代更新过程。 随着时间的推移,模型的规模得到了快速的膨胀,参数量从最初的数亿增长至如今的数千亿,从而 人工智能的发 它将原始数据转换为可用的训练数据, 通过专家标注或自动化标注工具为数据添加标签, 并确保隐 私数据经过严格脱敏处理,保护患者信息安全。 接下来是训练层, 这一层专注于大模型的设计与开发。大模型的训练通常包含预训练、指令微调、 强化学习等步骤。在模型训练过程中, 需要利用高性能计算资源, 进行大规模的分布式训练, 优化 模型的学习效率。对超参数的不断优化和交叉验证也是必要环节,以确保模型的稳健性和可靠性。20 积分 | 93 页 | 12.19 MB | 13 天前3
2025年中国智算云服务行业:人工智能时代下IaaS、PaaS、SaaS的产业机遇服务客户。 MaaS未来将成为调动I+P+S营收的核心入口,成为各大云厂的战略必争之地。 • 丰富模型超市(至少做到头部开源适配)。 • 丰富且低门槛的开发工具链(数据处理、 模型训推、知识库微调和业务环节部署)。 • 丰富的行业能力模块(如基因组数据库、 机器人训练场等) • 开源+闭源双轨策略。闭源保持性能优势绑定 客户到PaaS平台,开源吸引生态建设。 • 三者至少做到其一,越多越好:性能领先 模型业务理解提升(IaaS+PaaS) 业务增长带来资源需求提升(带动IaaS) 从API调用获益 • PaaS数据处理能力(数据库、数据存储、数据清洗) • RAG与向量知识数据库 • 精调微调与MLOps需求 • 部署专属节点 • VPC隔离专区 • 防火墙安全 14 www.leadleo.com 400-072-5588 中国:云计算系列 行业研读 | 2025/07 • 理自身数据,并与模型训练、精调、 增强等环节无缝衔接 数据能力产品化 能力2 通过提供从Prompt工程到知识注入、 安全审核等一系列低代码/无代码工具, 让客户能轻松地对基础模型进行“再加 工”,以适配自身业务 训练/微调工具链 能力3 通用AI技术封装成面向特定行业(如游 戏、医药、电商)的预制组件或解决方 案,从而极大加速客户的业务落地 行业化适配能力 能力4 云企业在MaaS层的差异化竞争点 1520 积分 | 19 页 | 1.03 MB | 13 天前3
医疗健康行业-AI应用白皮书(40页 WORD)历质控、疾病早期筛查与诊断、再到医药研发, AI 在医疗健康行业的应用逐步深入。当前,随着生成 式人工智能的加速发展,众多研究机构和企业在通 用大模型的基础上,基于不同细分领域的医学和医疗 数据进行再训练或微调,构建医疗行业大模型,推动 在智慧医疗、医药研发、健康管理等方面的应用,提 升医疗健康领域的智能化水平。 AI 医 疗 软 件 产 品 分 为 医 疗 器 械 类 和 非 医 疗 器 械类,如果 模型对风险的精准评估能力 有待提升 13 医疗健康行业 AI 应用白皮书 3 阿里云助力医疗健康 AI 应用开发 随着 AI 在医疗健康和生命科学行业的应用深化,行业企业在 模型训练、微调及应用开发上,需要高性能 GPU 集群、高性 能存储系统及低延迟网络支持,需要适配医疗数据特性的 AI 开发工具链(如基因数据脱敏、医学影像标注)、模型部署与 监控体系等。传统 IT 架构在应对海量数据计算、大模型训练 使用方式。通常而言,在初期验证阶段或数据安全风险较低的场景下,企业可优先选用直接调用通用基础大模型的 API 调用服务,以实现快速上线与验证。但通用大模型难以直接满足医疗领域的专业需求,医疗健康行业结构或 企业往往需要通过微调等技术推动具体场景的 AI 开发与应用,推动 AI 能力与现有医疗信息系统的无缝集成,实现 AI 在临床、研发和健康管理场景的落地应用,例如智能辅助诊断、药物靶点预测、个性化健康管理等,提升业务 效率和用户体验。20 积分 | 40 页 | 7.84 MB | 13 天前3
中国联通:中国联通自智网络白皮书(2025)不断完善元景网络大模型,通过模型微调意图识别,更好地理解用户在不同网络场景下的 指令,准确把握用户意图。通过模型微调参数提取,提升模型从复杂文本中精准提取关键参数 23 能力。定制场景化思维链模板,针对质差分析等场景定制推理模板,拆解专业逻辑与问题分析 路径;知识蒸馏生成思维链语料,基于思维链模板,利用DeepSeek-R1自动生成高质量思维 链语料,尽量覆盖复杂场景各种问题;指令微调&强化学习训练模型,生成语料做为输入,训 度数据资产,构建统一的数据支撑体系,为AI模型的应用与分析提供高质量、场景化的数据输 入,助力精准建模、智能决策和业务闭环。 AI模型层:构建融合通信领域知识的知识库,结合提示工程、智能诊断判决、基于RAG及 微调模型等技术手段,打造面向用户问答场景的意图识别与语义理解能力,实现对用户需求的 精准捕捉与高效响应。 应用层:依据分拣知识库与问题场景网络指标,推理式生成问题场景分拣建议,对话式提 供分拣操10 积分 | 46 页 | 4.28 MB | 1 天前3
2025年应用全生命周期智能化白皮书服务。 1) 应用开发阶段:提供需求、设计、到开发、测试、发布、部署完整的软件开发工具链能力。面向 AI,数据生产 线生产模型训练所需的数据和模型推理所需的知识库,通过模型生产线进行模型的训练与微调,与软件应用生 产线共同构成完整的 XOps 融合生产线,支持任意研发作业任务的智能编排。 2) 应用运行阶段:平台提供统一的多形态复合运行时,支持工作流、容器、函数、WASM 等多种应用运行形态, 驱动的多模态大模型、多智能体群体协作式的“应用智能驾驶”,包括:软件开发从“需求分 析、系统设计、代码开发、构建打包、测试验证”研发全过程的“应用开发自动驾驶”,真实数据与模拟数据的“数 据生成自动驾驶”,大模型开发微调的“模型训练自动驾驶”,智能应用平台的工具与服务,实现自主式全自动的软 件应用开发、运行和运维,为开发者提供全场景的应用智能驾驶体验。借助智能应用平台的可观测服务,智能应用从 XPU 基础设施层 协同模式极大的提高了研发效率,同时避免了人为操作可能产生的疏漏。 模型层 多模态大模型 代码生成大模型 领域大模型 NLP大模型 AI能力层 Prompt工程 知识库管理 AI能力编排 模型微调 AI接入层 接口管理 权限认证 流量控制 AI连接器 AI策略插件 智能编排 数据增强 智能交互 智能开发 组件库 生态&业务底座 低代码平台 平台层 应用层 终端应用 AI应用 行业解决方案20 积分 | 59 页 | 8.39 MB | 4 月前3
2025年人工智能就绪度白皮书-企业数智化转型的Al变革路径与评估指南队还推出了聚焦空间推理的Gemini Robotics-ER,显 著提升了模型对世界的理解能力。 算力需求仍将持续攀升,算力生态将逐步转向分布式 算力网络。AI普惠化和持续跃迁趋势下,大模型预训 练、微调、推理的算力需求仍将持续爆发。分布式计 算架构能将对单一节点的算力需求分散到多节点,通 过连接各计算节点实现高效协同计算,进而降低计算 成本,正在成为新一代计算范式,也是国产算力突围 的关键 又会是相对独立的AI工厂,企业需积极变革集中式的 IT基础设施以适应新变化。具体来说: 6 2025 NVIDIA GTC 主题演讲 计算方面 越来越多企业倾向于在云端进行大模型预训练,而 在本地进行基于本地化数据的模型微调、RAG、推 理等,最终形成更小规模、集约化和高知识密度的 AI训推一体形态,所占用的资源会低于大型智算中 心几个数量级。以本地化智算中心(AI DC)为例, 在以GPU为计算核心的服务器架构中,当前主要有 其次,“小样本合成数据生成”以51%的占比位列第 二,反映出企业倾向于利用Diffusion等模型进行数据 增强,生成高质量的合成数据,以补充真实数据的不 足。同时,49%的企业选择“模型蒸馏与微调”,通 过将大型复杂模型的知识迁移到轻量化模型,如 BERT-base蒸馏至TinyBERT,进一步提升模型在垂直 领域的适应性。此外,34%的企业选择“领域知识图 谱增强”,例如医疗领域的术语图谱构建以补全数据20 积分 | 78 页 | 21.63 MB | 4 月前3
全国数智产业发展研究报告(2024-2025)算)、元数据管理工具等。 11 数据建模分析 软件 指支持数据分析和建模的工具。包括但不限于统计分析 工具、BI 工具、科学计算与工程建模软件、数据分析平 台、深度学习框架、大模型开发与微调平台等。 12 数据计算平台 指支持数据计算的工具和系统。包括但不限于计算引擎 (如分布式计算引擎、流计算引擎等)、算力调度软件 (如计算资源调度、负载均衡等)。 13 智能化解决方 指基于机器学习训练形成的智能化模型产品,包括但不 限于自然语言处理模型(如机器翻译、文本生成)、计 算机视觉模型(如场景理解、动作识别)、语音识别模 25 型(如语音转文字、声纹识别)、预训练大模型(如大 语言模型)、垂类微调大模型(如医疗、金融等行业专 用大模型)等。 20 模型类数据产 品 指通过配置用户流量于特定目的而获取收入的业务,包 括互联网广告、大数据营销等 21 用户流量类数 据产品 指 本地处理)、智算服务等。 32 存储服务 指提供数据存储能力的基础服务。包括但不限于对象存 储、数据文件存储等。 33 人工 智能 基础大模型产 品服务 指以通用大模型为核心,通过微调或定制化开发,针对 特定任务或行业需求构建的预训练模型。这类模型在海 量通用数据(如互联网文本、书籍、网页等)上完成预 26 产品 服务 训练,可辅助完成文本生成、翻译、问答、图像分类等20 积分 | 236 页 | 8.61 MB | 13 天前3
基层疾控疫情防控韧性评价指标体系构建研究指标不现实”, 因此最终将三级指标 “防控备用物资 与产能供应” “防控备用人员” “防控备用资金” 删 除。 此外, 对专家提出建议修改的以及 CV>0. 25 的 共计 20 个指标进行了名称和内涵的细微调整。 最后, 有专家提出建议添加指标 “组织功能、 人员架构及资 金消耗、 遗留问题等系统评估” “外总协调、 调度及 社会动员能力” 和 “内部优化调整与动员”, 由于在 指标体系中已经有其他指标反映20 积分 | 6 页 | 1.15 MB | 13 天前3
2025年中国人工智能与商业智能发展白皮书:AI驱动商业智能决策,企业数字化转型的智脑引擎传统的BI系统往往需要用户具备一定的数据分析能力,尤其是对复杂数据的理解和 操作。然而,AI,尤其是大语言模型(LLM)的发展,正在打破这一技术壁垒。在 预训练过程中,LLM内嵌了大量的通用数据分析知识,并通过精细化的监督微调 (SFT)进一步加入专业领域的知识。通过集成这些具备数据分析知识的LLM,用户 不再需要深厚的数据分析技能,而只需具备一定的业务理解,就能够通过自然语言 与BI系统交互,轻松获得自己关注的业务问题的答案。这种转变极大地降低了数据 BI的转变。传统BI 和自助式BI仍然要求用户具备数据思维和分析能力,这使得即使在技术上有了进步, 广泛的业务人员依然无法全面使用这些工具。然而,LLM通过在预训练阶段内嵌数 据分析知识,并通过监督微调(SFT)增强专业领域的分析能力,彻底消除了对数 据思维的依赖。用户只需具备一定的业务理解,通过自然语言与BI系统交互,就能 够获得所需的业务洞察。这一转变大大降低了BI的使用门槛,使得几乎所有业务人10 积分 | 40 页 | 8.31 MB | 5 月前3
共 16 条
- 1
- 2
