阿里云:2025年阿里云百炼安全白皮书的训练数据中还需要增加各 种风险类型、各种对抗攻击指令。 GRPO 安全训练 (4)更多安全实践:通义大模型还探索并落地了更多维度的安全增强策略,进一步 提升模型在复杂场景下的安全性。 ● 推理模型安全性:推理模型(Reasoning Model)通过引入“思考过程”来增强模 型在逻辑推理问题上的准确性和可解释性,已被广泛应用于各类大模型中。然而,由 于思考过程具有发散性和探索性,在回答风险提问时可能产生不安全内容。应对这一 时可能产生不安全内容。应对这一 挑战的方式是构建带思考过程的安全语料库 :思考过程本身避免不安全的假设和推 演,并在面对恶意指令时,主动思考问题的意图并制定安全的回复策略。该方法有效 保证了推理模型的安全性,抵御了思考过程被恶意滥用的风险。 ● 小语种安全性:随着大模型的小语种能力不断提升,安全语料生产从中英文拓展 至多语言。具体做法包括:一是制作所有语言通用价值观的安全语料;二是结合目标20 积分 | 59 页 | 45.36 MB | 4 月前3
数字中国十五五发展趋势白皮书-华信咨询平台, 深化基于语音识别、图像识别、语义分析等人工智能技术的 算法模型建设、归集、纳管,广州市开展政务领域统一人工 智能大模型平台建设,提供统一的大模型开发部署、通用基 础模型、通用场景化推理模型、原子算法等共性服务能力。 三是“人工智能+政务服务”加快探索,国办发文首次正式 提出探索开展“人工智能+政务服务”,为人工智能时代全国 政务服务发展作出战略性思考和前瞻性布局,要求聚焦“高10 积分 | 93 页 | 1.52 MB | 1 月前3
上海科学智能研究院:2025年科学智能白皮书通过跨模 态对齐技术,实现了视觉、语音、文本等多 模态信息的高效整合,大幅拓宽了模型应用 场景。 3) 深 度 推 理: 以 OpenAI o1/o3 和 DeepSeek R18 为代表的推理模型,在解题 回答中引入类似人类“思考—反思”的推理 机制,用更长推理时间换取更高质量答案, 在数学、科学和编程等复杂任务上取得显著 突破。 4)自主智能体:多智能体系统 9 依托 大语言模型的认知与推理能力,通过自主感20 积分 | 29 页 | 2.74 MB | 9 月前3
2025年人工智能就绪度白皮书-企业数智化转型的Al变革路径与评估指南型市场的竞争焦点由模型参数等 底层技术比拼,逐渐转向用户流量争夺、垂直场景的轻量化解决方案等,免费策略 成为各家抢占市场份额的一大利器。例如,OpenAI不仅向免费用户开放了o3-mini 推理模型的API,还宣布GPT-5将向免费用户开放。技术路线和市场竞争的双重转 变下,大模型的“成本效益革命”正在拉开帷幕。 中国AI发 展的阶段 性态势 1.1 模型架构与能力演进 © 202520 积分 | 78 页 | 21.63 MB | 9 月前3
全国数智产业发展研究报告(2024-2025)17 日,是一家典型的数 据资源、数据技术、人工智能和数据应用企业,专注于开发 先进的大语言模型和相关技术,以“低成本、高性能”为技 术路径,主要产品包括开源大模型 DeepSeek-V3、推理模型 R1 以及代码专用模型 DeepSeek-Coder 等。 在数据资源方面,DeepSeek 通过对新闻、百科、学术等 公开数据抓取,数学推理、代码生成等自研合成数据,金融、 医疗、政20 积分 | 236 页 | 8.61 MB | 5 月前3
2025年云计算研究白皮书-中国电信关键保护技术 基于密码学 同态加密 零知识证明 安全多方计算 可量化隐私 差分隐私 遗忘学习 数据最小化暴露 联邦学习 拆分学习 数据合成 访问静态存储数据 获取动态传输数据 推理模型使用数据 数据 计算 数据可用 不可见 图 4.3: 面向数据隐私的安全威胁与保护技术 是否保留提示中的敏感片段 [690]。研究还表明上下文规模越大,泄漏概率越高 [658]。面向 RAG10 积分 | 140 页 | 11.65 MB | 1 月前3
共 6 条
- 1
