北大:DeepSeek-R1及类强推理模型开发解读然而,这些对齐微调是否真正修改并对齐了模型的内部表征? 经过安全对齐的模型可以在经过最小化的微调后再次变得不安全; 在非恶意数据集上微调对齐的语言模型可能会削弱模型的安全机制; 不仅限于安全,这种“假象对齐”表明模型可能会内在执行对齐的逆操作。大模型存在会逆转或撤 销对齐过程的可能性,这一概念我们称之为逆向对齐( Inverse Alignment ) 。我们进一步探究了: 语言模型的参数是否表现出弹性,从而抗拒对齐? 训练分布的“弹力”; 类似于胡克定律,我们发现大模型也存在弹性:对模型施加微调时,模型倾向 于 保持原有预训练分布,抗拒对齐分布,使得“逆向对齐”更加容易。 从最简单的弹簧系统建模,探究大模型内在抗拒对齐的机理 大模型存在弹性:模型在预训练阶段经过大数据、 大更新产生了具备通用能力的稳定分布 pθ, 而经 过对齐阶段的“小数据、小更新”表现出由对齐分 布 pθ’回弹到预训练分布 评估与模型评估等,应当从模型的内在机理出发; ① 预训练阶段和对齐阶段不应当各自独立; u 预训练模型抗拒对齐,如何在预训练阶段为对齐阶段提供一个具备可塑性分布帮助微调; u 如何确保对齐初始模型弹性系数更小(抗拒更小),弹性限度更大(对齐空间更大) ; ② 模型评估应该更关注模型内在表征的对齐; u 表面的对齐训练很容易被撤销, 对齐算法应当修改模型的内在表征,而非进行表面的对齐; u10 积分 | 76 页 | 6.72 MB | 5 月前3
人形机器人标准化白皮书(2024版)具有高强度 和抗疲劳性能。这些材料的应用可以提高人形机器人的强度和刚度, 同时减轻其重量,从而提高人形机器人的机动性和能效。这对于人形 机器人的运动性能和动态特性有着至关重要的影响。近年来,国内在 人形机器人骨架躯干的技术研究中取得了显著进展,尤其是在材料选 择、框架结构设计、驱动与控制系统方面。国内研究者在使用碳纤维 复合材料(CFRP)、PEEK 材料等轻量化高强度材料方面有所突破,尤 得较大突破,这些材料不仅具备良好的柔性,还能保证高分辨率和高 耐用性。国内在这些高性能材料的研究和应用上尚处于追赶阶段,材 料的耐用性和传感器的分辨率仍存在不小的差距。触觉传感器阵列的 布局和集成是电子皮肤技术中的关键挑战。虽然单个传感元件的灵敏 度、分辨率等性能已有较大提升,但在大面积阵列化部署时,面临着 高成本、拼接问题、电路连通性差等难题,这在国内外都存在较大的 技术挑战。国内在阵列式触觉传感器的生产成本和大规模部署方面仍 方面仍 面临较大困难。国内在信号传输和标定机制上相对滞后,尤其是在多 物理量传感、信号干扰和一致性优化方面,仍依赖于国外技术的支持。 相比之下,国际上尤其是欧美在算法优化和传感器标定的精度和稳定 性上已经取得了显著进展。未来,柔性触觉传感器将朝着更高精度、 更灵敏和更大面积的方向发展,阵列化、柔性化将成为主流趋势。智 能化的传感技术将在触觉感知中发挥更大的作用,配合人工智能算法 优化0 积分 | 93 页 | 3.74 MB | 5 月前3
算力基础设施高质量发展行动计划源,有效支撑面向重大项目或课题的开发与创新。推进公共算 力资源覆盖校园,鼓励各类高等院校、职业院校积极运用算力 8 平台为学校实习实验实训环境、平台和基地建设及转型发展提 供支撑,促进教育公平,全面提升教育体系内在质量水平。 4.“算力+金融”。加快算力在金融领域的创新应用,构建 多节点并行的分布式算力资源架构,提供跨地域资源高效管理、 核心业务多地多活部署能力。围绕金融市场高频交易等低时延 业务场景0 积分 | 18 页 | 309.59 KB | 20 天前3
2025年人工智能物联网(AIoT):将人工智能与现实世界相连白皮书AI对可靠的、现实世界的数据有着无尽的需求,以此来推动训练和推理。因此,AI的快速发 展需要大量关于我们所处世界的准确数据,而这种依赖从根本上改变了设备连接的经济价值。 过去,评估一个联网设备的价值往往基于其功能的内在价值,比如恒温器能够测量温度并控 制HVAC系统。但如今,AI拓展了设备的价值主张,使其价值还包括对能源管理等更高级别 系统的贡献。 设备总价值 = 功能价值 + AI贡献价值 - 设备成本10 积分 | 15 页 | 581.21 KB | 5 月前3
华泰证券:DeepSeek冲击下,AI产业对国内电力行业的变与不变但是同时我们也看到随着效率的提升,服务器和机柜的功率参数以每代 40-60%的比例提升。而 DeepSeek 实现 GPU 白卡互联的能力,为国产芯 片的大规模应用打开了大门,在经济上必然存在较强的优势,但是短期内在 能耗上与英伟达芯片仍然存在差距。因此随着国内数据中心中智算中心的比 例提升,单个数据中心的 MW 数将持续上升,甚至相同算力下可能提升更 快。这将带来供配电解决方案的技术迭代加速从传统 UPS 向0 积分 | 25 页 | 1.36 MB | 5 月前3
中国算力中心行业白皮书于每个应用场景日数据的吞吐量。 大模型及生成式人工智能需求日益增长,训练与推理环节对算力双重刚需,显著推动智能算力基础设施踏上快速 发展轨道,促使其不断迭代升级、扩容增效,全方位满足人工智能技术蓬勃发展的内在需求。 推理算力 核心影响因素 训练 预训练 二次训练 全参微调 局部微调 算力需求 超大规模 千卡~万卡 大规模 数百卡~千 卡 较小规模 单卡~8卡 起步 小规模 单卡1卡起10 积分 | 54 页 | 6.96 MB | 5 月前3
2025企业智能化转型 2.0 时代 指南由于不同行业、不同企业在数据 治理、经营模式、技术应用、组织结构、人才积累等方面存在显著差异, 且在智 能化发展水平上呈现出整体差距,因此企业在进行智能化转型时还受到规模、 资 源投入、业务范围等内在因素的影响。基于此,企业智能化转型框架必须在普遍 规律和企业特性相结合的基础上,建立起系统性、 客观性、可迭代、且具备量化 能力的分析框架和评估体系。 更多干货请关注公众号“管理技术化平台”10 积分 | 72 页 | 1.95 MB | 5 月前3
5G +AI投资策略研究报告率超过30%,在存储载板领域技术国内领 先。公司无锡厂新增年产能60万平存储用封 装载板,预计明年投产。目前已经与三星、 海力士、长江存储等客户进入洽谈认证阶 段,公司存储类封装载板的量产将有力填补 国内在存储封装用材方面的空缺。 毛利率持续改善,估值有望进一步提升:公 司之前PCB产线多为混线生产,随着新增产 能的陆续开出,还将通过专线专供优化产 线,提升毛利。同时公司内部也做智能化改 造毛利率提升的项目。随着5G用高端产品占10 积分 | 206 页 | 10.47 MB | 5 月前3
共 8 条
- 1
