2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告胡克定律:在弹性限度内,弹簧弹力𝑭和 长度变化量𝒙成线性关系,即:𝑭 = −𝒌𝒙, 弹力系数𝒌 ,弹力与其形变方向相反,表 示它有使系统不改变的趋势; 模型是否具有与 弹簧类似的属性 从而抗拒改变? 𝑝𝜃’ 𝑝𝜃 从最简单的弹簧系统建模,探究大模型内在抗拒对齐的机理 ➢ 弹力系数𝒌:表示为大模型本身性质,与模型参数量和预训练数据相关; ➢ 长度变化量𝒙:表示对齐前后的模型的变化,一般用KL散度刻画;10 积分 | 76 页 | 8.39 MB | 5 月前3
共 1 条
- 1
