语言模型通过 f-散度最小化与偏好对齐
该研究提出利用 f-散度最小化来对齐语言模型与人类偏好。
文件大小:9.15MB
该研究提出利用 f-散度最小化来对齐语言模型与人类偏好。
评论区