语言模型通过 f-散度最小化与偏好对齐
该研究提出利用 f-散度最小化来对齐语言模型与人类偏好。
9.15MB
文件大小:
该研究提出利用 f-散度最小化来对齐语言模型与人类偏好。
评论区