RLHF

RLHF (Reinforcement Learning from Human Feedback) là kỹ thuật huấn luyện AI qua phản hồi con người. Cách OpenAI áp dụng RLHF cho ChatGPT.

2 bài viết