Technique · alignment

RLAIF (Reinforcement Learning from AI Feedback)

Using an off-the-shelf LLM to generate preference labels, scaling preference learning without human annotators.

Origin: Google, 2023-09Read origin paper →Also known as: RLAIF

0

Products deploying

—

Avg research → prod

—

First commercial deploy

Deployment timeline

No verified deployments yet in our tracked product set.

Prior art

Techniques built on this

Self-Rewarding Language Models