FilterHN

new ask show jobs

Reinforcement Learning from Human Feedback (RLHF) in Notebooks

68 points

10 hours ago

| 1 comment

| HN

8 hours ago

[-]

Hl