Skip to playerSkip to main content
  • 3 years ago
ChatGPTini menggunakan Reinforcement Learning from Human Feedback (RLHF), menggunakan metode yang sama seperti InstructGPT
Comments

Recommended