![]() ![]() |
Register | Login |
![]() |
habr_ru | Dec 11 |
Динамическая адаптация награды с помощью Pydantic http://habr.com/ru/companies/otus/articles/864178 #ml #pydantic #RL #python | ||
![]() |
habr_ru | Aug 09, 2024 |
RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI http://habr.com/ru/articles/833622 #rl | ||
![]() |
habr_ru | Aug 02, 2024 |
RLHF. История становления идеи — 3 http://habr.com/ru/articles/832736 #rl #rlhf #llm #ai_alignment #ai #искусственный_интеллект |