Register | Login |
habr_ru | Dec 11 | |
Динамическая адаптация награды с помощью Pydantic http://habr.com/ru/companies/otus/articles/864178 #ml #pydantic #RL #python | ||
habr_ru | Aug 09 | |
RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI http://habr.com/ru/articles/833622 #rl | ||
habr_ru | Aug 02 | |
RLHF. История становления идеи — 3 http://habr.com/ru/articles/832736 #rl #rlhf #llm #ai_alignment #ai #искусственный_интеллект |