|
|
Register | Login |
|
|
habr_ru | Aug 18 |
| LLM на прокачку: практический гайд по Alignment http://habr.com/ru/companies/tochka/articles/933380 #llm #reinforcement-learning #alignment | ||
|
|
habr_ru | Aug 10 |
| GSPO (Qwen RL Algorithm by Alibaba Cloud) http://habr.com/ru/articles/935800 #Qwen #Alibaba #GSPO #GRPO #reinforcement-learning | ||
|
|
habr_ru | Dec 28, 2024 |
| Контекстные бандиты в ценообразовании http://habr.com/ru/companies/X5Tech/articles/870012 #reinforcement-learning #machine-learning | ||
|
|
habr_ru | Oct 21, 2024 |
| Мультимодальные приложения на Llama 3.2 и Llama Stack http://habr.com/ru/articles/852168 #mlops #нейронные_сети #reinforcement-learning | ||