🏋️🏻 Puntata in solitaria con Luca, che vi tiene compagnia raccontando ciò che ha studiato di recente sul training delle LLM, con un occhio particolare alla fase di post-training. 🪄 Si comincia con una panoramica generale sull'addestramento delle LLM, entriamo poi nel dettaglio del Supervised Fine-Tuning cercando di capire come funziona questa fase, a cosa serve e che tipo di dati vengono utilizzati. 💫 Continuiamo con un ampio spazio dedicato al Reinforcement Learning: perché viene usato durante il post-training? Quali problemi risolve e come funzionano alcuni degli algoritmi più citati in questo contesto? 💬 L'argomento può sembrare complesso ma è molto interessante e di grande attualità. Se la puntata vi è piaciuta fatecelo sapere e se vi fa piacere lasciate una recensione!