![]() |
PointerPodcastAuthor: PointerPodcast Language: it Genres: News, Tech News, Technology Contact email: Get it Feed URL: Get it iTunes ID: Get it |
Listen Now...
Pointer[275]: Tutto Quello Che Ho Imparato Sul Post-Training
Episode 275
Saturday, 17 January, 2026
🏋️🏻 Puntata in solitaria con Luca, che vi tiene compagnia raccontando ciò che ha studiato di recente sul training delle LLM, con un occhio particolare alla fase di post-training. 🪄 Si comincia con una panoramica generale sull'addestramento delle LLM, entriamo poi nel dettaglio del Supervised Fine-Tuning cercando di capire come funziona questa fase, a cosa serve e che tipo di dati vengono utilizzati. 💫 Continuiamo con un ampio spazio dedicato al Reinforcement Learning: perché viene usato durante il post-training? Quali problemi risolve e come funzionano alcuni degli algoritmi più citati in questo contesto? 💬 L'argomento può sembrare complesso ma è molto interessante e di grande attualità. Se la puntata vi è piaciuta fatecelo sapere e se vi fa piacere lasciate una recensione!Supporta il PointerPodcast La nostra pagina supportaci Unitevi al nostro gruppo Telegram per discutere della puntata Lascia una recensione su Spotify Lascia una recensione su Apple Podcast Acquista il prodotto della settimana o parti da uno dei link qui sotto per fare acquisti su Amazon! Prodotto della settimana Build a Large Language Model from Scratch Note Puntata Post-training 101 A Primer on LLM Post-Training CME 295 - Transformers & Large Language Models Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 6 - LLM Reasoning Training language models to follow instructions with human feedback Constitutional AI: Harmlessness from AI Feedback Llama 2: Open Foundation and Fine-Tuned Chat Models I nostri contatti: Gruppo Telegram LinkedIn Twitch YouTube Instagram Twitter Mail










