Logo LeBonLLM
Carnet de code et de réflexions autour de l’IA générative à la française
codecorpuscontributionsconversationscurationlexiquefaqrecherche
Communauté

Pour échanger, demandez l’accès au :

Infolettre

Nous avons le projet d’une infolettre, seriez-vous intéressé ?

Misc
XLinkedInBlueskyMentions légales
Contact

Visualiser le fonctionnement d'un LLM

23/02/2025

Joël Gombin

Tags : AI, IA, LLM

Une visualisation assez géniale du fonctionnement concret d'un LLM, token par token et couche par couche, par Brendan Bycroft, un développeur néo-zélandais. On peut effectivement visualiser nano-gpt (85k paramètres, très pratique pour pouvoir effectivement le visualiser !), mais la visualisation la met en regard avec GPT-2 small (124M de paramètres), GPT-2 XL (1,5B de paramètres) ou encore GPT3 (174B de paramètres !).