Visualiser le fonctionnement d'un LLM

23/02/2025

•

Joël Gombin

•

Tags : AI, IA, LLM

Une visualisation assez géniale du fonctionnement concret d'un LLM, token par token et couche par couche, par Brendan Bycroft, un développeur néo-zélandais. On peut effectivement visualiser nano-gpt (85k paramètres, très pratique pour pouvoir effectivement le visualiser !), mais la visualisation la met en regard avec GPT-2 small (124M de paramètres), GPT-2 XL (1,5B de paramètres) ou encore GPT3 (174B de paramètres !).

https://bbycroft.net/llm