LLM | Brice's Blog

Build GPT-2 from Scratch: Architecture, Tokenization, and Training

A first-principles guide to building GPT-2, from tokenization and embeddings to transformer training.

Build deep learning intuition from first principles, progressing from linear models and backpropagation to transformers, diffusion, and LLMs.