[1hr Talk] Intro to Large Language Models | Karpathy

[1hr Talk] Intro to Large Language Models | Andrej Karpathy

youtube.com

Лучший часовой обзор «что такое LLM» — без кода, на уровне ясной картины целого. Карпаты объясняет, что языковая модель — это, по сути, два файла (веса + код запуска), как она получается из терабайтов текста и почему ведёт себя так, как ведёт.

Идеально дополняет урок про масштабирование и ChatGPT: связывает воедино pretraining, fine-tuning и то, как из «предсказателя следующего токена» получается ассистент.

Ключевые темы:

Что такое LLM — веса как «сжатие интернета», и почему обучение стоит миллионы.
Pretraining → fine-tuning — две стадии: сначала знания, потом превращение в ассистента (SFT, RLHF).
Как модель «думает» — что она умеет и где системно ошибается.
LLM как новая ОС — взгляд Карпатого на инструменты, контекст и агентов вокруг модели.
Безопасность — обзор типичных атак (jailbreak, prompt injection) на понятном уровне.