What is backpropagation really doing? | 3Blue1Brown

What is backpropagation really doing? | 3Blue1Brown, Chapter 3

Доступна русская озвучка. В плеере YouTube откройте настройки → «Звуковая дорожка» → выберите русский.

Третья глава серии 3Blue1Brown — интуитивное объяснение алгоритма, благодаря которому нейросети вообще могут учиться. Важно: здесь нет тяжёлой математики и формул цепного правила. Вместо этого Грант показывает, что делает backpropagation на уровне смысла.

В предыдущей главе мы узнали, что обучение сводится к поиску градиента функции потерь. Backpropagation — это рецепт: как посчитать этот градиент быстро, двигаясь от выходного слоя к входному.

Ключевые темы урока:

Желаемые изменения на выходе — сеть «хочет», чтобы нейрон правильной цифры стал ярче, а остальные — тусклее. Насколько сильно — зависит от текущей ошибки.
Три способа повлиять на активацию нейрона — изменить веса, изменить смещение, изменить активации предыдущего слоя. Backpropagation распределяет «желания» по всем трём каналам.
Рекурсивная природа алгоритма — желаемые изменения активаций предыдущего слоя становятся новой задачей для ещё более глубокого слоя. Отсюда и название — back-propagation, «распространение назад».
Стохастический градиентный спуск (SGD) и мини-батчи — почему мы не считаем градиент по всему датасету, а берём случайные подмножества примеров. Компромисс между точностью и скоростью.
Почему нужно много данных — каждый обучающий пример задаёт своё «желание» для весов, и итоговое обновление усредняет их.

После этого видео становится понятно, что происходит при обучении. Математический вывод (цепное правило, частные производные) вынесен в следующую, более формальную главу — но для прикладного понимания достаточно этой.

Статья с текстовой версией

What is backpropagation really doing? — текстовая версия на 3blue1brown.com

Начальный

Весь цикл видео и статей

Neural Networks — серия 3Blue1Brown

Начальный