Лекция 8 курса по машинному обучению трансформеров от Евгения Разинкова посвящена логистической регрессии и её применению в классификации.
Key Takeaways
- Логистическая регрессия — базовый, но важный алгоритм классификации, применяемый в современных нейросетях.
- One-hot encoding позволяет эффективно кодировать классы для многоклассовой классификации.
- Прямая линейная регрессия не подходит для классификации из-за отсутствия вероятностной интерпретации и проблем с оптимизацией.
- Функция Softmax преобразует выходы модели в вероятностный вектор, что решает проблему интерпретации и обучения.
- Градиентный спуск и обратное распространение являются ключевыми методами обучения логистической регрессии и нейросетей.
Summary
- Введение в тему логистической регрессии как алгоритма классификации.
- Объяснение кодирования классов с помощью one-hot encoding.
- Связь логистической регрессии с нейронными сетями и deep learning.
- Обсуждение проблем прямого применения линейной регрессии для классификации.
- Идея обучения K линейных регрессий для оценки уверенности принадлежности к классам.
- Проблемы с оптимизацией целевой функции при простом подходе к классификации.
- Необходимость получения вероятностного вектора с суммой компонентов равной единице.
- Введение функции Softmax для преобразования выходов модели в вероятности.
- Формулировка целевой функции для многоклассовой классификации.
- Обзор градиентного спуска и обратного распространения для обучения модели.
Chapters
- 00:00Введение и обзор курса, тема логистической регрессии
- 05:14Связь логистической регрессии с нейронными сетями и deep learning
- 08:54Идея обучения K линейных регрессий для оценки классов
- 13:58Проблемы оптимизации целевой функции в классификации
- 19:57Математическое представление модели и векторов Z
- 24:45Требования к вероятностному вектору и введение Softmax
- 30:59Вычисление производных и градиентов для обучения
- 50:55Обзор итоговой модели логистической регрессии и целевой функции
- 62:01Использование функции Softmax для вероятностной интерпретации
- 72:00Формулировка целевой функции и методы оптимизации











