Полная программа

Подробная программа теперь отображается как роадмап: проходите темы по этапам, открывайте материалы и отмечайте прогресс.

Базовый ML NLP и LLM Рекомендательные системы MLOps & Data Engineering Computer Vision Advanced ML Engineering

Базовый ML

Путь от работы с данными до ансамблей и feature engineering — всё что нужно для уверенного старта в ML

Прогресс

0 из 17 тем

Кликни на кружок ○ чтобы отметить прогресс0%

📊

Знакомство с данными

0/3

Учимся загружать, исследовать и визуализировать данные — первый шаг в любом ML-проекте

Обязательно

Чтение данных (Pandas, CSV, JSON)

Учимся загружать данные из разных источников и работать с DataFrame — основной структурой для анализа.

3 ресурса5 вопросов

Обязательно

EDA (разведочный анализ)

Разбираемся как исследовать данные: распределения, пропуски, корреляции, выбросы — до того как строить модель.

2 ресурса5 вопросов

Обязательно

Визуализация (matplotlib, seaborn)

Знакомимся с построением графиков: гистограммы, scatterplot, heatmap, boxplot — чтобы видеть данные.

2 ресурса3 вопроса

📈

Линейные модели

0/4

Осваиваем фундамент ML — линейные модели, метрики и оптимизацию

Обязательно

Линейная регрессия

Учимся предсказывать числовые значения — самая базовая модель ML, но суперважная для понимания всего остального.

3 ресурса8 вопросов

Читать →

Обязательно

Метрики регрессии (MAE, MSE, RMSE, R²)

Разбираемся как оценивать качество предсказаний — без метрик непонятно, хорошая модель или нет.

2 ресурса5 вопросов

Читать →

Обязательно

Градиентный спуск

Знакомимся с главным алгоритмом оптимизации в ML — как модели учатся на данных шаг за шагом.

2 ресурса6 вопросов

Читать →

Обязательно

Логистическая регрессия

Учимся решать задачи классификации — предсказываем вероятности принадлежности к классу.

2 ресурса7 вопросов

Читать →

🎯

Метрики классификации

0/3

Глубоко разбираемся в метриках качества классификации — must have для любого собеса

Обязательно

Confusion Matrix, Precision, Recall, F1

Разбираемся в базовых метриках классификации — без них ни один собес не пройти.

2 ресурса10 вопросов

Читать →

Обязательно

ROC-AUC

Учимся оценивать модель по ROC-кривой и AUC — ключевая метрика для задач с дисбалансом классов.

2 ресурса5 вопросов

Обязательно

Валидация и переобучение

Разбираемся с train/val/test split, кросс-валидацией и как бороться с переобучением.

2 ресурса8 вопросов

Читать →

🌲

Деревья и ансамбли

0/4

Переходим к мощным моделям — деревья решений, Random Forest, бустинг

Обязательно

Решающие деревья

Знакомимся с деревьями решений — интуитивно понятная модель, которая лежит в основе всех ансамблей.

2 ресурса7 вопросов

Читать →

Обязательно

Random Forest

Учимся объединять много деревьев в ансамбль — баггинг, случайные подпространства и почему это работает.

2 ресурса6 вопросов

Читать →

Обязательно

Градиентный бустинг (XGBoost, LightGBM, CatBoost)

Осваиваем главное оружие на Kaggle и в продакшене — бустинг, который побеждает почти всех.

3 ресурса10 вопросов

Читать →

🌟 Бонус

Feature Engineering

Учимся создавать новые признаки из сырых данных — часто важнее выбора модели.

2 ресурса5 вопросов

🔧

Продвинутые темы

0/3

Дорабатываем навыки — работа с грязными данными, категориями и отбором признаков

Обязательно

Работа с пропусками и выбросами

Разбираемся что делать, когда данные неидеальны — пропуски, выбросы, аномалии.

2 ресурса5 вопросов

Обязательно

Категориальные признаки

Учимся кодировать категории: one-hot, label encoding, target encoding — и когда что использовать.

2 ресурса5 вопросов

🌟 Бонус

Feature Selection

Знакомимся с методами отбора признаков — убираем шум и ускоряем модели.

2 ресурса4 вопроса