MLOps & Data Engineering
От управления окружениями до production ML-пайплайнов: Docker, CI/CD, PySpark, DWH и мониторинг моделей.
🧱 Основы окружений
🗄️ Данные и хранилища
Продвинутый SQL
Оконные функции, CTE, EXPLAIN ANALYZE, индексы, партиционирование.
3 ресурсов
NoSQL базы данных
опц.MongoDB, Redis, Cassandra — когда что использовать, CAP-теорема.
3 ресурсов
Data Warehouse
Star/Snowflake schema, OLAP vs OLTP, staging/prod/replica.
3 ресурсов
Data Modeling
опц.Нормализация, денормализация, SCD (Slowly Changing Dimensions), Data Vault.
3 ресурсов
⚡ Обработка данных
🔧 ML Infrastructure
🚀 Serving & Production
Model Serving
FastAPI, TorchServe, Triton, vLLM — деплой моделей, батчинг, кеширование.
3 ресурсов
Мониторинг и Observability
Data drift, model drift, Prometheus/Grafana, алерты, Evidently.
3 ресурсов
A/B тестирование ML
опц.Shadow mode, canary deploys, interleaving, статзначимость для ML-экспериментов.
3 ресурсов
Подготовка к собеседованию
Docker, CI/CD, Feature Store, serving, мониторинг и data engineering — проверьте готовность к собеседованию.