Есть 100 собак и 100 кошек. 50 собак и 40 кошек весят больше 5 кг. Пусть B — животное является кошкой, A — животное весит больше 5 кг. Найдите P(A | B).
Банк вопросов из реальных собеседований
Направления, темы и вопросы из записей интервью. Фильтры ниже сохраняются в ссылке.
Все вопросы
673Полный банк вопросов из реальных собеседований.
ML-теория
119Классический ML, нейросети, NLP, CV и RecSys без длинного кейса.
Python
67Устройство языка, структуры данных, тестирование и инженерная база.
SQL
12Запросы, агрегации, оконные функции и объяснение результата.
ML System Design
259Архитектура ML-сервиса, данные, обучение, инференс, мониторинг и откат версии.
Метрики и A/B
101Качество моделей, продуктовые метрики, эксперименты и валидация.
Продуктовые кейсы
72Как разложить задачу продукта, ограничения, риски и первый бейзлайн.
Математика и статистика
18Вероятность, статистика, оценки, распределения и аккуратные допущения.
Behavioral Interview
25Ответственность за задачу, конфликты, мотивация, коммуникация и работа с фидбеком.
Математика и статистика
18 вопросов из реальных интервью
Честная монета: ровно 6 орлов за 10 бросков
Почему высокая accuracy медицинского теста не означает высокую вероятность болезни после положительного результата?
Зачем используют BatchNorm? Как он работает во время training и чем поведение отличается на inference?
BatchNorm при обучении, инференсе и multi-GPU
Как решать probability-задачу с большим числом независимых одинаковых испытаний?
Как связаны PDF, CDF, fitting распределения и теорема Байеса?
Дана серия бросков монеты с H heads и T tails. Как через maximum likelihood оценить probability of heads p и как проверить, что найден maximum?
MLE для смещенной монеты
Опишите алгоритм reservoir sampling для одного элемента из потока и объясните, почему каждый увиденный элемент выбирается с одинаковой вероятностью.
Как посчитать вероятность хотя бы одного орла в 10 бросках честной монеты?
Векторное пространство, span и базис
What is a probability space? What is a set of measure zero and why can a finite or countable set have probability zero in a continuous distribution?
Объясните закон больших чисел и центральную предельную теорему. Что получится с распределением среднего, если много раз брать подвыборки по 100 наблюдений и считать среднее?
В какой момент применяется temperature при генерации LLM, какая формула scaling и что происходит после softmax?
Как меняется распределение выбранных чисел, если для каждого query выбирать число с максимальным XOR?
Есть монетка с неизвестной вероятностью орла p, 0 < p < 1. Как получить честный случайный бит 0/1, используя броски этой нечестной монетки?
Что такое linear regression, как получить аналитическое OLS-решение, когда оно не существует и при каких assumptions MLE дает тот же оптимум?