Data Science & ML

Некероване ML

K-Means, ієрархічна кластеризація, DBSCAN, PCA, t-SNE, UMAP, silhouette score, elbow method

22 питань зі співбесід·
Mid-Level
1

У чому головна різниця між керованим і некерованим навчанням?

Відповідь

Некероване навчання працює з немаркованими даними, прагнучи виявити приховані структури або патерни без попередньо визначеної цільової змінної. На відміну від керованого навчання, яке прогнозує відоме значення (мітку), некероване навчання досліджує дані, щоб знайти природні групи, зменшити розмірність або виявити аномалії. Такі алгоритми, як K-Means, PCA або DBSCAN, є типовими прикладами некерованого навчання.

2

Як працює алгоритм K-Means для розбиття даних?

Відповідь

K-Means — це ітеративний алгоритм, який розбиває дані на K кластерів. Він випадково ініціалізує K центроїдів, потім чергує два кроки: призначення кожної точки найближчому центроїду (крок призначення) і перерахунок позицій центроїдів як середнього призначених точок (крок оновлення). Алгоритм сходиться, коли призначення більше не змінюються або після максимальної кількості ітерацій.

3

Який метод використовувати для визначення оптимальної кількості кластерів K у K-Means?

Відповідь

Метод ліктя (elbow method) будує графік інерції (сума квадратів відстаней між кожною точкою та її центроїдом) залежно від K. Точка, де крива утворює лікоть, вказує на оптимальне K, оскільки за нею додавання кластерів більше не покращує інерцію суттєво. Цей метод доповнюється silhouette score для валідації якості кластерів.

4

Що вимірює silhouette score у контексті кластеризації?

5

Який діапазон значень silhouette score та як інтерпретувати оцінку 0.7?

+19 питань зі співбесід

Інші теми співбесід Data Science & ML

Основи Python

Junior
25 запитань

Об'єктно-орієнтоване програмування Python

Junior
20 запитань

Структури даних Python

Junior
20 запитань

Основи Git

Junior
18 запитань

Основи SQL

Junior
20 запитань

Основи NumPy

Junior
22 запитань

Основи Pandas

Junior
22 запитань

Jupyter & Google Colab

Junior
16 запитань

SQL Joins та розширені запити

Mid-Level
22 запитань

Просунутий Pandas

Mid-Level
24 запитань

Візуалізація з Matplotlib & Seaborn

Mid-Level
20 запитань

Інтерактивні візуалізації з Plotly

Mid-Level
18 запитань

Описова статистика

Mid-Level
20 запитань

Інференційна статистика

Mid-Level
24 запитань

Web Scraping

Mid-Level
18 запитань

BigQuery & Cloud Data

Mid-Level
18 запитань

Feature Engineering

Mid-Level
22 запитань

Кероване ML: Регресія

Mid-Level
24 запитань

Кероване ML: Класифікація

Mid-Level
24 запитань

Дерева рішень та ансамблі

Mid-Level
24 запитань

ML Pipelines та валідація

Mid-Level
22 запитань

Часові ряди та прогнозування

Mid-Level
22 запитань

Основи Deep Learning

Senior
24 запитань

TensorFlow & Keras

Senior
22 запитань

CNN та класифікація зображень

Senior
24 запитань

RNN та послідовності

Senior
22 запитань

Transformers та Attention

Senior
24 запитань

NLP та Hugging Face

Senior
24 запитань

GenAI та LangChain

Senior
24 запитань

MLOps та розгортання

Senior
24 запитань

Опануй Data Science & ML для наступної співбесіди

Отримай доступ до всіх питань, flashcards, технічних тестів, вправ code review та симуляторів співбесід.

Почни безкоштовно