Data Science & ML

Ongesuperviseerd ML

K-Means, hiërarchische clustering, DBSCAN, PCA, t-SNE, UMAP, silhouette score, elbow method

22 gespreksvragen·
Mid-Level
1

Wat is het belangrijkste verschil tussen supervised en unsupervised learning?

Antwoord

Unsupervised learning werkt met ongelabelde data en probeert verborgen structuren of patronen te ontdekken zonder een vooraf gedefinieerde doelvariabele. In tegenstelling tot supervised learning dat een bekende waarde (label) voorspelt, verkent unsupervised learning data om natuurlijke groepen te vinden, dimensionaliteit te verminderen of anomalieën te detecteren. Algoritmes zoals K-Means, PCA of DBSCAN zijn typische voorbeelden van unsupervised learning.

2

Hoe werkt het K-Means algoritme om data te partitioneren?

Antwoord

K-Means is een iteratief algoritme dat data partitioneert in K clusters. Het initialiseert K centroids willekeurig en wisselt af tussen twee stappen: elk punt toewijzen aan de dichtstbijzijnde centroid (toewijzingsstap) en centroidposities herberekenen als het gemiddelde van toegewezen punten (updatestap). Het algoritme convergeert wanneer toewijzingen niet meer veranderen of na een maximaal aantal iteraties.

3

Welke methode moet worden gebruikt om het optimale aantal clusters K in K-Means te bepalen?

Antwoord

De elbow method plot de inertia (som van kwadratische afstanden tussen elk punt en zijn centroid) tegen K. Het punt waar de curve een elleboog vormt, geeft de optimale K aan, omdat verder toevoegen van clusters de inertia niet meer significant verbetert. Deze methode wordt aangevuld met silhouette score om de clusterkwaliteit te valideren.

4

Wat meet de silhouette score in de context van clustering?

5

Wat is het waardenbereik van de silhouette score en hoe een score van 0.7 te interpreteren?

+19 gespreksvragen

Beheers Data Science & ML voor je volgende gesprek

Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.

Begin gratis