Data Science & ML

Beschrijvende statistiek

Gemiddelde, mediaan, standaarddeviatie, kwartielen, verdelingen, correlaties, outliers, skewness

20 gespreksvragen·
Mid-Level
1

Welke maatstaf voor centrale tendens is het meest geschikt voor data met extreme waarden (outliers)?

Antwoord

De mediaan is de meest robuuste maatstaf voor centrale tendens tegen outliers omdat deze de middelste waarde van gesorteerde data vertegenwoordigt, zonder beïnvloed te worden door extreme waarden. In tegenstelling tot het gemiddelde dat alle waarden optelt, beschouwt de mediaan alleen de positie. Bij salarissen van een bedrijf met een paar hoogbetaalde directeuren geeft de mediaan bijvoorbeeld een betere weergave van het typische salaris dan het gemiddelde.

2

Wat is de variantie van een dataset?

Antwoord

De variantie meet de spreiding van de data rond het gemiddelde. Het wordt berekend als het gemiddelde van de kwadraten van de afwijkingen van het gemiddelde. Door te kwadrateren krijgen we altijd positieve waarden en versterken we de impact van waarden die ver van het gemiddelde liggen. De eenheid van de variantie is het kwadraat van de oorspronkelijke data-eenheid, daarom gebruiken we vaak de standaarddeviatie (vierkantswortel van de variantie) om de spreiding in de oorspronkelijke eenheid te interpreteren.

3

Wat is de relatie tussen standaarddeviatie en variantie?

Antwoord

De standaarddeviatie is de vierkantswortel van de variantie. Deze transformatie brengt de spreidingsmaat terug naar de oorspronkelijke data-eenheid, wat de interpretatie vergemakkelijkt. Als data bijvoorbeeld in euro's is, zal de variantie in kwadraat-euro's zijn (moeilijk te interpreteren), terwijl de standaarddeviatie in euro's zal zijn. Daarom heeft de standaarddeviatie de voorkeur om datasprenading intuïtief te communiceren.

4

Wat vertegenwoordigt het eerste kwartiel (Q1) van een verdeling?

5

Hoe interpreteer je een Pearson-correlatiecoëfficiënt van -0.85?

+17 gespreksvragen

Beheers Data Science & ML voor je volgende gesprek

Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.

Begin gratis