Data Analytics

Statistica descrittiva

Media vs mediana, varianza, deviazione standard, distribuzione normale, asimmetria, correlazione vs causalità, bias di campionamento, percentili

20 domande da colloquio·
Junior
1

Quale misura di tendenza centrale rappresenta il valore che divide un dataset ordinato in due metà uguali?

Risposta

La mediana è il valore centrale di un dataset ordinato in modo crescente. Separa esattamente il 50% dei valori inferiori dal 50% di quelli superiori. A differenza della media, la mediana non è influenzata dai valori estremi, rendendola un indicatore più robusto per distribuzioni asimmetriche come redditi o prezzi immobiliari.

2

Qual è la differenza fondamentale tra la media e la mediana?

Risposta

La media tiene conto di tutti i valori ed è quindi sensibile ai valori estremi (outlier), mentre la mediana dipende solo dalla posizione centrale dei dati ordinati. Ad esempio, se cinque stipendi sono 30k, 35k, 40k, 45k e 500k, la media è trascinata verso l'alto dai 500k (130k), mentre la mediana resta a 40k, riflettendo meglio la realtà del gruppo.

3

Cos'è la moda in un dataset?

Risposta

La moda è il valore che appare più frequentemente in un dataset. Un dataset può essere unimodale (una sola moda), bimodale (due mode) o multimodale (più mode). La moda è l'unica misura di tendenza centrale utilizzabile con dati categorici, come il colore preferito o la categoria di prodotti più venduta.

4

Cosa misura la varianza in un dataset?

5

Qual è la relazione tra varianza e deviazione standard?

+17 domande da colloquio

Padroneggia Data Analytics per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis