Data Science & ML

BigQuery & Cloud Data

BigQuery, query SQL su larga scala, partizionamento, dataset pubblici, costi, ottimizzazione

18 domande da colloquio·
Mid-Level
1

Cos'è Google BigQuery?

Risposta

BigQuery è un data warehouse serverless, altamente scalabile ed economicamente conveniente offerto da Google Cloud Platform. Permette di eseguire query SQL analitiche su petabyte di dati in pochi secondi grazie alla sua architettura distribuita. A differenza dei database tradizionali, BigQuery separa lo storage dal calcolo, consentendo la fatturazione a consumo e una scalabilità quasi illimitata.

2

Qual è il principale vantaggio dell'architettura serverless di BigQuery?

Risposta

L'architettura serverless di BigQuery significa che non c'è infrastruttura da gestire: nessun provisioning di server, nessuna configurazione di cluster, nessuna manutenzione. Google gestisce automaticamente le risorse in base alla domanda. Questo permette di concentrarsi sulle query e sull'analisi piuttosto che sull'amministrazione di sistema, beneficiando al contempo della scalabilità automatica.

3

Come fattura BigQuery le query in modalità on-demand?

Risposta

In modalità on-demand, BigQuery fattura in base alla quantità di dati scansionati dalla query, non al tempo di esecuzione o alle righe restituite. Il primo terabyte scansionato al mese è gratuito. È quindi cruciale ottimizzare le query selezionando solo le colonne necessarie e utilizzando il partizionamento per ridurre i costi.

4

Cos'è un dataset in BigQuery?

5

Cos'è il partizionamento delle tabelle in BigQuery e qual è il suo principale vantaggio?

+15 domande da colloquio

Padroneggia Data Science & ML per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis