
BigQuery & Cloud Data
BigQuery, query SQL su larga scala, partizionamento, dataset pubblici, costi, ottimizzazione
1Cos'è Google BigQuery?
Cos'è Google BigQuery?
Risposta
BigQuery è un data warehouse serverless, altamente scalabile ed economicamente conveniente offerto da Google Cloud Platform. Permette di eseguire query SQL analitiche su petabyte di dati in pochi secondi grazie alla sua architettura distribuita. A differenza dei database tradizionali, BigQuery separa lo storage dal calcolo, consentendo la fatturazione a consumo e una scalabilità quasi illimitata.
2Qual è il principale vantaggio dell'architettura serverless di BigQuery?
Qual è il principale vantaggio dell'architettura serverless di BigQuery?
Risposta
L'architettura serverless di BigQuery significa che non c'è infrastruttura da gestire: nessun provisioning di server, nessuna configurazione di cluster, nessuna manutenzione. Google gestisce automaticamente le risorse in base alla domanda. Questo permette di concentrarsi sulle query e sull'analisi piuttosto che sull'amministrazione di sistema, beneficiando al contempo della scalabilità automatica.
3Come fattura BigQuery le query in modalità on-demand?
Come fattura BigQuery le query in modalità on-demand?
Risposta
In modalità on-demand, BigQuery fattura in base alla quantità di dati scansionati dalla query, non al tempo di esecuzione o alle righe restituite. Il primo terabyte scansionato al mese è gratuito. È quindi cruciale ottimizzare le query selezionando solo le colonne necessarie e utilizzando il partizionamento per ridurre i costi.
Cos'è un dataset in BigQuery?
Cos'è il partizionamento delle tabelle in BigQuery e qual è il suo principale vantaggio?
+15 domande da colloquio
Altri argomenti di colloquio Data Science & ML
Fondamenti di Python
Programmazione Orientata agli Oggetti in Python
Strutture dati Python
Fondamenti di Git
Fondamenti di SQL
Fondamenti di NumPy
Fondamenti di Pandas
Jupyter & Google Colab
SQL Joins e query avanzate
Pandas avanzato
Visualizzazione con Matplotlib & Seaborn
Visualizzazioni interattive con Plotly
Statistica descrittiva
Statistica inferenziale
Web Scraping
Feature Engineering
ML Supervisionato: Regressione
ML Supervisionato: Classificazione
Alberi Decisionali e Ensembles
ML Non Supervisionato
Pipeline ML e Validazione
Serie Temporali e Previsione
Fondamenti di Deep Learning
TensorFlow & Keras
CNN e classificazione di immagini
RNN e Sequenze
Transformers e Attention
NLP e Hugging Face
GenAI e LangChain
MLOps e Deployment
Padroneggia Data Science & ML per il tuo prossimo colloquio
Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.
Inizia gratis