Data Science & ML

BigQuery & Cloud Data

BigQuery, consultas SQL a gran escala, particionamiento, datasets públicos, costos, optimización

18 preguntas de entrevista·
Mid-Level
1

¿Qué es Google BigQuery?

Respuesta

BigQuery es un data warehouse serverless, altamente escalable y rentable ofrecido por Google Cloud Platform. Permite ejecutar consultas SQL analíticas sobre petabytes de datos en segundos gracias a su arquitectura distribuida. A diferencia de las bases de datos tradicionales, BigQuery separa el almacenamiento del cómputo, lo que permite facturación por uso y escalabilidad casi ilimitada.

2

¿Cuál es la principal ventaja de la arquitectura serverless de BigQuery?

Respuesta

La arquitectura serverless de BigQuery significa que no hay infraestructura que gestionar: sin aprovisionamiento de servidores, sin configuración de clusters, sin mantenimiento. Google gestiona automáticamente los recursos según la demanda. Esto permite centrarse en las consultas y el análisis en lugar de la administración del sistema, mientras se beneficia de la escalabilidad automática.

3

¿Cómo cobra BigQuery las consultas en modo on-demand?

Respuesta

En modo on-demand, BigQuery cobra según la cantidad de datos escaneados por la consulta, no el tiempo de ejecución ni las filas devueltas. El primer terabyte escaneado por mes es gratuito. Por lo tanto, es crucial optimizar las consultas seleccionando solo las columnas necesarias y usando particionamiento para reducir costos.

4

¿Qué es un dataset en BigQuery?

5

¿Qué es el particionamiento de tablas en BigQuery y cuál es su principal ventaja?

+15 preguntas de entrevista

Domina Data Science & ML para tu próxima entrevista

Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.

Empieza gratis