Data Analytics

BigQuery - Funcionalidades avanzadas

Particionamiento, clustering, vistas materializadas, UDFs, consultas anidadas, STRUCT, ARRAY

20 preguntas de entrevista·
Mid-Level
1

¿Cuál es el rol principal del particionamiento en BigQuery?

Respuesta

El particionamiento divide una tabla en segmentos basados en una columna (a menudo una fecha), lo que reduce la cantidad de datos escaneados durante las consultas. Cuando una consulta filtra por la columna de partición, BigQuery solo lee las particiones relevantes en lugar de escanear toda la tabla. Esto mejora el rendimiento y reduce los costos de consulta, que se facturan según el volumen de datos escaneados.

2

¿Qué tipos de particionamiento están disponibles en BigQuery?

Respuesta

BigQuery ofrece tres tipos de particionamiento: por columna DATE, TIMESTAMP o DATETIME (el más común), por rango de enteros (INTEGER RANGE), y por tiempo de ingesta (_PARTITIONTIME). El particionamiento por fecha es el más utilizado porque la mayoría de los análisis filtran por períodos de tiempo. El particionamiento por rango de enteros es útil para identificadores numéricos.

3

¿Qué es un STRUCT en BigQuery?

Respuesta

Un STRUCT (o RECORD) es un tipo de datos que agrupa múltiples campos nombrados de tipos potencialmente diferentes en una sola columna. Por ejemplo, un STRUCT puede contener un nombre (STRING), una edad (INT64) y un email (STRING). Los STRUCT permiten modelar datos jerárquicos directamente dentro de una tabla, evitando joins costosos. Los campos se acceden usando la notación de punto (struct_col.field).

4

¿Qué es un ARRAY en BigQuery?

5

¿Para qué sirve la función UNNEST en BigQuery?

+17 preguntas de entrevista

Domina Data Analytics para tu próxima entrevista

Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.

Empieza gratis