
BigQuery - Funcionalidades avanzadas
Particionamiento, clustering, vistas materializadas, UDFs, consultas anidadas, STRUCT, ARRAY
1¿Cuál es el rol principal del particionamiento en BigQuery?
¿Cuál es el rol principal del particionamiento en BigQuery?
Respuesta
El particionamiento divide una tabla en segmentos basados en una columna (a menudo una fecha), lo que reduce la cantidad de datos escaneados durante las consultas. Cuando una consulta filtra por la columna de partición, BigQuery solo lee las particiones relevantes en lugar de escanear toda la tabla. Esto mejora el rendimiento y reduce los costos de consulta, que se facturan según el volumen de datos escaneados.
2¿Qué tipos de particionamiento están disponibles en BigQuery?
¿Qué tipos de particionamiento están disponibles en BigQuery?
Respuesta
BigQuery ofrece tres tipos de particionamiento: por columna DATE, TIMESTAMP o DATETIME (el más común), por rango de enteros (INTEGER RANGE), y por tiempo de ingesta (_PARTITIONTIME). El particionamiento por fecha es el más utilizado porque la mayoría de los análisis filtran por períodos de tiempo. El particionamiento por rango de enteros es útil para identificadores numéricos.
3¿Qué es un STRUCT en BigQuery?
¿Qué es un STRUCT en BigQuery?
Respuesta
Un STRUCT (o RECORD) es un tipo de datos que agrupa múltiples campos nombrados de tipos potencialmente diferentes en una sola columna. Por ejemplo, un STRUCT puede contener un nombre (STRING), una edad (INT64) y un email (STRING). Los STRUCT permiten modelar datos jerárquicos directamente dentro de una tabla, evitando joins costosos. Los campos se acceden usando la notación de punto (struct_col.field).
¿Qué es un ARRAY en BigQuery?
¿Para qué sirve la función UNNEST en BigQuery?
+17 preguntas de entrevista
Otros temas de entrevista Data Analytics
Google Sheets - Fundamentos
Google Sheets - Fórmulas avanzadas
SQL - Fundamentos
SQL - Agregaciones y agrupamientos
SQL - Joins
BigQuery - Fundamentos
Data Cleaning - Limpieza de datos
KPIs y métricas de negocio
Estadística descriptiva
Zapier y automatización No-Code
Principios de visualización de datos
Python & Pandas - Fundamentos
Google Sheets - Dashboards automatizados
SQL - Subconsultas y CTEs
SQL - Window Functions
Data Modeling
Análisis de funnels y conversión
Análisis de cohortes y retención
Google Tag Manager y tracking
APIs y webhooks
dbt - Fundamentos
AB Testing y estadística aplicada
Looker Studio (Google Data Studio)
Power BI - Fundamentos
SQL - Consultas analíticas avanzadas
dbt - Funciones avanzadas
Power BI - DAX y dashboards avanzados
Python Analytics - Análisis avanzado y ML
Domina Data Analytics para tu próxima entrevista
Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.
Empieza gratis