Question 1

¿Cuál es el rol principal del particionamiento en BigQuery?

Accepted Answer

El particionamiento divide una tabla en segmentos basados en una columna (a menudo una fecha), lo que reduce la cantidad de datos escaneados durante las consultas. Cuando una consulta filtra por la columna de partición, BigQuery solo lee las particiones relevantes en lugar de escanear toda la tabla. Esto mejora el rendimiento y reduce los costos de consulta, que se facturan según el volumen de datos escaneados.

Question 2

¿Qué tipos de particionamiento están disponibles en BigQuery?

Accepted Answer

BigQuery ofrece tres tipos de particionamiento: por columna DATE, TIMESTAMP o DATETIME (el más común), por rango de enteros (INTEGER RANGE), y por tiempo de ingesta (_PARTITIONTIME). El particionamiento por fecha es el más utilizado porque la mayoría de los análisis filtran por períodos de tiempo. El particionamiento por rango de enteros es útil para identificadores numéricos.

Question 3

¿Qué es un STRUCT en BigQuery?

Accepted Answer

Un STRUCT (o RECORD) es un tipo de datos que agrupa múltiples campos nombrados de tipos potencialmente diferentes en una sola columna. Por ejemplo, un STRUCT puede contener un nombre (STRING), una edad (INT64) y un email (STRING). Los STRUCT permiten modelar datos jerárquicos directamente dentro de una tabla, evitando joins costosos. Los campos se acceden usando la notación de punto (struct_col.field).

BigQuery - Funcionalidades avanzadas

¿Cuál es el rol principal del particionamiento en BigQuery?

Respuesta

¿Qué tipos de particionamiento están disponibles en BigQuery?

Respuesta

¿Qué es un STRUCT en BigQuery?

Respuesta

¿Qué es un ARRAY en BigQuery?

¿Para qué sirve la función UNNEST en BigQuery?

Otros temas de entrevista Data Analytics

Google Sheets - Fundamentos

Google Sheets - Fórmulas avanzadas

SQL - Fundamentos

SQL - Agregaciones y agrupamientos

SQL - Joins

BigQuery - Fundamentos

Data Cleaning - Limpieza de datos

KPIs y métricas de negocio

Estadística descriptiva

Zapier y automatización No-Code

Principios de visualización de datos

Python & Pandas - Fundamentos

Google Sheets - Dashboards automatizados

SQL - Subconsultas y CTEs

SQL - Window Functions

Data Modeling

Análisis de funnels y conversión

Análisis de cohortes y retención

Google Tag Manager y tracking

APIs y webhooks

dbt - Fundamentos

AB Testing y estadística aplicada

Looker Studio (Google Data Studio)

Power BI - Fundamentos

SQL - Consultas analíticas avanzadas

dbt - Funciones avanzadas

Power BI - DAX y dashboards avanzados

Python Analytics - Análisis avanzado y ML

Domina Data Analytics para tu próxima entrevista