Question 1

¿Qué biblioteca de Python se utiliza típicamente para realizar peticiones HTTP antes de parsear contenido HTML?

Accepted Answer

La biblioteca requests es el estándar en Python para realizar peticiones HTTP de manera simple e intuitiva. Permite ejecutar peticiones GET, POST y otros verbos HTTP con una API clara. BeautifulSoup no realiza peticiones HTTP, solo parsea el HTML una vez obtenido.

Question 2

¿Cuál es el rol principal de BeautifulSoup en un proyecto de web scraping?

Accepted Answer

BeautifulSoup es una biblioteca de parsing HTML/XML que permite navegar, buscar y extraer datos de un documento HTML. Crea un árbol del documento que facilita la búsqueda de elementos mediante métodos como find() y find_all(). No realiza peticiones HTTP.

Question 3

¿Qué método de BeautifulSoup permite encontrar todos los elementos que coinciden con un criterio dado?

Accepted Answer

El método find_all() retorna una lista de todos los elementos que coinciden con los criterios especificados (tag, atributos, clase, etc.). El método find() solo retorna el primer elemento encontrado. select() utiliza selectores CSS y select_one() retorna un solo elemento con un selector CSS.

Web Scraping

¿Qué biblioteca de Python se utiliza típicamente para realizar peticiones HTTP antes de parsear contenido HTML?

Respuesta

¿Cuál es el rol principal de BeautifulSoup en un proyecto de web scraping?

Respuesta

¿Qué método de BeautifulSoup permite encontrar todos los elementos que coinciden con un criterio dado?

Respuesta

¿Cómo especificar un header User-Agent personalizado al hacer una petición con requests?

¿Qué atributo del objeto Response retorna el contenido HTML como texto?

Otros temas de entrevista Data Science & ML

Fundamentos de Python

Programación Orientada a Objetos en Python

Estructuras de datos en Python

Fundamentos de Git

Fundamentos de SQL

Fundamentos de NumPy

Fundamentos de Pandas

Jupyter & Google Colab

SQL Joins y consultas avanzadas

Pandas avanzado

Visualización con Matplotlib & Seaborn

Visualizaciones interactivas con Plotly

Estadística descriptiva

Estadística inferencial

BigQuery & Cloud Data

Feature Engineering

ML Supervisado: Regresión

ML Supervisado: Clasificación

Árboles de Decisión y Ensembles

ML No Supervisado

Pipelines ML y Validación

Series Temporales y Pronóstico

Fundamentos de Deep Learning

TensorFlow & Keras

CNN y clasificación de imágenes

RNN y Secuencias

Transformers y Attention

NLP y Hugging Face

GenAI y LangChain

MLOps y Despliegue

Domina Data Science & ML para tu próxima entrevista