
Web Scraping
BeautifulSoup, requests, parsing HTML, XPath, selectores CSS, APIs, paginación, mejores prácticas
1¿Qué biblioteca de Python se utiliza típicamente para realizar peticiones HTTP antes de parsear contenido HTML?
¿Qué biblioteca de Python se utiliza típicamente para realizar peticiones HTTP antes de parsear contenido HTML?
Respuesta
La biblioteca requests es el estándar en Python para realizar peticiones HTTP de manera simple e intuitiva. Permite ejecutar peticiones GET, POST y otros verbos HTTP con una API clara. BeautifulSoup no realiza peticiones HTTP, solo parsea el HTML una vez obtenido.
2¿Cuál es el rol principal de BeautifulSoup en un proyecto de web scraping?
¿Cuál es el rol principal de BeautifulSoup en un proyecto de web scraping?
Respuesta
BeautifulSoup es una biblioteca de parsing HTML/XML que permite navegar, buscar y extraer datos de un documento HTML. Crea un árbol del documento que facilita la búsqueda de elementos mediante métodos como find() y find_all(). No realiza peticiones HTTP.
3¿Qué método de BeautifulSoup permite encontrar todos los elementos que coinciden con un criterio dado?
¿Qué método de BeautifulSoup permite encontrar todos los elementos que coinciden con un criterio dado?
Respuesta
El método find_all() retorna una lista de todos los elementos que coinciden con los criterios especificados (tag, atributos, clase, etc.). El método find() solo retorna el primer elemento encontrado. select() utiliza selectores CSS y select_one() retorna un solo elemento con un selector CSS.
¿Cómo especificar un header User-Agent personalizado al hacer una petición con requests?
¿Qué atributo del objeto Response retorna el contenido HTML como texto?
+15 preguntas de entrevista
Otros temas de entrevista Data Science & ML
Fundamentos de Python
Programación Orientada a Objetos en Python
Estructuras de datos en Python
Fundamentos de Git
Fundamentos de SQL
Fundamentos de NumPy
Fundamentos de Pandas
Jupyter & Google Colab
SQL Joins y consultas avanzadas
Pandas avanzado
Visualización con Matplotlib & Seaborn
Visualizaciones interactivas con Plotly
Estadística descriptiva
Estadística inferencial
BigQuery & Cloud Data
Feature Engineering
ML Supervisado: Regresión
ML Supervisado: Clasificación
Árboles de Decisión y Ensembles
ML No Supervisado
Pipelines ML y Validación
Series Temporales y Pronóstico
Fundamentos de Deep Learning
TensorFlow & Keras
CNN y clasificación de imágenes
RNN y Secuencias
Transformers y Attention
NLP y Hugging Face
GenAI y LangChain
MLOps y Despliegue
Domina Data Science & ML para tu próxima entrevista
Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.
Empieza gratis