Question 1

Qual biblioteca Python é tipicamente usada para fazer requisições HTTP antes de parsear conteúdo HTML?

Accepted Answer

A biblioteca requests é o padrão em Python para fazer requisições HTTP de forma simples e intuitiva. Permite realizar requisições GET, POST e outros verbos HTTP com uma API clara. BeautifulSoup não faz requisições HTTP, apenas parseia o HTML uma vez obtido.

Question 2

Qual é o papel principal do BeautifulSoup em um projeto de web scraping?

Accepted Answer

BeautifulSoup é uma biblioteca de parsing HTML/XML que permite navegar, buscar e extrair dados de um documento HTML. Cria uma árvore do documento que facilita a busca de elementos através de métodos como find() e find_all(). Não faz requisições HTTP.

Question 3

Qual método do BeautifulSoup permite encontrar todos os elementos que correspondem a um critério dado?

Accepted Answer

O método find_all() retorna uma lista de todos os elementos que correspondem aos critérios especificados (tag, atributos, classe, etc.). O método find() retorna apenas o primeiro elemento encontrado. select() usa seletores CSS e select_one() retorna um único elemento com um seletor CSS.

Web Scraping

Qual biblioteca Python é tipicamente usada para fazer requisições HTTP antes de parsear conteúdo HTML?

Resposta

Qual é o papel principal do BeautifulSoup em um projeto de web scraping?

Resposta

Qual método do BeautifulSoup permite encontrar todos os elementos que correspondem a um critério dado?

Resposta

Como especificar um header User-Agent personalizado ao fazer uma requisição com requests?

Qual atributo do objeto Response retorna o conteúdo HTML como texto?

Outros temas de entrevista Data Science & ML

Fundamentos de Python

Programação Orientada a Objetos em Python

Estruturas de dados em Python

Fundamentos do Git

Fundamentos de SQL

Fundamentos de NumPy

Fundamentos de Pandas

Jupyter & Google Colab

SQL Joins e consultas avançadas

Pandas avançado

Visualização com Matplotlib & Seaborn

Visualizações interativas com Plotly

Estatística descritiva

Estatística inferencial

BigQuery & Cloud Data

Feature Engineering

ML Supervisionado: Regressão

ML Supervisionado: Classificação

Árvores de Decisão e Ensembles

ML Não Supervisionado

Pipelines ML e Validação

Séries Temporais e Previsão

Fundamentos de Deep Learning

TensorFlow & Keras

CNN e classificação de imagens

RNN e Sequências

Transformers e Attention

NLP e Hugging Face

GenAI e LangChain

MLOps e Implantação

Domine Data Science & ML para sua proxima entrevista