Question 1

Quale libreria Python viene tipicamente utilizzata per effettuare richieste HTTP prima di parsare il contenuto HTML?

Accepted Answer

La libreria requests è lo standard in Python per effettuare richieste HTTP in modo semplice e intuitivo. Consente di eseguire richieste GET, POST e altri verbi HTTP con un'API chiara. BeautifulSoup non effettua richieste HTTP, ma si limita a parsare l'HTML una volta recuperato.

Question 2

Qual è il ruolo principale di BeautifulSoup in un progetto di web scraping?

Accepted Answer

BeautifulSoup è una libreria di parsing HTML/XML che consente di navigare, cercare ed estrarre dati da un documento HTML. Crea un albero del documento che facilita la ricerca di elementi tramite metodi come find() e find_all(). Non effettua richieste HTTP.

Question 3

Quale metodo di BeautifulSoup trova tutti gli elementi corrispondenti a un criterio specifico?

Accepted Answer

Il metodo find_all() restituisce una lista di tutti gli elementi corrispondenti ai criteri specificati (tag, attributi, classe, ecc.). Il metodo find() restituisce solo il primo elemento corrispondente. select() utilizza selettori CSS e select_one() restituisce un singolo elemento con un selettore CSS.

Web Scraping

Quale libreria Python viene tipicamente utilizzata per effettuare richieste HTTP prima di parsare il contenuto HTML?

Risposta

Qual è il ruolo principale di BeautifulSoup in un progetto di web scraping?

Risposta

Quale metodo di BeautifulSoup trova tutti gli elementi corrispondenti a un criterio specifico?

Risposta

Come specificare un header User-Agent personalizzato durante una richiesta con requests?

Quale attributo dell'oggetto Response restituisce il contenuto HTML come testo?

Altri argomenti di colloquio Data Science & ML

Fondamenti di Python

Programmazione Orientata agli Oggetti in Python

Strutture dati Python

Fondamenti di Git

Fondamenti di SQL

Fondamenti di NumPy

Fondamenti di Pandas

Jupyter & Google Colab

SQL Joins e query avanzate

Pandas avanzato

Visualizzazione con Matplotlib & Seaborn

Visualizzazioni interattive con Plotly

Statistica descrittiva

Statistica inferenziale

BigQuery & Cloud Data

Feature Engineering

ML Supervisionato: Regressione

ML Supervisionato: Classificazione

Alberi Decisionali e Ensembles

ML Non Supervisionato

Pipeline ML e Validazione

Serie Temporali e Previsione

Fondamenti di Deep Learning

TensorFlow & Keras

CNN e classificazione di immagini

RNN e Sequenze

Transformers e Attention

NLP e Hugging Face

GenAI e LangChain

MLOps e Deployment

Padroneggia Data Science & ML per il tuo prossimo colloquio