
Web Scraping
BeautifulSoup, requests, parsing HTML, XPath, selettori CSS, API, paginazione, best practice
1Quale libreria Python viene tipicamente utilizzata per effettuare richieste HTTP prima di parsare il contenuto HTML?
Quale libreria Python viene tipicamente utilizzata per effettuare richieste HTTP prima di parsare il contenuto HTML?
Risposta
La libreria requests è lo standard in Python per effettuare richieste HTTP in modo semplice e intuitivo. Consente di eseguire richieste GET, POST e altri verbi HTTP con un'API chiara. BeautifulSoup non effettua richieste HTTP, ma si limita a parsare l'HTML una volta recuperato.
2Qual è il ruolo principale di BeautifulSoup in un progetto di web scraping?
Qual è il ruolo principale di BeautifulSoup in un progetto di web scraping?
Risposta
BeautifulSoup è una libreria di parsing HTML/XML che consente di navigare, cercare ed estrarre dati da un documento HTML. Crea un albero del documento che facilita la ricerca di elementi tramite metodi come find() e find_all(). Non effettua richieste HTTP.
3Quale metodo di BeautifulSoup trova tutti gli elementi corrispondenti a un criterio specifico?
Quale metodo di BeautifulSoup trova tutti gli elementi corrispondenti a un criterio specifico?
Risposta
Il metodo find_all() restituisce una lista di tutti gli elementi corrispondenti ai criteri specificati (tag, attributi, classe, ecc.). Il metodo find() restituisce solo il primo elemento corrispondente. select() utilizza selettori CSS e select_one() restituisce un singolo elemento con un selettore CSS.
Come specificare un header User-Agent personalizzato durante una richiesta con requests?
Quale attributo dell'oggetto Response restituisce il contenuto HTML come testo?
+15 domande da colloquio
Altri argomenti di colloquio Data Science & ML
Fondamenti di Python
Programmazione Orientata agli Oggetti in Python
Strutture dati Python
Fondamenti di Git
Fondamenti di SQL
Fondamenti di NumPy
Fondamenti di Pandas
Jupyter & Google Colab
SQL Joins e query avanzate
Pandas avanzato
Visualizzazione con Matplotlib & Seaborn
Visualizzazioni interattive con Plotly
Statistica descrittiva
Statistica inferenziale
BigQuery & Cloud Data
Feature Engineering
ML Supervisionato: Regressione
ML Supervisionato: Classificazione
Alberi Decisionali e Ensembles
ML Non Supervisionato
Pipeline ML e Validazione
Serie Temporali e Previsione
Fondamenti di Deep Learning
TensorFlow & Keras
CNN e classificazione di immagini
RNN e Sequenze
Transformers e Attention
NLP e Hugging Face
GenAI e LangChain
MLOps e Deployment
Padroneggia Data Science & ML per il tuo prossimo colloquio
Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.
Inizia gratis