Question 1

Welke Python-bibliotheek wordt doorgaans gebruikt om HTTP-verzoeken te doen voordat HTML-inhoud wordt geparsed?

Accepted Answer

De requests-bibliotheek is de standaard in Python voor het maken van HTTP-verzoeken op een eenvoudige en intuïtieve manier. Het maakt het mogelijk om GET-, POST- en andere HTTP-werkwoorden uit te voeren met een duidelijke API. BeautifulSoup maakt geen HTTP-verzoeken, het parseert alleen HTML zodra deze is opgehaald.

Question 2

Wat is de hoofdrol van BeautifulSoup in een web scraping-project?

Accepted Answer

BeautifulSoup is een HTML/XML-parsingbibliotheek waarmee je kunt navigeren, zoeken en gegevens uit een HTML-document kunt halen. Het maakt een documentboom die het zoeken naar elementen vergemakkelijkt via methoden zoals find() en find_all(). Het maakt geen HTTP-verzoeken.

Question 3

Welke BeautifulSoup-methode vindt alle elementen die voldoen aan een bepaald criterium?

Accepted Answer

De methode find_all() retourneert een lijst van alle elementen die voldoen aan de opgegeven criteria (tag, attributen, klasse, enz.). De methode find() retourneert alleen het eerste overeenkomende element. select() gebruikt CSS-selectors en select_one() retourneert een enkel element met een CSS-selector.

Web Scraping

Welke Python-bibliotheek wordt doorgaans gebruikt om HTTP-verzoeken te doen voordat HTML-inhoud wordt geparsed?

Antwoord

Wat is de hoofdrol van BeautifulSoup in een web scraping-project?

Antwoord

Welke BeautifulSoup-methode vindt alle elementen die voldoen aan een bepaald criterium?

Antwoord

Hoe een aangepaste User-Agent-header opgeven bij het doen van een verzoek met requests?

Welk attribuut van het Response-object retourneert de HTML-inhoud als tekst?

Andere Data Science & ML-sollicitatieonderwerpen

Python-basisbeginselen

Python Objectgeoriënteerd Programmeren

Python-datastructuren

Git-Fundamenten

SQL-basisbeginselen

NumPy-grondbeginselen

Pandas-basis

Jupyter & Google Colab

SQL Joins & geavanceerde queries

Geavanceerd Pandas

Visualisatie met Matplotlib & Seaborn

Interactieve visualisaties met Plotly

Beschrijvende statistiek

Inferentiële statistiek

BigQuery & Cloud Data

Feature Engineering

Supervised ML: Regressie

Supervised ML: Classificatie

Beslissingsbomen & Ensembles

Ongesuperviseerd ML

ML Pipelines & Validatie

Tijdreeksen & Voorspelling

Fundamenten van Deep Learning

TensorFlow & Keras

CNN en beeldclassificatie

RNN & Reeksen

Transformers & Attention

NLP & Hugging Face

GenAI & LangChain

MLOps en Deployment

Beheers Data Science & ML voor je volgende gesprek