Question 1

Welche Python-Bibliothek wird typischerweise verwendet, um HTTP-Anfragen zu stellen, bevor HTML-Inhalte geparst werden?

Accepted Answer

Die requests-Bibliothek ist der Standard in Python für einfache und intuitive HTTP-Anfragen. Sie ermöglicht GET-, POST- und andere HTTP-Methoden mit einer klaren API. BeautifulSoup führt keine HTTP-Anfragen aus, sondern parst nur das HTML nach dem Abrufen.

Question 2

Was ist die Hauptrolle von BeautifulSoup in einem Web-Scraping-Projekt?

Accepted Answer

BeautifulSoup ist eine HTML/XML-Parsing-Bibliothek, die das Navigieren, Suchen und Extrahieren von Daten aus einem HTML-Dokument ermöglicht. Sie erstellt einen Dokumentenbaum, der die Suche nach Elementen über Methoden wie find() und find_all() erleichtert. Sie führt keine HTTP-Anfragen aus.

Question 3

Welche BeautifulSoup-Methode findet alle Elemente, die einem bestimmten Kriterium entsprechen?

Accepted Answer

Die Methode find_all() gibt eine Liste aller Elemente zurück, die den angegebenen Kriterien (Tag, Attribute, Klasse usw.) entsprechen. Die Methode find() gibt nur das erste übereinstimmende Element zurück. select() verwendet CSS-Selektoren und select_one() gibt ein einzelnes Element mit einem CSS-Selektor zurück.

Web Scraping

Welche Python-Bibliothek wird typischerweise verwendet, um HTTP-Anfragen zu stellen, bevor HTML-Inhalte geparst werden?

Antwort

Was ist die Hauptrolle von BeautifulSoup in einem Web-Scraping-Projekt?

Antwort

Welche BeautifulSoup-Methode findet alle Elemente, die einem bestimmten Kriterium entsprechen?

Antwort

Wie gibt man einen benutzerdefinierten User-Agent-Header bei einer Anfrage mit requests an?

Welches Attribut des Response-Objekts gibt den HTML-Inhalt als Text zurück?

Weitere Data Science & ML-Interviewthemen

Python-Grundlagen

Python Objektorientierte Programmierung

Python-Datenstrukturen

Git-Grundlagen

SQL-Grundlagen

NumPy-Grundlagen

Pandas-Grundlagen

Jupyter & Google Colab

SQL Joins & fortgeschrittene Abfragen

Fortgeschrittenes Pandas

Visualisierung mit Matplotlib & Seaborn

Interaktive Visualisierungen mit Plotly

Deskriptive Statistik

Inferenzstatistik

BigQuery & Cloud Data

Feature Engineering

Überwachtes ML: Regression

Überwachtes ML: Klassifikation

Entscheidungsbäume & Ensembles

Unüberwachtes ML

ML-Pipelines & Validierung

Zeitreihen & Prognosen

Grundlagen des Deep Learning

TensorFlow & Keras

CNN und Bildklassifizierung

RNN & Sequenzen

Transformers & Attention

NLP & Hugging Face

GenAI & LangChain

MLOps und Deployment

Meistere Data Science & ML für dein nächstes Interview