
Web Scraping
BeautifulSoup, requests, парсинг HTML, XPath, CSS-селектори, API, пагінація, найкращі практики
1Яка бібліотека Python зазвичай використовується для виконання HTTP-запитів перед парсингом HTML-вмісту?
Яка бібліотека Python зазвичай використовується для виконання HTTP-запитів перед парсингом HTML-вмісту?
Відповідь
Бібліотека requests є стандартом у Python для виконання HTTP-запитів простим та інтуїтивним способом. Вона дозволяє виконувати GET, POST та інші HTTP-методи з чітким API. BeautifulSoup не виконує HTTP-запити, вона лише парсить HTML після його отримання.
2Яка основна роль BeautifulSoup у проєкті web scraping?
Яка основна роль BeautifulSoup у проєкті web scraping?
Відповідь
BeautifulSoup — це бібліотека для парсингу HTML/XML, яка дозволяє переходити, шукати та витягувати дані з HTML-документа. Вона створює дерево документа, що полегшує пошук елементів за допомогою методів find() та find_all(). Вона не виконує HTTP-запитів.
3Який метод BeautifulSoup знаходить усі елементи, що відповідають заданим критеріям?
Який метод BeautifulSoup знаходить усі елементи, що відповідають заданим критеріям?
Відповідь
Метод find_all() повертає список усіх елементів, що відповідають вказаним критеріям (тег, атрибути, клас тощо). Метод find() повертає лише перший знайдений елемент. select() використовує CSS-селектори, а select_one() повертає один елемент із CSS-селектором.
Як вказати власний заголовок User-Agent при виконанні запиту з requests?
Який атрибут об'єкта Response повертає HTML-вміст у вигляді тексту?
+15 питань зі співбесід
Інші теми співбесід Data Science & ML
Основи Python
Об'єктно-орієнтоване програмування Python
Структури даних Python
Основи Git
Основи SQL
Основи NumPy
Основи Pandas
Jupyter & Google Colab
SQL Joins та розширені запити
Просунутий Pandas
Візуалізація з Matplotlib & Seaborn
Інтерактивні візуалізації з Plotly
Описова статистика
Інференційна статистика
BigQuery & Cloud Data
Feature Engineering
Кероване ML: Регресія
Кероване ML: Класифікація
Дерева рішень та ансамблі
Некероване ML
ML Pipelines та валідація
Часові ряди та прогнозування
Основи Deep Learning
TensorFlow & Keras
CNN та класифікація зображень
RNN та послідовності
Transformers та Attention
NLP та Hugging Face
GenAI та LangChain
MLOps та розгортання
Опануй Data Science & ML для наступної співбесіди
Отримай доступ до всіх питань, flashcards, технічних тестів, вправ code review та симуляторів співбесід.
Почни безкоштовно