Data Science & ML

Web Scraping

BeautifulSoup, requests, HTML ayrıştırma, XPath, CSS seçicileri, API'ler, sayfalama, en iyi uygulamalar

18 mülakat soruları·
Mid-Level
1

HTML içeriğini ayrıştırmadan önce HTTP istekleri yapmak için tipik olarak hangi Python kütüphanesi kullanılır?

Cevap

requests kütüphanesi, HTTP isteklerini basit ve sezgisel bir şekilde yapmak için Python'daki standarttır. Net bir API ile GET, POST ve diğer HTTP fiillerini gerçekleştirmeye olanak tanır. BeautifulSoup HTTP istekleri yapmaz, yalnızca alındıktan sonra HTML'yi ayrıştırır.

2

Bir web scraping projesinde BeautifulSoup'un ana rolü nedir?

Cevap

BeautifulSoup, bir HTML belgesinden veri gezinmeyi, aramayı ve çıkarmayı sağlayan bir HTML/XML ayrıştırma kütüphanesidir. find() ve find_all() gibi yöntemler kullanarak öğelerin aranmasını kolaylaştıran bir belge ağacı oluşturur. HTTP istekleri yapmaz.

3

Verilen bir kritere uyan tüm öğeleri hangi BeautifulSoup yöntemi bulur?

Cevap

find_all() yöntemi, belirtilen kriterlere (etiket, öznitelikler, sınıf, vb.) uyan tüm öğelerin bir listesini döndürür. find() yöntemi yalnızca eşleşen ilk öğeyi döndürür. select() CSS seçicileri kullanır ve select_one() bir CSS seçici ile tek bir öğe döndürür.

4

requests ile bir istek yaparken özel bir User-Agent başlığı nasıl belirtilir?

5

Response nesnesinin hangi özniteliği HTML içeriğini metin olarak döndürür?

+15 mülakat soruları

Bir sonraki mülakatın için Data Science & ML'de uzmanlaş

Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.

Ücretsiz başla