Question 1

HTMLコンテンツをパースする前にHTTPリクエストを行うために通常使用されるPythonライブラリはどれですか？

Accepted Answer

requestsライブラリは、HTTPリクエストをシンプルかつ直感的に実行するためのPython標準です。明確なAPIでGET、POSTなどのHTTPメソッドを実行できます。BeautifulSoupはHTTPリクエストを行わず、取得後のHTMLをパースするだけです。

Question 2

Web scrapingプロジェクトにおけるBeautifulSoupの主な役割は何ですか？

Accepted Answer

BeautifulSoupは、HTMLドキュメントからデータをナビゲート、検索、抽出することを可能にするHTML/XMLパーシングライブラリです。find()やfind_all()などのメソッドを使用して要素を検索しやすくするドキュメントツリーを作成します。HTTPリクエストは行いません。

Question 3

指定された条件に一致するすべての要素を見つけるBeautifulSoupのメソッドはどれですか？

Accepted Answer

find_all()メソッドは、指定された条件（タグ、属性、クラスなど）に一致するすべての要素のリストを返します。find()メソッドは最初に一致した要素のみを返します。select()はCSSセレクタを使用し、select_one()はCSSセレクタで単一の要素を返します。

Web Scraping

その他のData Science & ML面接トピック