
Web Scraping
BeautifulSoup、requests、HTMLパーシング、XPath、CSSセレクタ、API、ページネーション、ベストプラクティス
18 面接問題·
Mid-Level
1HTMLコンテンツをパースする前にHTTPリクエストを行うために通常使用されるPythonライブラリはどれですか?
1
HTMLコンテンツをパースする前にHTTPリクエストを行うために通常使用されるPythonライブラリはどれですか?
回答
requestsライブラリは、HTTPリクエストをシンプルかつ直感的に実行するためのPython標準です。明確なAPIでGET、POSTなどのHTTPメソッドを実行できます。BeautifulSoupはHTTPリクエストを行わず、取得後のHTMLをパースするだけです。
2Web scrapingプロジェクトにおけるBeautifulSoupの主な役割は何ですか?
2
Web scrapingプロジェクトにおけるBeautifulSoupの主な役割は何ですか?
回答
BeautifulSoupは、HTMLドキュメントからデータをナビゲート、検索、抽出することを可能にするHTML/XMLパーシングライブラリです。find()やfind_all()などのメソッドを使用して要素を検索しやすくするドキュメントツリーを作成します。HTTPリクエストは行いません。
3指定された条件に一致するすべての要素を見つけるBeautifulSoupのメソッドはどれですか?
3
指定された条件に一致するすべての要素を見つけるBeautifulSoupのメソッドはどれですか?
回答
find_all()メソッドは、指定された条件(タグ、属性、クラスなど)に一致するすべての要素のリストを返します。find()メソッドは最初に一致した要素のみを返します。select()はCSSセレクタを使用し、select_one()はCSSセレクタで単一の要素を返します。
4
requestsでリクエストを行う際にカスタムUser-Agentヘッダーを指定するにはどうすればよいですか?
5
ResponseオブジェクトのどのプロパティがHTMLコンテンツをテキストとして返しますか?
+15 面接問題
その他のData Science & ML面接トピック
Pythonの基礎
Junior
25問Pythonオブジェクト指向プログラミング
Junior
20問Pythonのデータ構造
Junior
20問Git の基礎
Junior
18問SQLの基礎
Junior
20問NumPyの基礎
Junior
22問Pandasの基礎
Junior
22問Jupyter & Google Colab
Junior
16問SQL Joinsと高度なクエリ
Mid-Level
22問Pandas応用
Mid-Level
24問Matplotlib & Seabornによる可視化
Mid-Level
20問Plotlyによるインタラクティブな可視化
Mid-Level
18問記述統計
Mid-Level
20問推測統計学
Mid-Level
24問BigQuery & Cloud Data
Mid-Level
18問Feature Engineering
Mid-Level
22問教師あり機械学習:回帰
Mid-Level
24問教師あり機械学習:分類
Mid-Level
24問決定木とアンサンブル
Mid-Level
24問教師なしML
Mid-Level
22問MLパイプラインと検証
Mid-Level
22問時系列と予測
Mid-Level
22問Deep Learningの基礎
Senior
24問TensorFlow & Keras
Senior
22問CNN と画像分類
Senior
24問RNNとシーケンス
Senior
22問TransformersとAttention
Senior
24問NLPとHugging Face
Senior
24問GenAIとLangChain
Senior
24問MLOps とデプロイ
Senior
24問