Data Analytics

Python & Pandas - 基礎

DataFrame、Series、インデックス(loc、iloc)、ブール値フィルタリング、データ型、read_csv、describe、info、head/tail、shape、columns

20 面接問題·
Junior
1

表形式データを格納するためのPandasの主要なデータ構造は何ですか?

回答

DataFrameはPandasの中核となるデータ構造です。スプレッドシートやSQLテーブルに似た、行と列を持つ2次元のテーブルを表します。各列はSeriesであり、各行はインデックスを持ちます。DataFrameは、組み込みメソッドの豊富さにより、構造化データを効率的に操作できます。

2

PandasのSeriesとは何ですか?

回答

Seriesはインデックスを持つ1次元配列です。DataFrame内の単一の列のデータを表します。各要素には名前または位置による高速アクセスを可能にするラベル(インデックス)があります。Seriesは1つのデータ型(int、float、stringなど)しか保持できず、これがPythonの通常のリストとの違いです。

3

CSVファイルを読み込んでDataFrameにロードするPandasの関数はどれですか?

回答

pd.read_csv()関数はCSVファイルを読み込み、DataFrameを返します。多くのパラメータを受け付けます:区切り文字のsep、ヘッダー行のheader、ファイルエンコーディングのencoding、列の型を強制するdtype、欠損値を定義するna_values。これはPandasにデータをインポートする最も一般的な方法です。

4

DataFrameのdf.shape属性は何を返しますか?

5

DataFrameの最初の5行を表示するメソッドはどれですか?

+17 面接問題

次の面接に向けてData Analyticsをマスター

すべての問題、flashcards、技術テスト、コードレビュー演習、面接シミュレーターにアクセス。

無料で始める