Data Analytics

Python & Pandas - Grondbeginselen

DataFrames, Series, indexering (loc, iloc), booleaanse filtering, datatypes, read_csv, describe, info, head/tail, shape, columns

20 gespreksvragen·
Junior
1

Wat is de belangrijkste Pandas-datastructuur voor het opslaan van tabulaire gegevens?

Antwoord

Het DataFrame is de kerngegevensstructuur van Pandas. Het vertegenwoordigt een tweedimensionale tabel met rijen en kolommen, vergelijkbaar met een spreadsheet of SQL-tabel. Elke kolom is een Series, en elke rij heeft een index. Het DataFrame maakt efficiënte manipulatie van gestructureerde gegevens mogelijk dankzij de vele ingebouwde methoden.

2

Wat is een Series in Pandas?

Antwoord

Een Series is een eendimensionale array met een index. Het vertegenwoordigt een enkele kolom met gegevens in een DataFrame. Elk element heeft een label (index) dat snelle toegang op naam of positie mogelijk maakt. Een Series kan slechts één datatype bevatten (int, float, string, enz.), wat het onderscheidt van een gewone Python-lijst.

3

Welke Pandas-functie leest een CSV-bestand en laadt het in een DataFrame?

Antwoord

De functie pd.read_csv() leest een CSV-bestand en retourneert een DataFrame. Het accepteert vele parameters: sep voor het scheidingsteken, header voor de kopregel, encoding voor de bestandscodering, dtype om kolomtypen te forceren, en na_values om ontbrekende waarden te definiëren. Het is de meest gebruikelijke methode om gegevens in Pandas te importeren.

4

Wat retourneert het df.shape-attribuut op een DataFrame?

5

Welke methode toont de eerste 5 rijen van een DataFrame?

+17 gespreksvragen

Beheers Data Analytics voor je volgende gesprek

Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.

Begin gratis