
Python & Pandas - Grondbeginselen
DataFrames, Series, indexering (loc, iloc), booleaanse filtering, datatypes, read_csv, describe, info, head/tail, shape, columns
1Wat is de belangrijkste Pandas-datastructuur voor het opslaan van tabulaire gegevens?
Wat is de belangrijkste Pandas-datastructuur voor het opslaan van tabulaire gegevens?
Antwoord
Het DataFrame is de kerngegevensstructuur van Pandas. Het vertegenwoordigt een tweedimensionale tabel met rijen en kolommen, vergelijkbaar met een spreadsheet of SQL-tabel. Elke kolom is een Series, en elke rij heeft een index. Het DataFrame maakt efficiënte manipulatie van gestructureerde gegevens mogelijk dankzij de vele ingebouwde methoden.
2Wat is een Series in Pandas?
Wat is een Series in Pandas?
Antwoord
Een Series is een eendimensionale array met een index. Het vertegenwoordigt een enkele kolom met gegevens in een DataFrame. Elk element heeft een label (index) dat snelle toegang op naam of positie mogelijk maakt. Een Series kan slechts één datatype bevatten (int, float, string, enz.), wat het onderscheidt van een gewone Python-lijst.
3Welke Pandas-functie leest een CSV-bestand en laadt het in een DataFrame?
Welke Pandas-functie leest een CSV-bestand en laadt het in een DataFrame?
Antwoord
De functie pd.read_csv() leest een CSV-bestand en retourneert een DataFrame. Het accepteert vele parameters: sep voor het scheidingsteken, header voor de kopregel, encoding voor de bestandscodering, dtype om kolomtypen te forceren, en na_values om ontbrekende waarden te definiëren. Het is de meest gebruikelijke methode om gegevens in Pandas te importeren.
Wat retourneert het df.shape-attribuut op een DataFrame?
Welke methode toont de eerste 5 rijen van een DataFrame?
+17 gespreksvragen
Andere Data Analytics-sollicitatieonderwerpen
Google Sheets - Grondbeginselen
Google Sheets - Geavanceerde formules
SQL - Grondbeginselen
SQL - Aggregaties en groeperingen
SQL - Joins
BigQuery - Grondbeginselen
Data Cleaning - Data opschonen
KPI's en business-metrieken
Beschrijvende statistiek
Zapier en No-Code automatisering
Principes van datavisualisatie
Google Sheets - Geautomatiseerde dashboards
SQL - Subquery's en CTE's
SQL - Window Functions
BigQuery - Geavanceerde functies
Data Modeling
Funnel- en conversieanalyse
Cohort- en retentieanalyse
Google Tag Manager en tracking
API's en webhooks
dbt - Grondbeginselen
AB Testing en toegepaste statistiek
Looker Studio (Google Data Studio)
Power BI - Basisprincipes
SQL - Geavanceerde analytische queries
dbt - Geavanceerde functies
Power BI - DAX en geavanceerde dashboards
Python Analytics - Geavanceerde analyse en ML
Beheers Data Analytics voor je volgende gesprek
Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.
Begin gratis