Data Science & ML

Pandas-basis

DataFrames, Series, indexering, selectie, filtering, ontbrekende waarden, datatypes

22 gespreksvragen·
Junior
1

Wat is de belangrijkste Pandas-datastructuur voor het opslaan van tabelgegevens met benoemde rijen en kolommen?

Antwoord

Het DataFrame is de centrale datastructuur van Pandas, ontworpen om tweedimensionale tabelgegevens op te slaan. Elke kolom kan een ander datatype bevatten en zowel rijen als kolommen hebben labels (index). Deze structuur lijkt op een Excel-spreadsheet of een SQL-tabel, waardoor het manipuleren van gestructureerde gegevens eenvoudig is.

2

Welke Pandas-structuur vertegenwoordigt een enkele kolom gegevens met een index?

Antwoord

Een Series is een eendimensionale structuur die elk datatype kan bevatten (gehele getallen, strings, floats, Python-objecten). Elk element heeft een bijbehorende index, waardoor toegang tot waarden via hun label mogelijk is. Een kolom die uit een DataFrame is gehaald, wordt automatisch geconverteerd naar een Series.

3

Hoe maak je een DataFrame van een Python-dictionary waarbij sleutels kolomnamen worden?

Antwoord

De functie pd.DataFrame() accepteert direct een Python-dictionary. Dictionary-sleutels worden automatisch kolomnamen en waarden (lijsten of arrays) worden de gegevens van elke kolom. Deze methode is de meest gebruikelijke manier om DataFrames te maken van gestructureerde gegevens in Python.

4

Welke methode moet worden gebruikt om een CSV-bestand te lezen en in een DataFrame te laden?

5

Welke methode toont de eerste rijen van een DataFrame voor een snel gegevensvoorvertoning?

+19 gespreksvragen

Beheers Data Science & ML voor je volgende gesprek

Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.

Begin gratis