
Pandas-basis
DataFrames, Series, indexering, selectie, filtering, ontbrekende waarden, datatypes
1Wat is de belangrijkste Pandas-datastructuur voor het opslaan van tabelgegevens met benoemde rijen en kolommen?
Wat is de belangrijkste Pandas-datastructuur voor het opslaan van tabelgegevens met benoemde rijen en kolommen?
Antwoord
Het DataFrame is de centrale datastructuur van Pandas, ontworpen om tweedimensionale tabelgegevens op te slaan. Elke kolom kan een ander datatype bevatten en zowel rijen als kolommen hebben labels (index). Deze structuur lijkt op een Excel-spreadsheet of een SQL-tabel, waardoor het manipuleren van gestructureerde gegevens eenvoudig is.
2Welke Pandas-structuur vertegenwoordigt een enkele kolom gegevens met een index?
Welke Pandas-structuur vertegenwoordigt een enkele kolom gegevens met een index?
Antwoord
Een Series is een eendimensionale structuur die elk datatype kan bevatten (gehele getallen, strings, floats, Python-objecten). Elk element heeft een bijbehorende index, waardoor toegang tot waarden via hun label mogelijk is. Een kolom die uit een DataFrame is gehaald, wordt automatisch geconverteerd naar een Series.
3Hoe maak je een DataFrame van een Python-dictionary waarbij sleutels kolomnamen worden?
Hoe maak je een DataFrame van een Python-dictionary waarbij sleutels kolomnamen worden?
Antwoord
De functie pd.DataFrame() accepteert direct een Python-dictionary. Dictionary-sleutels worden automatisch kolomnamen en waarden (lijsten of arrays) worden de gegevens van elke kolom. Deze methode is de meest gebruikelijke manier om DataFrames te maken van gestructureerde gegevens in Python.
Welke methode moet worden gebruikt om een CSV-bestand te lezen en in een DataFrame te laden?
Welke methode toont de eerste rijen van een DataFrame voor een snel gegevensvoorvertoning?
+19 gespreksvragen
Andere Data Science & ML-sollicitatieonderwerpen
Python-basisbeginselen
Python Objectgeoriënteerd Programmeren
Python-datastructuren
Git-Fundamenten
SQL-basisbeginselen
NumPy-grondbeginselen
Jupyter & Google Colab
SQL Joins & geavanceerde queries
Geavanceerd Pandas
Visualisatie met Matplotlib & Seaborn
Interactieve visualisaties met Plotly
Beschrijvende statistiek
Inferentiële statistiek
Web Scraping
BigQuery & Cloud Data
Feature Engineering
Supervised ML: Regressie
Supervised ML: Classificatie
Beslissingsbomen & Ensembles
Ongesuperviseerd ML
ML Pipelines & Validatie
Tijdreeksen & Voorspelling
Fundamenten van Deep Learning
TensorFlow & Keras
CNN en beeldclassificatie
RNN & Reeksen
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps en Deployment
Beheers Data Science & ML voor je volgende gesprek
Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.
Begin gratis