Data Analytics

Python & Pandas - Podstawy

DataFrame, Series, indeksowanie (loc, iloc), filtrowanie boolowskie, typy danych, read_csv, describe, info, head/tail, shape, columns

20 pytań z rozmów·
Junior
1

Jaka jest główna struktura danych Pandas do przechowywania danych tabelarycznych?

Odpowiedź

DataFrame to podstawowa struktura danych Pandas. Reprezentuje dwuwymiarową tabelę z wierszami i kolumnami, podobną do arkusza kalkulacyjnego lub tabeli SQL. Każda kolumna to Series, a każdy wiersz ma indeks. DataFrame umożliwia efektywną manipulację ustrukturyzowanymi danymi dzięki licznym wbudowanym metodom.

2

Czym jest Series w Pandas?

Odpowiedź

Series to jednowymiarowa tablica z indeksem. Reprezentuje pojedynczą kolumnę danych w DataFrame. Każdy element ma etykietę (indeks) umożliwiającą szybki dostęp po nazwie lub pozycji. Series może przechowywać tylko jeden typ danych (int, float, string itd.), co odróżnia ją od zwykłej listy Python.

3

Która funkcja Pandas odczytuje plik CSV i ładuje go do DataFrame?

Odpowiedź

Funkcja pd.read_csv() odczytuje plik CSV i zwraca DataFrame. Akceptuje wiele parametrów: sep dla separatora, header dla wiersza nagłówka, encoding dla kodowania pliku, dtype do wymuszania typów kolumn oraz na_values do definiowania brakujących wartości. To najczęstsza metoda importowania danych do Pandas.

4

Co zwraca atrybut df.shape na DataFrame?

5

Która metoda wyświetla pierwsze 5 wierszy DataFrame?

+17 pytań z rozmów

Opanuj Data Analytics na następną rozmowę

Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.

Zacznij za darmo