Data Science & ML

Podstawy Pandas

DataFrames, Series, indeksowanie, selekcja, filtrowanie, brakujące wartości, typy danych

22 pytań z rozmów·
Junior
1

Jaka jest główna struktura danych Pandas do przechowywania danych tabelarycznych z nazwanymi wierszami i kolumnami?

Odpowiedź

DataFrame to centralna struktura danych Pandas, zaprojektowana do przechowywania dwuwymiarowych danych tabelarycznych. Każda kolumna może zawierać inny typ danych, a zarówno wiersze, jak i kolumny mają etykiety (index). Ta struktura jest podobna do arkusza Excel lub tabeli SQL, co ułatwia manipulację danymi strukturalnymi.

2

Która struktura Pandas reprezentuje pojedynczą kolumnę danych z indeksem?

Odpowiedź

Series to jednowymiarowa struktura, która może przechowywać dowolny typ danych (liczby całkowite, ciągi znaków, liczby zmiennoprzecinkowe, obiekty Pythona). Każdy element ma powiązany indeks, co pozwala na dostęp do wartości przez ich etykietę. Kolumna wyodrębniona z DataFrame jest automatycznie konwertowana na Series.

3

Jak utworzyć DataFrame ze słownika Pythona, w którym klucze stają się nazwami kolumn?

Odpowiedź

Funkcja pd.DataFrame() bezpośrednio akceptuje słownik Pythona. Klucze słownika automatycznie stają się nazwami kolumn, a wartości (listy lub tablice) stają się danymi każdej kolumny. Ta metoda jest najczęstszym sposobem tworzenia DataFrame'ów z danych strukturalnych w Pythonie.

4

Której metody należy użyć do odczytania pliku CSV i załadowania go do DataFrame?

5

Która metoda wyświetla pierwsze wiersze DataFrame dla szybkiego podglądu danych?

+19 pytań z rozmów

Opanuj Data Science & ML na następną rozmowę

Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.

Zacznij za darmo