
PostgreSQL - Administracja
Konfiguracja, replikacja, indeksowanie (B-tree, GIN, GiST, BRIN), VACUUM, EXPLAIN ANALYZE, rozszerzenia, kopie zapasowe
1Który plik konfiguracyjny PostgreSQL zawiera główne parametry serwera, takie jak shared_buffers i work_mem?
Który plik konfiguracyjny PostgreSQL zawiera główne parametry serwera, takie jak shared_buffers i work_mem?
Odpowiedź
Plik postgresql.conf zawiera główne parametry konfiguracyjne serwera PostgreSQL, w tym alokacje pamięci (shared_buffers, work_mem), ustawienia połączenia, logowanie i strojenie wydajności. Plik ten jest odczytywany przy uruchamianiu serwera, a niektóre parametry wymagają pełnego restartu, aby zaczęły obowiązywać.
2Który parametr PostgreSQL definiuje ilość pamięci współdzielonej używanej do buforowania danych?
Który parametr PostgreSQL definiuje ilość pamięci współdzielonej używanej do buforowania danych?
Odpowiedź
shared_buffers definiuje ilość pamięci, której PostgreSQL używa do buforowania danych. Ten parametr jest kluczowy dla wydajności, ponieważ określa rozmiar puli buforów współdzielonej między wszystkimi połączeniami. Typowa rekomendacja to ustawienie go między 25% a 40% całkowitej pamięci RAM serwera dla serwera dedykowanego PostgreSQL.
3Jaka jest główna różnica między replikacją streaming a replikacją logiczną w PostgreSQL?
Jaka jest główna różnica między replikacją streaming a replikacją logiczną w PostgreSQL?
Odpowiedź
Replikacja streaming przesyła zmiany na poziomie WAL (Write-Ahead Log) w formacie binarnym, tworząc dokładną kopię bazy podstawowej. Replikacja logiczna dekoduje zmiany na logiczne operacje SQL, umożliwiając selektywną replikację określonych tabel i transformację danych podczas replikacji. Replikacja logiczna oferuje większą elastyczność, ale z nieco wyższym narzutem.
Który typ indeksu PostgreSQL jest najbardziej odpowiedni dla wyszukiwania full-text i kolumn JSONB?
W jakim przypadku indeks BRIN (Block Range Index) jest szczególnie skuteczny?
+17 pytań z rozmów
Inne tematy rekrutacyjne Data Engineering
Linux & Shell - Podstawy
Git & GitHub - Podstawy
Zaawansowany Python dla Data Engineering
Docker - Podstawy
Google Cloud Platform - Podstawy
CI/CD i jakość kodu
Docker Compose
FastAPI - API danych
Zaawansowany SQL dla Data Engineering
Data Lake - Architektura i wprowadzanie danych
BigQuery dla Data Engineering
Data Modeling dla Data Engineering
Fivetran & Airbyte - Pozyskiwanie danych
dbt - Podstawy
Apache Airflow - Podstawy
Kubernetes - Podstawy
dbt - Zaawansowane funkcje
Wzorce ETL / ELT / ETLT
Apache Airflow - Zaawansowany
Airflow + dbt - Orkiestracja pipeline'ów
PySpark - Przetwarzanie na dużą skalę
Google Pub/Sub - Streaming danych
Apache Beam & Dataflow
Kubernetes - Produkcja i skalowanie
Terraform - Infrastructure as Code
Bazy danych NoSQL
Nowoczesna Data Architecture
Monitorowanie i obserwowalność
IAM i bezpieczeństwo danych
Opanuj Data Engineering na następną rozmowę
Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.
Zacznij za darmo