Question 1

Który plik konfiguracyjny PostgreSQL zawiera główne parametry serwera, takie jak shared_buffers i work_mem?

Accepted Answer

Plik postgresql.conf zawiera główne parametry konfiguracyjne serwera PostgreSQL, w tym alokacje pamięci (shared_buffers, work_mem), ustawienia połączenia, logowanie i strojenie wydajności. Plik ten jest odczytywany przy uruchamianiu serwera, a niektóre parametry wymagają pełnego restartu, aby zaczęły obowiązywać.

Question 2

Który parametr PostgreSQL definiuje ilość pamięci współdzielonej używanej do buforowania danych?

Accepted Answer

shared_buffers definiuje ilość pamięci, której PostgreSQL używa do buforowania danych. Ten parametr jest kluczowy dla wydajności, ponieważ określa rozmiar puli buforów współdzielonej między wszystkimi połączeniami. Typowa rekomendacja to ustawienie go między 25% a 40% całkowitej pamięci RAM serwera dla serwera dedykowanego PostgreSQL.

Question 3

Jaka jest główna różnica między replikacją streaming a replikacją logiczną w PostgreSQL?

Accepted Answer

Replikacja streaming przesyła zmiany na poziomie WAL (Write-Ahead Log) w formacie binarnym, tworząc dokładną kopię bazy podstawowej. Replikacja logiczna dekoduje zmiany na logiczne operacje SQL, umożliwiając selektywną replikację określonych tabel i transformację danych podczas replikacji. Replikacja logiczna oferuje większą elastyczność, ale z nieco wyższym narzutem.

PostgreSQL - Administracja

Który plik konfiguracyjny PostgreSQL zawiera główne parametry serwera, takie jak shared_buffers i work_mem?

Odpowiedź

Który parametr PostgreSQL definiuje ilość pamięci współdzielonej używanej do buforowania danych?

Odpowiedź

Jaka jest główna różnica między replikacją streaming a replikacją logiczną w PostgreSQL?

Odpowiedź

Który typ indeksu PostgreSQL jest najbardziej odpowiedni dla wyszukiwania full-text i kolumn JSONB?

W jakim przypadku indeks BRIN (Block Range Index) jest szczególnie skuteczny?

Inne tematy rekrutacyjne Data Engineering

Linux & Shell - Podstawy

Git & GitHub - Podstawy

Zaawansowany Python dla Data Engineering

Docker - Podstawy

Google Cloud Platform - Podstawy

CI/CD i jakość kodu

Docker Compose

FastAPI - API danych

Zaawansowany SQL dla Data Engineering

Data Lake - Architektura i wprowadzanie danych

BigQuery dla Data Engineering

Data Modeling dla Data Engineering

Fivetran & Airbyte - Pozyskiwanie danych

dbt - Podstawy

Apache Airflow - Podstawy

Kubernetes - Podstawy

dbt - Zaawansowane funkcje

Wzorce ETL / ELT / ETLT

Apache Airflow - Zaawansowany

Airflow + dbt - Orkiestracja pipeline'ów

PySpark - Przetwarzanie na dużą skalę

Google Pub/Sub - Streaming danych

Apache Beam & Dataflow

Kubernetes - Produkcja i skalowanie

Terraform - Infrastructure as Code

Bazy danych NoSQL

Nowoczesna Data Architecture

Monitorowanie i obserwowalność

IAM i bezpieczeństwo danych

Opanuj Data Engineering na następną rozmowę