
Bases de données NoSQL
GraphDB (Neo4j), Document DBs (MongoDB, Firestore), Wide Column (Cassandra, Bigtable), CAP theorem, cas d'usage
1Qu'est-ce que le théorème CAP et quelles sont ses trois propriétés ?
Qu'est-ce que le théorème CAP et quelles sont ses trois propriétés ?
Réponse
Le théorème CAP stipule qu'un système distribué ne peut garantir simultanément que deux des trois propriétés : Consistency (tous les noeuds voient les mêmes données), Availability (le système répond toujours), et Partition tolerance (le système continue de fonctionner malgré des partitions réseau). Ce théorème est fondamental pour comprendre les compromis architecturaux des bases NoSQL.
2Quelle est la différence principale entre une base de données Document (MongoDB) et une base Wide Column (Cassandra) ?
Quelle est la différence principale entre une base de données Document (MongoDB) et une base Wide Column (Cassandra) ?
Réponse
Les bases Document comme MongoDB stockent des documents JSON/BSON avec des schémas flexibles et permettent des requêtes complexes sur n'importe quel champ. Les bases Wide Column comme Cassandra organisent les données en familles de colonnes avec des clés de partition, optimisées pour les écritures massives et les lectures par clé. MongoDB excelle pour les données hiérarchiques, Cassandra pour les séries temporelles à haute vélocité.
3Dans quel cas d'usage privilégier Neo4j par rapport à MongoDB ou Cassandra ?
Dans quel cas d'usage privilégier Neo4j par rapport à MongoDB ou Cassandra ?
Réponse
Neo4j est une base de données graphe optimisée pour les relations complexes et multi-niveaux entre entités. Elle excelle pour les réseaux sociaux, les systèmes de recommandation, la détection de fraude et l'analyse de dépendances. Le langage Cypher permet de traverser des millions de relations en quelques millisecondes, là où les jointures SQL ou les lookups NoSQL seraient prohibitifs en performance.
Qu'est-ce qu'une partition key dans Cassandra et pourquoi est-elle critique pour les performances ?
Quelle est la syntaxe Cypher pour trouver tous les amis des amis d'un utilisateur dans Neo4j ?
+17 questions d'entretien
Autres sujets d'entretien Data Engineering
Linux & Shell - Fondamentaux
Git & GitHub - Fondamentaux
Python avancé pour le Data Engineering
Docker - Fondamentaux
Google Cloud Platform - Fondamentaux
CI/CD et qualité de code
Docker Compose
FastAPI - APIs de données
SQL avancé pour le Data Engineering
Data Lake - Architecture et ingestion
BigQuery pour le Data Engineering
PostgreSQL - Administration
Data Modeling pour le Data Engineering
Fivetran & Airbyte - Ingestion de données
dbt - Fondamentaux
Apache Airflow - Fondamentaux
Kubernetes - Fondamentaux
dbt - Fonctionnalités avancées
Patterns ETL / ELT / ETLT
Apache Airflow - Avancé
Airflow + dbt - Orchestration de pipelines
PySpark - Traitement à grande échelle
Google Pub/Sub - Streaming de données
Apache Beam & Dataflow
Kubernetes - Production et scaling
Terraform - Infrastructure as Code
Architecture Data moderne
Monitoring et observabilité
IAM et sécurité des données
Maîtrise Data Engineering pour ton prochain entretien
Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.
Commencer gratuitement