
ML Pipeline'ları & Doğrulama
Scikit-learn pipeline'ları, cross-validation, GridSearchCV, RandomizedSearchCV, data leakage, katmanlama
1Dönüşümleri manuel olarak uygulamak yerine scikit-learn Pipeline kullanmanın temel avantajı nedir?
Dönüşümleri manuel olarak uygulamak yerine scikit-learn Pipeline kullanmanın temel avantajı nedir?
Cevap
Bir Pipeline, aynı dönüşümlerin hem eğitim hem de test verilerine tutarlı bir şekilde uygulanmasını sağlar. Tüm preprocessing ve modelleme adımlarını tek bir nesnede kapsüller, bu da kodu basitleştirir, data leakage'i önler ve modelin production'a dağıtımını kolaylaştırır.
2Bir Pipeline'da tüm adımları eğitmek ve bir tahmin yapmak için hangi method çağrılmalıdır?
Bir Pipeline'da tüm adımları eğitmek ve bir tahmin yapmak için hangi method çağrılmalıdır?
Cevap
fit_predict methodu regresyon veya sınıflandırma Pipeline'ları için mevcut değildir. Önce pipeline'ı eğitmek için fit() çağırmanız, sonra tahminleri almak için predict() çağırmanız gerekir. Alternatif olarak, daha fazla kontrol için fit() ardından predict() ayrı ayrı çağrılabilir.
3Machine learning bağlamında data leakage nedir?
Machine learning bağlamında data leakage nedir?
Cevap
Data leakage, test setinden veya gelecekteki verilerden gelen bilgilerin eğitim sırasında yanlışlıkla kullanılması durumunda oluşur. Bu, preprocessing sırasında (split öncesi tüm dataset üzerinde mean hesaplama) veya hedefi dolaylı olarak içeren özellikler aracılığıyla olabilir. Genelleşmeyen yapay olarak yüksek performansla sonuçlanır.
scikit-learn'de ColumnTransformer'ın rolü nedir?
K-Fold cross-validation nedir?
+19 mülakat soruları
Diğer Data Science & ML mülakat konuları
Python Temelleri
Python Nesne Yönelimli Programlama
Python Veri Yapıları
Git Temelleri
SQL Temelleri
NumPy Temelleri
Pandas Temelleri
Jupyter & Google Colab
SQL Joins ve Gelişmiş Sorgular
İleri Pandas
Matplotlib & Seaborn ile Görselleştirme
Plotly ile Etkileşimli Görselleştirmeler
Tanımlayıcı İstatistik
Çıkarımsal İstatistik
Web Scraping
BigQuery & Cloud Data
Feature Engineering
Denetimli ML: Regresyon
Denetimli ML: Sınıflandırma
Karar Ağaçları ve Topluluk Yöntemleri
Denetimsiz ML
Zaman Serileri & Tahminleme
Deep Learning Temelleri
TensorFlow & Keras
CNN ve görüntü sınıflandırma
RNN ve Diziler
Transformers ve Attention
NLP ve Hugging Face
GenAI ve LangChain
MLOps ve Dağıtım
Bir sonraki mülakatın için Data Science & ML'de uzmanlaş
Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.
Ücretsiz başla