Question 1

Dönüşümleri manuel olarak uygulamak yerine scikit-learn Pipeline kullanmanın temel avantajı nedir?

Accepted Answer

Bir Pipeline, aynı dönüşümlerin hem eğitim hem de test verilerine tutarlı bir şekilde uygulanmasını sağlar. Tüm preprocessing ve modelleme adımlarını tek bir nesnede kapsüller, bu da kodu basitleştirir, data leakage'i önler ve modelin production'a dağıtımını kolaylaştırır.

Question 2

Bir Pipeline'da tüm adımları eğitmek ve bir tahmin yapmak için hangi method çağrılmalıdır?

Accepted Answer

fit_predict methodu regresyon veya sınıflandırma Pipeline'ları için mevcut değildir. Önce pipeline'ı eğitmek için fit() çağırmanız, sonra tahminleri almak için predict() çağırmanız gerekir. Alternatif olarak, daha fazla kontrol için fit() ardından predict() ayrı ayrı çağrılabilir.

Question 3

Machine learning bağlamında data leakage nedir?

Accepted Answer

Data leakage, test setinden veya gelecekteki verilerden gelen bilgilerin eğitim sırasında yanlışlıkla kullanılması durumunda oluşur. Bu, preprocessing sırasında (split öncesi tüm dataset üzerinde mean hesaplama) veya hedefi dolaylı olarak içeren özellikler aracılığıyla olabilir. Genelleşmeyen yapay olarak yüksek performansla sonuçlanır.

ML Pipeline'ları & Doğrulama

Dönüşümleri manuel olarak uygulamak yerine scikit-learn Pipeline kullanmanın temel avantajı nedir?

Cevap

Bir Pipeline'da tüm adımları eğitmek ve bir tahmin yapmak için hangi method çağrılmalıdır?

Cevap

Machine learning bağlamında data leakage nedir?

Cevap

scikit-learn'de ColumnTransformer'ın rolü nedir?

K-Fold cross-validation nedir?

Diğer Data Science & ML mülakat konuları

Python Temelleri

Python Nesne Yönelimli Programlama

Python Veri Yapıları

Git Temelleri

SQL Temelleri

NumPy Temelleri

Pandas Temelleri

Jupyter & Google Colab

SQL Joins ve Gelişmiş Sorgular

İleri Pandas

Matplotlib & Seaborn ile Görselleştirme

Plotly ile Etkileşimli Görselleştirmeler

Tanımlayıcı İstatistik

Çıkarımsal İstatistik

Web Scraping

BigQuery & Cloud Data

Feature Engineering

Denetimli ML: Regresyon

Denetimli ML: Sınıflandırma

Karar Ağaçları ve Topluluk Yöntemleri

Denetimsiz ML

Zaman Serileri & Tahminleme

Deep Learning Temelleri

TensorFlow & Keras

CNN ve görüntü sınıflandırma

RNN ve Diziler

Transformers ve Attention

NLP ve Hugging Face

GenAI ve LangChain

MLOps ve Dağıtım

Bir sonraki mülakatın için Data Science & ML'de uzmanlaş