
Transformers ve Attention
Attention mekanizması, self-attention, multi-head attention, Transformer mimarisi, positional encoding
1Sequence işlemede attention mekanizmasının RNN'lere göre temel avantajı nedir?
Sequence işlemede attention mekanizmasının RNN'lere göre temel avantajı nedir?
Cevap
Attention mekanizması, sequence içindeki herhangi bir konuma doğrudan erişim sağlar ve RNN'lerin sıralı darboğazını ortadan kaldırır. Bilgiyi adım adım yayması gereken RNN'lerin aksine, attention tüm konumlar arasında doğrudan bağlantılar hesaplar, büyük ölçekli paralelleştirmeyi mümkün kılar ve gradyan bozulması olmadan uzun mesafeli bağımlılıkları yakalar.
2Attention mekanizmasında Query (Q), Key (K) ve Value (V) vektörleri neyi temsil eder?
Attention mekanizmasında Query (Q), Key (K) ve Value (V) vektörleri neyi temsil eder?
Cevap
Query token'ın aradığı şeyi temsil eder, Key her token'ın eşleşme olarak sunabileceği şeyi temsil eder ve Value alınacak bilgiyi içerir. Attention skoru, göreceli önemi belirlemek için Q ve K arasında hesaplanır, ardından V'leri ağırlıklandırmak için kullanılır. Bu analoji, bir query'nin değerleri almak için anahtarlarla karşılaştırıldığı bilgi alma sistemlerinden gelir.
3Scaled dot-product attention'ın formülü nedir ve neden dk'nın kareköküne bölünür?
Scaled dot-product attention'ın formülü nedir ve neden dk'nın kareköküne bölünür?
Cevap
Formül Attention(Q,K,V) = softmax(QK^T / sqrt(dk)) * V'dir. sqrt(dk)'ya bölmek kritiktir çünkü yüksek boyutlu vektörlerin dot product'ları büyük büyüklüklere sahip olma eğilimindedir ve softmax'ı çok küçük gradyanlı bölgelere iter. Bu normalleştirme attention skorlarının kararlı varyansını korur ve verimli öğrenmeyi sağlar.
Attention ve self-attention arasındaki temel fark nedir?
Tek bir attention head yerine neden multi-head attention kullanılır?
+21 mülakat soruları
Diğer Data Science & ML mülakat konuları
Python Temelleri
Python Nesne Yönelimli Programlama
Python Veri Yapıları
Git Temelleri
SQL Temelleri
NumPy Temelleri
Pandas Temelleri
Jupyter & Google Colab
SQL Joins ve Gelişmiş Sorgular
İleri Pandas
Matplotlib & Seaborn ile Görselleştirme
Plotly ile Etkileşimli Görselleştirmeler
Tanımlayıcı İstatistik
Çıkarımsal İstatistik
Web Scraping
BigQuery & Cloud Data
Feature Engineering
Denetimli ML: Regresyon
Denetimli ML: Sınıflandırma
Karar Ağaçları ve Topluluk Yöntemleri
Denetimsiz ML
ML Pipeline'ları & Doğrulama
Zaman Serileri & Tahminleme
Deep Learning Temelleri
TensorFlow & Keras
CNN ve görüntü sınıflandırma
RNN ve Diziler
NLP ve Hugging Face
GenAI ve LangChain
MLOps ve Dağıtım
Bir sonraki mülakatın için Data Science & ML'de uzmanlaş
Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.
Ücretsiz başla