Question 1

Apa keunggulan utama mekanisme attention dibandingkan RNN untuk pemrosesan sequence?

Accepted Answer

Mekanisme attention memungkinkan akses langsung ke posisi mana pun dalam sequence, menghilangkan bottleneck sequential dari RNN. Berbeda dengan RNN yang harus mempropagasi informasi langkah demi langkah, attention menghitung koneksi langsung antara semua posisi, memungkinkan paralelisasi masif dan menangkap dependensi jarak jauh tanpa degradasi gradien.

Question 2

Dalam mekanisme attention, apa yang direpresentasikan oleh vektor Query (Q), Key (K), dan Value (V)?

Accepted Answer

Query merepresentasikan apa yang dicari token, Key merepresentasikan apa yang dapat ditawarkan setiap token sebagai kecocokan, dan Value berisi informasi yang akan diambil. Skor attention dihitung antara Q dan K untuk menentukan kepentingan relatif, lalu digunakan untuk membobot V. Analogi ini berasal dari sistem information retrieval di mana query dibandingkan dengan keys untuk mengambil values.

Question 3

Apa formula scaled dot-product attention dan mengapa membaginya dengan akar kuadrat dk?

Accepted Answer

Formulanya adalah Attention(Q,K,V) = softmax(QK^T / sqrt(dk)) * V. Pembagian dengan sqrt(dk) sangat penting karena dot product vektor berdimensi tinggi cenderung memiliki magnitudo besar, mendorong softmax ke wilayah dengan gradien sangat kecil. Normalisasi ini menjaga varians stabil dari skor attention, memastikan pembelajaran yang efisien.

Transformers & Attention

Apa keunggulan utama mekanisme attention dibandingkan RNN untuk pemrosesan sequence?

Jawaban

Dalam mekanisme attention, apa yang direpresentasikan oleh vektor Query (Q), Key (K), dan Value (V)?

Jawaban

Apa formula scaled dot-product attention dan mengapa membaginya dengan akar kuadrat dk?

Jawaban

Apa perbedaan fundamental antara attention dan self-attention?

Mengapa menggunakan multi-head attention daripada satu attention head?

Topik wawancara Data Science & ML lainnya

Dasar-dasar Python

Pemrograman Berorientasi Objek Python

Struktur Data Python

Dasar-Dasar Git

Dasar-dasar SQL

Dasar-Dasar NumPy

Dasar-dasar Pandas

Jupyter & Google Colab

SQL Joins & Kueri Lanjutan

Pandas Lanjutan

Visualisasi dengan Matplotlib & Seaborn

Visualisasi Interaktif dengan Plotly

Statistik Deskriptif

Statistik Inferensial

Web Scraping

BigQuery & Cloud Data

Feature Engineering

ML Terbimbing: Regresi

ML Terbimbing: Klasifikasi

Pohon Keputusan & Ensemble

ML Tanpa Pengawasan

Pipeline ML & Validasi

Deret Waktu & Peramalan

Dasar-Dasar Deep Learning

TensorFlow & Keras

CNN dan klasifikasi gambar

RNN & Sekuens

NLP & Hugging Face

GenAI & LangChain

MLOps dan Deployment

Kuasai Data Science & ML untuk wawancara berikutnya