Data Science & ML

Data Science & ML

DATA

Kurikulum Data Science dan Machine Learning komprehensif dengan Python sebagai bahasa utama. Dari manipulasi data dengan Pandas dan NumPy hingga implementasi model Deep Learning dengan TensorFlow/Keras, melalui ML klasik dengan Scikit-Learn. Termasuk juga keterampilan MLOps untuk mendeploy dan memelihara model di produksi dengan Docker, FastAPI, dan platform cloud.

Apa yang akan Anda pelajari

Python modern dengan pemrograman berorientasi objek dan praktik terbaik

Manipulasi data dengan Pandas, NumPy, dan SQL (BigQuery)

Visualisasi dengan Matplotlib, Seaborn, dan Plotly

Statistik deskriptif dan inferensial dengan Statsmodel

Machine Learning dengan Scikit-Learn dan XGBoost (regresi, klasifikasi, clustering)

Deep Learning dengan TensorFlow dan Keras (CNN, RNN, Transformers)

NLP dan GenAI dengan Hugging Face, LangChain, dan LLMs (GPT, Gemini)

MLOps dengan MLflow, Docker, FastAPI, dan Streamlit

Lingkungan pengembangan: Jupyter, Google Colab

Deployment cloud dengan Google Compute, Cloud Storage, dan GPU

Topik utama yang harus dikuasai

Konsep terpenting untuk memahami teknologi ini dan berhasil di wawancara

1

Python: tipe, struktur data, OOP, decorator, generator, context manager

2

NumPy: array, broadcasting, indexing, operasi vektor, aljabar linear

3

Pandas: DataFrames, Series, indexing, groupby, merge, pivot, time series

4

SQL: SELECT, JOIN, GROUP BY, window functions, CTEs, optimisasi query

5

Visualisasi: Matplotlib (figures, axes, subplots), Seaborn (plot statistik), Plotly (interaktif)

6

Statistik: distribusi, pengujian hipotesis, interval kepercayaan, regresi

7

Feature Engineering: encoding, scaling, seleksi fitur, pembuatan fitur

8

ML Supervised: regresi linear/logistik, tree, Random Forest, XGBoost, metrik

9

ML Unsupervised: K-Means, clustering hierarkis, PCA, t-SNE

10

Pipeline ML: train/test split, cross-validation, hyperparameter tuning, overfitting

11

Deep Learning: perceptron, backpropagation, fungsi aktivasi, optimizer, fungsi loss

12

CNN: konvolusi, pooling, arsitektur (ResNet, VGG), transfer learning

13

RNN/LSTM: sekuens, vanishing gradient, mekanisme attention, Transformers

14

NLP: tokenisasi, embeddings, word2vec, BERT, fine-tuning LLM

15

MLOps: versioning (MLflow), containerisasi (Docker), API (FastAPI), monitoring

16

Cloud: Google Cloud (Compute, Storage, BigQuery), pelatihan GPU, Vertex AI

17

Etika AI: bias, explainability (SHAP, LIME), fairness, GDPR