Skip to content

Pengenalan Pola

Umpan balik

Mohon untuk mengisi formulir umpan balik kuliah di sini.

Pendahuluan

Ada baiknya untuk sedikit mengulas materi aljabar linear, kalkulus, dan statistika Anda sebelum memulai kuliah ini. Beberapa orang merekomendasikan untuk belajar dari bagian pertama buku Deep Learning yang ditulis oleh Ian Goodfellow dkk. Untuk pemahaman lebih lanjut, Anda juga bisa melihat materi probabilitas untuk ilmu komputer yang sangat menarik di kuliah Stanford CS109: Probability for Computer Scientists.

Referensi

Kuliah ini banyak mengadaptasi materi dari Introductory Applied Machine Learning dan Machine Learning & Pattern Recognition dari the University of Edinburgh, serta CS229: Machine Learning dari Stanford University.

Beberapa materi kuliah ini juga diadaptasi dari kuliah Data Mining. Namun, alur penyampaian kuliah akan sedikit diubah. Selain itu, contoh-contoh kasusnya akan lebih banyak berkaitan dengan masalah-masalah dalam computer vision.

Anda dapat membuat clone dari repositori mata kuliah ini di sini.

Pre-test

Coba soal latihan ini untuk mengetahui apakah Anda punya cukup pengetahuan untuk mengikuti kelas ini atau tidak.

Konsep Probabilistik dalam Pengenalan Pola

Salindia minggu ke-1: Pendahuluan

Apa hubungannya data mining, machine learning, dan pengenalan pola? Uraian singkat mengenai materi yang akan dipelajari selama kuliah ini akan disampaikan pada pertemuan pertama perkuliahan. Anda diminta proaktif dalam mencari materi tambahan untuk belajar lebih banyak lagi.

Salindia minggu ke-2: Probabilitas

Di minggu ini, kita akan membahas tentang konsep peluang, peubah acak, dan beberapa materi lainnya yang berkaitan dengan ketidakpastian yang akan membantu untuk memahami materi-materi di beberapa pertemuan berikutnya. Sangat disarankan bagi Anda untuk melihat kuliah Stanford CS109 dan Harvard Stats 110.

Salindia minggu ke-3: Beberapa Distribusi Diskrit

Salindia minggu ke-4: Beberapa Distribusi Kontinu

Sebagi dasar untuk masuk ke materi berikutnya tentang Naive Bayes, di minggu ini dan minggu depan kita akan membahas beberapa jenis distribusi yang akan sering dijumpai untuk pemodelan data. Anda akan belajar untuk mengestimasi nilai parameter dari suatu distribusi yang dapat menjelaskan data dengan baik (Maximum Likelihood Estimation). Gunakan SciPy, pomegranate, atau PyMC3 untuk melakukan pemodelan probabilistik dari contoh-contoh data yang tersedia, misalnya data menu McDonald's.

Salindia minggu ke-5: Naïve Bayes

Praktikum 1: Distribusi Gaussian dan Naive Bayes

Memanfaatkan konsep yang sudah dipelajari minggu lalu, minggu ini kita akan melihat bagaimana berbagai distribusi tersebut dapat digunakan untuk melakukan klasifikasi. Pelajari multivariate Gaussian dan distribusi Bernoulli secara lebih intensif untuk bisa memahami materi ini.

Tugas 1

Notebook Tugas 1

Dalam tugas ini, Anda akan melakukan eksplorasi data dan pemilihan model dari data konsumsi bensin mobil.

Tenggat

Minggu, 14 April 2019, pukul 23.55 WIB

Dimensionality Reduction

Salindia minggu ke-6: Dimensionality Reduction

Dalam multivariate Gaussian, Anda menghitung matriks kovariansi yang menggambarkan variansi dari tiap variabel dan hubungan antarvariabel. Ingat bahwa dalam kasus MNIST, selalu ada variabel yang tidak pernah berubah nilainya. Jadi, apakah kita masih membutuhkan variabel tersebut? Metode yang akan Anda pelajari di minggu ini akan membantu Anda dalam mereduksi dimensi yang tinggi menjadi beberapa dimensi yang bermakna saja. Untuk melakukan hal tersebut, Anda memerlukan kovariansi matriks yang dihitung tadi.

Model Linear

Salindia minggu ke-7: Model Linear

Referensi

Coba baca referensi dari Iain Murray ini untuk mempelajari lebih lanjut tentang least square regression.

Model linear secara umum sudah pernah dibahas di mata kuliah Kecerdasan Buatan. Kali ini, kita akan melihat bagaimana prosesnya untuk bisa mendapatkan solusi dari regresi linear dengan asumsi Gaussian noise. Untuk itu, pelajari kembali materi distribusi Gaussian dan MLE-nya. Selain itu, materi tambahan kali ini adalah regularisasi dan dampaknya ke model yang dihasilkan.

Tugas 2

Notebook Tugas 2

Dataset Tugas 2

Label Dataset Tugas 2

Dalam tugas ini, Anda akan mengulas materi tentang Naive Bayes, PCA, model linear, dan evaluasi model dengan menerapkannya pada dataset Quick Draw.

Tenggat

Sabtu, 11 Mei 2019, pukul 23.55 WIB

Evaluasi Model

Salindia minggu ke-8: Evaluasi Model

Apakah model machine learning selalu hanya berupa trial and error? Pada minggu ini, topik yang akan dibahas adalah bagaimana kita dapat mengevaluasi model dan menentukan perbaikan seperti apa yang dapat dilakukan terhadap model tersebut. Beberapa konsep penting yang akan dibahas antara lain bias-variance trade-off, underfitting, overfitting, dan beberapa metrik yang dapat digunakan untuk mengevaluasi model dalam kasus klasifikasi maupun regresi.

Tugas 3

Kompetisi Kaggle

Dalam tugas kali ini, Anda akan mengklasifikasikan gambar beberapa spesies daun. Anda harus menggunakan situs kompetisi Kaggle untuk mengumpulkan prediksi Anda. Nilai Anda untuk tugas ini akan sangat tergantung pada metrik yang digunakan. Keterangan lebih lanjut dapat dilihat pada tautan di atas. Selain pengumpulan melalui Kaggle, Anda juga diminta untuk mengumpulkan notebook yang Anda gunakan melalui e-learning.

Tenggat

Selasa, 12 Juni 2019, pukul 06.59 WIB

Perluasan dari Model Linear

Salindia minggu ke-9: Support Vector Machines

Salindia minggu ke-10: Neural Networks

Berdasarkan model linear yang sudah kita pelajari, kita dapat melakukan modifikasi sehingga kinerjanya bisa lebih baik. Salah satu caranya adalah dengan perubahan fungsi galat yang digunakan dan menggunakan kernel tricks. Cara lainnya adalah dengan menumpuk model linear tersebut sehingga keluaran dari suatu model menjadi masukan bagi model lainnya. Dengan demikian, Anda akan mendapatkan neural networks!

Model Berdasarkan Perhitungan Jarak

Salindia minggu ke-11: k-Nearest Neighbours

Salindia minggu ke-12: k-Means

k-Nearest Neighbours atau k-NN merupakan algoritma yang bisa digunakan untuk klasifikasi dan juga regresi. Di mata kuliah ini, selain mengulang materi yang sudah disampaikan di Kecerdasan Buatan, Anda juga akan belajar cara untuk mempercepat proses belajar dari k-NN. Di pekan berikutnya, Anda akan belajar tentang algoritma untuk unsupervised learning yang juga menggunakan konsep perhitungan jarak antarobjek, yaitu k-Means.

Umpan balik

Mohon untuk mengisi formulir umpan balik kuliah k-Nearest Neighbours di sini.

Umpan balik

Mohon untuk mengisi formulir umpan balik kuliah k-Means di sini.

Visualisasi k-Means

Anda dapat melihat ilustrasi cara kerja k-Means secara interaktif di situs ini.

Gaussian Mixture Models

Salindia minggu ke-13: Gaussian Mixture Models

Gaussian Mixture Models

Untuk kuliah tamu, salindia yang digunakan adalah ini.

Umpan balik

Mohon untuk mengisi formulir umpan balik kuliah GMM di sini.

Setelah mendapat materi tentang k-Means di beberapa pertemuan sebelumnya, kali ini yang dibahas adalah Gaussian Mixture Models yang dapat melakukan soft clustering. Materi ini akan berkaitan dengan materi konsep probabilitas dan distribusi yang disampaikan di beberapa pertemuan awal.

Tugas 4

Notebook Tugas 4

Dataset Tugas 4

Dalam tugas ini, Anda akan mencoba melakukan clustering dengan menggunakan k-Means dan Gaussian Mixture Models pada dataset artikel berita dari BBC.

Tenggat

Rabu, 10 Juli 2019, pukul 23.55 WIB