Part 06: Supervised Learning dan K-Nearest Neighbor

Supervised Learning adalah sebuah pendekatan dimana sudah terdapat data yang dilatih, dan terdapat variable yang ditargetkan sehingga tujuan dari pendekatan ini adalah mengkelompokan suatu data ke data yang sudah ada.

Tujuan dari Klasifikasi adalah untuk:

  • Menemukan model dari training set yang membedakan record kedalam kategori atau kelas yang sesuai, model tersebut kemudian digunakan untuk mengklasifikasikan record yang kelasnya belum diketahui sebelumnya pada test set.
  • Mengambil keputusan dengan memprediksikan suatu kasus, berdasarkan hasil klasifikasi yang diperoleh.

Konsep Pembentukan Model Klasifikasi

  • Untuk mendapatkan model, kita harus melakukan analisis terhadap data latih (training set).
  • Sedangkan data uji (test set) digunakan untuk mengetahui tingkat akurasi dari model yang telah dihasilkan.
  • Klasifikasi dapat digunakan untuk memprediksi nama atau nilai kelas dari suatu obyek data.

Proses klasifikasi data dibedakan dalam 2 tahap, yaitu :

  • Pembelajaran/ Pembangunan Model Tiap–tiap record pada data latih dianalisis berdasarkan nilai–nilai atributnya, dengan menggunakan suatu algoritma klasifikasi untuk mendapatkan model.
  • Klasifikasi Pada tahap ini, data uji digunakan untuk mengetahui tingkat akurasi dari model yang dihasilkan.

Jika tingkat akurasi yang diperoleh sesuai dengan nilai yang ditentukan, maka model tersebut dapat digunakan untuk mengklasifikasikan record–record data baru yang belum pernah dilatihkan atau diujikan sebelumnya. Namun jika hasil akurasi yang diperoleh belum maksimal, beberapa cara yang dilakukan adalah:

  • Mencobakan dengan algoritma/ model yang lain
  • Melakukan optimasi/ improve algorithm
  • Melakukan pemodelan teknik pembagian data
  • Feature Selection
  • Mengganti dataset

K-Nearest Neighbor (K-NN)

  • Algoritma K-Nearest Neighbor (K-NN) adalah sebuah metode klasifikasi terhadap sekumpulan data berdasarkan pembelajaran data yang sudah terklasifikasikan sebelumya.
  • Termasuk dalam supervised learning, dimana hasil query instance yang baru diklasifikasikan berdasarkan mayoritas kedekatan jarak dari kategori yang ada dalam K-NN

Langkah-langkah Algoritma K-NN:

  1. Menentukan parameter K sebagai banyaknya jumlah tetangga terdekat dengan objek baru.
  2. Menghitung jarak antar objek/data baru terhadap semua objek/data yan gtelah di training.
  3. Urutkan hasil perhitungan tersebut.
  4. Tentukan tetangga terdekat berdasarkan jarak minimum ke K.
  5. Tentukan kategori dari tetangga terdekat dengan objek/data.
  6. Gunakan kategori mayoritas sebagai klasifikasi objek/data baru.

Download Full Materi

Lihat Video 1: https://www.youtube.com/watch?v=3IrPSkOvFUI&t=364s

Lihat Video 2: https://www.youtube.com/watch?v=ltiqkV2GzsY&t=216s

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *