Part 08: Unsupervised Learning dan K-Means Clustering

Unsupervised Learning:

  • Unsupervised learning memiliki keunggulan dari supervised learning. Jika supervised learning memiliki label sebagai dasar prediksi baik serta membuat clasification dan regression algorithm memungkinkan.
  • Unsupervised learning tidak menggunakan label dalam memprediksi target feautures / variable.
  • Melainkan menggunakan ke samaan dari attribut attribut yang dimiliki.
  • Jika attribut dan sifat-sifat dari data data feature yang diekstrak memiliki kemirip-miripan, maka akan dikelompok kelompokan (clustering).
  • Dari kelompok kelompok itu model melabelkan, dan jika data baru mau di prediksi, maka akan dicocok kan dengan kelompok yang mirip mirip featurenya.

Clustering:

  • Clustering adalah proses membuat pengelompokan sehingga semua anggota dari setiap partisi mempunyai persamaan berdasarkan matriks tertentu
  • Objek data yang terletak didalam cluster harus memiliki kemiripan sedangkan yang tidak berada dalam satu cluster, tidak memiliki kemiripan.

Perbedaan Klasifikasi dan Klasterisasi:

  • Data supervised pada klasifikasi artinya data melalui pembelajaran terbimbing, sedangkan data unsupervised pada klasterisasi artinya data tidak melalui pembelajaran terbimbing.
  • Pada dataset yang digunakan oleh klasifikasi terdapat satu attribut (Label) yang berfungsi sebagai attribut target, sedangkan dataset pada klasterisasi tidak terdapat attribut (label) sebagai attribut target
  • Analisa Hasil pada klasterisasi dinyatakan dengan variance yang menunjukkan variansi data dalam satu cluster atau validitas, sedangkan klasifikasi analisa hasil diukur menggunakan rasio kesalahan (error ratio) atau akurasi.

Karakteristik Klastering:

  • Partitioning Clustering
  • Hierarchical Clustering
  • Overlapping Clustering
  • Hybrid

Download Full Materi

Download Full Paper K-Means

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *