Unsupervised Learning:
- Unsupervised learning memiliki keunggulan dari supervised learning. Jika supervised learning memiliki label sebagai dasar prediksi baik serta membuat clasification dan regression algorithm memungkinkan.
- Unsupervised learning tidak menggunakan label dalam memprediksi target feautures / variable.
- Melainkan menggunakan ke samaan dari attribut attribut yang dimiliki.
- Jika attribut dan sifat-sifat dari data data feature yang diekstrak memiliki kemirip-miripan, maka akan dikelompok kelompokan (clustering).
- Dari kelompok kelompok itu model melabelkan, dan jika data baru mau di prediksi, maka akan dicocok kan dengan kelompok yang mirip mirip featurenya.
Clustering:
- Clustering adalah proses membuat pengelompokan sehingga semua anggota dari setiap partisi mempunyai persamaan berdasarkan matriks tertentu
- Objek data yang terletak didalam cluster harus memiliki kemiripan sedangkan yang tidak berada dalam satu cluster, tidak memiliki kemiripan.
Perbedaan Klasifikasi dan Klasterisasi:
- Data supervised pada klasifikasi artinya data melalui pembelajaran terbimbing, sedangkan data unsupervised pada klasterisasi artinya data tidak melalui pembelajaran terbimbing.
- Pada dataset yang digunakan oleh klasifikasi terdapat satu attribut (Label) yang berfungsi sebagai attribut target, sedangkan dataset pada klasterisasi tidak terdapat attribut (label) sebagai attribut target
- Analisa Hasil pada klasterisasi dinyatakan dengan variance yang menunjukkan variansi data dalam satu cluster atau validitas, sedangkan klasifikasi analisa hasil diukur menggunakan rasio kesalahan (error ratio) atau akurasi.
Karakteristik Klastering:
- Partitioning Clustering
- Hierarchical Clustering
- Overlapping Clustering
- Hybrid