Part 09. Teknik Pembagian Data/ Data Splitting for Classification

Supervised Learning adalah sebuah pendekatan dimana sudah terdapat data yang dilatih, dan terdapat variable yang ditargetkan sehingga tujuan dari pendekatan ini adalah mengelompokan suatu data kedata yang sudah ada.

  • Pembelajaran yang ada Supervisornya.
  • Maksud supervisornya adalah label di tiap datanya
  • Memiliki Data Training dan Data Testing

Algoritma Supervised Learning:

  • Decision Tree/ C4.5/ ID3
  • K-Nearest Neighbor (K-NN) Classifier
  • Modified K-Nearest Neighbor (MK-NN)
  • Fuzzy K-Nearest Neighbor (FK-NN)
  • Improve K-Nearest Neighbor (IK-NN)
  • Naive Bayes Classifier (NBC)
  • Support Vector Machine (SVM)
  • Artificial Neural Network (ANN)
  • Learning Vector Quantification (LVQ)
  • Probabilistic Neural Network (PNN)
  • Backpropagation Neural Network (BPNN)
  • Perceptron Neural Network
  • Convolutional Neural Network (CNN)
  • Recurrent Neural Network (RNN)

Tiga Bagian Teknik Pembagian Data

Hold-Out

  • Metode Holdout adalah metode yang akan menyediakan sejumlah data untuk digunakan sebagai data training, dan sisanya sebagai data testing.
  • Saat proses pengacakan data untuk dibagi sebagai data training dan testing, sangat mungkin terjadi overrepresented pada salah satu atau lebih klasifikasi.

K-Fold Cross Validation

  • K-Fold Cross Validation adalah salah satu metode untuk mengevaluasi kinerja classifier, metode ini dapat digunakan apabila memiliki jumlah data yang terbatas (jumlah instance tidak banyak).
  • Seluruh data yang ada akan dibagi menjadi sepuluh subset, yaitu: fold 1, fold 2, fold 3, fold 4, fold 5, fold 6, fold 7, fold 8, fold 9, dan fold 10.
  • Hal tersebut dilakukan dengan tujuan untuk mencari performansi terbaik

Clustering

  • Clustering atau klasterisasi adalah metode pengelompokan data. Menurut Tan, 2006 clustering adalah sebuah proses untuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang minimum.
  • Contoh Clustering: K-Means, K-Medoid, FCM, SOM, DBSCAN, CLARA, Hierarki dll

Download Full Materi

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *