ABSTRAKSI: Klustering adalah sebuah metode yang mengelompokkan data menjadi kelompok-kelompok yang saling terpisah berdasarkan keunikan karakteristiknya. Salah satu algoritma yang digunakan untuk klusterisasi adalah K-Means. Namun, dalam algoritma K-Means ini terdapat permasalahan dalam hal kecepatan dan akurasi.
Dalam Tugas Akhir ini mengimplementasikan sebuah metode klustering, yaitu K-Means++. Algoritma K-Means++ dapat mengatasi kelemahan yang terjadi pada algoritma K-Means melalui inisialisasi centroid dengan kondisi tertentu pada saat awal pembentukan kluster. Evaluasi dilakukan terhadap algoritma K-Means++ melalui penghitungan akurasi menggunakan metode silhouette coefficient dengan menggunakan data order kalibrasi.
Hasil percobaan yang dilakukan selama sepuluh kali tiap kluster dan data yang diambil adalah data yang terbaik atau nilai akurasi silhouette coefficient rataratanya paling tinggi. Hasil yang didapat dari penelitian menunjukkan bahwa nilai akurasi algoritma K-Means++ berkisar antara nilai medium dan strong pada data order kalibrasi. Nilai silhouette coefficient bervariasi pada tiap jumlah kluster. Nilai silhouette coefficient rata-rata tertinggi terdapat pada kluster yang berjumlah dua pada tiap-tiap jumlah dataset yang berbeda.Kata Kunci : k-means++, akurasi, data mining, silhouette coefficientABSTRACT: Clustering is a method of classifying data into groups which separated from each other based on unique characteristics. One of the algorithms used to klusterisasi is K-Means. However, in the K-Means algorithms have problems in terms of speed and accuracy.
In this Final clustering implement a method, namely K-Means++. K-Means++ algorithm can overcome the weakness that occurs in K-Means algorithm through the initialization of centroids with certain conditions during the early formation of clusters. Evaluation carried out on K-Means++ algorithm through the calculation accuracy using silhouette coefficient method using orders data calibration.
The result of experiments conducted over ten times each cluster and the data collected is the best data or the accuracy of the silhouette coefficient average is highest. The results of the study indicate that the value of K-Means++ algorithm accuracy ranged between medium and strong values in order calibration data. Silhouette coefficient value varies in each of the cluster. Silhouette coefficient value of the highest average found in clusters, amounting to two in each of the different datasets.Keyword: k-means++, accuracy, data mining, silhouette coefficient