ABSTRAKSI: Klasifikasi adalah salah satu fungsionalitas dalam data mining yang sering digunakan untuk menemukan suatu set rule yang menjelaskan atau membedakan kelas data. Salah satu algoritma yang sering digunakan untuk proses klasifikasi adalah algoritma K Nearest Neighbors (KNN). Namun karena kekurangan yang dimiliki oleh KNN dalam memproses large dataset maka diajukan satu algoritma perbaikan yaitu Condensed Nearest Neighbors (CNN). Sayangnya, CNN masih memiliki kekurangan yaitu CNN bersifat order dependent. Untuk menangani kekurangan yang dimiliki oleh CNN maka diajukan algoritma Fast Condensed Nearest Neighbors (FCNN) oleh Fabrizio Angiulli.
Tugas akhir ini mengimplementasikan dan menganalisis algoritma Fast Condensed Nearest Neighbors (FCNN). Tugas akhir ini menganalisis akurasi yang dimiliki FCNN dalam mengklasifikasikan suatu data dan menganalisis karakteristik dari algoritma FCNN. Parameter acuan yang digunakan adalah nilai akurasi, jumlah subset yang terbentuk, jumlah iterasi, dan learning time. FCNN sendiri adalah algoritma yang bersifat order independent yang memungkinkan subset yang dihasilkannya selalu berisi sampel yang sama. Dengan sifatnya yang order independent, FCNN memiliki akurasi yang cenderung konstan untuk suatu data jika dibandingkan dengan CNN.
Kata Kunci : klasifikasi, algoritma Fast Condensed Nearest Neighbors, order independentABSTRACT: Classification is one of the functionality in data mining which is used to find a set rule that can determined a class in dataset. One of the algorithms that usually used for classification process is K-Nearest Neighbor algorithm. In order to reduce the lack from KNN, there have been proposed an algorithm called Condensed Nearest Neighbors (CNN) . Unfortunately, CNN characteristic is order dependent. For handling the lack in CNN, Fabrizio Angiulli proposed an algorithm called Fast Condensed Nearest Neighbors (FCNN).
In this Final Project the implementation and the analysis of Fast Condensed Nearest Neighbors (FCNN) algorithm is performed. The analysis is carried out to the accuracy that result from the implementation of FCNN and compared with the accuracy result from CNN. Comparison Parameter such as accuracy, subset size, iteration, and learning time is used in the analysis. In the other hand, FCNN it self is an order independent algorithm that can compute a training set consistent subset. This characteristic makes FCNN have a relative stable accuracy compared with CNN.
Keyword: classification, Fast Condensed Nearest Neighbors algorithm, order independent