Dalam suatu penelitian, data adalah hal yang sangat penting. Kualitas hasil dari penelitian akan berbanding lurus dengan kualitas data yang akan dipakai dalam penelitian yang bersangkutan. Salah satu permasalahan yang ada pada data set adalah ketiadaan nilai pada data untuk atribut tertentu atau yang lebih dikenal dengan istilah missing data. Salah satu metode yang sering digunakan oleh para peneliti adalah k-Nearst Neighbour (KNN). Namun, metode ini memiliki beberapa kelemahan, salah satunya adalah pemilihan nilai k yang tidak tepat dapat menurunkan kinerja klasifikasi. Penelitian bertujuan menangani missing data dengan teknik imputasi menggunakan gabungan algoritma KNN dengan algoritma memetika. Algoritma memetika digunakan untuk mengoptimasi nilai k pada KNN sehingga dapat menghasilkan nilai estimasi yang baik dengan MSE sekecil mungkin. Pengujian performansi dilakukan dengan membandingkan nilai MSE hasil imputasi missing data pada saat missing data ada sebanyak, 5%, 10%, 15%, 20% dan 25% dengan menggunakan metode KNN dan KNN yang dioptimasi dengan algoritma memetika. Hasil dari penelitian menunjukkan bahwa k yang didapat dari hasil optimasi algoritma memetika tidak selalu menunjukkan k optimal dengan hasil pengukuran akurasi terbaik yang diuji, namun sangat mendekati hasil terbaik dari pengukuran akurasi yang diuji.
Kata Kunci : missing data, KNN, algoritma memetika, optimasi
Data is one most important key in researching. The quality in one research will be highly affected by the quality of the data that researcher collect. One most deadly problem is missing data in the data set. One of many way to find missing data is k-Nearest Neighbour(KNN). But this method have a weakness. That is, k value that researcher don’t know what number to set it. This project goal is to find a way to search optimal k value to input on KNN. Memetic algorithm is the metod that used in this journal project to find that. This project try to find optimal k value on KNN with memetic algorithm, that can minimize MSE as mush as possible. Performance testing is done by comparing the value of MSE from the imputation of missing data when there were missing data, 5%, 10%, 15%, 20% and 25% with KNN method and KNN with memethic algorithm optimation. Results from the study showed that the k obtained from the memetic algorithm optimization does not necessarily indicate the optimum k with the best accuracy measurement results are tested, but very close to the best results of the measurement accuracy is tested.
Keywords : missing data, KNN, memetic algorithm, optimation