ABSTRAKSI: Naïve Bayes Classifier (NBC) merupakan salah satu metode klasifikasi yang praktis dan efisien sehingga banyak digunakan untuk menangani berbagai permasalahan klasifikasi di dunia nyata. Dalam proses klasifikasinya, Naïve Bayes memerlukan informasi mengenai peluang dari setiap pasangan atribut dengan label kelas atribut tersebut. Seringkali permasalahan klasifikasi di dunia nyata melibatkan atribut numerik, yang cara mengestimasi peluangnya berbeda dengan atribut kategorikal. Diskritisasi merupakan salah satu pendekatan populer untuk memetakan atribut numerik ke atribut kategorikal yang dapat mengurangi jumlah kesalahan klasifikasi pada NBC.
Metode diskritisasi sederhana mengharuskan 1 nilai berada dalam 1 interval saja, padahal nilai tersebut mungkin memiliki hubungan dengan interval lainnya. Diskritisasi dengan pendekatan fuzzy memungkinkan 1 nilai berada dalam 1 atau 2 interval jika nilai tersebut berada di batas kedua interval. Namun, untuk menentukan jumlah interval, batasan interval, dan titik potong kedua buah interval yang berbatasan tidaklah mudah. Oleh karena itu, algoritma genetika dapat digunakan untuk mengoptimasi parameter - parameter ini, sehingga Genetic Algorithm Fuzzy Discretization (GAFD) adalah metode diskritisasi yang akan digunakan untuk meningkatkan akurasi dari NBC dalam tugas akhir ini.
Hasil penelitian menunjukan bahwa akurasi NBC dengan GAFD menghasilkan nilai akurasi yang lebih tinggi dan jumlah kesalahan klasifikasi lebih rendah dibandingkan dengan NBC tanpa diskritisasi.
Kata Kunci : Naïve Bayes Classifier, Fuzzy Discretization, Algoritma Genetika, Diskritisasi.ABSTRACT: Naïve Bayes Classifier (NBC) is one of classification method which is simple and efficient, so that it employed widely to dealing with various problems of classification in real world. In its classification process, NBC requires probability of each attribute and its class label pair. The classification problems in real world involve numeric attributes and the ways to estimate its probability are different from categorical attributes. Discretization is a popular approach to map numeric attribute into categorical attribute which can reduce the number of classification errors on NBC.
A value in simple dicretization method must belong to one interval, whereas that value may have a relation with another interval. Discretization with Fuzzy approach makes a value belong to one or two interval when it located in a boundary of adjacent interval. However, to determine number of interval, boundary of interval, and cut point of adjacent interval is not easy. Therefore, Genetic Algorithm can used to optimize these parameters, so that Genetic Algorithm Fuzzy Discretization (GAFD) is a discretization method that will be used to improve the accuracy of NBC. Experimental result showed NBC with GAFD generated higher accuracy and smaller classification error than NBC without discretizaiton.
Keyword: Naïve Bayes Classifier, Fuzzy Discretization, Genetic Algorithm, Discretization.