ABSTRAKSI: Data merupakan bahan utama dalam mendapatkan Informasi. Pengolahan data yang tepat dapat berimbas pada informasi bahkan pengetahuan yang berguna. Salah satu cara untuk mendapatkan pengetahuan dari suatu data adalah dengan proses klasifikasi. Proses klasifikasi sangat dipengaruhi oleh kondisi data. Kondisi data yang bersih bebas noise akan menyebabkan data dapat terklasifikasi dengan baik. Data dengan dimensi tinggi dapat dipastikan akan memiliki waktu proses yang sangat besar. Salah satu noise yang sering dijumpai adalah adanya irrelevant dan redundant feature.
Salah satu cara yang biasa digunakan untuk menyelesaikan permasalahan adanya irrelevant dan redundant feature adalah dengan menggunakan feature selection. salah satu metode feature selection yang cukup terkenal adalah Fisher score, tetapi fisher score sendiri memiliki beberapa kelemahan diantaranya adalah tidak dapat menangani redundant feature dan tidak dapat mengani kemungkinan terdapatnya subset feature pada suatu data.
Pada Tugas Akhir ini, akan dibahas sebuah metode yang menangani kelemahan dari metode Fisher score, yaitu Generalized Fisher Score dan dilakukan pula analisis terhadap peforma metode Generalized Fisher Score sebagai feature selection. Selain itu pada tugas akhir ini juga mencoba memperbaiki kelemahan yang ada pada Generalized Fisher Score dengan memberikan modifikasi pada Generalized Fisher Score.
Kata Kunci : Data Mining, Klasifikasi, feature selection, Generalized Fisher Score.ABSTRACT: The data is a key ingredient in getting information. Proper data processing can affect even the knowledge of useful information. One way to gain knowledge from the data is the process of classification. Classification process is strongly influenced by the condition of the data. Conditions clean noise-free data will cause data to be classified properly. With high-dimensional data certainly will have a very big process.
One of the common ways to solve the problem are irrelevant and redundant features using feature selection. Feature selection is a process of selecting relevant features for a classification process. one of the methods well-known feature selection is Fisher score, but the fisher score itself has some drawbacks such as it can’t handle redundant features and can’t hold a possibility of the presence of a subset of features in the data.
In this final project, we discuss a method that handles the weakness of the method of Fisher score, namely the Generalized Fisher Score and also conducted an analysis of the Performance of Generalized Fisher score methods as a feature selection. In addition to the final project is also trying to fix weaknesses in Generalized Fisher scores by providing modifications to the Generalized Fisher Score.
Keyword: Data Mining, classification, feature selection, Generalized Fisher Score.