ABSTRAKSI: E-mail spam merupakan pesan yang tidak diminta yang dikirim ke sejumlah penerima melalui e-mail dalam jumlah yang besar. Contoh kiriman e-mail yang merupakan spam seperti iklan, tawaran untuk bergabung ke MLM, undian, informasi palsu, phishing, dan penipuan. Dengan adanya e-mail spam ini mengakibatkan pengguna e-mail membutuhkan waktu yang lebih banyak untuk membaca dan memutuskan apakah e-mail yang diterima tersebut adalah spam atau bukan.
Dalam tugas akhir ini, dibangun sebuah sistem e-mail spam filtering dengan menggunakan algoritma Granular Support Vector Machine-Recursive Feature Elimination (GSVM-RFE). GSVM-RFE akan menghapus kata-kata yang irrelevant, redundant, noisy yang terdapat pada e-mail dalam granules yang berbeda dan memilih kata-kata yang informatif untuk digunakan dalam klasifikasi. Dengan cara kerja yang demikian GSVM-RFE dapat menghasilkan akurasi sebesar 98% dengan 8192 kata yang dihasilkan
Kata Kunci : Kata kunci: e-mail spam filtering, granular computing, fuzzy C-means clustering, recursive feature elimination, relevance index, support vector machinesABSTRACT: E-mail spam are unsolicited messages that sent to multiple recipients via e-mail in large numbers. The example of e-mail spam is advertisement e-mail, bid to join the MLM, sweepstakes, fake information, phishing and fraud. With this e-mail spam, an e-mail users need more time to read and decide whether the e-mail received is spam or not.
In this work, we built an e-mail spam filtering system using Granular Support Vector Machine-Recursive Feature Elimination (GSVM-RFE) algoritm. The GSVM-RFE separately eliminates irrelevant, redundant, or noisy word at email in different granules at different stages and selects highly informative word that used in classification. With that kind of word GSVM-RFE can produce 98% accuracy with 8192 words
Keyword: Keywords: e-mail spam filtering, granular computing, fuzzy C-means clustering, recursive feature elimination, relevance index, support vector machines,