ABSTRAKSI: Intrusion Detection System (IDS) merupakan alat yang memonitor event yang terjadi pada sistem atau jaringan komputer dan memberikan peringatan jika ada aktivitas yang berbahaya. Cara mengenali aktivitas yang berbahaya membutuhkan proses mengenali dari aktivitas sebelumnya yang disebut Misuse IDS. Misuse IDS ini menggunakan teknik klasifikasi.
Pada Tugas Akhir ini penulis mengimplementasikan gabungan metode Random Forest (RF) dan Classification and Regression Tree (CART) untuk membangun model klasifikasi yang digunakan dalam Misuse IDS. Melihat karakteristik dataset KDD Cup 1999 yang digunakan dalam Tugas Akhir ini merupakan unbalanced dataset yang memiliki banyak features, dengan penggabungan kedua metode diharapkan dapat memberikan solusi atas permasalahan pada Dataset KDD Cup 1999 agar meningkatkan akurasi deteksi intrusi.
Pengujian dilakukan dengan mengevaluasi matrix confusion dan menentukan nilai precison, recall, F Measure. Berdasarkan hasil evaluasi terhadap ketiga parameter tersebut, disimpulkan bahwa implementasi gabungan metode RF dan CART mampu mengklasifikasikan kelas minor pada dataset KDD Cup 1999 dengan sedikit modifikasi pada metode RF yaitu mengimplementasikan teknik Balanced Random Forest (BRF) dengan cara menyeimbangkan jumlah kelas mayor dan kelas minor. Akurasi yang dicapai oleh model belum mencapai nilai maksimal, karena keterbatasan jumlah record pada data training setelah diimplementasikan BRF yang tidak dapat menggambarkan karakteristik kelaskelas yang ada.
Kata Kunci : Klasifikasi, Ranfom Forest, Classification and Regression Tree,ABSTRACT: Intrusion Detection System (IDS) is a tools or application to monitor events that happened in computer system and give alert when a danger activity occurs. The process to recognize the danger activity is learning from the activity before. This process is called misuse Intrusion Detection System which use classification techique.
In this Final Project the author implements Random Forest (RF) and Classification and Regression Tree (CART) methods to build classification models that used in misuse IDS. The characteristics of KDD Cup 1999 dataset which used in this final project are unbalanced dataset, and there are many features in it. The excellences in that method are wiiling to give solutions of the problem in the dataset to improve the accuracy of intrusion detection.
Testing is done by evaluating confusion matrix and calculating the value of precion, recall and F Measure. The result showed that implementation of RF and CART could classify the minority classes in KDD Cup 1999 dataset with a little modification in RF method that is balancing the number of records of majority and minority classes. This modification named Balanced Random Forest (BRF). The accuracy is not quite high because of the limited number of records used in training phase after BRF was implemented. Limited number of records couldn’t give detail characteristics of each class in the dataset.
Keyword: Classification, Ranfom Forest, Classification and Regression Tree,