ABSTRAKSI: Intrusion detection system (IDS) merupakan sistem yang dapat mendeteksi adanya intrusi atau gangguan pada suatu jaringan atau sistem informasi. Salah satu jenis IDS adalah anomaly detection dimana suatu data trafik jaringan akan dikatakan intrusi apabila mempunyai karakteristik yang berbeda dari kebanyakan data lainnya. Pada anomaly detection terdapat pendekatan clustering based dimana data akan dikelompokkan menjadi beberapa cluster. Cluster intrusi adalah cluster dengan jumlah anggota yang sedikit. Algoritma clustering yang cukup dikenal adalah K-Means karena mudah diimplementasikan dengan kompleksitas yang rendah. Akan tetapi terdapat beberapa kekurangan pada algoritma tersebut. Algoritma Y-Means adalah algoritma clustering yang dibangun untuk memperbaiki kekurangan K-Means. Data trafik jaringan akan dikelompokkan ke beberapa cluster, lalu dilihat cluster mana yang merupakan cluster intrusi berdasarkan threshold. Pengujian dilakukan dengan beberapa skenario untuk mengetahui akurasi sistem dilihat dari nilai detection rate dan false positive rate, pengaruh besar konstanta merging terhadap jumlah cluster akhir, dan juga pengaruh konstanta merging dan threshold terhadap nilai akurasi. Y-Means dapat mendeteksi intrusi dengan tingkat akurasi yang cukup baik dilihat dari nilai detection rate sebesar 92.46%. Untuk nilai false positive rate Y-Means menunjukkan akurasi yang tidak terlalu buruk yaitu sebesar 9.69%.
Kata Kunci : intrusi, clustering, anomaly detection, Y-MeansABSTRACT: Intrusion detection systems (IDS) is a system that can detect any intrusion or attack on a network or information systems. Anomaly detection is one of the method in IDS. In anomaly detection, network traffic data is detected as intrusion if it has different characteristics from most of data. There are clustering based approach in anomaly detection where data will be grouped into several clusters. Intrusion cluster is the cluster with a small number of members. One of well-known clustering algorithm is K-Means because it is easy to implement and has low complexity. However there are some shortcoming in that algorithm. Y-Means is a clustering algorithm that is built to solve the shortcoming of K-Means. Network traffic data will be grouped into several clusters, and there will be intrusion cluster which can be seen by the threshold. Test carried out with several scenarios to determine the accuracy of the system based on the value of detection rate and false positive rate, the influence of the merging variable on the number of final cluster and also the influence of merging variable and threshold value on accuracy. Y-Means can detect intrusions with fairly good accuracy based on detection rate (92.46%). From false alarm value, Y-Means accuracy is not too bad (9.69%).
Keyword: intrusion, clustering, anomaly detection, Y-Means