ABSTRAKSI: Deteksi outlier merupakan salah satu task penting dalam data mining, bertujuan untuk mencari data yang memiliki karakteristik berbeda dengan kebanyakan data lainnya. Dalam dataset yang besar, deteksi outlier dianggap merupakan permasalahan yang sangat sulit jika dibandingkan dengan dataset yang kecil. Kebanyakan metode deteksi outlier sering tidak cocok diaplikasikan di dunia nyata karena data di dunia nyata biasanya memiliki distribusi yang tersebar. Struktur data tersebar tidak secara eksplisit mempresentasikan perilaku data normal dan tidak ada nya label yang menunjukkan data tersebut dikatakan sebagai outlier.
Pada deteksi outlier dengan algoritma LDOF, pencarian data yang menyimpang dapat ditemukan. Metode LDOF ini berbasiskan pendekatan jarak, dengan memperhitungkan nilai LDOF yang merepresentasikan derajat suatu data lalu membandingkannya dengan nilai Lower Bound LDOF yaitu batas nilai yang digunakan untuk mengetahui apakah data termasuk dalam outlier atau bukan dan mengurutkannya berdasarkan nilai LDOF terbesar sampai terkecil dimana data dengan nilai LDOF terbesar merupakan outlier yang dicari. Pengujian dilakukan dengan beberapa skenario untuk mengetahui nilai akurasi, error rate, dan FPR. LDOF dapat mendeteksi outlier dengan tingkat akurasi yang baik pada data yang memiliki distribusi data yang berbeda-beda.Kata Kunci : Outlier, LDOF, deteksi outlier, distance based approachABSTRACT: Outlier detection is one of the important tasks in data mining, aims to find the data that has characteristics different from most other data. In large datasets, outlier detection is considered to be a very difficult problem when compared to a fairly small dataset. Most outlier detection methods are often not properly used in the real world because the data in the real world usually have a scattered distribution. Scattered data structures are not explicitly present normal behavior of the data and its no label indicating the data may be regarded as an outlier.
In outlier detection with LDOF method, data searching that deviates from its class can be found. LDOF method is based on the distance approach, by calculating LDOF that represents the degree of the data and compares with the value of Lower Bound LDOF, the limit values used to determine whether the data included in the outlier or not, and then sorted the biggest to the smallest value of LDOF where data with the biggest value of LDOF are outlier. The testing is done with some scenarios to know the system’s accuracy, error rate, and its FPR. LDOF can detect outliers with better accuracy on data that has different distribution.Keyword: Outlier, LDOF, outlier detection, distance based approach