Analisis dan Implementasi Local Distance Outlier Factor dalam Mendeteksi Outlier pada Data Numerik

Yudhi Maulana

Informasi Dasar

113 kali
113071039
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Deteksi outlier merupakan salah satu task penting dalam data mining, bertujuan untuk mencari data yang memiliki karakteristik berbeda dengan kebanyakan data lainnya. Dalam dataset yang besar, deteksi outlier dianggap merupakan permasalahan yang sangat sulit jika dibandingkan dengan dataset yang kecil. Kebanyakan metode deteksi outlier sering tidak cocok diaplikasikan di dunia nyata karena data di dunia nyata biasanya memiliki distribusi yang tersebar. Struktur data tersebar tidak secara eksplisit mempresentasikan perilaku data normal dan tidak ada nya label yang menunjukkan data tersebut dikatakan sebagai outlier.

Pada deteksi outlier dengan algoritma LDOF, pencarian data yang menyimpang dapat ditemukan. Metode LDOF ini berbasiskan pendekatan jarak, dengan memperhitungkan nilai LDOF yang merepresentasikan derajat suatu data lalu membandingkannya dengan nilai Lower Bound LDOF yaitu batas nilai yang digunakan untuk mengetahui apakah data termasuk dalam outlier atau bukan dan mengurutkannya berdasarkan nilai LDOF terbesar sampai terkecil dimana data dengan nilai LDOF terbesar merupakan outlier yang dicari. Pengujian dilakukan dengan beberapa skenario untuk mengetahui nilai akurasi, error rate, dan FPR. LDOF dapat mendeteksi outlier dengan tingkat akurasi yang baik pada data yang memiliki distribusi data yang berbeda-beda.Kata Kunci : Outlier, LDOF, deteksi outlier, distance based approachABSTRACT: Outlier detection is one of the important tasks in data mining, aims to find the data that has characteristics different from most other data. In large datasets, outlier detection is considered to be a very difficult problem when compared to a fairly small dataset. Most outlier detection methods are often not properly used in the real world because the data in the real world usually have a scattered distribution. Scattered data structures are not explicitly present normal behavior of the data and its no label indicating the data may be regarded as an outlier.

In outlier detection with LDOF method, data searching that deviates from its class can be found. LDOF method is based on the distance approach, by calculating LDOF that represents the degree of the data and compares with the value of Lower Bound LDOF, the limit values used to determine whether the data included in the outlier or not, and then sorted the biggest to the smallest value of LDOF where data with the biggest value of LDOF are outlier. The testing is done with some scenarios to know the system’s accuracy, error rate, and its FPR. LDOF can detect outliers with better accuracy on data that has different distribution.Keyword: Outlier, LDOF, outlier detection, distance based approach

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis dan Implementasi Local Distance Outlier Factor dalam Mendeteksi Outlier pada Data Numerik
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Yudhi Maulana
Perorangan
Hetti Hidayati, Mahmud Imrona
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini