ABSTRAKSI: Classification adalah salah satu task dalam data mining yaitu predictive task yang digunakan untuk memprediksi nilai dari variable target yang diskrit. Classification telah secara luas diimplementasikan diberbagai bidang seperti Direct Marketing, Spam detection, Functional Classification of Proteins, Galaxy Classficaiton dan sebagainya. Metode dalam Data Mining Classification antara lain adalah Decision tree, Neural Network, k-Nearest Neighbor, Case Based Reasoning, Algoritma Genetika dan sebagainya. Decision Tree sendiri merupakan salah satu fungsional yang menggunakan representasi tree untuk menentukan aturan-aturan klasifikasi. Salah satu metode dalam Decision Tree ialah ID3 (iterative Dichotomiser three). Algoritma memiliki fungsi yaitu dengan melakukan pembobotan pada setiap atribut, kemudian dengan melihat bobot tersebut dibangun tree berdasarkan bobot terbesar ke bobot terkecil dan pohon ini akan rekursif dibangun dengan memanggil fungsi itu sendiri. Walaupun pohon yang dibangun cukup baik, namun terdapat cara lebih baik untuk meningkatkan efisiensi waktu dan ukuran pohon, dengan tidak mengabaikan akurasi. Hasil analisa didapatkan bahwa penggunaan nilai ambang batas atau threshold cenderung memberikan waktu pembangunan tree yang lebih efisiesn, ukuran pohon yang lebih kecil, dan akurasi yang cukup baik, bergantung terhadap karakteristik dari setiap dataset.Kata Kunci : data mining, classification, ID3ABSTRACT: Classification is one of predictive Data Mining Task, which used to predict the value form discrete variable target. Classification has been widely implemented in various fields, such as Direct Marketing, Spam Detection, Functional Classification of Proteins, Galaxy Classification etc. Methods in Data Mining Classification are Decision Tree, Neural Network, k-Nearest Neighbor, Case Based Reasoning, Genetic Algorithm etc. Decision tree itself is a functional that uses a tree representation to determine the rules of classification. One of Decision tree method is ID3 (Iterative Dichotomiser three). The algorithm is a function that is by performing weighting on each attribute. Then the tree is built based on the greatest weight to the weight of the smallest and the tree will be constructed by calling the function recursively. Although the tree is built pretty good, but there are better ways to improve the efficiency of time and size of trees, by not ignoring accuracy. Results of analysis found that the use of threshold values can provide a tree construction with efficiency in time, smaller tree size, and good enough accuracy depend on each characteristics that each dataset has.
Keyword: data mining, classification,ID3