ABSTRAKSI: Data mining merupakan serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui. Ada beberapa task dalam data mining, salah satunya adalah klasifikasi. Dalam Tugas Akhir ini akan digunakan metode klasifikasi C4.5 dan salah satu metode dalam Bayesian Network, yaitu Tree Augmented Naive Bayes (TAN).
Algoritma C4.5 menggambarkan suatu distribusi joint probability dari sebuah set atribut. TAN merupakan graf asiklik berarah yang node-nodenya merepresentasikan variable pada data set sedangkan busur-busurnya (arc) merepresentasikan relasi ketergantungan diantara variable tersebut, dan algoritma C4.5+TAN adalah penggabungan kedua fungsionalitas di atas.
Tugas Akhir ini bertujuan untuk menganalisis performansi waktu klasifikasi dan akurasi, serta bentuk pohon keputusan dari gabungan algoritma C4.5 dan TAN Classifier yang pemodelannya dibangun menggunakan algoritma C4.5 dan conditional independence test.Kata Kunci : Kata Kunci: C4.5, Conditional independence test, TAN, data mining, klasifikasi.ABSTRACT: Data mining is a process to find out the potential of information implicitly from database which unknown identifier before. One of many tasks in data mining that would be the subject of this final project is classification. The subjects of this final project are C4.5 Tree Augmented Naive Bayes (TAN) classifier.
TAN is a directed acyclic graph whose nodes represent variables and arcs represent statistical dependence relations among the variables and local probability distributions for each variable given values of its parents.
This final project analyzes the performance and accuracy of Naïve Bayes classifier and Tree Augmented Naïve Bayes classifier as classification technique of BN which build using conditional independence test based algorithms.Keyword: Keywords: C4.5, Conditional independence test, TAN, data mining, klasifikasi.