ABSTRAKSI: Data merupakan aset berharga yang dimiliki oleh perusahaan. dengan adanya ilmu data mining yang menggali informasi dari data, maka suatu data akan lebih bermanfaat dalam perkembangan perusahaan tersebut. Salah satu data yang dimiliki oleh perusahaan telekomunikasi adalah Calling Detail Record, dimana data ini menyimpan transaksi pemanggilan yang terjadi pada jaringan telekomunikasi. Pada tugas akhir ini, data CDR yang secara tidak langsung menggambarkan perilaku pelanggan pada daerah tertentu akan diolah dengan proses data mining, yaitu klasifikasi dengan metode ensemble.
Metode ensemble dalam klasifikasi bertujuan untuk meningkatkan performansi, dengan menggunakan base classifier untuk menghasilkan hipotesis dari model yang dibentuk. Tugas akhir ini menerapkan salah satu metode ensemble, yaitu boosting, dengan decision tree C45 sebagai base classifier. Dengan proses boosting, setiap hipotesis yang diperoleh dari model C45 akan dikombinasikan, sehingga performansi yang dihasilkan lebih baik disbanding dengan proses klasifikasi tanpa boosting.
Dari hasil pengujian, diperoleh kesimpulan bahwa boosting dapat meningkatkan performansi pada proses klasifikasi daerah pelanggan, disbanding dengan klasifikasi menggunakan decision tree C45 tanpa boosting. Ini karena dengan boosting, data yang sulit diklasifikasi pada suatu iterasi akan mendapat kesempatan yang lebih banyak untuk dilatih lagi pada iterasi selanjutnya. Sehingga classifier lebih banyak memahami data yang sulit tersebut.Kata Kunci : boosting, algoritma C45, AdaboostM1, AdaboostReg, CDR, iterasiABSTRACT: Data is very important for many companies. With data mining, which digging information from data, this data can be more useful for development of its company. One most important data in telecommunication company is Calling Detail Record, that contains transactions of calling in network. In this final task, CDR that describe behavior of customer in every region, will processed by data mining techniques, classification with ensemble method.
Ensemble method is used to increase performance of classification process, that use base classifier to prodeuce hypothesis from its model. This final task implements bbosting, with C45 decision tree as base classifier.with this method, all of hypothesis from C45 would be combined to get final hypothesis, so that the performance will be better then classification without boosting.
The results of testing show that boosting clearly improve the performance of classification with C45 decision tree. It is because in boosting, data that hard to classify get more chance to be classified in the next iteration. So that classifier learns more from this data.Keyword: boosting, C45 algorythm, AdaboostM1, AdaboostReg, iteration,CDR