ABSTRAKSI: Ada kalanya frequent itemset yang dihasilkan oleh Traditional Association Rule Mining hanyalah barang-barang yang sering terjual bersamaan saja, dan tidak menghasilkan keuntungan yang cukup besar bagi pihak retailer. Oleh karena itu, Traditional Association Rule Mining tersebut dapat dikembangkan lebih jauh lagi menjadi Utility Mining, yang dapat menggali Itemset yang menghasilkan keuntungan tinggi. Pada penelitian ini, Two-Phase Algorithm dijadikan algoritma untuk mengimplementasikan Utility Mining. Pada Utility Mining, setiap item diberikan 2 buah jenis bobot, yaitu jumlah terjualnya item tersebut pada sebuah transaksi, dan profit yang dimiliki oleh item tersebut. Kemudian Two-Phase Algorithm mengkalkulasi 2 buah jenis bobot tersebut dalam 2 tahap, untuk menghasilkan knowledge berupa sejumlah itemset yang memiliki nilai profit dan asosiasi yang tinggi Pada penelitian ini, terdapat dua buah variabel yang mempengaruhi performansi, yaitu minimum utility threshold dan minimum confidence threshold. Minimum utility threshold mempengaruhi jumlah knowledge yang dihasilkan juga waktu pemrosesan. Semakin kecil minimum utility threshold maka jumlah knowledge yang dihasilkan semakin banyak, dan waktu pemrosesan semakin lama, serta akurasi meningkat. Sedangkan minimum confidence threshold mempengaruhi jumlah knowledge yang dihasilkan dan akurasi. Jumlah knowledge semakin meningkat seiring dengan diturunkannya nilai minimum confidence threshold.
Kata Kunci : Knowledge, Market Basket Analysis, Utility Mining, Two-Phase AlgorithmABSTRACT: There are times when frequent itemset which is generated by the Traditional Association Rule Mining are the items that are only often sold together, and do not generate substantial profits for the retailer. Therefore, the Traditional Association Rule Mining can be further developed into Utility Mining, which can digs high profitability itemset. In this final project, Two-Phase Algorithm is used to implement the Utility Mining. On Utility Mining, each item is given two kind of weights, ie the item sold count in a transaction, and a profit for each item. Then the Two-Phase Algorithm 2 calculates the weight these 2 weights in 2 stages, to produce knowledge, which is itemsets which have high profitability and association value In this study, there are two variables that affect the performance, the minimum utility threshold and minimum confidence threshold. Minimum threshold affects the number of number of knowledge generated and processing time. The smaller the minimum utility threshold, the number of knowledge generated more and more, and the longer the processing time, with the increase of accuracy. While the minimum confidence threshold also affects the number of knowledge generated and the accuracy. The number of knowledge are increasing with lowered minimum confidence threshold
Keyword: Knowledge, Market Basket Analysis, Utility Mining, Two-Phase Algorithm