ABSTRAKSI: Adanya pengelompokkan suatu dokumen sangat diperlukan untuk berbagai bidang teknologi.Perkembangan data pun kian meningkat dan kebutuhan akan pemrosesan data kelompok yang cepat dalam keadaan real time pun semakin dikembangkan.
Cover Coefficient Clustering Method (C2ICM) adalah salah satu algoritma pengelompokan atau clustering dokumen yang menggunakan model probalistik, kesamaan term ,dan seed dokumen sebagai poin penting dalam menentukan inisialisasi awal dari pembentukan cluster-nya, dimana dokumen yang dikelompokan ini telah diproses terlebih dahulu agar bisa diolah menggunakan algoritma C2ICM dan memenuhi kebutuhan akan dinamika perkembangan data yang selalu terjadi update real time.Pemprosesan ini disebut juga preprocessing atau indexing dokumen. Dalam Indexing , ada beberapa tahap yang biasa dilakukan, salah satunya stemming. Pada Tugas Akhir ini, Algoritma Jelita Asian digunakan pada tahap stemming kata dengan dilanjutkan penggunaan Algoritma C2ICM dalam pengclusteran dokumen abstrak TA mahasiswa ITTELKOM.
Pengujian yang dilakukan dalam Tugas Akhir ini yaitu untuk meng-cluster-kan dokumen dengan Algoritma C2ICM , menganalisa konsep Cover Coefficient C2ICM dan tahapan Algoritma C2ICM serta menganalisa hasil kualitas cluster yang dihasilkan oleh perpaduan Jelita Asian dengan C2ICM menggunakan nilai Silhouette Coefficient. Dan didapatkan bahwa kualitas cluster yang dihasilkan termasuk dalam kualitas yang lemah berdasarkan nilai rata-rata silhouette yang diperoleh.Kata Kunci : C2ICM, Jelita Asian, SilhouetteCoefficient , Clustering, IndexingABSTRACT: The existence of a document grouping is necessary for many fields of data technology.The data development is more increase and the need for rapid data processing group in real time the state became more developed.
Cover Clustering Coefficient Method (C2ICM) is one of the grouping or clustering algorithm a document that uses the model probabilistically, in common terms, and the seed document as an important point in determining the initial initialization of cluster formation, where classified documents have been processed in advance in order to be processed using C2ICM algorithm and meet the needs of the dynamic development of the data is always the case time.That proccess of real update is also called preprocessing or indexing of documents. In Indexing, there are some steps commonly performed, one stemming. At this final project, Jelita Asian algorithm used in phase before the document gets the next step to be clustered by C2ICM algorithm.The collection document is an abstract document from the final project of IT Telkom students.
Tests performed in this final documents are to clustered by C2ICM algorithm, analyze concepts and stages C2ICM Cover Coefficient Algorithm C2ICM and analyze the results of the quality of clusters produced by fusion with Asian Jelita C2ICM using the Silhouette Coefficient. And found that the quality of the resulting cluster is included in the quality of the weak by the average silhouette values obtained.Keyword: C2ICM, Jelita Asian, CBR , SilhouetteCoefficient , Clustering, Indexing