Sebuah query pada suatu sistem retrieval dokumen, umumnya memberikan hasil berupa cuplikan dokumen-dokumen yang disusun berdasarkan peringkat kecocokan (matching) dengan query berupa daftar yang panjang. Tidak jarang suatu query menghasilkan puluhan bahkan ratusan cuplikan dokumen yang menyebabkan seorang pengguna harus menggulung layar ke atas dan ke bawah (scrolling) untuk meneliti satu persatu cuplikan dokumen. Paradigma ini menyebabkan seorang pengguna cukup mengalami kesulitan dalam hal menentukan dokumen yang relevan dengan topik yang ia inginkan.
Pada Tugas Akhir ini dikembangkan suatu aplikasi pengelompokan dokumen berbasis web dengan metode suffix tree clustering yang diterapkan pada kumpulan hasil dari mesin pencarian (search engine). Ide dasar metode ini adalah dengan mengelompokkan dokumen hasil pencarian oleh mesin pencarian ke dalam bentuk grup-grup atau clusters berdasarkan frasa-frasa yang dipakai bersama (shared phrases) dalam dokumen-dokumen tersebut.. Mesin pencarian yang digunakan adalah JSE (Java Search Engine). JSE membutuhkan input query pencarian dan akan menghasilkan output kumpulan hasil, yang masing-masing terdiri dari judul, cuplikan dan URL dokumen. Cuplikan-cuplikan dokumen dari JSE tersebut akan menjadi input bagi aplikasi pengelompokan yang akan dibuat, dan akan menghasilkan output hasil pencarian berupa clusters. Cluster-cluster yang dihasilkan inilah yang ditampilkan kepada pengguna. Dengan metode ini diharapkan hasil pencarian akan lebih mudah untuk ditelusuri. pengelompokan dokumen – mesin pencarian – suffix tree clustering