ABSTRAKSI: Semakin meningkatnya jumlah informasi pada masa kini menimbulkan permasalahan berupa menemukan dokumen yang relevan dengan kebutuhan secara tepat dan cepat. Sistem temu kembali dapat dibangun untuk menyelesaikan masalah tersebut.
Sistem temu kembali terdiri dari indexing subsystem dan matching (searching) subsystem, untuk mengolah kumpulan dokumen dan kata kunci sehingga dapat mengembalikan dokumen yang relevan. Metoda Savoy yang diimplementasikan pada pembobotan dokumen, akan memberikan skor kemiripan berdasarkan kecocokan dokumen dengan kata kunci. Skor tersebut akan dijumlahkan untuk semua kata kunci, sehingga diperoleh nilai total dokumen.
Dalam Tugas Akhir ini digunakan metode TF dan IDF sebagai pembanding. Pengujian dilakukan pada seluruh Dataset ADI, CRAN, MED, CISI dan juga dengan penambahan jumlah dokumen pada koleksi data MED. Metode TF, IDF dan Savoy menghasilkan nilai precision maupun recall yang sama untuk tiap metode. Metode Savoy menghasilkan nilai IAP paling tinggi dibandingkan dengan metode TF dan IDF.
Kata Kunci : information retrieval, term weighting, SavoyABSTRACT: Growing of amount of informations at present generates problem in the form of finding relevant document to the need accurately and quickly. Information retrieval system can assist to solve this problem.
Information retrieval system consist of indexing subsystem and matching(searching) subsystem that cultivate the document collection and query to get the relevance document. Savoy method that is implemented in searhing subsystem, will return the relevance score based on similarity between document and query. The relevance score will be accumulated for all of the query, therefore the total score could be retrieve.
In this final project used TF and IDF method for comparing. Testing implemented in all Dataset, ADI, CRAN, MED, CISI and also implemented by increasing the total document in the MED dataset. TF, IDF, and Savoy method give the same precision and recall value for each methods. Savoy method give the highest IAP value than TF and IDF value.
Keyword: information retrieval, term weighting, Savoy.