ABSTRAKSI:
Sistem temu kembali informasi (information retrieval system) digunakan untuk menemukan kembali (retrieve) informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. Informasi tersebut direpresentasikan dalam bentuk query. Sistem temu kembali informasi dikatakan ideal apabila dapat menemukan informasi yang relevan saja. Term yang ada pada query ataupun kumpulan informasi memiliki banyak varian morfologik sehingga term-term yang memiliki bentuk beda tidak akan dianggap ekivalen oleh sistem.
Stemming dalam sistem temu kembali informasi digunakan untuk membatasi varian bentuk kata yang berbeda menjadi bentuk dasarnya, sehingga nantinya dapat meningkatkan kemampuan sistem dalam menemukan dokumen relevan sesuai query yang ada. Dalam tugas akhir ini, dibuat sebuah sistem temu kembali informasi yang mengimplementasikan teknik stemming dengan menggunakan algoritma Porter dan Krovetz.
Porter stemmer merupakan algoritma penghilangan akhiran morphological dan infleksional yang umum dari bahasa Inggris. Algoritma ini terdiri dari himpunan kondisi atau action rules. Algoritma Krovetz dikembangkan oleh Robert Krovetz pada tahun 1993 dan merupakan validasi leksikal stemmer. Krovetz dikembangkan sebagai pendekatan baru dalam stemming berdasarkan mesin kamus. Pada tugas akhir ini akan dilakukan analisis perbandingan penerapan kedua algoritma tersebut pada sistem temu kembali informasi.
Kata Kunci : sistem temu kembali informasi, stemming, algoritma Porter, algoritma KrovetzABSTRACT: Information Retrieval System is a system that used to find relevant information from some information collection automatically. The information is represented by query. Information retrieval is said to be ideal when the system can find only the relevant ones. Term in a query or information collection has many morphological varians that made them are not equivalent to the system.
In an information retrieval system, stemming is used to reduce different word forms to common roots, and thereby improve the ability of the system to match query and document vocabulary. In this final project, we implemented a stemming technic using Porter and Krovetz algorithm in information retrieval system.
Porter stemmer is a common morphological and inflectional affix removal in English. This algorithm is consists of a group of action rules. Krovetz algorithm created by Robert Krovetz in 1993 and it is a lecsical stemmer validation. Krovetz is a new approach in stemming which is a dictionary-based stemmer. In this final project, we will compare these two algorithms. We analyzed the effect of implementing stemming in information retrieval using these two algorithms.
Keyword: Information Retrieval System, stemming, Porter algorithm, Krovetz algorithm