Analisis dan Implementasi Stemming Menggunakan Algoritma Idris pada Dokumen Teks Berbahasa Indonesia

Eka Sandra Paramitha

Informasi Dasar

171 kali
113081030
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Stemming adalah suatu teknik pencarian bentuk dasar dari suatu term pada information retrieval. Yang dimaksud dengan term itu sendiri adalah tiap kata yang berada pada suatu dokumen teks. Stemming dilakukan pada saat pembuatan indeks dari suatu dokumen. Teknik stemming diperlukan selain untuk memperkecil jumlah indeks yang berbeda dari suatu dokumen, juga untuk melakukan pengelompokan kata-kata lain yang memiliki kata dasar dan arti yang serupa namun memiliki bentuk atau form yang berbeda karena mendapatkan imbuhan yang berbeda. Teknik stemming terdiri dari berbagai macam metode. Metode pertama yakni stemming dengan acuan tabel pemenggalan imbuhan. Proses stemming suatu term dengan metode ini dilakukan dengan cara menghilangkan imbuhan dari term tersebut sesuai dengan table acuan pemenggalan imbuhan yang digunakan. Metode kedua merupakan pengembangan dari metode pertama. Metode kedua ini selain menggunakan tabel acuan pemenggalan imbuhan, juga menggunakan suatu kamus kata dasar. Kamus kata dasar ini digunakan sebagai acuan hasil stemming saat proses pemenggalan imbuhan selesai dilakukan. Hasil dari proses stemming dengan metode ini harus ada pada kamus kata dasar, jika tidak maka term yang diinputkan dianggap sebagai bentuk dasar.Salah satu teknik stemming adalah algoritma Idris. Algoritma Idris menggunakan teknik berbeda dalam menentukan hasil stemming, yaitu menggunakan 2 kamus : kamus umum dan kamus khusus (sesuai isi dokumen). Algoritma ini akan mengoreksi ulang hasil stemming, lalu mencocokkannya dengan kata-kata dalam kamus.Kata Kunci : stemming, algoritma Idris, term, information retrievalABSTRACT: Stemming is a basic form searching technique of a term. Term is a word that exists in a text document. Stemming performed at the time of the index of a document. Stemming technique is required in addition to minimize the number of different index of a document, as well as to perform other grouping of words that have the basic words and meanings are similar but have a different shape or form because of a different particle. Stemming technique consists of a variety of methods. The first method of stemming the reference table which affix beheading. The process of stemming a term with this method is done by removing the particle from the term in accordance with the reference tables are used beheadings affixes. The second method is the development of the first method. This second method uses a table of reference other than beheading affixes, also uses a dictionary of basic words. Basic word dictionary is used as a reference stemming results during the process of augmentation is complete decapitation. The results stemming from the process with this method must exist in the dictionary headword, if not entered then the term is regarded as a basic form. One of the stemming technique is the algorithm Idris. Idris algorithms use different techniques in determining the outcome stemming, which uses two dictionaries: general dictionary and the dictionary (based on the content of the document). This algorithm will correct the results stemming back, and then match them with the words in the dictionary.Keyword: stemming, Idris algorithm, term, information retrieval

Subjek

Informatika Teori dan Pemrograman
 

Katalog

Analisis dan Implementasi Stemming Menggunakan Algoritma Idris pada Dokumen Teks Berbahasa Indonesia
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Eka Sandra Paramitha
Perorangan
Ema Rachmawati, Adiwijaya
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini