Analisis dan Implementasi Metoda BM25 pada Information Retrieval

James Rukka Embongbulan

Informasi Dasar

224 kali
113050258
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Kebutuhan terhadap informasi yang begitu tinggi menyebabkan munculnya masalah bagaimana teknik atau cara untuk memperoleh informasi yang efektif dan efisien. Sistem temu kembali digunakan untuk menjawab permasalahan tersebut.
Sistem temu kembali terdiri dari indexing subsystem dan searching subsystem, untuk mengolah kumpulan dokumen dan kata kunci sehingga dapat mengembalikan dokumen yang relevan. Metoda BM25 yang diimplementasikan pada pembobotan dokumen, akan memberikan nilai relevansi berdasarkan kecocokan dokumen dengan kata kunci. Nilai relevansi tersebut akan diakumulasi untuk semua kata kunci, sehingga diperoleh nilai total kecocokan dokumen terhadap kata kunci.
Dengan menerapkan BM25, diperoleh nilai precision tertinggi (13.56%) pada jumlah dokumen terendah (200 dokumen). Serta, diperoleh nilai recall tertinggi (91.08%) pada jumlah dokumen tertinggi (800 dokumen). Nilai interpolated average precision (IAP) dipengaruhi oleh faktor normalisasi panjang dokumen (parameter b). Perubahan IAP yang diakibatkan oleh pertambahan pengaruh normalisasi panjang dokumen menyebabkan perubahan penilaian pada dokumen yang terambil. Nilai IAP tertinggi (60.74%) diperoleh pada b=0.6.Kata Kunci : information retrieval, BM25.ABSTRACT: The increasing of information needs cause a problem occur that how is the way to get information more effectively and efficienly. Information retrieval system was used to solve this problem.
Information retrieval system consist of indexing subsystem and searching subsystem that cultivate the document collection and query to get the relevance document. BM25 method that is implemented in searhing subsystem, will return the relevance score based on similarity between document and query. The relevance score will be accumulated for all of the query, therefore the total of relevance score between document and query could be retrieve.
By implemented BM25, the highest precision (13.56%) could be reached on the lowest amount of document collection (200 documents). The highest recall (91.08%) could be reached on the highest amount of document collection (1033 documents). The Interpolated average precision (IAP) was influenced by document length normalization factor (factor b). The changing of IAP that caused by document length normalization factor evokes on different scoring document retrieved. The highest IAP (60.74%) could be reached on b=0.6.Keyword: information retrieval, BM25.

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Analisis dan Implementasi Metoda BM25 pada Information Retrieval
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

James Rukka Embongbulan
Perorangan
Yanuar Firdaus A.W., Angelina Prima Kurniati
 

Penerbit

Universitas Telkom
Bandung
2010

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini