Proses pencarian dengan cara konvensional akan membuat pengguna I-GRACIAS
bingung apabila keyword yang dimasukkan memiliki ejaan kata yang berbeda dengan
nama aplikasi yang ada. Semantic similarity adalah suatu pendekatan untuk menangani pencarian dengan mengandalkan nilai keterhubungan antar-term yang dibentuk
dari Wordnet. Pendekatan semantic similarity yang digunakan adalah Path-based dengan Wu and Palmer (WUP) sebagai metode perhitungan semantic similarity. Omiotis
merupakan metode yang ditujukan untuk mengukur derajat relevansi antar-dokumen.
Terdapat dua komponen utama dari perhitungan Omiotis. Komponen tersebut adalah
lexical relevance dan semantic similarity.
Pada komponen lexical relevance, Omiotis melakukan proses pembobotan terhadap
masing-masing lexical dengan menggunakan TF IDF terlebih dahulu. Setelah itu,
Omiotis menghitung lexical relevance dari pasangan dokumen menggunakan harmonical mean dari hasil TF IDF. Lexical relevance sangat berpengaruh pada Omiotis, karena
jika mengandalkan semantic saja, maka akan menurunkan derajat relevansi dari hasil
Omiotis seperti yang dijelaskan pada hasil pengujian.
Pengujian Omiotis menggunakan dataset Semeval 2014 task 3 dan dataset I-GRACIAS. Dengan menggunakan kedua sumber dataset tersebut bisa membuktikan bahwa
Omiotis bisa diterapkan pada data I-GRACIAS. Berdasarkan hasil pengujian menggunakan dataset I-GRACIAS Omiotis memiliki nilai korelasi Pearson 0,38. Sedangkan dengan dataset Semeval 2014 task 3 Omiotis memiliki nilai korelasi Pearson 0,29
dan mencapai peringkat 30 dari 38 peserta. Selain itu, dengan menggunakan dataset
Semeval 2014 task 3 Omiotis lebih unggul dibandingkan PairingWord, dimana PairingWord yang penulis lakukan berbeda dengan PairingWord yang dikenalkan oleh Tim
Meerkat Mafia, meskipun masih menggunakan metode yang sama dengan PairingWord
dari Meerkat Mafia perbedaan pada semantic dan preprocessing.
Dengan demikian, proses pencarian yang awalnya menggunakan cara konvensional
akan diubah dengan pendekatan Semantic Textual Similarity (STS). Oleh karena itu,
pada tugas akhir ini Omiotis ditujukan untuk menghitung kemiripan antar-dokumen
dengan menggunakan pendekatan Path-based sebagai metode semantic similairty, yang
mana masih memiliki ketergantungan dengan Wordnet. Sehingga mampu membantu
menangani masalah pencarian aplikasi di I-GRACIAS.
Kata Kunci: semantic similarity, lexycal relevance, Omiotis, PairingWord, Wordnet.