ABSTRAKSI: Saat ini sudah banyak digunakan berbagai jenis metode untuk ekstraksi frasa kunci. Terdapat dua kategori untuk algoritma frasa kunci diantaranya ekstraksi frasa kunci untuk dokumen tunggal dan ekstraksi frasa kunci untuk sekelompok dokumen.
Kategori ekstraksi frasa kunci yang dibahas pada tugas akhir ini adalah ekstraksi frasa kunci untuk sekelompok dokumen. Metode yang digunakan adalah metode CorePhrase. Diharapkan dengan menggunakan metode CorePhrase ini didapat frasa kunci yang sesuai dengan topik dan memiliki performansi yang baik.
Metode CorePhrase bekerja dengan mengiriskan dokumen menggunakan graph-based model kemudian feature dari tiap kandidat keyphrase yang diekstraksi dihitung lalu dilakukan perhitungan rangking terhadap phrase feature yang didapat untuk kemudian diperoleh nilai top rank nya.
Pada tugas akhir ini performansi dari tiap frasa kunci dapat diukur dengan berdasarkan overlap dan precision-nya. Berdasarkan percobaan yang dilakukan didapat nilai performansi overlap yang paling tinggi adalah sebesar 1 dan nilai performansi precision yang paling tinggi adalah sebesar 1. Dapat dikatakan bahwa performansinya sangat baik. Keyphrase yang dihasilkan sesuai dengan topik dokumen.Kata Kunci : CorePhrase , ekstraksi, phrase feature, overlap, precissionABSTRACT: Currently, there are many different types of methods used for keyphrase extraction. There are two categories for keyphrase extraction; keyphrase extraction for single document and keyphrase extraction from a set of document.
Keyphrase extraction categories discussed in this final project is keyphrase extraction from a set of document. The method is CorePhrase. It is expected that by using this CorePhrase can get keyphrase which accordance with the topic and has a good performance.
Corephrase works by intersecting document using graph-based model then Features of the extracted candidate keyphrases are calculated and phrases are ranked based on their feature and then will get the top rank.
In this final project the performance of each keyphrase can be measured based on the overlap and precission. Based on the experiments conducted, the performance of the highest overlap is 1 and the performance of the highest precission is 1. It could be argued that the performance is good. The resulting keyphrase is in accordance with the topic of the document.Keyword: CorePhrase , ekstraksi, phrase feature, overlap, precission