ABSTRAKSI: Peringkasan teks (text summarization) adalah proses pengambilan informasi yang paling penting dari satu atau beberapa dokumen teks sehingga dihasilkan sebuah versi yang lebih ringkas dengan menggunakan aplikasi berbasis komputer.
Pada Tugas Akhir ini diimplementasikan metode clustering dan nonnegative matrix factorization(NMF) untuk meringkas multi dokumen berita. Ringkasan yang dihasilkan berupa ringkasan ekstraktif yang berisi kalimat-kalimat penting dari dokumen berita. NMF akan menguraikan kalimat menjadi kombinasi semantic feature. Hal ini dapat meningkatkan kualitas hasil ringkasan, karena dengan melihat kesamaan antara semantic feature kalimat dengan topik berita, akan diketahui kalimat yang penting dan benar-benar relevan dengan topik berita. Dalam metode peringkasan ini juga akan dilakukan proses clustering yang bertujuan untuk menghilangkan kalimat-kalimat noise dan meminimalkan redundancy pada ringkasan.
Pengevaluasian dilakukan menggunakan ROUGE evaluation toolkit. Hasil pengujian menunjukkan bahwa metode NMF dengan clustering menghasilkan ringkasan yang mempunyai nilai precision lebih tinggi dan redundancy lebih sedikit dibandingkan dengan ringkasan yang dihasilkan metode NMF tanpa clustering.Kata Kunci : peringkasan teks, nonnegative matrix factorization, clustering.ABSTRACT: The text summarization is the process of taking the most important information from a text document or some text documents to create a brief version of that text using a computer-based application.
On this final assessment implemented multi document summarization based on clustering and nonnegative matrix factorization. The summarization produce extractive summaries consist of important sentences from the documents. NMF decomposes a sentence into combination of semantic feature. It can improve the quality of document summaries, because by using similarity between semantic feature and document topic, it can produce important sentences which have high relevance with the document topic. In the proposed method there is also clustering process to remove noise sentence and redundancy.
Evaluation of the summaries uses ROUGE evaluation toolkit. The test results show that summarization using NMF and clustering can produce summaries with higher precision score than summarization using NMF without clustering. NMF with clustering also produce summaries with fewer redundancy.Keyword: text summarization, nonnegative matrix factorization, clustering.