ABSTRAKSI: Peringkasan teks otomatis (automatic text summarization) adalah proses mengambil informasi yang paling penting dari sebuah teks dokumen atau beberapa teks dokumen sehingga dihasilkan versi yang lebih singkat yang digunakan oleh user (users) untuk task tertentu (tasks) dengan memanfaatkan aplikasi berbasis komputer.
Pada Tugas Akhir ini diimplementasikan suatu teknik Automatic Text summarization berdasarkan pendekatan graf yaitu Timestamped Graph Model untuk multi dokumen berita. Aplikasi ini dilakukan terhadap multidokumen berita berbahasa Indonesia atau Inggris yang memiliki topik yang sama. Metode ini menerapkan konsep Topic-sensitive PageRank untuk menghasilkan skor tiap kalimat pada seluruh dokumen sehingga didapatkan urutan rangking seluruh kalimat. Beberapa kalimat yang memiliki rangking tertinggi akan diekstraksi menjadi kalimat ringkasan sesuai dengan parameter compression rate yang diinginkan user. Perhitungan skor kalimat dilakukan berdasarkan similarity antar kalimat dengan user query dan Timestamped Graph, yaitu graf berarah yang dibangun secara bertahap dengan simpulnya sebagai kalimat dan sisinya sebagai similarity antar kalimat. Metode similarity yang digunakan yaitu cosine-based similarity. Proses ordering dan reranking dilakukan agar kalimat-kalimat hasil ringkasan dapat terurut dan tidak ada redundancy data atau informasi yang berulang.
Pengujian dilakukan dengan menggunakan ROUGE evaluation toolkit dengan membandingkan hasil aplikasi ini dengan summarizer lainnya yaitu MEAD. Hasil pengujian menunjukkan bahwa metode Timestamped Graph Model yang diaplikasikan pada tugas akhir ini sudah memiliki akurasi yang cukup baik.Kata Kunci : peringkas teks otomatis, Timestamped Graph Model, topic-senstive PageRank, user query, cosine-based similarity, ordering, reranking.ABSTRACT: The automatic text summarization is the process of taking the most important information from a text or some text to create a brief version of that text to fulfill user's need or any tasks required.using a computer-based application.
On this final assessment the Automatic Text summarization technique based on Graph approach which is Timestamped Graph Model for multi-document of news is applied. As the input for this application are Indonesia and English news documents which have same topic. This method applies the concept of Topic-Sensitive Pagerank to yield the score of every sentence to get sequence ranking of all sentence. Some sentences which have highest ranking will be extracted to be a summary as according to parameter of compression rate from user. The calculation of sentence score is based on similarity sentences with query and Timestamped Graph which is directed graph builded step by step with its node as sentence and its edge as similarity between sentences. Similarity method that is used is cosine-based similarity. Ordering and reranking process are apllied to produce a summary which has chronological in meaning yet and there are no redundancy data or repeated information
Evaluation of the summaries uses ROUGE evaluation toolkit comparing the result from another summarizer, MEAD. Result of examination indicate that the method of Timestamped Graph Model application in this final assessment have owned the good enough accuration.Keyword: automatic text summarization, Timestamped Graph Model, topic-senstive PageRank, cosine-based similarity, ordering, reranking.