Kalimat sitasi berperan penting dalam penulisan jurnal ilmiah. Kalimat sitasi dapat
diidentifikasi dengan mengekstraksi fiturnya. Pada penelitian ini digunakan 5 fitur
utama dan juga akan dikombinasikan. Fitur-fitur yang kita gunakan adalah unigram,
bigram, proper noun, cue phrase, dan pronoun. Untuk mengklasifikasi kita
menggunakan naive bayes (NB) dan support vector machine (SVM). Penelitian ini
menggunakan 500 makalah ilmiah yang diambil dari acl-arc. Hasil dari penelitian
ini adalah fitur yang terbaik untuk mengidentifikasi kalimat sitasi adalah “proper
noun, dan cue phrase” dengan 59,069% f-measure, dan supervised learning yang
terbaik pada penelitian ini adalah naive bayes
Kata kunci: supervised learning, ekstraksi fitur, id