ABSTRAKSI: Sistem pengenalan suara membutuhkan model akustik dan model bahasa agar dapat bekerja. Model akustik berasal dari file suara yang kemudian diubah menjadi hmm oleh HTK. Model bahasa statistikal menggunakan teks corpus Bahasa Indonesia yang kemudian diubah menjadi model bahasa trigram, untuk model bahasa syntactic, digunakan Julius untuk pembentukan grammar. Setelah model akustik dan model bahasa statistikal dan syntactic didapat, digunakanlah Julius untuk sistem pengenalan suara.
Pada penggabungan model bahasa dengan model akustik 16khz, didapat kebenaran kalimat tertinggi yaitu 82%, kebenaran kata 94.7%, dan akurasi kata 94.7%, dengan akurasi kata model bahasa statistikal 93.43% dan akurasi kata pada model bahasa syntactic 82.63%.Kata Kunci : sistem pengenalan suara kosakata besar, julius, htk, model bahasa.ABSTRACT: Speech recognition system needs aouctic model and language model. Acoustic model can acquired from speech file that have been converted to hmm by HTK. Statistical language model using Indonesian text corpus, and then its converted to trigram language model, for syntactic language model, we used Julius to make grammar. After acoustic model and statistical and syntactic language model acquired, we used Julius in speech recognition system.
To combined language model and 16khz acoustic model, we get highest correct sentence 82%, word correct 94.7%, and word accuracy 94.7%, from statistical language model word accuracy 93.43% and word accuracy from syntactic language model is 82.63%.Keyword: LVCSR, julius, htk, language model.