ABSTRAKSI: Sistem pengenalan sinyal ucapan mencocokkan sinyal ucapan yang akan dikenali dengan membandingkannya dengan model bahasa dan model akustik dari suara pengucapan manusia. Model bahasa statistical didapat dari kumpulan teks corpus dan diubah menjadi model bahasa trigram. Untuk model bahasa sintaktik didapat dari struktur atau pola bahasa yang digunakan dalam kehidupan sehari-hari. Model akustik dan bahasa selanjutnya akan dilakukan proses training untuk selanjutnya akan digunakan dalam pengenalan sinyal ucapan. Proses training dan pengenalan sinyal dilakukan dengan menggunakan modul yang terdapat didalam Sphinx ASR.Kata Kunci : sistem pengenalan sinyal ucapan, kosakata besar, Sphinx ASR, model bahasa.ABSTRACT: Speech recognition system do recognize speech signal that will be recognized by comparing with language model and acoustic model from human speeches. Statistical language model is retrieved from some text corpus and convert it to n-gram language model. To match on regular speeches, we must use text corpus with the same case too. The acoustic model and language model will be used for training and the result will be used for speech recognition. The training process is done with some moduls from Sphinx ASR.Keyword: Speech recognition, large vocabulary, Sphinx ASR, language model