ABSTRAKSI: Concatenation synthesizer merupakan pensintesis yang mampu memproduksi sinyal ucapan secara otomatis melalui transkripsi grafem-ke-fonem untuk kalimat yang diucapkan. Concatenation synthesizer masih merupakan cara termudah untuk membuat ucapan sistesis berkualitas tinggi.
Penelitian concatenation synthesizer dalam bahasa Indonesia sudah dikembangkan, dan telah mencapai hasil yang cukup memuaskan. Namun demikian beberapa permasalahan masih belum terselesaikan secara tuntas. Oleh karena itu dalam tugas akhir ini dirancang model pensintesis untuk kontrol prosodi untuk meningkatkan kualitas intonasi kalimat pada penelitian sebelumnya. Dalam tugas akhir ini Hopfield Neural Network dipilih untuk merealisasikan model prosodi pada sintesis bahasa Indonesia. Pada bagian pensintesa digunakan model generator intonasi untuk memodifikasi panjang durasi dan kontur intonasi pada setiap suku kata. Digunakan juga Pitch Synchronous Overlap-Add (PSOLA) untuk mengubah pitch yang ada.
Hasil penelitian menunjukkan adanya intonasi kalimat sintesis yang lebih menonjol dibandingkan penelitian sebelumnya. MOS fluidity meningkat dari 2.482353 menjadi 2.81951. MOS intelligibility meningkat dari 2.082353 menjadi 2.77526. Selain itu MOS naturalness juga dapat dipertahankan dari 3.258824 menjadi 3.26143. Akurasi dari pengujian Hopfield Neural Network juga sangat baik, terbukti dengan hasil performansinya yaitu sebesar 100%. Dimana penggunaan. Pada pengujiannya menggunakan FD-PSOLA didapatkan hasil bahwa overlap 90% memiliki pitch countour yang lebih bagus dengan jumlah lebih sedikit sinyal drop pada sambungannya bila di bandingan dengan overlap yang lain. Untuk TD-PSOLA diperoleh bahwa overlap 1% menjadi titik penyambungan yang paling baik.
Kata Kunci : Hopfield Neural Network, pembangkit prosodi, concatenation synthesizer, pitch synchronous overlap-add.ABSTRACT: Concatenation synthesizer is a synthesizer that can produce automatic speech signal through the transcription of grapheme-to-phoneme for the spoken sentence. The concatenative synthesis is still become the easiest way the produce a high quality synthetic speech.
Research concatenation synthesizer in the Indonesian version was already developed, and has achieved satisfactory result. However, several problems in the research remain unsolved. In this final task, Hopfield Neural Network (HNN) is selected to realize the concatenation synthesizer model of prosody in the Indonesian language. Pitch Synchronous Overlap-Add (PSOLA) use to modify the signal speech.
The results showed the synthesis of intonation phrase is more prevalent than previous research. Fluidity MOS increased from 2.482353 to 2.81951. Intelligibity MOS increased from 2.082353 to 2.77526. Beside that naturalness MOS also keep from 3.258824 to 3.26143. From the test of Hopfield Neural Network get the best accuration is 100%. FD-PSOLA test get overlap 90% have more pitch countour and less drop signal at the point of junction if differentiated with other overlap. Overlap 1% to be the best point of junction for TD-PSOLA.Keyword: Hopfield neural Network, generator prosody, concatenation synthesizer, Pitch Synchronous Overlap-Add.