ABSTRAKSI: Berbagai penelitian dalam pengolahan sinyal suara telah banyak dikembangkan. Salah satu penelitian yang menarik untuk dikembangkan adalah identifikasi dialek. Informasi dialek masing-masing daerah memiliki karakteristik yang unik ditinjau dari ciri-ciri sinyal suaranya. Identifikasi dialek dilakukan untuk mendapat informasi lebih lengkap dari seseorang melalui logat suara dari berbagai suku di Indonesia dan kemungkinan lebih lanjut dapat dikembangkan untuk mengetahui suku bangsa seseorang.
Pada tugas akhir ini, suara dari beberapa suku bangsa dengan dialek jawa, sunda, batak, bali, makassar direkam dan diproses menggunakan analisa sinyal dalam domain waktu dan frekuensi yang bisa diamati dari spectrogramnya, kemudian di ekstraksi ciri menggunakan Mel Frequency Cepstrum Coefficients (MFCC) untuk mengetahui ciri-ciri penting dari sinyal suara dengan dialek berbeda. Hasil ekstraksi ciri tersebut sebagai input pada metode klasifikasi Self Organizing Map (SOM). Proses yang dilakukan dalam pembuatan simulasi ini yakni secara non real time dan real time.
Hasil yang didapatkan pada proses non real time yaitu akurasi 92.5% saat menggunakan koefisien moving average 10, fungsi topologi Randtop, fungsi jarak dist, dan Epoch 1000. Pada proses real time, akurasi yang didapatkan sebesar 80% dikarenakan beberapa faktor seperti sensitivitas perangkat baik hardware dan software yang digunakan dalam simulasi identifikasi Tugas Akhir ini.Kata Kunci : Dialek, Spectrogram, Mel Frequency Cepstrum Coefficients, Self Organizing MapABSTRACT: In various research of speech signal processing has been developed. One of the interesting research to develop is a dialect identification. Information dialects of each region has unique characteristics in terms of the characteristics of speech signals. Dialect identification is done to get more information from someone through accent speech from various tribe in Indonesia and possibly further developed to determine a person's tribe.
In this Final Project, the speech of some tribes with the dialect of Javanese, Sundanese, Batak, Bali, Makassar recorded and processed using signal analysis in time domain and frequency that can be observed from spectrogram, then the feature extraction using the Mel Frequency Cepstrum Coefficients (MFCC) to know the essential characteristics of speech signals with different dialects. The results of feature extraction methods as input on the classification of the Self Organizing Map (SOM). There are two process in this simulation, nonreal time and real time.
Results in the process of non-real time accuracy is 92.5% when using moving average coefficient is 10, the topology function is Randtop, distance function is dist and the Epoch is 1000. Accuracy in the process real time is 80% because several factors such as sensitivity of both hardware and software devices used in this final project.Keyword: Dialect, Spectrogram, Mel Frequency Cepstrum Coefficients, Self Organizing Map