Pemenggalan suku kata Bahasa Indonesia seringkali disepelekan, namun ternyata sangat penting untuk setidaknya dua hal yaitu perannya di pemenggalan yang perlu dilakukan ketika kata yang ditulis panjangnya melebihi batas kanan kertas dan dalam bahasa lisan berperan untuk mengetahui bagaimana cara mengucapkan suatu kata. Pada penelitian yang pernah dilakukan sebelumnya, pemenggalan suku kata Bahasa Indonesia sudah dapat dilakukan dengan baik, kecuali pada pemenggalan suku kata yang mengandung huruf diftong. Pemenggalan yang dilakukan belum bisa dengan baik membedakan antara kata yang mengandung diftong dan deret vokal, karena sama-sama memiliki dua huruf vokal yang saling berdampingan, hanya saja pada diftong pengucapannya dalam suatu waktu yang bersamaan sedangkan pada kata bukan diftong pengucapan di waktu yang tidak bersamaan.
Sehingga perlu diterapkan suatu metode pemenggalan yang mampu menyelesaikan masalah ini. Metode yang diajukan pada penelitian ini adalah pattern-based hyphenation. Metode ini diperkenalkan oleh Liang (1983). Metode ini menggunakan patternset yang berasal dari sebuah daftar kata-kata yang menandakan legal dan illegalnya titik pemenggalan. Patternset ini menyimpan informasi dari konteks pemenggalan dari kata-kata di kamus.
Metode pattern-based hyphenation ini digunakan pada pemenggalan suku kata Bahasa Indonesia termasuk kata yang memiliki struktur tertentu seperti huruf diftong. Jumlah pattern yang dihasilkan adalah 566 dengan correct mencapai 94% dan tingkat wrong sebesar 17%. Dengan patternset ini akurasi jumlah diftong yang dihasilkan sebesar 97.44% dan deret vokal sebesar 40.28%. Pemenggalan, diftong, deret vokal, Pattern-based Hyphenation