Pengenalan Ucapan Suku Kata Bahasa Lisan Menggunakan Ciri LPC, MFCC, dan JST
Abriyono Abriyono(1*), Agus Harjoko(2)
(1) Jurusan Teknik Informatika, STMIK Widya Dharma, Pontianak
(2) Departemen Ilmu Komputer dan Elektronika, FMIPA UGM, Yogyakarta
(*) Corresponding Author
Abstract
Abstrak
Suara adalah salah satu alat komunikasi antar manusia yang efektif dan digemari. Selain sebagai alat komunikasi antar manusia, suara manusia telah digunakan sebagai alat komunikasi antara manusia dan komputer (mesin). Penelitian menggunakan suara sebagai alat komunikasi manusia dan mesin telah banyak dilakukan dengan menggunakan berbagai bahasa. Bahkan ada beberapa penelitian yang telah menghasilkan kemampuan pengenalan yang baik dan dikomersilkan (menggunakan bahasa Inggris). Bagaimana dengan penelitian pengenalan suara menggunakan Bahasa Indonesia? Peneliti mengamati penelitian pengenalan ucapan kata dalam Bahasa Indonesia masih minim dan cakupan jumlah katanya pun masih kecil. Oleh karena itu, pada penelitian ini, peneliti melakukan pengenalan ucapan kata Bahasa Indonesia. Pengenalan ucapan kata Bahasa Indonesia dilakukan dengan memecah kata Bahasa Indonesia ke dalam bentuk suku kata bahasa lisan. Pemecahan ke dalam bentuk lafal kata diharapkan mampu mengurangi jumlah kata yang sangat besar, namun tetap mengakomodasi seluruh kata yang dalam Bahasa Indonesia. Total jumlah lafal kata yang ditemukan oleh peneliti adalah 1741 suku kata bahasa lisan. Peneliti membagi sistem dalam 4 bagian besar, yakni proses perekaman, pre-processing, ekstraksi ciri, dan pengenalan. Pada proses perekaman digunakan frekuensi 11025 Hz, Mono, 8 bit. Pada pre-processing digunakan proses bantuan seperti pre-emphasis, segmentasi, framing, dan windowing. Sedangkan untuk ekstraksi ciri dan pengenalan digunakan ciri LPC/MFCC dan identifier jaringan syaraf tiruan backpropagation. Hasil pengenalan dengan pendekatan yang dibangun menunjukkan hasil yang belum memuaskan, yakni dengan kemampuan pengenalan terbaik sebesar 0.65% dengan ciri MFCC.
Kata kunci—pengenalan kata Bahasa Indonesia, LPC, MFCC, JST, backpropagation.
Abstract
Voice is one of effective and convinienced communication’s medium among human. However, the used of voice is not only for communication among human but also has another role nowadays. Voice becomes communication medium for human and computer (machine). One of its application is speech to text application. Some of speech to text research already claimed good accuracy for some languages. How about Indonesian language? The research for Indonesian word recognition was still at low amount. The word used for research was at small amount too. Because of some of the reasons, researcher focus on Indonesian word recognition in this research. This research will divide the word into the speech syllable. The aim for the dividing system is to reduce the large amount of the word, but still cover all of the word. We found and used 1741 speech syllables. For managing the recognition, we used several approaches. The approaches are 11025 Hz, Mono, 8 bit for recording, pre-emphasized, segmentation, framing, and windowing for pre-processing, LPC and MFCC for the features, and back-propagation neural network for the identifier. The result using this approach was not reached good performance. The best result performed 0.65% by using MFCC feature.
Keywords—Indonesian’s syllable recognition, LPC, MFCC, neural network, backpropagation
Keywords
Full Text:
PDFReferences
[1] Sitanggang, D., Sumardi, Hidayatno, A., 2002, Pengenalan Vokal Bahasa Indonesia dengan Jaringan Syaraf Tiruan Melalui Transformasi Fourier, Seminar Nasional I Rekayasa Aplikasi dan Industri (RAPI), Semarang.
[2] May, I.L., Sumardi, Hidayatno, A., 2002, Pengenalan Vokal Bahasa Indonesia dengan Jaringan Syaraf Tiruan Melalui Transformasi Wavelet, Seminar Nasional I Rekayasa Aplikasi dan Industri (RAPI), Semarang.
[3] Amri, Arhami M., Fauzan, 2008, Analisa Teknik Pengenalan Sinyal Wicara dengan Hidden Markov Models - Neural Network, Jurnal Listrik Telekomunikasi dan Elektronika 2008 (LiTEk), No.2, Vol. 5, Hal 64-67.
[4] Ajulian, A.Z., Hidayatno, A., Widyanto, M.T.S., 2008, Aplikasi Pengenalan Ucapan Sebagai Pengatur Mobil Dengan Pengendali Jarak Jauh, Jurnal Berkala Transmisi Teknik Elektro, No.1, Jilid 10, Hal 21-26.
[5] Hapsari, J.P., 2007, Aplikasi Pengenalan Suara dalam Pengaksesan Sistem Informasi Akademik, Skripsi S-1, Fakultas Teknik Elektro, Universitas Diponegoro, Semarang.
[6] Rizal, A., Suryani, V., 2008, Pengenalan Signal EKG Menggunakan Dekomposisi Paket Wavelet dan K-Means Clustering, Seminar Nasional Aplikaso Teknologi Informasi 2008 (SNATI), Yogyakarta, 21 Juni 2008
[7] Rabiner L., Juang B.H., 1993, Fundamentals for Speech Recognition, Prentice Hall, New Jersey.
[8] Bachu R.G., Kopparthi S., Adapa B., Barkana B.D., 2008, Voiced/Unvoiced Decision for Speech Signals Based on Zero-Crossing Rate and Energy, Khaled Elleithy, Advanced Techniquee in Computing Sciences and Software Engineering, Springer Science+Business Media, New York. Hal. 279-282.
[9] Oppenheim, A.V., Schafer, R.W., 1999, Discrete Time Signal Processing, Second Edition, Prentice Hall, New Jersey.
[10] Gonzales R.C., Woods R.E., 2008, Digital Image Processing, 3rd Edition, Prentice Hall, New Jersey.
[11] Huang, X.D., Acero, A., Hon, H.W., 2001, Spoken Language Processing: A Guide to Theory, Algorithm, and System Development, Prentice Hall, New Jersey.
[12] Fausett L., 1994, Fundamentals of Neural Networks: Architecture, Algorithms, dan Applications, Prentice Hall, New Jersey.
[13] Pusat Pengembangan Bahasa Indonesia, 2000, Pedoman Umum Ejaan Bahasa Indonesia yang Disempurnakan, Pusat Bahasa Departemen Pendidikan Nasional, Jakarta.
[14] Ahmad, A.M., Ismail, S., Samaon, D.F., 2004, Reccurent Neural Network with Backpropagation through Time for Speech Recognition, International Symposium on Communications and Information Technologies 2004 (ISCIT), Sapporo (Jepang), 26-29 Oktober 2004.
[15] Demuth H, Beale M., 2000, Neural Network Toolbox: For Use with MATLAB, The MathWorks, Natick Massachusetts USA.
DOI: https://doi.org/10.22146/ijccs.2149
Article Metrics
Abstract views : 4684 | views : 4027Refbacks
- There are currently no refbacks.
Copyright (c) 2013 IJCCS - Indonesian Journal of Computing and Cybernetics Systems
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
View My Stats1