PENGENALAN TEKS BAHASA INDONESIA PADA CITRA TULISAN TANGAN BERBASIS TRANSFORMER
Dianita Alfi Rahmawati(1*), Ika Candradewi(2)
(1) Gadjah Mada University
(2) Gadjah Mada University
(*) Corresponding Author
Abstract
Digitalisasi dokumen dapat dipercepat berkat kemajuan teknologi. Banyak upaya telah dilakukan untuk mengenali teks dari foto. Banyak arsitektur mampu mengenali teks, khususnya citra tulisan tangan salah satunya adalah transformer. Pada penelitian sebelumnya masih banyak yang menggunakan dataset citra dengan aksara tegak sehingga kurang variatif. Untuk meningkatkan keahlian pemodelan pembelajaran, proyek ini berfokus pada pengimplementasian dan pengembangan sistem pada Transformers dengan pengujian dataset yang lebih bervariasi.
Dataset yang digunakan terdiri dari foto dengan tulisan Indonesia. setelah langkah pra-pemrosesan kemudian akan diubah menjadi token dengan label kelas dan koordinat kotak pembatas untuk anotasi gambar. Dataset akan dilatih menggunakan arsitektur transformer. Encoder-decoder merupakan dasar dari arsitektur Transformer ini. Pengujian data dilakukan setelah model dilatih menggunakan mean Average Precision (mAP).
Sistem yang dibuat mampu mengenali dan mengklasifikasikan objek secara akurat dari data gambar tulisan tangan, termasuk objek yang mewakili kata-kata bahasa Indonesia. Hyperparameter yang paling optimal didapatkan batch dan jumlah epoch masing-masing 32 dan 40. Dengan menggunakan parameter terbaik, evaluasi model menghasilkan data dari sampel latih dan uji dengan masing-masing nilai mAP 0,97 dan 0,95.
Keywords
Full Text:
PDFReferences
Chen T, Saxena S, Li L et al., "Pix2seq: A Language Modeling Framework for Object Detection", ArXiv, ID: 2109.10852, 2021. [Online]. Available: http://arxiv.org/abs/2109.10852. [Accessed: Feb-2023]
Ly V, Doan T, Ly N, "Transformer-based model for Vietnamese Handwritten Word Image Recognition", Proceedings - 2020 7th NAFOSTED Conference on Information and Computer Science, NICS 2020 page 163-168, 2020 doi: 10.1109/NICS51282.2020.9335877 Scopus: 2-s2.0-85101122800.
Vaswani A, Shazeer N, Parmar N et al., "Attention Is All You Need", ArXiv, ID: 1706.03762, 2017. [Online]. Available: http://arxiv.org/abs/1706.03762. [Accessed: Feb-2023]
Touvron H, Cord M, Jégou H, "DeiT III: Revenge of the ViT", ArXiv, ID: 2204.07118 2022. [Online]. Available: https://arxiv.org/pdf/2204.07118 [Accessed: Jun 2023]
Touvron H, Cord M, Douze M et al., "Training Data-Efficient Image Transformers & Distillation Through Attention", ArXiv, ID: 2012.12877, 2020. [Online] Available: http://arxiv.org/abs/2012.12877 [Accessed: Jun 2023]
Dosovitskiy A, Beyer L, Kolesnikov A et al., "An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale", ArXiv, ID: 2010.11929, 2020. [Online] Available: http://arxiv.org/abs/2010.11929 [Accessed: Nov 2022]
Bi J, Zhu Z, Meng Q, "Transformer in Computer Vision", 2021 IEEE International Conference on Computer Science, Electronic Information Engineering and Intelligent Control Technology, CEI 2021 page 178-188, 2021. doi: 10.1109/CEI52496.2021.9574462 Scopus: 2-s2.0-85118925905
Bhunia A, Khan S, Cholakkal H et al., "Handwriting Transformers", ArXiv, ID: 2104.03964, 2021. [Online] Available: http://arxiv.org/abs/2104.03964 [Accessed: Nov 2022]
Pu Y, Apel D, Szmigiel A et al. "Image Recognition of Coal and Coal Gangue Using a Convolutional Neural Network and Transfer Learning", Energies, Vol. 12(9), 2019. doi: 10.3390/en12091735 Scopus: 2-s2.0-85065980182
Shaikh M, Duan T, Chauhan M et al., "Attention based Writer Independent Verification", Proceedings of International Conference on Frontiers in Handwriting Recognition, ICFHR, page 373-379, 2020. doi: 10.1109/ICFHR2020.2020.00074 Scopus: 2-s2.0-85097792375
Bayat O, Aljawarneh S, Carlak H et al. "Understanding of a Convolutional Neural Network", Book: Proceedings of 2017 International Conference on Engineering & Technology (ICET'2017) : Akdeniz University, Antalya, Turkey, 21-23 August, 2017. ISBN: 9781538619490
DOI: https://doi.org/10.22146/ijeis.86926
Article Metrics
Abstract views : 577 | views : 363Refbacks
- There are currently no refbacks.
Copyright (c) 2024 IJEIS (Indonesian Journal of Electronics and Instrumentation Systems)
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
View My Stats1