Pengelompokan Berita Indonesia Berdasarkan Histogram Kata Menggunakan Self-Organizing Map
Ambarwati Ambarwati(1*), Edi Winarko(2)
(1) Jurusan Teknik Komputer, Instituto Profissional de Canossa, Dili
(2) Departemen Ilmu Komputer dan Elektronika, FMIPA UGM, Yogyakarta
(*) Corresponding Author
Abstract
Abstrak
Berita merupakan sumber informasi yang dinantikan oleh manusia setiap harinya. Manusia membaca berita dengan kategori yang diinginkan. Jika komputer mampu mengelompokkan berita secara otomatis maka tentunya manusia akan lebih mudah membaca berita sesuai dengan kategori yang diinginkan. Pengelompokan berita yang berupa artikel secara otomatis sangatlah menarik karena mengorganisir artikel berita secara manual membutuhkan waktu dan biaya yang tidak sedikit.
Tujuan penelitian ini adalah membuat sistem aplikasi untuk pengelompokkan artikel berita dengan menggunakan algoritma Self Organizing Map. Artikel berita digunakan sebagai input data. Kemudian sistem melakukan pemrosesan data untuk dikelompokkan. Proses yang dilakukan sistem meliputi preprocessing, feature extraction, clustering dan visualize.Sistem yang dikembangkan mampu menampilkan hasil clustering dengan algoritma Self Organizing Map dan memberikan visualisasi dengan smoothed data histograms berupa island map dari artikel berita. Selain itu sistem dapat menampilkan koleksi dokumen dari lima kategori berita yang ada pada tiap tahunnya dan banyaknya kata (histogram kata) yang sering muncul pada tiap arikel berita. Pengujian dari sistem ini dengan memasukan artikel berita, kemudian sistem memprosesnya dan mampu memberikan hasil cluster dari artikel berita yang dimasukan.
Kata kunci—Pengelompokkan berita Indonesia, pengelompokkan berdasar histogram kata, pengelompokan berita menggunakan SOM
Abstract
News is awaited information resources by humans every day. Human reading the news with the desired category. If the computer able to news clustering with automatically, humans of course will be easier to read the news according to the desired category. News clustering in the form of news articles with automatically very interesting because it organizes news articles manually takes time and costs not a little bit.
The purpose of this research is to create a system application for grouping news articles by using the Self Organizing Map algorithm. News article be used as input into the system. News articles used as input data. Then the system performs data processing until to be clustered. Processes performed by the system covers: preprocessing, feature extraction, clustering and visualize.The system developed is able to display the results clustering of the Self Organizing Map algorithm and gives visualization of the Smoothed Data Histograms in the form of island map from news articles. Additionally the system can display a word histogram and news articles from five categories news in each year. Testing of this system by entering the news articles, then the system performs data processing and gives results of a cluster from news articles that input.
Keywords—Indonesia news clustering, clustering based on words histograms, news clustering using SOM
Keywords
Full Text:
PDFReferences
[1]. Wibisono Y., dan Khodra, M. L., 2005, Clustering Berita Berbahasa Indonesia, Jurnal FPMIPA UPI dan KK Informatika ITB, Bandung.
[2]. Ramadan, R., 2007, Penerapan Pohon Untuk Klasifikasi Dokumen Teks Berbahasa Inggris, Seminar Nasional, Bandung.
[3]. Langgeni, D. P., Baizal A., dan Firdaus, Y., 2010, Clustering Artikel Berita Berbahasa Indonesia Menggunakan Unsupervised Feature Selection, Seminar Nasional Informatika, Yogyakarta.
[4]. Anggraeni, D., 2008, Klasifikasi Topik Menggunakan Metode Naive Bayes dan Maximum Entropi pada Artikel Media Masa dan Abstrak Tulisan, Skripsi, Program Ilmu Komputer, Universitas Indonesia, Depok.
[5]. Kohonen, T., 2000, Self-Organizing Maps of Massive Document Collections, IEEE-INNS-ENNS International Joint Conference on Neural Networks, Finland.
[6]. Vuori, V., 2002 Clustering Writing Styles with a Self-Organizing Map, IEEE Eighth International Workshop on Frontiers in Handwriting Recognition, Finland.
[7]. Perelomov, I., Azcarraga, A.P., Tan, J., dan Chua, T.S., 2002, Using Structured Self-Organizing Maps in News Integration Websites, School of Computing, National University of Singapore, Singapore.
[8]. Bação, F.,dan Lobo, V., 2010, Introduction to Kohonen’s Self-Organizing Maps, Instituto Superior de Estatistica E Gestao de Informacao, Universidade Nova de Lisboa, Portugal.
[9]. Siang, J. J., 2009, Jaringan Saraf Tiruan dan Pemrogramannya Menggunakan Matlab, Andi Offset, Yogyakarta.
DOI: https://doi.org/10.22146/ijccs.3500
Article Metrics
Abstract views : 3673 | views : 5553Refbacks
- There are currently no refbacks.
Copyright (c) 2014 IJCCS - Indonesian Journal of Computing and Cybernetics Systems
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
View My Stats1