Pengelompokkan Dataset Bus Menggunakan Algoritma K-Means
Abstract
Data mining is the process of finding information by identifying patterns from datasets. The process of finding this information can be done by grouping data into several groups from a dataset which in data mining is called the clustering method. Clustering is the process of partitioning a dataset into several subsets or groups based on the similarity of the characteristics of each data in the existing groups. The clustering method used in this research is K-Means which belongs to the Partition Clustering algorithm group. This method has also been widely used in solving problems related to sales clustering, forest fires, agriculture, transportation, and so on. In this study, the k-means algorithm was used to classify the Bus BB dataset based on data collected during 2022. In the process of converting raw datasets into useful information, the Knowledge Discovery in Database (KDD) process was used. In the early stages, data cleaning will be carried out, then data selection, data transformation, and data mining will be carried out using the Rapidminer software. Modeling results were evaluated using the Davies Bouldin Index (DBI) instrument. Based on the research that has been done, it can be seen that the K-Means algorithm can be used to group BB bus datasets. Which later can be used by companies as an illustration, this research can also be used as input for companies/service providers.Abstrak Bahasa Inggris maksimum 250 kata dalam satu alinea menggunakan huruf Arial 10, spasi 1. Abstrak berisi pendahuluan singkat, tujuan, metode dan hasil secara ringkas dan jelas. Penulisan singkatan yang tidak umum tidak diperkenankan kecuali didefinisikan sebelumnya.
References
[1] M. Krishnamoorthy and R. Karthikeyan, “Pattern mining algorithms for data streams using itemset,†Meas. Sensors, vol. 24, no. June, p. 100421, 2022, doi: 10.1016/j.measen.2022.100421.
[2] D. P. Utomo and M. Mesran, “Analisis Komparasi Metode Klasifikasi Data Mining dan Reduksi Atribut Pada Data Set Penyakit Jantung,†J. Media Inform. Budidarma, vol. 4, no. 2, p. 437, 2020, doi: 10.30865/mib.v4i2.2080.
[3] Hafizah, Tugiono, and W. R. Maya, “Penerapan Data Mining Dalam Memprediksi Jumlah Penumpang Pada CV . Surya Mandiri Sukses Dengan Menggunakan Metode Regresi Linier,†J. Teknol. Inf. dan Sist. Komput. TGD, vol. 2, no. 1, pp. 54–61, 2019.
[4] Y. Goktua Siadari and D. Saripuna, “Data Mining Untuk Mengestimasi Jumlah Penumpang Pada Pt. Pinem Lau Guna Medan Dengan Menggunakan Metodere Gresi Linear Berganda,†J. CyberTech, vol. x. No.x, no. x, 2020.
[5] Y. P. Sari, A. Primajaya, and A. S. Y. Irawan, “Implementasi Algoritma K-Means untuk Clustering Penyebaran Tuberkulosis di Kabupaten Karawang,†INOVTEK Polbeng - Seri Inform., vol. 5, no. 2, p. 229, 2020, doi: 10.35314/isi.v5i2.1457.
[6] A. Sulistiyawati and E. Supriyanto, “Implementasi Algoritma K-means Clustring dalam Penetuan Siswa Kelas Unggulan,†J. Tekno Kompak, vol. 15, no. 2, p. 25, 2021, doi: 10.33365/jtk.v15i2.1162.
[7] V. Herlinda and D. Darwis, “Analisis Clustering Untuk Recredesialing Fasilitas Kesehatan Menggunakan Metode Fuzzy C-Means,†Darwis, Dartono, vol. 2, no. 2, pp. 94–99, 2021, [Online]. Available: http://jim.teknokrat.ac.id/index.php/JTSI
[8] E. Dianawati, P. P. Yanti, and Y. Suryandari, “Klustering Jumlah Penumpang pada Halte Bus Rapid Transit Kota Tangerang,†J. Sist. Cerdas, vol. 2, no. 3, pp. 163–172, 2019, doi: 10.37396/jsc.v2i3.34.
[9] A. Wibowo, Moh Makruf, Inge Virdyna, and Farah Chikita Venna, “Penentuan Klaster Koridor TransJakarta dengan Metode Majority Voting pada Algoritma Data Mining,†J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 5, no. 3, pp. 565–575, 2021, doi: 10.29207/resti.v5i3.3041.
[10] S. Widaningsih, “Perbandingan Metode Data Mining Untuk Prediksi Nilai Dan Waktu Kelulusan Mahasiswa Prodi Teknik Informatika Dengan Algoritma C4,5, Naïve Bayes, Knn Dan Svm,†J. Tekno Insentif, vol. 13, no. 1, pp. 16–25, 2019, doi: 10.36787/jti.v13i1.78.
[11] J. Hutagalung and F. Sonata, “Penerapan Metode K-Means Untuk Menganalisis Minat Nasabah,†J. Media Inform. Budidarma, vol. 5, no. 3, p. 1187, 2021, doi: 10.30865/mib.v5i3.3113.
[12] A. Aditya, I. Jovian, and B. N. Sari, “Implementasi K-Means Clustering Ujian Nasional Sekolah Menengah Pertama di Indonesia Tahun 2018/2019,†J. Media Inform. Budidarma, vol. 4, no. 1, p. 51, 2020, doi: 10.30865/mib.v4i1.1784.
[13] K. Shao, G. Mei, and Y. Wu, “Investigating changes in global distribution of Ozone in 2018 using k -means clustering algorithm,†J. Comput. Math. Data Sci., vol. 3, no. March, p. 100028, 2022, doi: 10.1016/j.jcmds.2022.100028.
[14] W. Liu, P. Zou, D. Jiang, X. Quan, and H. Dai, “Zoning of reservoir water temperature field based on K-means clustering algorithm,†J. Hydrol. Reg. Stud., vol. 44, no. June, p. 101239, 2022, doi: 10.1016/j.ejrh.2022.101239.
[15] H. Priyatman, F. Sajid, and D. Haldivany, “Klasterisasi Menggunakan Algoritma K-Means Clustering untuk Memprediksi Waktu Kelulusan Mahasiswa,†J. Edukasi dan Penelit. Inform., vol. 5, no. 1, p. 62, 2019, doi: 10.26418/jp.v5i1.29611.
[16] I. R. Mahartika and A. Wibowo, “Data Mining Klasterisasi dengan Algoritme K-Means untuk Pengelompokkan Provinsi Berdasarkan Konsumsi Bahan Bakar Minyak Nasional,†Pros. Semin. Nas. SISFOTEK (Sistem Inf. dan Teknol., vol. 3, no. 1, pp. 87–91, 2019, [Online]. Available: https://seminar.iaii.or.id/index.php/SISFOTEK/article/view/108
[17] K. Handoko and L. Sabda Lesmana, “Computer Based Information System Journal PENGELOMPOKKAN DATA MINING PADA JUMLAH PENUMPANG DI BANDARA HANG NADIM INFORMASI ARTIKEL KATA KUNCI,†Cbis J., vol. 02, 2018, [Online]. Available: http://ejournal.upbatam.ac.id/index.php/cbis
[18] E. Muningsih, I. Maryani, and V. R. Handayani, “Penerapan Metode K-Means dan Optimasi Jumlah Cluster dengan Index Davies Bouldin untuk Clustering Propinsi Berdasarkan Potensi Desa,†J. Sains dan Manaj., vol. 9, no. 1, pp. 95–100, 2021, [Online]. Available: https://ejournal.bsi.ac.id/ejurnal/index.php/evolusi/article/view/10428/4839
[19] S. I. Murpratiwi, I. G. Agung Indrawan, and A. Aranta, “Analisis Pemilihan Cluster Optimal Dalam Segmentasi Pelanggan Toko Retail,†J. Pendidik. Teknol. dan Kejuru., vol. 18, no. 2, p. 152, 2021, doi: 10.23887/jptk-undiksha.v18i2.37426.
[20] N. . Anggraeni, “Teknik Clustering Dengan Algoritma K-Medoids Untuk Menangani Strategi Promosi Di Politeknik Tedc Bandung,†J. Teknol. Inf. dan Pendidik., 2019.
[2] D. P. Utomo and M. Mesran, “Analisis Komparasi Metode Klasifikasi Data Mining dan Reduksi Atribut Pada Data Set Penyakit Jantung,†J. Media Inform. Budidarma, vol. 4, no. 2, p. 437, 2020, doi: 10.30865/mib.v4i2.2080.
[3] Hafizah, Tugiono, and W. R. Maya, “Penerapan Data Mining Dalam Memprediksi Jumlah Penumpang Pada CV . Surya Mandiri Sukses Dengan Menggunakan Metode Regresi Linier,†J. Teknol. Inf. dan Sist. Komput. TGD, vol. 2, no. 1, pp. 54–61, 2019.
[4] Y. Goktua Siadari and D. Saripuna, “Data Mining Untuk Mengestimasi Jumlah Penumpang Pada Pt. Pinem Lau Guna Medan Dengan Menggunakan Metodere Gresi Linear Berganda,†J. CyberTech, vol. x. No.x, no. x, 2020.
[5] Y. P. Sari, A. Primajaya, and A. S. Y. Irawan, “Implementasi Algoritma K-Means untuk Clustering Penyebaran Tuberkulosis di Kabupaten Karawang,†INOVTEK Polbeng - Seri Inform., vol. 5, no. 2, p. 229, 2020, doi: 10.35314/isi.v5i2.1457.
[6] A. Sulistiyawati and E. Supriyanto, “Implementasi Algoritma K-means Clustring dalam Penetuan Siswa Kelas Unggulan,†J. Tekno Kompak, vol. 15, no. 2, p. 25, 2021, doi: 10.33365/jtk.v15i2.1162.
[7] V. Herlinda and D. Darwis, “Analisis Clustering Untuk Recredesialing Fasilitas Kesehatan Menggunakan Metode Fuzzy C-Means,†Darwis, Dartono, vol. 2, no. 2, pp. 94–99, 2021, [Online]. Available: http://jim.teknokrat.ac.id/index.php/JTSI
[8] E. Dianawati, P. P. Yanti, and Y. Suryandari, “Klustering Jumlah Penumpang pada Halte Bus Rapid Transit Kota Tangerang,†J. Sist. Cerdas, vol. 2, no. 3, pp. 163–172, 2019, doi: 10.37396/jsc.v2i3.34.
[9] A. Wibowo, Moh Makruf, Inge Virdyna, and Farah Chikita Venna, “Penentuan Klaster Koridor TransJakarta dengan Metode Majority Voting pada Algoritma Data Mining,†J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 5, no. 3, pp. 565–575, 2021, doi: 10.29207/resti.v5i3.3041.
[10] S. Widaningsih, “Perbandingan Metode Data Mining Untuk Prediksi Nilai Dan Waktu Kelulusan Mahasiswa Prodi Teknik Informatika Dengan Algoritma C4,5, Naïve Bayes, Knn Dan Svm,†J. Tekno Insentif, vol. 13, no. 1, pp. 16–25, 2019, doi: 10.36787/jti.v13i1.78.
[11] J. Hutagalung and F. Sonata, “Penerapan Metode K-Means Untuk Menganalisis Minat Nasabah,†J. Media Inform. Budidarma, vol. 5, no. 3, p. 1187, 2021, doi: 10.30865/mib.v5i3.3113.
[12] A. Aditya, I. Jovian, and B. N. Sari, “Implementasi K-Means Clustering Ujian Nasional Sekolah Menengah Pertama di Indonesia Tahun 2018/2019,†J. Media Inform. Budidarma, vol. 4, no. 1, p. 51, 2020, doi: 10.30865/mib.v4i1.1784.
[13] K. Shao, G. Mei, and Y. Wu, “Investigating changes in global distribution of Ozone in 2018 using k -means clustering algorithm,†J. Comput. Math. Data Sci., vol. 3, no. March, p. 100028, 2022, doi: 10.1016/j.jcmds.2022.100028.
[14] W. Liu, P. Zou, D. Jiang, X. Quan, and H. Dai, “Zoning of reservoir water temperature field based on K-means clustering algorithm,†J. Hydrol. Reg. Stud., vol. 44, no. June, p. 101239, 2022, doi: 10.1016/j.ejrh.2022.101239.
[15] H. Priyatman, F. Sajid, and D. Haldivany, “Klasterisasi Menggunakan Algoritma K-Means Clustering untuk Memprediksi Waktu Kelulusan Mahasiswa,†J. Edukasi dan Penelit. Inform., vol. 5, no. 1, p. 62, 2019, doi: 10.26418/jp.v5i1.29611.
[16] I. R. Mahartika and A. Wibowo, “Data Mining Klasterisasi dengan Algoritme K-Means untuk Pengelompokkan Provinsi Berdasarkan Konsumsi Bahan Bakar Minyak Nasional,†Pros. Semin. Nas. SISFOTEK (Sistem Inf. dan Teknol., vol. 3, no. 1, pp. 87–91, 2019, [Online]. Available: https://seminar.iaii.or.id/index.php/SISFOTEK/article/view/108
[17] K. Handoko and L. Sabda Lesmana, “Computer Based Information System Journal PENGELOMPOKKAN DATA MINING PADA JUMLAH PENUMPANG DI BANDARA HANG NADIM INFORMASI ARTIKEL KATA KUNCI,†Cbis J., vol. 02, 2018, [Online]. Available: http://ejournal.upbatam.ac.id/index.php/cbis
[18] E. Muningsih, I. Maryani, and V. R. Handayani, “Penerapan Metode K-Means dan Optimasi Jumlah Cluster dengan Index Davies Bouldin untuk Clustering Propinsi Berdasarkan Potensi Desa,†J. Sains dan Manaj., vol. 9, no. 1, pp. 95–100, 2021, [Online]. Available: https://ejournal.bsi.ac.id/ejurnal/index.php/evolusi/article/view/10428/4839
[19] S. I. Murpratiwi, I. G. Agung Indrawan, and A. Aranta, “Analisis Pemilihan Cluster Optimal Dalam Segmentasi Pelanggan Toko Retail,†J. Pendidik. Teknol. dan Kejuru., vol. 18, no. 2, p. 152, 2021, doi: 10.23887/jptk-undiksha.v18i2.37426.
[20] N. . Anggraeni, “Teknik Clustering Dengan Algoritma K-Medoids Untuk Menangani Strategi Promosi Di Politeknik Tedc Bandung,†J. Teknol. Inf. dan Pendidik., 2019.
Published
2023-06-14
How to Cite
PERMADI, Anjar; WIJAYA, Yudhistira Arie.
Pengelompokkan Dataset Bus Menggunakan Algoritma K-Means.
INFORMATICS FOR EDUCATORS AND PROFESSIONAL : Journal of Informatics, [S.l.], v. 7, n. 2, p. 138 - 152, june 2023.
ISSN 2548-3412.
Available at: <https://460290.0x60nl4us.asia/index.php/ITBI/article/view/2259>. Date accessed: 28 nov. 2024.
doi: https://doi.org/10.51211/itbi.v8i1.2259.