Clustering Dataset Numerik Multivariat menggunakan Algoritma K-Means dengan Evaluasi Silhouette dan Davies–Bouldin Index

Mei Yanda Maharani Messakh; Jusuf Ezra Rudolf Fransz; David Hermanus; Adriana Fanggidae; Yulianto Triwahyuadi Polly

doi:10.55606/jutiti.v6i1.6748

Authors

Mei Yanda Maharani Messakh Universitas Nusa Cendana
Jusuf Ezra Rudolf Fransz Universitas Nusa Cendana
David Hermanus Universitas Nusa Cendana
Adriana Fanggidae Universitas Nusa Cendana
Yulianto Triwahyuadi Polly Universitas Nusa Cendana

DOI:

https://doi.org/10.55606/jutiti.v6i1.6748

Keywords:

Clustering, Data Analysis, Data Grouping, Data Mining, K-Means

Abstract

Clustering is a data mining technique used to group data based on similarity. This study applies the K-Means clustering algorithm to analyze multivariate numerical data from the Standard Minimum Service (SPM) dataset of Nusa Tenggara Timur Province. The dataset is structured and consists of six numerical attributes representing basic service sectors, namely education, health, public works, housing and settlement, public order and community protection, and social services. The research stages include data cleaning, data standardization using the Z-score method, determination of the optimal number of clusters, and clustering using the K-Means algorithm. The quality of the clustering results is evaluated using the Silhouette Score and Davies–Bouldin Index. The results show that the optimal number of clusters is three (k = 3), with a Silhouette Score of 0.327 and a Davies–Bouldin Index of 0.872. The clustering process produces three data groups with different characteristics based on the average values of each sector. These results indicate that the K-Means algorithm can be used to group SPM data into meaningful clusters based on similarity patterns.

Downloads

Download data is not yet available.

References

Abid, D., Adikusuma, R. W., AL Fikri, A. M., & Hapsari, R. K. (2023). Penerapan Metode K-Means Clustering Untuk Analisa Penjualan Komoditas Toko Tani Indonesia. KERNEL: Jurnal Riset Inovasi Bidang Informatika Dan Pendidikan Informatika, 3(2), 25–30. https://doi.org/10.31284/j.kernel.2022.v3i2.4076

Al Rivan, M. E., & Sonaru, R. A. (2022). Perbandingan Metode K-Means dan GA K-Means untuk Clustering Dataset Heart Disease Patients. JATISI (Jurnal Teknik Informatika Dan Sistem Informasi), 9(3), 2585–2597. https://doi.org/10.35957/jatisi.v9i3.2799

Darmawan, S. A. D., & Karmilasari. (2024). Penerapan Metode & K-Means Clustering dan Simple Moving Average untuk Memprediksi Jenis Penyakit di Provinsi Jawa Timur. Jurnal Teknologi Informasi Dan Ilmu Komputer, 11(4), 877–886. https://doi.org/10.25126/jtiik.1148703

Dewi, F. P., Aryni, P. S., & Umaidah, Y. (2022). Implementasi Algoritma K-Means Clustering Seleksi Siswa Berprestasi Berdasarkan Keaktifan dalam Proses Pembelajaran. JISKA (Jurnal Informatika Sunan Kalijaga), 7(2), 111–121. https://doi.org/10.14421/jiska.2022.7.2.111-121

Fadlil, A., Riadi, I., & Mulyana, Y. (2022). Penerapan Algoritma K-Means pada Pengelompokan Data Pendaftar Bantuan Biaya Pendidikan. Jurnal Teknologi Informatika Dan Komputer, 8(2), 352–366. https://doi.org/10.37012/jtik.v8i2.1261

Galela, M. R. (2023, November 21). Koefisien Silhouette untuk Menentukan Jumlah Klaster Ideal. Kemenkeu Learning Center.

Handayani, F. (2022). Aplikasi Aplikasi Data Mining Menggunakan Algoritma K-Means Clustering untuk Mengelompokan Mahasiswa Berdasarkan Gaya Belajar. Jurnal Teknologi Dan Informasi, 12(1), 46–63. https://doi.org/10.34010/jati.v12i1.6733

Hutagalung, M. I., & Sriani, S. (2024). Pengelompokan Data Penyakit THT Menggunakan Algoritma K-Means Clustering. MALCOM: Indonesian Journal of Machine Learning and Computer Science, 4(4), 1568–1577. https://doi.org/10.57152/malcom.v4i4.1692

Isni Rinjani, Saeful Anwar, & Ruli Herdiana. (2023). PENGELOMPOKAN DAERAH BENCANA ALAM MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING. Jurnal Ilmiah Sistem Informasi Dan Ilmu Komputer, 3(1), 35–51. https://doi.org/10.55606/juisik.v3i1.417

Margaretha, A. P., Ulinnuha, N., & Intan, P. K. (2025). Clustering Data Kecelakaan Lalu Lintas melalui Algoritma K-Means dengan Seleksi Fitur Chi-Square. INTEGER: Journal of Information Technology, 10(2). https://doi.org/10.31284/j.integer.0.v10i2.7529

Murdiaty, M., Angela, A., & Sylvia, C. (2020). Pengelompokkan Data Bencana Alam Berdasarkan Wilayah, Waktu, Jumlah Korban dan Kerusakan Fasilitas Dengan Algoritma K-Means. JURNAL MEDIA INFORMATIKA BUDIDARMA, 4(3), 744. https://doi.org/10.30865/mib.v4i3.2213

Prasetiyo, D., Lestari, W., & Atima, V. (2024). PENERAPAN CLUSTERING DENGAN K-MEANS UNTUK PEMILIHAN MENU FAVORIT DI TETRA COFFEESHOP. JATISI (Jurnal Teknik Informatika Dan Sistem Informasi.

Ramadani, M. S., & Fatah, Z. (2024). ANALISIS PENGELOMPOKAN DATA NILAI SISWA UNTUK MENENTUKAN SISWA BERPRESTASI MENGGUNAKAN METODE CLUSTERING K-MEANS. JISSI (Jurnal RIset Sistem Informasi), 103–110.

Ramdani, R., Suarna, N., Ali, I., & Efendi, D. I. (2025). PENERAPAN ALGORITMA K-MEANS DALAM ANALISIS DATA KEPENDUDUKAN UNTUK OPTIMALISASI PENGELOMPOKAN DI DESA PASAWAHAN. Jurnal Informatika Dan Teknik Elektro Terapan, 13(1). https://doi.org/10.23960/jitet.v13i1.5639

Saputra, E. A., & Nataliani, Y. (2021). Analisis Pengelompokan Data Nilai Siswa untuk Menentukan Siswa Berprestasi Menggunakan Metode Clustering K-Means. Journal of Information Systems and Informatics, 3(3), 424–439. https://doi.org/10.51519/journalisi.v3i3.164

Sembiring, E. M. (2022). Penerapan K-Means Clustering Untuk Pengelompokan Penyebaran Demam Berdarah Dengue (DBD) Di Kabupaten Deli Serdang. TIN: Terapan Informatika Nusantara, 2(11), 673–677. https://doi.org/10.47065/tin.v2i11.1503

Sholeh, M., & Aeni, K. (2023). Perbandingan Evaluasi Metode Davies Bouldin, Elbow dan Silhouette pada Model Clustering dengan Menggunakan Algoritma K-Means. STRING (Satuan Tulisan Riset Dan Inovasi Teknologi), 8(1), 56. https://doi.org/10.30998/string.v8i1.16388

Siahaan, M. (2022). Data Mining Strategi Pembangunan Infrastruktur Menggunakan Algoritma K-Means. Jurnal Sisfokom (Sistem Informasi Dan Komputer), 11(3), 316–324. https://doi.org/10.32736/sisfokom.v11i3.1453

Simanjuntak, H. T. A., Silaban, P. E. P., Manurung, J. K. S., & Sormin, V. H. (2023). Klasterisasi Berita Bahasa Indonesia Dengan Menggunakan K-Means Dan Word Embedding. Jurnal Teknologi Informasi Dan Ilmu Komputer, 10(3), 641–652. https://doi.org/10.25126/jtiik.2023106468

Zebua, J. A. G. (2025, November 28). ANALISIS MULTIVARIAT MENGGUNAKAN K-MEANS UNTUK MENGIDENTIFIKASI POLA PENGELOMPOKAN BIJI GANDUM. RPubs by RStudio.

Clustering Dataset Numerik Multivariat menggunakan Algoritma K-Means dengan Evaluasi Silhouette dan Davies–Bouldin Index

Authors

DOI:

Keywords:

Abstract

Downloads

References

Downloads

Published

How to Cite

Issue

Section

License

Similar Articles

Menu