PENERAPAN DATA MINING DALAM ANALISIS KLASTERISASI PENYEBARAN PENYAKIT HIV MENGGUNAKAN ALGORITMA K-MEANS

Bekti Dinar Cahyani, Irma Amelia Putri, Prawido Utomo, Detin Sofia

Abstract


The Banten Health Office recorded cases of Human Immunodeficiency Virus (HIV) transmission reaching 2,100 people during the period from January to October 2024. The locations infected with HIV are spread across all districts/cities in Banten Province. However, the largest number is in the Greater Tangerang area which includes Tangerang City, Tangerang Regency and South Tangerang. The spread of HIV occurred in one of the Health Centers located in the Pasar Kemis area with an increasing number of cases in recent years. This study aims to carry out clustering by identifying the distribution of HIV cases in sub-districts with the highest and lowest levels of spread. This study applies data mining techniques, namely the Cross-Industry Standard Process for Data Mining (CRISP-DM) method with the K-Means Clustering algorithm that integrates the Elbow and Silhouette Coefficient methods by minimizing the SSE value. CRISP-DM includes 6 stages consisting of Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation, Deployment. The analysis results obtained from each clustering with scatter plot visualization produced 4 clusters divided into 2 clusters with the highest and lowest cluster sub-districts. The highest sub-district is included in cluster_3 which is occupied by Sukamantri Sub-district with 11 HIV cases. While the lowest sub-district is included in cluster_0 which is occupied by Pasar Kemis Sub-district with 6 HIV cases.

 

Dinas Kesehatan Banten mencatat adanya kasus penularan Human Immunodeficiency Virus (HIV) yang mencapai 2.100 orang selama periode Januari sampai dengan Oktober 2024. Adapun lokasi yang terinfeksi HIV tersebar di seluruh kabupaten/kota di Provinsi Banten. Namun jumlah terbanyak berada di daerah Tangerang Raya yang meliputi Kota Tangerang, Kabupaten Tangerang dan Tangerang Selatan. Penyebaran HIV terjadi pada salah satu Puskesmas yang terletak di daerah Pasar Kemis dengan jumlah kasus yang meningkat dalam beberapa tahun terakhir. Penelitian ini bertujuan untuk melakukan klasterisasi dengan mengidentifikasi persebaran kasus HIV pada kelurahan dengan tingkat penyebaran tertinggi dan terendah. Penelitian ini menerapkan teknik data mining yaitu metode Cross-Industry Standard Process for Data Mining (CRISP-DM) dengan algoritma K-Means Clustering yang mengintegrasikan metode Elbow dan Silhouette Coefficient dengan meminimalkan nilai SSE. CRISP-DM meliputi 6 tahap yang terdiri dari Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation, Deployment. Hasil analisa yang diperoleh dari setiap klasterisasi dengan visualisasi scatter plot menghasilkan 4 cluster yang terbagi ke dalam 2 cluster dengan kelurahan cluster tertinggi dan terendah. Kelurahan tertinggi termasuk dalam cluster_3 yang ditempati oleh Kelurahan Sukamantri dengan 11 kasus HIV. Sementara Kelurahan terendah termasuk dalam cluster_0 yang ditempati oleh Kelurahan Pasar Kemis dengan 6 kasus HIV.


Keywords


HIV; CRISP-DM; K-Means; Data Mining

References


Anggraeni, D. (2024a). Dinkes Berikan Layanan HIV Gratis di Seluruh Faskes Kota Tangerang. SEKRETARIAT DAERAH KOTA TANGERANG. https://setda.tangerangkota.go.id/berita/dinkes-berikan-layanan-hiv-gratis-di-seluruh-faskes-kota-tangerang#:~:text=Kepala Dinkes Kota Tangerang dr,yang dapat dimanfaatkan oleh masyarakat

Anggraeni, D. (2024b). Hari AIDS Sedunia, Berikut Layanan Kesehatan untuk ODHA di Kota Tangerang. Pemerintah Kota Tangerang. https://www.tangerangkota.go.id/berita/detail/47831/hari-aids-sedunia-berikut-layanan-kesehatan-untuk-odha-di-kota-tangerang%0A%0ADownload aplikasi Android TangerangLive : https://play.google.com/store/apps/details?id=id.go.tangerangkota.tangeranglive&hl=

Kemenkes RI. (2022). Perkembangan Hiv Aids Dan Penyakit Infeksi Menular Seksual (Pims) Triwulan IV Tahun 2022. Kemenkes RI. https://siha.kemkes.go.id/portal/files_upload/Laporan_TW_3_2022.pdf

Kodratul Munawar, K., & Irma Purnamasari, A. (2023). Implementasi Algoritma K-Means Clustering Pada Klasterisasi Kasus Hiv Di Jawa Barat. JATI (Jurnal Mahasiswa Teknik Informatika), 7(2), 1092–1099. https://doi.org/10.36040/jati.v7i2.6372

Nur Amalia, I., Umaidah, Y., & Mayasari, R. (2024). Penerapan Data Mining Untuk Klasterisasi Daerah Rawan Penyakit Menular Di Kabupaten Karawang Dengan Menggunakan Algoritma K-Means. JATI (Jurnal Mahasiswa Teknik Informatika), 8(4), 5582–5591. https://doi.org/10.36040/jati.v8i4.9953

Orisa, M., & Ardita, M. (2020). Web Usage Mining Menggunakan Algoritma Clastering K-Mean. Jurnal Teknologi Informasi dan Terapan, 8(1), 60–64. https://doi.org/10.25047/jtit.v8i1.179

Prabiantissa, C. N., & Yuliastuti, G. E. (2021). Prediksi Pergerakan Ikan Di Pesisir Pulau Madura Menggunakan Metode Gaussian Mixture Model Dan K-Means Clustering. Jurnal Teknologi Informasi dan Terapan, 8(2), 121–128. https://doi.org/10.25047/jtit.v8i2.244

Putra, A. Z., Pinem, R. W., Silalahi, S., Gulo, F., & Liukhoto, J. A. A. (2022). Classification of Covid-19 Patient Spread Rate By Age and Region With K-Means Algorithm. SinkrOn, 7(3), 1085–1989. https://doi.org/10.33395/sinkron.v7i3.11603

Rachman, F. H., Naim, I. J., & Aminah, F. F. N. (2023). Data Mining. Literasi Nusantara. https://ipusnas2.perpusnas.go.id/book/b8ba1b73-665c-4a57-a56b-19cc71556a1c

Rahmawati, T., Wilandari, Y., & Kartikasari, P. (2024). Analisis perbandingan silhouette coefficient dan metode elbow pada pengelompokkan provinsi di indonesia berdasarkan indikator ipm dengan k-medoids 1,2,3. 13, 13–24. https://doi.org/10.14710/j.gauss.13.1.13-24

Rangkuti, Y. M., Nasution, S. A. P., Karo, I. M. K., & Fadhillah, W. N. (2023). VISUALISASI PENYEBARAN COVID-19 DI KABUPATEN DELI SERDANG DENGAN SIG DAN K-MEANS. Jejak Pustaka. https://ipusnas2.perpusnas.go.id/book/a97254ca-7361-4b8c-a61f-24376739fb9c

Refialy, L. P., Maitimu, H., & Pesulima, M. S. (2021). Perbaikan Kinerja Clustering K-Means pada Data Ekonomi Nelayan dengan Perhitungan Sum of Square Error (SSE) dan Optimasi nilai K cluster. Techno.Com, 20(2), 321–329. https://doi.org/10.33633/tc.v20i2.4572

Rohmah Zaidah, A., Indira Septiarani, C., Sholikhatun Nisa, M., Yusuf, A., & Wahyudi, N. (2021). Komparasi Algoritma K-Means, K-Medoid, Agglomeartive Clustering Terhadap Genre Spotify. Jurnal Ilmiah Ilmu Komputer, 7(1), 49–54. https://doi.org/10.35329/jiik.v7i1.186

Setiawan, W. (2021). DATA MINING: TEORI DAN APLIKASI. Rumah Cermelang Indonesia. https://ipusnas2.perpusnas.go.id/book/47802019-82e9-4543-8f88-b2ff614fb43b

Swasika, R., Mukodimah, S., Susanto, F., Muslihudin, M., & Ipnuwati, S. (2023). IMPLEMENTASI DATA MINING (Clastering, Association, Prediction, Estimation, Classification). Adab. https://ipusnas2.perpusnas.go.id/book/c6fb2403-1432-41cc-b3f0-8ade254cd10b

Vania, P., & Nurina Sari, B. (2023). Perbandingan Metode Elbow dan Silhouette untuk Penentuan Jumlah Klaster yang Optimal pada Clustering Produksi Padi menggunakan Algoritma K-Means. Jurnal Ilmiah Wahana Pendidikan, 9(21), 547–558. https://doi.org/10.5281/zenodo.10081332

Wala, J., Herman, & Umar, R. (2024). Implementasi K-Means Clustering pada Pengelompokan Pasien Penyakit Jantung. JISKA (Jurnal Informatika Sunan Kalijaga), 9(3), 205–216.

WHO. (2024). HIV dan AIDS. World Health Organization. https://www.who.int/news-room/fact-sheets/detail/hiv-aids

Zuliansyah, R. A. (2024). 189 Ibu Rumah Tangga di Banten Terpapar HIV, Paling Banyak di Tangerang Raya. Tangerang Media. https://www.tangerangnews.com/banten/read/51816/189-Ibu-Rumah-Tangga-di-Banten-Terpapar-HIV-Paling-Banyak-di-Tangerang-Raya




DOI: https://doi.org/10.17509/e.v24i2.84914

Refbacks

  • There are currently no refbacks.


Copyright (c) 2025 EDUTECH

Lisensi Creative Commons
Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi-BerbagiSerupa 4.0 Internasional.
Copyright © 2018 Edutech