Penerapan Algoritma C4.5 untuk Prediksi Risiko Turnover (Pergantian Karyawan) Menggunakan Data Kinerja dan Kepuasan Kerja

Authors

  • Ginta Khairunisa Universitas Bina Sarana Informatika
  • Farah Fauziyyah Hasyim Universitas Bina Sarana Informatika
  • Andi Aprilia Sidiuzdah Universitas Bina Sarana Informatika
  • Heri Purnomo Universitas Bina Sarana Informatika
  • Adia Nanda Universitas Bina Sarana Informatika
  • Annida Purnamawati Universitas Bina Sarana Informatika

DOI:

https://doi.org/10.180997/jrsikom.v1i4.109

Abstract

Tingkat pergantian karyawan yang tinggi menyebabkan kerugian yang besar dari segi finansial dan operasional bagi perusahaan. Penelitian ini bertujuan untuk menciptakan model prediktif yang efisien dalam mengidentifikasi pegawai yang berisiko tinggi mengalami Turnover dengan memanfaatkan algoritma klasifikasi C4.5 yang berbasis pada pohon keputusan. Data yang digunakan berasal dari dataset publik HR-Employee-Attrition yang diambil dari platform Kaggle, yang berisi 1.470 entri serta 35 atribut, mencakup faktor demografis, kinerja, dan tingkat kepuasan. Proses pemodelan dilaksanakan dengan menggunakan perangkat lunak RapidMiner, yang mencakup langkah-langkah persiapan data dan validasi silang. Hasil dari pengujian model menunjukkan rata-rata akurasi sebesar 83,67%. Analisis kinerja kelas mengindikasikan adanya masalah ketidakseimbangan kelas; model memiliki Recall yang sangat baik untuk kelas “Tidak Resign” dengan persentase 95,78%. Namun sangat rendah untuk kelas “Resign” yaitu 20,68%. Model berbasis keputusan menunjukkan bahwa variabel umur merupakan atribut penyaring utama, diikuti oleh Pendapatan Bulanan dan Lama Sejak Promosi Terakhir. Kesimpulan dari studi ini adalah meskipun C4.5 memberikan akurasi yang tinggi secara keseluruhan, masih diperlukan penanganan atas ketidakseimbangan kelas untuk meningkatkan kemampuan dalam mengidentifikasi kejadian Turnover yang sebenarnya.

 

Kata kunci: C4.5, Prediksi Turnover, Penambangan Data, Pohon Keputusan, Manajemen SDM, RapidMiner

References

Pratama, A., Mujiyono, S., & Sanjaya, U. P. (2025). Analisis Klasifikasi Resign Karyawan dengan Random Forest. JURNAL UNITEK, 18(1), 156–166. https://doi.org/10.52072/unitek.v18i1.1415

Setiyadi, P., Prayogi, M. N., & Solichin, A. (2024). OPTIMALISASI PREDIKSI KEHILANGAN KARYAWAN MENGGUNAKAN TEKNIK RFE, SMOTE, DAN ADABOOST. JIPI (Jurnal Ilmiah Penelitian Dan Pembelajaran Informatika), 9(4), 2131–2145. https://doi.org/10.29100/jipi.v9i4.5642

Sulaiman Asyuti, Ahmad Aji Setyawan. (2022). DATA MINING DALAM PENGGUNAAN PRESENSI KARYAWAN DENGA CLUSTER MEANS. JURNAL ILMIAH SAINS TEKNOLOGI DAN INFORMASI, 1(1), 1–10. https://doi.org/10.59024/jiti.v1i1.6

Khomsi Pane, S. Y., Ramadhan, N. G., & Adhinata, F. D. (2022). Perancangan basis data menggunakan normalisasi tabel pada perusahaan dagang barokah abadi. Journal of Dinda : Data Science, Information Technology, and Data Analytics, 2(2), 90–96. https://doi.org/10.20895/dinda.v2i2.563

Aulia, B. W., Rizki, M., Prindiyana, P., & Surgana, S. (2023). Peran Krusial Jaringan Komputer dan Basis Data dalam Era Digital. JUSTINFO | Jurnal Sistem Informasi Dan Teknologi Informasi, 1(1), 9–20. https://doi.org/10.33197/justinfo.vol1.iss1.2023.1253

Yusuf Maulana, Riki Winanjaya, & Fitri Rizki. (2022). Penerapan Data Mining dengan Algoritma C.45 Dalam Memprediksi Penjualan Tempe. Bulletin of Computer Science Research, 2(2), 53–58. https://doi.org/10.47065/bulletincsr.v2i2.163

Nasrullah, A. H. (2021). IMPLEMENTASI ALGORITMA DECISION TREE UNTUK KLASIFIKASI PRODUK LARIS. JURNAL ILMIAH ILMU KOMPUTER, 7(2), 45–51. https://doi.org/10.35329/jiik.v7i2.203

Ramadhon, R. N., Ogi, A., Agung, A. P., Putra, R., Febrihartina, S. S., & Firdaus, U. (2024). Implementasi Algoritma Decision Tree untuk Klasifikasi Pelanggan Aktif atau Tidak Aktif pada Data Bank. Karimah Tauhid, 3(2), 1860–1874. https://doi.org/10.30997/karimahtauhid.v3i2.11952

Prayogi, A. (2022). TELAAH KONSEPTUAL PENDEKATAN KUANTITATIF DALAM SEJARAH. Kalpataru: Jurnal Sejarah Dan Pembelajaran Sejarah, 8(1). https://doi.org/10.31851/kalpataru.v8i2.8970

Sudarsono, B. G., Leo, M. I., Santoso, A., & Hendrawan, F. (2021). ANALISIS DATA MINING DATA NETFLIX MENGGUNAKAN APLIKASI RAPID MINER. JBASE - Journal of Business and Audit Information Systems, 4(1). https://doi.org/10.30813/jbase.v4i1.2729

Apriliah, W., Kurniawan, I., Baydhowi, M., & Haryati, T. (2021). Prediksi Kemungkinan Diabetes pada Tahap Awal Menggunakan Algoritma Klasifikasi Random Forest. SISTEMASI, 10(1), 163. https://doi.org/10.32520/stmsi.v10i1.1129

Maesaroh, I., Miladia, U. A., Fithriyan, M., & Nulhakim, L. (2025). TEKNIK PENGUMPULAN DATA DALAM PENELITIAN. Pendas : Jurnal Ilmiah Pendidikan Dasar, 10(02), 315–325. https://doi.org/10.23969/jp.v10i02.27110

Haq, M. Z., Octiva, C. S., Ayuliana, A., Nuryanto, U. W., & Suryadi, D. (2024). Algoritma Naïve Bayes untuk Mengidentifikasi Hoaks di Media Sosial. Jurnal Minfo Polgan, 13(1), 1079–1084. https://doi.org/10.33395/jmp.v13i1.13937

Harvida, C. W. D. A. (2020). FAKTOR YANG MEMPENGARUHI TURNOVER KARYAWAN DAN STRATEGI RETENSI SEBAGAI PENCEGAHAN TURNOVER KARYAWAN : SEBUAH TINJAUAN LITERATUR. JIANA ( Jurnal Ilmu Administrasi Negara ), 18(2), 13–23. https://doi.org/10.46730/jiana.v18i2.7926

Rizki, I. N., Prayoga, D., Puspita, M. L., & Huda, M. Q. (2024). IMPLEMENTASI EXPLORATORY DATA ANALYSIS UNTUK ANALISIS DAN VISUALISASI DATA PENDERITA STROKE KALIMANTAN SELATAN MENGGUNAKAN PLATFORM TABLEAU. Jurnal Informatika Dan Teknik Elektro Terapan, 12(1). https://doi.org/10.23960/jitet.v12i1.3856

Tuntun, R., Kusrini, K., & Kusnawi, K. (2022). Analisis Perbandingan Kinerja Algoritma Klasifikasi dengan Menggunakan Metode K-Fold Cross Validation. JURNAL MEDIA INFORMATIKA BUDIDARMA, 6(4), 2111. https://doi.org/10.30865/mib.v6i4.4681

Downloads

Published

20-12-2025