Perbandingan Metode Decision Tree, Naive Bayes, dan Induction Rule untuk Klasifikasi Penyakit Diabetes

  • Dwy Laila Safitry Program Studi Teknik Informatika, Fakultas Teknik Universitas Pancasila
  • Anisa Al Harani Program Studi Teknik Informatika, Fakultas Teknik Universitas Pancasila
  • Erin Divayaning Program Studi Teknik Informatika, Fakultas Teknik Universitas Pancasila
  • Faiqa Hadya Hanifa Program Studi Teknik Informatika, Fakultas Teknik Universitas Pancasila
  • Dheva Fauzia Chema Program Studi Teknik Informatika, Fakultas Teknik Universitas Pancasila
  • Iman Paryudi Program Studi Teknik Informatika, Fakultas Teknik Universitas Pancasila
Keywords: Data mining, Klasifikasi, Decision Tree, Naïve Bayes, Induction Rule, Diagnosa penyakit diabetes

Abstract

Teknik klasifikasi digunakan untuk memprediksi suatu nilai dari target variabel kategori. Metode klasifikasi menggunakan algoritma Decision Tree, Naive Bayes, dan Induction Rule. Decision Tree merupakan model prediksi menggunakan struktur pohon keputusan yang mengubah data dari proses pengambilan keputusan yang kompleks menjadi lebih sederhana sehingga memudahkan interpretasi informasi, pengambilan solusi, menemukan hubungan, dan identifikasi pola antara faktor-faktor yang mempengaruhi. Naive Bayes digunakan untuk mencari probabilitas dalam suatu class. Induction Rule bertujuan untuk mencari pola yang sering muncul diantara banyak transaksi dan akan menginduksi aturan yang kompleks. Metode-metode ini dapat digunakan sebagai acuan untuk mendiagnosa suatu jenis penyakit. Metode yang terbaik didapatkan dari penggunaan beberapa metode teknik klasifikasi. Penelitian ini mengimplementasikan konsep dan ilmu data mining tersebut dalam bidang kesehatan. Menggunakan dataset diagnosa penyakit diabetes yang diperoleh dari situs kaggle. Metode pemodelan dilakukan menggunakan Decision Tree, Naïve Bayes, dan Induction Rule melalui aplikasi Orange. Pemodelan diuji menggunakan Confusion Matrix dan Cross Validation untuk menunjukkan perbandingan dari ketiga metode klasifikasi yang diterapkan. Proses pengujian mengevaluasi kinerja pemodelan yang digunakan untuk memperoleh model dengan hasil akurasi yang maksimal. Penelitian ini membahas perbandingan akurasi dari penggunaan ketiga metode tersebut dan menghasilkan sepuluh aturan yang diketahui paling mempengaruhi hasil outcome diagnosa penyakit diabetes dari metode yang didapat paling baik dan efektif dalam proses klasifikasi.

Published
2023-05-01