Random Forest + SMOTE · Proyek Riset 2025

Sistem Prediksi
Risiko Diabetes

Alat klinis berbasis kecerdasan buatan yang dibangun dari penelitian machine learning. Masukkan nilai klinis kamu di bawah untuk menilai risiko diabetes menggunakan model Random Forest yang telah dilatih.

81.50%
Accuracy
86.00%
Recall
82.30%
F1-Score
768
Data Pelatihan
Nilai Input Klinis
Glucose mg/dL
120
Konsentrasi glukosa plasma (2 jam)
BMI kg/m²
30.0
Indeks massa tubuh
Age years
35
Usia pasien (min. 21 tahun)
Insulin µU/mL
79
Kadar insulin serum (2 jam)
Tekanan Darah mm Hg
72
Tekanan darah diastolik
Kehamilan count
3
Jumlah kehamilan
Ketebalan Kulit mm
29
Ketebalan lipatan kulit trisep
Pedigree Function score
0.47
Skor fungsi riwayat diabetes keluarga
?
Probabilitas diabetes
Risiko diabetes
Non-diabetes
Penting: Prediksi ini didasarkan pada model penelitian yang dilatih menggunakan Pima Indians Diabetes Dataset. Hanya untuk tujuan edukasi dan penelitian — bukan pengganti diagnosis medis profesional. Konsultasikan dengan tenaga kesehatan untuk keputusan klinis.
Kepentingan Fitur
1Glucose
0.291
2BMI
0.172
3Age
0.126
4Insulin
0.107
5Fungsi Riwayat
0.099
6Tekanan Darah
0.075
7Kehamilan
0.069
8Ketebalan Kulit
0.061

Performa Model

Random Forest dilatih pada Pima Indians Diabetes Dataset dengan SMOTE untuk penyeimbangan kelas.

Metrik Evaluasi — Data Uji (Pembagian 80/20)
81.50%
Accuracy
78.90%
Precision
86.00%
Recall
82.30%
F1-Score

Tentang Penelitian Ini

Dibangun sebagai bagian dari proyek UAS mata kuliah Riset Teknologi Informasi.

🎯

Tujuan Penelitian

Membangun model prediksi diabetes menggunakan Random Forest yang dikombinasikan dengan SMOTE untuk mengatasi ketidakseimbangan kelas dan meningkatkan sensitivitas deteksi dini.

📊

Dataset

Pima Indians Diabetes Dataset dari UCI Repository — 768 rekam medis, 8 fitur klinis, label biner (diabetes / non-diabetes).

🔬

Metodologi

Pipeline terintegrasi: imputasi median → normalisasi StandardScaler → penyeimbangan SMOTE → Random Forest (100 pohon, validasi 5-fold CV).