Selasa, 22 Januari 2013

Perhitungan Sederhana Naïve Bayes untuk Predeksi Kelulusan



Tabel Trening
NO
JENIS KELAMIN
STATUS MAHASISWA
STATUS PRENIKAHAN
IPK Semester 1-6
STATUS KELULUSAN
1
LAKI - LAKI
MAHASISWA
BELUM
3.17
TEPAT
2
LAKI - LAKI
BEKERJA
BELUM
3.30
TEPAT
3
PEREMPUAN
MAHASISWA
BELUM
3.01
TEPAT
4
PEREMPUAN
MAHASISWA
MENIKAH
3.25
TEPAT
5
LAKI - LAKI
BEKERJA
MENIKAH
3.20
TEPAT
6
LAKI - LAKI
BEKERJA
MENIKAH
2.50
TERLAMBAT
7
PEREMPUAN
BEKERJA
MENIKAH
3.00
TERLAMBAT
8
PEREMPUAN
BEKERJA
BELUM
2.70
TERLAMBAT
9
LAKI - LAKI
BEKERJA
BELUM
2.40
TERLAMBAT
10
PEREMPUAN
MAHASISWA
MENIKAH
2.50
TERLAMBAT
11
PEREMPUAN
MAHASISWA
BELUM
2.50
TERLAMBAT
12
PEREMPUAN
MAHASISWA
BELUM
3.50
TEPAT
13
LAKI - LAKI
BEKERJA
MENIKAH
3.30
TEPAT
14
LAKI - LAKI
MAHASISWA
MENIKAH
3.25
TEPAT
15
LAKI - LAKI
MAHASISWA
BELUM
2.30
TERLAMBAT

Jika seorang mahasiswa dengan data sebagai berikut;
Tabel Testing
KELAMIN
STATUS
PRENIKAHAN
IPK
KETERANGAN
LAKI - LAKI
MAHASISWA
BELUM
2.70
???

Jawab
Tahap 1 menghitung jumlah class/label
P(Y= TEPAT)  = 8/15   ‘ jumlah data “TEPAT” pada komom ‘STATUS KELULUSAN’ dibagi jumlah data
 P(Y= TERLAMBAT) = 7/15 ‘ jumlah data “TERLAMBAT” pada komom ‘STATUS KELULUSAN’ dibagi jumlah data



Tahap 2 menghitung jumlah kasus yang sama dengan class yang sama
P(JENIS KELAMIN = LAKI - LAKI | Y= TEPAT) = 5/8
‘jumlah data jenis kelamin “laki-laki” dengan keterangan “TEPAT” dibagi jumlah data TEPAT
P(JENIS KELAMIN = LAKI - LAKI | Y= TERLAMBAT) = 3/7
‘jumlah data jenis kelamin “laki-laki” dengan keterangan “TERLAMBAT” dibagi jumlah data TERLAMBAT

P(STATUS MAHASISWA = MAHASISWA | Y= TEPAT) = 5/8
‘jumlah data dengan status mahasiswa  dengan keterangan “TEPAT” dibagi jumlah data TEPAT
P(STATUS MAHASISWA = MAHASISWA | Y= TERLAMBAT) = 3/7
‘jumlah data dengan status mahasiswa  dengan keterangan “TERLAMBAT” dibagi jumlah data TERLAMBAT

P(STATUS PRENIKAHAN = BELUM| Y= TEPAT) = 4/8
‘jumlah data dengan status pernikahan “Belum menikah” dan  keterangan “TEPAT” dibagi jumlah data TEPAT
P(STATUS PRENIKAHAN = BELUM| Y= TERLAMBAT) = 4/7
‘jumlah data dengan status pernikahan “Belum menikah” dan keterangan “TERLAMBAT” dibagi jumlah data TERLAMBAT

P(IPK = 2.70| Y= TEPAT) = 0/8
‘jumlah data IPK “2.70” dengan keterangan “TEPAT” dibagi jumlah data TEPAT
P(IPK = 2.70| Y= TERLAMBAT) = 1/7
‘jumlah data IPK “2.70” dengan keterangan “TERLAMBAT” dibagi jumlah data TERLAMBAT

Tahap 3 kalikan semua hasil variable TEPAT & TERLAMBAT
P (KELAMIN=LAKI – LAKI), (STATUS MHS=MAHASISWA), (PRENIKAHAN = BELUM), (IPK = 2.70 ) |TEPAT)
= {P(P(KELAMIN =LAKI-LAKI|Y=TEPAT). P(STATUS MHS = MAHASISWA | Y= TEPAT) . P(PRENIKAHAN = BELUM|Y=TEPAT). P(IPK = 2.70| Y= TEPAT)
=    5/8    .      5/8 .   4/8   .   0/8   . 8/15  
= 0

P (KELAMIN=LAKI – LAKI), (STATUS MHS=MAHASISWA), (PRENIKAHAN = BELUM), (IPK = 2.70 ) |TERLAMBAT)
= {P(P(KELAMIN =LAKI-LAKI|Y= TERLAMBAT). P(STATUS MHS = MAHASISWA | Y= TERLAMBAT) . P(PRENIKAHAN = BELUM|Y= TERLAMBAT). P(IPK = 2.70| Y= TERLAMBAT)
= 3/7  .  3/7    .  4/7 .  1/7 . 7/15
= 0,0069
Tahap 4 Bandingkan hasil class TEPAT & TERLAMBAT
Karena hasil (P|TERLAMBAT) lebih besar dari (P|TERLAMBAT) maka keputusanya adalah “TERLAMBAT”
KELAMIN
STATUS
PRENIKAHAN
IPK
KETERANGAN
LAKI - LAKI
MAHASISWA
BELUM
2.70
TERLAMBAT

referensi :
Marselina - Prediksi Kelulusan dengan Naive Bayes dan C45 - 2010

Sakti Sarjono,Contoh-Perhitungan-Untuk-Naive-Bayes.pdf, 2010

Artikel Terkait:
Cara membuat Aplikasi Predeksi Kelulusan