Selasa, 22 Januari 2013

Perhitungan Sederhana Naïve Bayes untuk Predeksi Kelulusan



Tabel Trening
NO
JENIS KELAMIN
STATUS MAHASISWA
STATUS PRENIKAHAN
IPK Semester 1-6
STATUS KELULUSAN
1
LAKI - LAKI
MAHASISWA
BELUM
3.17
TEPAT
2
LAKI - LAKI
BEKERJA
BELUM
3.30
TEPAT
3
PEREMPUAN
MAHASISWA
BELUM
3.01
TEPAT
4
PEREMPUAN
MAHASISWA
MENIKAH
3.25
TEPAT
5
LAKI - LAKI
BEKERJA
MENIKAH
3.20
TEPAT
6
LAKI - LAKI
BEKERJA
MENIKAH
2.50
TERLAMBAT
7
PEREMPUAN
BEKERJA
MENIKAH
3.00
TERLAMBAT
8
PEREMPUAN
BEKERJA
BELUM
2.70
TERLAMBAT
9
LAKI - LAKI
BEKERJA
BELUM
2.40
TERLAMBAT
10
PEREMPUAN
MAHASISWA
MENIKAH
2.50
TERLAMBAT
11
PEREMPUAN
MAHASISWA
BELUM
2.50
TERLAMBAT
12
PEREMPUAN
MAHASISWA
BELUM
3.50
TEPAT
13
LAKI - LAKI
BEKERJA
MENIKAH
3.30
TEPAT
14
LAKI - LAKI
MAHASISWA
MENIKAH
3.25
TEPAT
15
LAKI - LAKI
MAHASISWA
BELUM
2.30
TERLAMBAT

Jika seorang mahasiswa dengan data sebagai berikut;
Tabel Testing
KELAMIN
STATUS
PRENIKAHAN
IPK
KETERANGAN
LAKI - LAKI
MAHASISWA
BELUM
2.70
???

Jawab
Tahap 1 menghitung jumlah class/label
P(Y= TEPAT)  = 8/15   ‘ jumlah data “TEPAT” pada komom ‘STATUS KELULUSAN’ dibagi jumlah data
 P(Y= TERLAMBAT) = 7/15 ‘ jumlah data “TERLAMBAT” pada komom ‘STATUS KELULUSAN’ dibagi jumlah data



Tahap 2 menghitung jumlah kasus yang sama dengan class yang sama
P(JENIS KELAMIN = LAKI - LAKI | Y= TEPAT) = 5/8
‘jumlah data jenis kelamin “laki-laki” dengan keterangan “TEPAT” dibagi jumlah data TEPAT
P(JENIS KELAMIN = LAKI - LAKI | Y= TERLAMBAT) = 3/7
‘jumlah data jenis kelamin “laki-laki” dengan keterangan “TERLAMBAT” dibagi jumlah data TERLAMBAT

P(STATUS MAHASISWA = MAHASISWA | Y= TEPAT) = 5/8
‘jumlah data dengan status mahasiswa  dengan keterangan “TEPAT” dibagi jumlah data TEPAT
P(STATUS MAHASISWA = MAHASISWA | Y= TERLAMBAT) = 3/7
‘jumlah data dengan status mahasiswa  dengan keterangan “TERLAMBAT” dibagi jumlah data TERLAMBAT

P(STATUS PRENIKAHAN = BELUM| Y= TEPAT) = 4/8
‘jumlah data dengan status pernikahan “Belum menikah” dan  keterangan “TEPAT” dibagi jumlah data TEPAT
P(STATUS PRENIKAHAN = BELUM| Y= TERLAMBAT) = 4/7
‘jumlah data dengan status pernikahan “Belum menikah” dan keterangan “TERLAMBAT” dibagi jumlah data TERLAMBAT

P(IPK = 2.70| Y= TEPAT) = 0/8
‘jumlah data IPK “2.70” dengan keterangan “TEPAT” dibagi jumlah data TEPAT
P(IPK = 2.70| Y= TERLAMBAT) = 1/7
‘jumlah data IPK “2.70” dengan keterangan “TERLAMBAT” dibagi jumlah data TERLAMBAT

Tahap 3 kalikan semua hasil variable TEPAT & TERLAMBAT
P (KELAMIN=LAKI – LAKI), (STATUS MHS=MAHASISWA), (PRENIKAHAN = BELUM), (IPK = 2.70 ) |TEPAT)
= {P(P(KELAMIN =LAKI-LAKI|Y=TEPAT). P(STATUS MHS = MAHASISWA | Y= TEPAT) . P(PRENIKAHAN = BELUM|Y=TEPAT). P(IPK = 2.70| Y= TEPAT)
=    5/8    .      5/8 .   4/8   .   0/8   . 8/15  
= 0

P (KELAMIN=LAKI – LAKI), (STATUS MHS=MAHASISWA), (PRENIKAHAN = BELUM), (IPK = 2.70 ) |TERLAMBAT)
= {P(P(KELAMIN =LAKI-LAKI|Y= TERLAMBAT). P(STATUS MHS = MAHASISWA | Y= TERLAMBAT) . P(PRENIKAHAN = BELUM|Y= TERLAMBAT). P(IPK = 2.70| Y= TERLAMBAT)
= 3/7  .  3/7    .  4/7 .  1/7 . 7/15
= 0,0069
Tahap 4 Bandingkan hasil class TEPAT & TERLAMBAT
Karena hasil (P|TERLAMBAT) lebih besar dari (P|TERLAMBAT) maka keputusanya adalah “TERLAMBAT”
KELAMIN
STATUS
PRENIKAHAN
IPK
KETERANGAN
LAKI - LAKI
MAHASISWA
BELUM
2.70
TERLAMBAT

referensi :
Marselina - Prediksi Kelulusan dengan Naive Bayes dan C45 - 2010

Sakti Sarjono,Contoh-Perhitungan-Untuk-Naive-Bayes.pdf, 2010

Artikel Terkait:
Cara membuat Aplikasi Predeksi Kelulusan

29 komentar:

  1. thanks mas brow..,,, sangat membantu

    mampir jga ya di Situssejati.blogspot.com

    BalasHapus
  2. cara membagi 2.70 dengan data itu gimana ya caranya

    BalasHapus
  3. Komentar ini telah dihapus oleh pengarang.

    BalasHapus
  4. bang admin, pke tools apa ya nerpain ke programnya?

    BalasHapus
    Balasan
    1. bantu jawab, bisa pake aplikasi WEKA yg lebih praktis

      Hapus
    2. http://edukasi-informatika.blogspot.co.id/2013/01/imlementasi-naive-bayes-for-prediction.html

      Hapus
  5. nentuin trening nya gimana gan ?

    BalasHapus
    Balasan
    1. bantu jawab, untuk menentukan trening itu sesuai rule yang telah di tentuak dari sananya/ yg kita buat sendiri

      Hapus
    2. Misalkan saya punya data Trening tanpa "Kemungkinan Keputusan" seperti pada contoh adalah "STATUS KELULUSAN".

      Dapatkan metode NBC digunakan untuk mengolah data tersebut, atau mungkin ada solusi lain dengan mengisi data "Kemungkinan Keputusan" dengan menerapkan metode tertentu?

      Trima Kasih

      Hapus
  6. Alhamduliilah terimakasih sangat membantu dalam belajar :) tetapi ada salah ketik di bagian kesimpulan yaitu seharusya
    "Tahap 4 Bandingkan hasil class TEPAT & TERLAMBAT
    Karena hasil (P|TERLAMBAT) lebih besar dari (P|TEPAT) maka keputusanya adalah “TERLAMBAT” "

    BalasHapus
  7. Komentar ini telah dihapus oleh pengarang.

    BalasHapus
  8. mohon maaf, di naive bayes perhitungan hanya cukup sampai sini saja? tidak perlu menghitung jenis kelamin yg perempuannya kah ? apa di tahap menghitung jumlah kasus kita hanya perlu memilih salah satu saja seperti jkel yg ada laki" dan perempuan, kita hanya memilih laki" saja, apa contoh naive bayes ini sudah benar" selesai, atau masih ada yg harus di hitung yg lainnya juga, seperti jekel perempuannya? terimakasih

    BalasHapus
    Balasan
    1. bantu jawab : karena pada soalnya diketahui bahwa ditambahkan 1 data baru dengan data jenis kelamin laki-laki, status mahasiswa, pernikahan belum, ipk 2.70.

      Karena data yang ditambahkan berjenis kelamin laki-laki, maka tidak perlu menghitung kemungkinan jenis kelamin perempuan. (Tergantung data yang ditambahkan sih).
      Sebenarnya jika ingin lanjut untuk menghindari kemungkinan atau probabilitas yang menghasilkan nilai 0, kita dapat menggunakan Laplacian Correction.

      CMIIW~



      Hapus
  9. Admin kalaw misalnya studi kasus tentang penyakit, gimana cara implementasi dengan metode naive Bayesian

    BalasHapus
  10. Komentar ini telah dihapus oleh pengarang.

    BalasHapus
  11. bisa ditambahkan source code untuk matlabnya mungkin mas..

    BalasHapus
  12. #ask
    ada beberap jurnal yang pernah saya baca, disitu mengatakan bahwa naive bayes digunakan untuk memprediksi. mohon pencerahannya seperti apa perhitungannya? trimakasih

    BalasHapus
  13. https://www.4shared.com/rar/SflbJoyIgm/Predeksi_Kelulusan_dgn_Naive_B.html

    BalasHapus
  14. kebetulan ipk dari data testing di atas adalah 2.70, jadi jika dilihat dari data sebelumnya sudah ada data satu mahasiswa dengan ipk 2.70 yang berstatus terlambat, namun tidak ada data mahasiswa dengan ipk tersebut yang berstatus tepat. jika data tidak tersedia, ini berarti salah satu nilai variable akan menjadi 0, dimana selanjutnya nilai dari variable tersebut akan dikalikan dengan variable lainnya sehingga menghasilkan nilai 0. pertanyaan saya bagaimana jika menggunakan data testing yang belum tersedia datanya? misal saja jika ipk pada data testing yang digunakan 2.00, maka keputusannya apa?

    BalasHapus
  15. Kalau studi kasus nya tentang klasifikasi nilai gimana ya?

    BalasHapus