Machine Learning: Naive Bayes

Machine Learning: Naive Bayes

MENGAPA DISEBUT NAIVE BAYES?

Dalam teorema bayes ada asumsi yang sangat penting, di mana asumsi ini haruslah dipenuhi. Apa itu? Asumsinya adalah semua variabelnya harus bersifat independen.

Independen yang dimaksud adalah variabel-variabel tersebut tidak saling mempengaruhi satu sama lain. Misal untuk ilustasi kita antara usia dan gaji tidak boleh ada hubungan sama sekali.

Ilustrasi data pengguna motor dan mobil dengan fitur usia dan gaji

Jika melihat hubungan di atas, maka kita sebenarnya bisa menebak bahwa semakin tinggi usia ternyata gajinya juga semakin naik. Oleh karena itu, sangat logis bahwa hubungan antara gaji dan usia tidaklah independen.

Mengapa disebut naive? Karena kita tidak perlu memegang teguh asumsi ini dalam aplikasi machine learning. Kita menggunakan formula dan konsepnya, namun asumsinya kita abaikan. Oleh karena itu disebut naive yang jika diartikan ke dalam bahasa indonesia adalah polos (tanpa dosa).

Sampai di sini paham ya alasan penamaannya. Walau kita abaikan asumsi independennya, ternyata akurasinya cukup tinggi.


BAGAIMANA JIKA ADA LEBIH DARI 2 KELOMPOK?

Dalam contoh kali ini kita hanya membahas kelompok motor dan mobil. Lalu bagaimana jika ada 3 kelompok, misal pengguna angkot? Mudah saja, kita cukup membandingkan 3 probabilitas, yaitu:

P(Angkot|X) vs P(Motor|X) vs P(Mobil|X)

Setelah itu kita pilih yang nilai probabilitasnya paling besar. Dengan demikian ia masuk ke kelompok dengan nilai p tertinggi.

Mudah bukan?

Selanjutnya kita akan coba menyelesaikan permasalahan nyata dengan bahasa Python dan R.

Untuk melanjutkan membaca, silakan klik tombol lanjut ke halaman berikutnya di bawah ini.

Bagikan artikel ini:

Pages: 1 2 3 4 5 6

Subscribe
Notify of
guest
4 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
nan
nan
11 months ago

visualnya error kalo featurenya lebih dari 2, gimana ya pak caranya

Asep Muhidin
Asep Muhidin
4 months ago

Maaf pak. Mengapa feature ‘kelamin’ tidak dimasukkan ?