Catatan penting : Jika Anda benar-benar awam tentang apa itu Python, silakan klik artikel saya ini. Jika Anda awam tentang R, silakan klik artikel ini.
Kali ini saya akan berbagi tentang salah satu teknik klasifikasi yaitu decision tree classification (DTC).
Teknik ini sangat mirip dengan decision tree regression, hanya saja hasil akhirnya bukanlah angka prediksi melainkan beberapa kelompok.
Agar pembaca bisa memahami dengan baik teknik Mari kita mulai pembahasannya melalui ilustrasi berikut:
Anggap kita memiliki dataset seperti gambar di atas. Kita memiliki 2 variabel independen (X1, X2) dan variabel dependen Y. Di dalam grafik ini kita lihat ada beberapa data yang diplot terhadap sumbu X1 dan X2.
Yang dilakukan DT adalah membagi data-data ke dalam beberapa kelompok secara bertahap. Pembagiannya dimulai dari keputusan pertama. Hasil dari keputusan pertama digunakan untuk mengambil keputusan kedua. Hasil dari keputusan pertama dan kedua, digunakan untuk mengambil keputusan ketiga. Begitu seterusnya.
Ilustrasinya sebagai berikut:
Setelah itu langkah kedua, membagi data lagi sebagai berikut:
Langkah selanjutnya kita bagi lagi:
Pembagian keempat adalah sebagai berikut:
Sekarang kita memiliki diagram pohon (decision tree) yang bisa membagi 2 kelompok hijau dan merah. Ilustrasinya sebagai berikut:
Jadi semua proses decision tree classification (DTC) sangat identik dengan decision tree regression (DTR), yang membedakan hanya pada tahap akhirnya saja.
Sampai di sini saya harap pembaca sudah memahami konsep DTC. Sekarang, mari kita bahas permasalahan pemilik showroom mobil (permasalahan yang juga dibahas di teknik klasifikasi lainnya). Kita akan membantunya memecahkan masalah iklan mobil SUV nya. Ia bingung di kelompok mana ia harus mengiklankannya di sosmed. Kita akan memecahkan persoalan ini dengan teknik decision tree.
Untuk melanjutkan membaca silakan klik tombol lanjut ke halaman berikutnya di bawah ini.