Catatan penting : Jika Anda benar-benar awam tentang apa itu Python, silakan klik artikel saya ini. Jika Anda awam tentang R, silakan klik artikel ini.
Masih tentang Machine Learning, kali ini saya akan berbagi sebuah teknik regresi, yaitu Decision Tree (DT). Pada dasarnya DT bisa dilakukan untuk 2 hal, yaitu regresi dan klasifikasi. Namun kali ini kita bahas teknik regresinya.
Apa itu DT? Sesuai dengan penamaannya, maka ia adalah teknik pengambilan keputusan dengan analogi sebuah pohon memiliki banyak cabang/ akar. Di mana satu cabang akan bercabang lagi, kemudian bercabang lagi, dan seterusnya.
Dalam konteks regresi, maka decision tree adalah regresi yang bersifat non-linear dan non-kontinu (diskret).
Lebih mudahnya, dilihat melalui ilustrasi berikut:
Anggap kita memiliki dataset seperti gambar di atas. Kita memiliki 2 variabel independen (X1, X2) dan variabel dependen Y. Di dalam grafik ini kita lihat ada beberapa data yang diplot terhadap sumbu X1 dan X2.
Yang dilakukan DT adalah membagi data-data ke dalam beberapa kelompok secara bertahap. Pembagiannya dimulai dari keputusan pertama. Hasil dari keputusan pertama digunakan untuk mengambil keputusan kedua. Hasil dari keputusan pertama dan kedua, digunakan untuk mengambil keputusan ketiga. Begitu seterusnya.
Ilustrasinya sebagai berikut:
Setelah itu langkah kedua, membagi data lagi sebagai berikut:
Langkah selanjutnya kita bagi lagi:
Pembagian keempat adalah sebagai berikut:
Setelah membagi-bagi data ke dalam beberapa kelompok, kita sekarang sudah mendapatkan 5 grup (kelompok). Data points (titik-titik) dalam masing-masing kelompok memiliki nilai Y nya sendiri-sendiri. Sekarang anggap saja data Y dari masing-masing kelompok kita cari nilai rataannya, sehingga ilustrasinya seperti ini:
Sekarang kita memiliki model decision tree kita.
Dengan demikian, jika kita ingin memprediksi nilai Y (regresi nilai Y), maka cukup dilihat titik variabel independen (X1 dan X2) masuk di kelompok mana. Mudah bukan.
Sekarang mari kita coba memecahkan permasalahan real.
Untuk melanjutkan membaca, silakan klik tombol di bawah ini.
Halo Pak, jika melihat model DecisionTreeRegressor didalam source diatas, atribut mana yang menunjukan pengaturan jumlah keputusan(kelompok) yang akan digunakan? seperti konsep yang dijelaskan di slide pertama, Terima Kasih
Algoritma DecisionTreeRegressor di sklearn atau rpart di R secara otomatis melakukan fitting untuk regresi menggunakan decision tree.
Hasilnya bisa dilihat di grafik bahwa nilai y dihasilkan oleh rentang nilai X tertentu (dijelaskan juga di artikel).
Semoga menjawab.
Terima kasih Pak atas jawaban nya, berarti dengan model DecisionTreeRegressor secara otomatis sudah menentukan sendiri jumlah kelompok keputusan yang disesuaikan dengan jumlah dan bobot dari variabel independen nya ?
Iya betul
terima kasih…
Terimakasih sharing knowladge nya mas.. BTW ada lowongan kerja untuk AI gx mas ?