Machine Learning: K-Armed Bandit

Machine Learning: K-Armed Bandit

Aplikasi Lain K-armed Bandit di Dunia Nyata

Barangkali ada pembaca yang bertanya. Mengapa menggunakan contoh K-armed bandits? Apakah dengan belajar ini, hasilnya relevan untuk digunakan untuk aplikasi RL lainnya?

K-armed bandit sangat mirip dengan proses pemilihan iklan (advertisement) oleh sebuah perusahaan. Sehingga sangat relevan jika diaplikasikan ke dalan dunia bisnis dan marketing.

Anggap kita memiliki 3 jenis iklan produk Samsung S10 di internet yaitu iklan A, B dan C. Ilustrasinya sebagai berikut:

3 jenis iklan S10 yang berbeda

Sekarang permasalahannya adalah manakah iklan yang paling efektif? Yaitu iklan yang paling banyak diklik oleh pelanggan di internet?

Cara awamnya (common sense) adalah dengan melakukan AB-test. AB-test adalah sebuah uji coba dengan menyodorkan iklan ke calon pelanggan (walaupun namanya AB-test dengan hanya 2 produk A, dan B saja, konsep ini juga bisa dipakai untuk lebih dari 2 produk. Hanya masalah penamaan saja). Setelah kita sodorkan ke 1000 pelanggan misalnya, kita hitung dari 1000 itu, berapa banyak yang mengklik iklan A, B dan C. Dengan demikian, kita bisa mengetahui persentasenya. Persentase berapa banyak jumlah klik sering disebut dengan istilah CTR (click-through rate).

Anggap iklan terbaik adalah iklan C, dan kita sudah menyodorkannya ke 1 juta pelanggan. Kita mendapatkan persentase bahwa CTR iklan C adalah 65%. Artinya 650rb orang memilih untuk melakukan klik iklan C. Itu juga menandakan bahwa iklan A dan B lebih buruk dari C. Artinya hanya untuk mendapatkan nilai CTR iklan C sebesar 65%, kita sudah kehilangan peluang sebesar 35%. Tentunya menyodorkan iklan walaupun hanya berupa AB-test ke pelanggan juga memerlukan dana yang tidak sedikit.

AB-test adalah cara konvensional yang sering dipakai banyak perusahaan, sampai ditemukannya analogi K-armed bandit. Hal yang paling tidak efisien adalah untuk bisa mendapatkan confidence interval yang kecil maka sample size (jumlah konsumen untuk uji coba) haruslah sangat besar. Semakin besar jumlah konsumen maka semakin besar pula biaya yag harus dikeluarkan. Padahal AB-test adalah tahap awal (testing) sebuah iklan sebelum benar-benar diluncurkan ke pasar.

Di halaman selanjutnya kita akan coba memecahkan permasalahan K-armed bandit dengan bahasa Python.

Untuk melanjutkan membaca silakan klik tombol ke halaman selanjutnya di bawah ini:

Pages: 1 2 3

Subscribe
Notify of
guest

0 Comments
Oldest
Newest Most Voted