Machine Learning: Apriori

Machine Learning: Apriori

LANGKAH-LANGKAH APRIORI

Apriori terdiri dari 3 bagian yaitu:

  • Support
  • Confidence
  • Lift

Untuk menjelaskan ketiga parameter tersebut, anggap saja kita ingin mencari hubungan antara telur dengan garam. Kita ingin mengecek apakah orang yang membeli telur memiliki kecenderungan tinggi untuk kemudian membeli garam atau tidak. Dengan demikian, maka:

  • Telur = A1
  • Garam = A2
  • Hubungan = A1 –> A2

Support adalah perbandingan antara jumlah item yang kita cari dengan total item yang ada. Formulanya sebagai berikut:

Formula support dalam apriori

Support (A2) = Jumlah pembeli garam / Total pembeli di dataset

Jika kita memiliki 100 pembeli, dan dari 100 pembeli, 10 orang membeli garam, maka:

Support (A2) = 10/100 = 10%


Confidence (A1–>A2) adalah perbandingan antara jumlah item A1 dan A2 dengan item A1. Formulanya sebagai berikut:

Formula confidence dalam apriori

Jadi kita ingin mengecek berapa banyak orang yang membeli telur, benar-benar setelah itu membeli garam.

Jika kita memiliki 50 pembeli telur, dan dari pembeli telur ini yang beli garam adalah sebanyak 12, maka:

Confidence (A1–>A2) = 12/50 = 0.24 atau 24%


Lift (A1–> A2) adalah perbandingan antara Confidence (A1–>A2) dengan Support (A2). Formulanya sebagai berikut:

Formula lift dalam apriori

Dengan demikian, maka:

Lift (A1–>A2) = 0.24/0.1 = 2.4


Jika kita sudah menghitung lift (A1–>A2) lalu apa langkah selanjutnya? Langkah selanjutnya adalah mencari semua nilai lift dari sekian banyak kombinasi item yang kita miliki di dataset. Kita urutkan sesuai dengan tingkat lift tertinggi, dan kita pilih beberapa yang paling tinggi.

Secara sistematis, tahapan apriori (setelah memahami 3 parameter di atas) adalah sebagai berikut:

  1. Tentukan nilai minimum untuk support dan confidence.
  2. Pilih semua kombinasi perhitungan support yang di atas batas minimumnya.
  3. Pilih semua kombinasi perhitungan confidence yang di atas batas minimumnya.
  4. Urutkan hubungan-hubungan yang ada (dari kombinasi seleksi poin 2 dan 3) mulai dari skor lift tertinggi hingga yang paling rendah.

Jika datanya sedikit tentunya kita bisa menghitungnya secara manual. Bagaimana jika datanya berjumlah ribuah, puluhan ribu, bahkan mungkin hingga berukuran raksasa karena kita mengolah data retail dari perusahaan multinasional misalnya? Oleh karena itu, diperlukan perhitungan dengan bantuan komputer.

Setelah ini kita coba memecahkan permasalahan hubungan antara pembelian barang dengan metode apriori ini menggunakan dua bahasa yaitu Python dan R.

Untuk melanjutkan membaca, silakan klik lanjut ke halaman selanjutnya di bawah ini.

Pages: 1 2 3 4

Subscribe
Notify of
guest

0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments