Machine Learning: Eclat

Catatan penting : Jika Anda benar-benar awam tentang apa itu Python, silakan klik artikel saya ini. Jika Anda awam tentang R, silakan klik artikel ini.

Eclat merupakan teknik yang tergolong ke dalam Association Rule Learning (ARL) dan sangat berkaitan erat dengan apriori, di mana eclat merupakan versi sederhana dari apriori.

Seperti yang sudah dibahas sebelumnya di apriori, maka eclat juga mencari hubungan apakah pelanggan yang membeli produk A juga membeli kecenderungan membeli produk B, produk C, dan seterusnya. Lalu apa bedanya dengan apriori?

Jika di apriori kita memiliki 3 parameter, yaitu support, confidence, dan lift, maka di eclat kita hanya memiliki support. Tentunya dengan hanya memiliki 1 parameter saja, teknik ini memiliki kelebihan dan kekurangan.

Kelebihannya adalah lebih cepat, karena proses komputasinya sedikit. Jika data yang diolah berjumlah puluhan ribu, bahkan mungkin sampai jutaan transaksi, maka teknik eclat bisa jauh lebih cepat daripada apriori. Namun kekurangannya, tentu tidak sedetail apriori, karena hanya 1 parameter saja yang digunakan untuk mencari hubungan antara 1 produk dengan produk lainnya, yaitu support.

Sama dengan penjelasan sebelumnya di apriori, maka support yang merupakan perbandingan antara jumlah pasang item yang kita cari dengan total item yang ada, dihitung dengan formula:

Berbeda dengan apriori, maka support (A) bukanlah nilai untuk satu item A saja, melainkan A=pasangan 2 item. Penyebutnya (pembagi) yang dimaksud bukanlah jumlah total item, melainkan jumlah transaksi.

Dengan demikian, support (A) = support (tepung-air mineral). Sehingga :

Support(tepung-air mineral) = jumlah kemunculan tepung-air mineral/jumlah transaksi keseluruhan

Jika sudah menghitung nilai support dari masing-masing pasangan item, maka tinggal urutkan dari nilai support terbesar ke terkecil.

Secara sistematis, proses eclat adalah sebagai berikut:

  1. Tentukan nilai batas minimum untuk support.
  2. Hitung nilai support semua pasangan item.
  3. Pilih semua item yang memiliki nilai support di atas batas minimumnya.
  4. Urutkan pasangan item berdasarkan nilai support dari yang terbesar ke terkecil.

Jika sudah diurutkan, bagaimana eclat bisa membentuk hubungan antara beberapa produk? Jadi eclat akan melihat pasangan mana yang sering muncul dari semua transaksi. alam konteks ini, kita bisa mendesain pasangan dari 2 item, 3 item atau lebih. Namun untuk meudahkan, kita hanya menghitung pasangan untuk 2 item saja. Dengan demikian, pasangan yang memiliki nilai support tertinggi adalah pasangan yang harus kita prioritaskan. Akan lebih mudah jika langsung praktek melalui contoh di dalam bahasa Python dan R.

Untuk melanjutkan membaca, silakan klik lanjut ke halaman selanjutnya di bawah ini.

Bagikan artikel ini:

Pages: 1 2 3

Leave a Reply

avatar
  Subscribe  
Notify of