Clustering

Clustering

Kali ini saya akan berbagi tentang teknik clustering. Seperti kita ketahui, bahwa ML (Machine Learning) dibagi ke dalam 3 kelompok, yaitu supervised learning, unsupervised learning, dan reinforcement learning. Teknik clustering ini masuk ke dalam kelompok unsupervised learning, yang artinya ini merupakan teknik di mana mesin akan bekerja (belajar) sendiri tanpa kita ajari bagaimana cara memecahkan permasalahannya.

Sebagai contoh, anggap saja kita memiliki sebuah data, misal data pelanggan yang berisi tentang jenis kelamin, besarnya penghasilan dan besarnya pembelian produk-produk kita. Maka dengan algoritma clustering kita dapat mengetahui pelanggan kita akan dikelompokkan ke dalam beberapa kluster dengan sendirinya, misal ada pelanggan yang pelit, pelanggan yang royal dan lain sebagainya.

Jika kita memiliki data pengguna di sosial media, maka kita juga bisa mengelompokkan data pengguna sosmed ke dalam beberapa kelompok, misal penyuka buku, penyuka film, penyuka traveling, dan lain-lain. Jika dalam masa pemilu, maka data pengguna sosmed tadi juga bisa kita kelompokkan ke dalam beberapa kelompok, misal kelompok pendukung basangan A dan kelompok pendukung pasangan B. Dari hanya data pengguna sosmed, kita bisa mengelompokkannya, tergantung kebutuhan (tujuan) kita, dan tentunya apakah data-data yang diperlukan memadai untuk mengelompokkanya sesuai tujuan awal tadi.

Sebagai contoh, mari kita lihat bagaimana sebuah teknik clustering bisa mengelompokkan data ke dalam beberapa kluster.

Ilustrasi clustering

Ada 3 hasil klustering, yaitu A (menjadi 3 kluster), B (menjadi 4 kluster) dan C (menjadi 5 kluster). Manakah yang paling baik pembagiannya? Apakah A, B atau C? Itu semua tergantung kita sebagai pembuat algoritmanya. Jika kita menginginkan 3 kluster saja, maka mungkin A yang terbaik. Jika kita ingin 5 dan sangat detail, maka C yang terbaik. Itupun juga tergantung bagaimana data yang kita miliki.

Dalam pembelajaran kali ini, kita akan mempelajari 2 teknik clustering yaitu:

  1. K-Means Clustering
  2. Hierarchical Clustering
Subscribe
Notify of
guest

0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments