Deep Learning: Self-Organizing Maps

Seperti yang kita ketahui sebelumnya, deep learning bisa dibagi ke dalam 2 jenis, yaitu supervised dan unsupervised deep learning. Di artikel-artikel sebelumnya, saya sudah sempat membahas tentang jenis-jenis dari supervised deep learning. Kali ini saya akan bahas salah satu teknik unsupervised deep learning yang banyak dipakai di dunia industri yaitu SOM (self-organizing maps).

Apa itu SOM? SOM pertama kali diperkenalkan oleh Profesor yang berasar dari Finlandia, yaitu Teuvo Kohonen. SOM juga sering disebut dengan istilah Kohonen Map. Jika kita terjemahkan langsung dari namanya, maka bisa diartikan SOM adalah peta yang bisa mengorganisir dengan sendirinya, di mana pengertiannya sangat mirip teknik clustering. Ternyata memang benar, bahwa SOM adalah versi deep learning untuk clustering itu sendiri.

Berbeda dengan teknik clustering seperti K-means clustering di mana visualisasinya tidak menunjukkan hubungan antara kluster satu dengan yang lainnya, SOM masih mempertahankan hubungan antar kluster (diwakilkan oleh output nodes). Dengan kata lain, SOM masih mempertahankan topologi secara visual.

SOM juga bisa menggambarkan hubungan topologi antar output nodes dengan banyak variabel (banyak kolom dalam sebuah tabel dataset). Jumlah kolom yang bisa diolah bisa berjumlah puluhan bahkan ratusan.

Lalu apa yang dilakukan SOM dengan ratusan kolom tersebut? SOM meringkas sekian banyak kolom menjadi hanya 2 kolom saja. Dengan kata lain bisa dikatakan bahwa SOM mereduksi dimensi dari N dimensi menjadi 2 dimensi saja. Dengan menjadi 2 dimensi, diharapkan akan lebih mudah untuk membaca dan menginterpretasikan data hasil reduksi dimensi SOM ini.

Ilustrasi hasil SOM yang diambil dari sebuah paper tampak sebagai berikut:

Ilustrasi reduksi dimensi melalui SOM
Ilustrasi SOM dari sebuah paper ilmiah yang membahas tentang galaksi

Melihat ilustrasi di atas tentu menjadi sangat mudah untuk menginterpretasikan hasilnya, karena kita hanya tinggal melihat warna dari gambar tersebut (dibandingkan harus membaca tabel dengan banyak kolom). Bisa dibayangkan jika ada ratusan bahkan hingga ribuan kolom data (terutama pada kasus dataset galaksi di luar angkasa seperti ilustrasi di atas), kita mustahil bisa mengambil insights dengan hanya melihat tabelnya saja. Setiap warna dari gambar di atas menggambarkan karakteristik yang berbeda.

Hasil dari SOM tentu sangat membantu dan mempersingkat waktu, mengingat manusia menyukai representasi yang bersifat visual.


Apa yang istimewa dari SOM?

Sama seperti teknik unsupervised yang lain, maka kita tidak perlu memberikan label kepada training set. Lebih jelasnya, pada teknik unsupervised seperti SOM, kita belum tahu tujuannya (belum mengerti label datanya).

Kita hanya memberikan data kepada algoritma SOM sebanyak mungkin dan menentukan ukuran peta (jumlah nodes atau neurons) yang ingin dibuat. Setelah itu, biarkan SOM mengelompokkan sendiri data-data tersebut ke dalam beberapa cluster besar.

Teknik unsupervised ini sangat cocok bagi kita yang benar-benar blank (tidak tahu sama sekali) insights dari dataset kita. Teknik seperti ini digunakan ketika kita memiliki data yang berukuran sangat besar (big data), dan kita ingin bisa membaca dan mengerti makna (hubungan-hubungan yang terkandung di dalam datanya) dalam waktu yang cepat dan akurat.

Berbeda dengan teknik clustering lainnya di dalam domain machine learning, SOM bekerja melalui neural networks layaknya seperti ANN, CNN, dan RNN (namun tanpa hidden layers). Dengan demikian SOM masuk ke dalam keluarga deep learning.


Aplikasi Nyata dari SOM

Apakah ada aplikasi nyata dari SOM? Ya, ada sebuah paper ilmiah yang sangat bagus, di mana paper ini bisa menggambarkan tingkat kemiskinan negara-negara di dunia.

Tentunya untuk bisa memberikan gambaran yang tepat, mereka menggunakan banyak sekali variabel sebagai parameter penentu apakah sebuah negara tergolong ke dalam negara miskin, sedang, berkembang, maju, dan lain-lain. Data yang digunakan berasal dari World Bank yang bisa diunduh (download) kapan saja.

Berikut adalah proses perubahan dari dataset berbentuk tabel dengan banyak sekali kolom, yang kemudian diubah menjadi SOM. Setelah itu, dipetakan ke dalam peta dunia, di mana setiap negara memiliki warna yang berbeda-beda. Setiap warna juga menjelaskan tingkat kemiskinan tertentu.

Ilustrasi SOM untuk memetakan tingkat kemiskinan di tiap negara adalah sebagai berikut:

Aplikasi SOM untuk memetakan tingkat kemiskinan di dunia

Sekarang setelah memetakan SOM ke dalam peta dunia (world map), menjadi mudah bagi kita untuk menginterpretasikan tingkat kemiskinan tiap negara. Hal ini tidak mungkin dilakukan jika kita melihatnya hanya melalui tabel dengan puluhan yang ditunjukkan oleh data World Bank.


Saya harap sampai di sini pembaca bisa memahami secara singkat apa itu SOM (self-0rganizing maps) dan aplikasinya di dunia nyata.

Di halaman selanjutnya, kita akan bahas bagaimana SOM bekerja secara teknis.

Untuk melanjutkan membaca silakan klik tombol ke halaman selanjutnya di bawah ini:

Bagikan artikel ini:

Pages: 1 2

Leave a Reply

avatar
  Subscribe  
Notify of