Deep Learning: Convolutional Neural Networks

Deep Learning: Convolutional Neural Networks

PERBEDAAN GAMBAR HITAM PUTIH DAN BERWARNA

Sangat mudah bagi kita manusia untuk bisa membedakan mana gambar hitam putih, dan mana gambar yang berwarna. Namun hal ini tidak berlaku untuk mesin. Mesin (komputer) ternyata memiliki cara lain untuk bisa membedakan kedua gambar tersebut. Ilustrasinya adalah sebagai berikut:

Perbedaan hitam putih dan warna untuk gambar 3×3 pixel

Pada ilustrasi di atas kita memiliki contoh 2 buah gambar sederhana berukuran 3×3 pixel. Pixel adalah sebuah kotak kecil yang merepresentasikan gambar, di mana sebuah gambar adalah gabungan dari ratusan bahkan ribuan pixel. Tentu saja gambar yang pembaca lihat di layar komputer atau HP terdiri dari banyak pixel, namun untuk penyederhanaan kali ini anggap gambar kita hanya berukuran 3×3 pixel.

Gambar pada bagian atas adalah hitam putih, sementara bagian bawah adalah berwarna. Walaupun secara visual kita bisa tahu kedua gambar tersebut masing-masing terdiri dari 9 pixel (3×3), untuk setiap pixelnya komputer menerjemahkannya dengan pengkodean.

Komputer mengonversi sebuah pixel ke dalam array (baris angka) yang bersifat 2 dimensi (memiliki kolom dan baris) dari 1-256 (indeks dimulai dari nol, sehingga ditulis 0-255), sehingga setiap pixel memiliki angka dari 0-255. Nilai 0 menyatakan bahwa pixel tersebut adalah putih seutuhnya (100% putih), sementara angka 1 adalah hitam seutuhnya (100% hitam). Dengan demikian, angka di antara keduanya menggambarkan intensitas antara putih dan hitam (misal, angka 0.3 menyatakan warna abu-abu yang cenderung agak putih).

Dari mana angka 256 didapat? Angka ini didapat karena komputer mengolah data berukuran 8 bit. Dan karena komputer mengolah data biner, maka 2 pangkat 8 adalah 256 (tenang saja, kita tidak akan bahas tentang konsep perhitungan ini terlalu detail).

Di sisi lain, warna diterjemahkan oleh komputer menjadi array yang bersifat 3 dimensi (ada baris, kolom, dan 1 variabel tambahan). Mengapa menjadi 3D array, karena dibagi ke dalam 3 unit warna (RGB – red, green, blue) yaitu biru, merah, dan hijau. Untuk pixel biru misalnya, maka nilai 0 menyatakan bahwa ia tidak biru sama sekali, sementara nilai 255 menyatakan bahwa pixelnya berwarna 100% biru. Begitu pula untuk pixel merah dan hijau.

Sebagai tambahan informasi, untuk memahami perbedaan 2D dan 3D array: 2D array adalah kumpulan dari 1D array, dan 3D array adalah kumpulan dari 2D array.


CARA KOMPUTER MENERJEMAHKAN GAMBAR

Perhatikan gambar wajah senyum di bawah ini:

Gambar yang dilihat manusia adalah gambar A. Kemudian, agar komputer bisa menerjemahkan gambar tersebut, ia mengonversinya dari gambar utuh (gambar A) menjadi beberapa pixel yang tampak seperti gambar B. selanjutnya, agar gambar B bisa benar-benar dibaca oleh komputer, maka setiap pixel berwarna hitam diubah menjadi bernilai 1, sementara yang berwarna putih bernilai 0. Kurang lebih tampilan akhirnya menjadi seperti berikut:

blank
Tampilan pengkodean untuk tiap pixelnya

Sekarang kita coba lihat ilustrasi lain berupa gambar kucing berikut:

Cara komputer bisa memahami gambar kucing (sumber: http://cs231n.github.io/classification/ )

Bisa dilihat pada ilustrasi di atas bahwa kotak kecil yang berada di sekitar kumis kucing diterjemahkan oleh komputer menjadi angka untuk setiap pixelnya.

Komputer memahami sebuah gambar tidak sama dengan manusia. Apa yang dilakukan komputer sebenarnya adalah membaca angka yang ada di pixelnya (nilai antara 0-255). Jika kita sudah memahami cara komputer memahami sebuah gambar, yaitu dengan membaca nilai pixelnya sebagai angka bulat antara 0-255, maka kita juga menggunakan informasi ini untuk melakukan proses aritmatika (perhitungan matematis). Dengan demikian, informasi nilai pixel ini bisa kita gunakan untuk membuat aplikasi AI, yaitu dengan menggunakan teknik-teknik machine learning atau deep learning.

Untuk melanjutkan membaca, silakan klik tombol lanjut ke halaman selanjutnya di bawah ini.

Bagikan artikel ini:

Pages: 1 2 3 4 5 6 7

Subscribe
Notify of
guest
1 Comment
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Sukir
Sukir
4 months ago

Assalamu’alaikum pak saya ingin bertanya, pada pembahasan di halaman ini kan feature detector / filter berukuran 3 x 3 dan nilainya 0,1,0,1 karena hanya sebagai contoh agar lebih mempermudah, bagaimana pak cara menentukan ataupun mengetahui nilai2 piksel dari suatu feature detektor (misal 3×3 atau 5×5) jika gambar kita grayscale maupun RGB?