Deep learning (DL) adalah topik yang paling hangat saat ini jika kita membahas tetang AI atau Machine Learning. Deep learning memiliki hubungan yang erat dengan neural networks, yang merupakan sebuah jaringan saraf tiruan layaknya saraf pada otak manusia.
DL berkembang pesat seiring dengan perkembangan teknologi komputer. Mari kita lihat ilustrasi di bawah ini.

Pada tahun 1956, kapasitas hard drive (HD) saat itu hanyalah 5 MB saja. Ukurannya sangatlah besar, bahkan untuk membawanya diperlukan sebuah forklift. HD ini disewa (bukan dibeli) dengan biaya 2500 dollar per bulan, dan yang bisa menyewa hanyalah perusahaan raksasa atau bahkan negara.
Berlanjut ke tahun 1982, kapasitasnya sudah dua kali lipat, yaitu 10 MB. HD ini sudah bisa dibeli dengan biaya yang masih sangat mahal, yaitu 3398 dollar atau sekitar 50 juta rupiah. Tentunya pada masanya, kapasitas 10 MB sudah sangat canggih.
Di era milenial (era saat ini), kapasitas HD sudah sangat luar biasa, bahkan sampai 1 TB untuk ukuran yang sangat kecil (tipe microSD). Pada ilustrasi di atas untuk microSD dengan kapasitas 500 GB harganya hanyalah 145 dollar (sekitar 2 juta ripuah) dan ukurannya sangatlah mini.
Di sisi yang lain, untuk mengimbangi kapasitas HD maka kecepatan processor juga sangat cepat. Pada tahun 1982 kecepatan prosessor komputer hanyalah 4 MHz (lihat ilustrasi di bawah ini).

Dibandingkan dengan teknologi saat ini, kecepatan processor sebuah ponsel mini iPhone tahun 2017 adalah sebesar 400 MHz, menunjukkan perkembangan teknologi yang hebat dengan peningkatan kapasitas 100 kali lipat dalam jangka waktu 40 tahunan.
Hal ini pernah diungkapkan oleh Gordon Moore, yang menyatakan bahwa semakin cepat perkembangan teknologi, maka semakin kecil juga biaya produksinya, artinya harganya juga semakin murah. Konsepnya dikenal dengan istilah Moore’s law. Sekarang kita bisa memiliki laptop canggih dengan harga di bawah 10 juta rupiah. Dibandingkan dengan puluhan tahun lalu, dengan nominal yang sama, kita mungkin hanya bisa bermimpi memiliki komputer.
Dua ilustrasi Moore’s law bisa dilihat sebagai berikut.


PERKEMBANGAN DEEP LEARNING MENGIKUTI TEKNOLOGI
Perubahan teknologi (kecepatan prosessor komputer dan kapasitas HD) ini ikut mempengaruhi perkembangan teknologi artificial intelligence (AI) khususnya dalam konteks deep learning. Untuk bisa mendapatkan hasil yang cepat dan akurat, maka teknik DL memerlukan hardware yang baik pula, yaitu kecepatan processor yang sangat cepat (baik processor CPU atau GPU).
Teknologi prosessor CPU (computer processing unit) yang sudah kita kenal umumnya berasal dari dua perusahaan besar yaitu Intel dan AMD. Prosessor CPU ini bisa kita temui dalam komputer atau laptop kita, yang ditempel pada motherboard (papan elektronik utama di komputer).
Sementara teknologi GPU pada komputer, biasanya berasal dari dua perusahaan besar yaitu Nvidia dan AMD. Berbeda dengan CPU, maka GPU (graphics processing unit) adalah otak yang mengatur tampilan yang muncul di layar (display) komputer kita. Ia juga menempel pada motherboard komputer/laptop.
Untuk mengimbangi kemampuan HD komputer, para peneliti sudah berinovasi dengan menggunakan DNA manusia sebagai media penyimpanan informasi. Kecepatannya penyimpanan menggunakan DNA jauh melebihi HD saat ini, dengan usia pakai yang jauh lebih lama. Walau demikian, harganya masih sangat mahal yang membuatnya belum bisa dikomersialisasikan.

Semakin baik dua teknologi CPU dan GPU, maka semakin cepat pula waktu pemrosesan algoritma deep learning.
Jadi apa itu deep learning?
Untuk melanjutkan membaca silakan klik tombol halaman berikutnya di bawah ini.
Pages: 1 2
Pak Herlambang, mau tanya, bagaimana cara menentukan jumlah hidden layer di dalam DL? dan masing-masing hidden layer (misal lebih dari 1 hidden layer) digunakan untuk apa?
Terimakasih banyak
Halo,
Tidak ada aturan baku dalam deep learning, karena teknik ini selalu berkembang.
Silakan bereksperimen menentukan layernya, mulai dari 1 layer kemudian ditambah sedikit demi sedikit.
Semakin banyak layer umumnya akan semakin akurat, namun memerlukan kemampuan komputasi yang tinggi.
Terlalu banyak layer bisa saja justru memperburuk hasil, karena overfitting.
Secara umum 2 layer itu sudah cukup untuk mendapatkan akurasi tinggi.
Semoga menjawab.
terimakasih banyak penjelasannya pak Herlambang. Jadi intinya jumlah hidden layer untuk pemroses input ke ouput supaya tidak terjadi vanishing gradient dan hasilnya lebih akurat ya pak?
Terimakasih banyak
Vanishing gradient justru akan terjadi di deep learning secara umum, namun bisa disiasati dengan teknik yang benar.
Silakan baca artikel saya tentang RNN (recurrent neural networks) untuk penjelasan lebih lanjut.
Semoga membantu.
Mhon izin pak mw bertanya apakah untuk klasifikasi teks bisa menggunakan CNN
Jawabannya bisa.