Data Science

Data science adalah topik yang sangat hangat saat ini. Banyak perusahaan-perusahaan besar yang mulai merekrut para data scientists, yang merupakan sebutan bagi mereka yang berprofesi di dunia data science. Tidak tanggung-tanggung, gaji yang ditawarkan oleh perusahaan-perusahaan ini juga terbilang sangat besar, bahkan berada di urutan 5 pekerjaan gaji tertinggi di US.
Dunia saat ini sudah beralih dari sistem yang bersifat tertutup (offline) menjadi serba terbuka (online), sehingga kita dengan mudahnya bisa mengakses banyak informasi di luar sana melalui internet. Informasi yang bersifat pribadi juga mudah diakses oleh siapa saja, khususnya semenjak munculnya sosial media. Munculnya kecerdasan buatan (artificial inteligence) membuat pengambilan informasi bersifat otomatis dan sangat cepat. Kita memasuki dunia baru yang disebut dengan istilah Industry 4.0 atau Society 5.0.
Konsep dari industry 4.0 atau society 5.0 adalah membuat segala sesuatu berjalan secara otomatis, dan saling terintegrasi antara satu entitas (alat komunikasi, tools, mesin-mesin) sehingga membuat proses bisnis menjadi sangat efisien dan efektif. Hal ini memunculkan masalah baru, di mana data yang dihasilkan dari interaksi antar beberapa entitas tadi menjadi sangatlah besar dan beragam. Diperlukan banyak sekali mereka yang ahli mengolah data berukuran raksasa ini, dan tentunya bisa menginterpretasikan informasi yang tersimpan di dalamnya (insights). Oleh karena itu, mulailah data science menjadi sebuah topik yang terus diperbincangkan dan dipelajari oleh banyak orang.
Untuk menguasai data science maka perlu mempelajari berbagai keilmuan, antara lain:
- Matematika
- Statistik
- Programming
dan ditambah juga dengan pemahaman seorang data scientist atas lingkup bisnis yang ia analisis.
Pada dasarnya data science adalah keilmuan statistik, dan istilah data science ini juga muncul di akhir-akhir ini. Statisticians (ahli statistik) bisa saja disebut sebagai data scientists. Hanya saja yang membuatnya populer saat ini adalah mudahnya mengoperasikan dan membuatnya laporannya degan menggunakan komputer, dan software yang paling populer adalah R dan Python.
Dilihat dari sisi reproducibility (tingkat kegunaan yang memberikan hasil yang sama), maka R jauh lebih unggul dari Python. R juga lebih banyak dipakai oleh mereka para data scientist dari dunia akademisi maupun profesional. Salah satu kelebihan dari R adalah bahasanya yang bersifat direct (langsung) dan kualitas grafis (seperti kurva, grafik, dan visualisasi) yang sangat tinggi. Bahkan banyak jurnal penelitian di tingkat internasional merekomendasikan R sebagai platform untuk membuat tampilan grafis hasil riset para peneliti.
Di sini kita akan belajar bersama-sama segala sesuatu tentang dunia data science. Mulai dari pengertian, teori hingga aplikasi nyata di lapangan. Tentu saya harap pembaca tidak hanya mengerti tapi pembelajaran ini bisa memberikan skills baru yang bisa meningkatkan kualitas maupun kemampuan anaytics pembaca, baik di dunia nyata hingga ke pekerjaan profesional.
Berikut adalah beberapa materi data science yang akan kita pelajari dengan menggunakan bahasa pemrograman R:
- Dasar-dasar pemrograman R
- Visualisasi grafis
- Visualisasi interaktif di website dengan menggunakan Shiny R
Materi data science yang bisa dibaca:
Video Pengenalan Data Science
Berikut daftar video Data Science Masterclass dengan Menggunakan R:
- Kurikulum Pembelajaran
- Cara Install Program R
- Jenis-jenis Data Statistik
- Dasar-dasar Bahasa R
- Belajar Matriks di R
- Data Kategori di R
- Data Frame di R
- List di R
- Export Import Data di R
- Logical Operators di R
- Conditionals di R
- For dan While Loops di R
- Belajar Fungsi di R
- Fungsi Tingkat Lanjut
- Analisis Data Waktu
- Memanipulasi Data Dengan dplyr
- Menguasai pipe operator dan tidyr (part 1)
- Menguasai pipe operator dan tidyr (part 2)
- Visualisasi Data di R (Bagian 1)
Tips Data Science
Terus pantau halaman ini, karena setiap topik terbaru tentang data science maka halaman ini akan selalu saya update.
Selamat belajar data science!