Data Science : Pengertian Data Science dan Skill yang Harus Dimiliki oleh Data Scientist

Data Science : Pengertian Data Science dan Skill yang Harus Dimiliki oleh Data Scientist



MOTIVASI




Kalian memesan makanan lewat aplikasi. Kalian sering memesan menu Ayam Goreng Tepung Paket 1. Kemudian, setelah memesan menu itu beberapa kali dalam satu bulan ternyata ada rekomendasi menu baru, katakanlah Ayam Goreng Tepung Paket 3. Mengapa hal tersebut bisa terjadi ?


MEMAHAMI DATA SCIENCE


Sejak internet dan smartphone semakin mudah diakses oleh berbagai lapisan masyarakat, data pun semakin mudah dikumpulkan. Saat ini, data tersedia dalam jumlah melimpah, dengan bentuk yang beragam, serta perlu kita olah dan pahami dalam waktu yang relatif singkat.

Jumlah data terus berkembang secara signifikan. Jadi, kita memerlukan teknik dan strategi yang tepat untuk memperlakukan data. Dari mulai proses pengambilan, penyimpanan, pengolahan, analisis, dan visualisasi data.

Saat ini, banyak orang yang berkata “data is the new gold”. Serupa dengan emas, data juga memiliki nilai yang sangat berharga dan memiliki banyak manfaat. Tapi, kamu perlu mengolahnya secara khusus sebelum bisa merasakan seberapa besar nilainya.


DATA SCIENCE



Data science adalah salah satu disiplin ilmu yang secara khusus mempelajari soal data terutama data kuantitatif atau data numerik. Data science adalah penggalian atau bisa juga disebut mengekstrak data agar dapat difilter serta didapatkan data yang benar untuk menghasilkan produk data yang sebenar-benarnya.


Masih belum banyak diketahui oleh masyarakat. Di Indonesia, Data Scientist masih sangat sedikit


TUJUAN DATA SCIENCE


  • Memberikan saran atas hasil temuan analisis untuk klien
  • Memprioritaskan hal-hal yang ditindaklanjuti
  • Untuk mencapai target yang memuaskan dengan memproses data


PENGUMPULAN DATA



Banyak data yang dapat kita kumpulkan. Dari mulai perangkat mobile, remote sensing, geolocation, software, aplikasi mobile, perangkat multimedia, RFID (radio-frequency identification reader, sensor nirkabel, dan sebagainya.

Komponen utama dari big data adalah model 3V. Model ini menampilkan karakteristik dan tantangan yang harus mampu dihadapi oleh big data, yaitu Volume (banyaknya data), Variety (keberagaman data), dan Velocity (kecepatan proses data).


SKILL DATA SCIENTIST



Data science adalah sebuah ilmu yang tidak berdiri sendiri. Kamu juga memerlukan beberapa ilmu atau skill lain untuk bisa bekerja dengan baik di bidang ini. Mereka dengan latar belakang pendidikan software developer juga belum tentu bisa secara otomatis menjadi seorang data scientist. Lalu, skill apa saja yang perlu kamu kuasai untuk terjun ke bidang ini? 


Pemrograman 





Memiliki skill pemrograman akan sangat membantu kalian dalam menjadi seorang data scientist atau data analyst. Tidak bisa dipungkiri jika data science adalah soal memasukan data-data tertentu ke komputer. Untuk memudahkan mereka dalam melakukan hal tersebu, keahlian dalam programming akan memastikan pekerjaan tersebut berakhir sempurna. Artinya, seorang data scientist setidaknya harus mengusai bahasa pemrograman seperti Python. 

Seorang data scientist juga harus memiliki kreativitas dan kecerdikan dalam menggunakan keterampilan teknis untuk membangun berbagai hal dan menemukan solusi cerdas untuk suatu masalah. Mengapa hal itu penting? Pada tahap awal, yakni datafication, berbagai data dari aneka sumber harus disiapkan agar bisa dibaca program komputer. Tahap ini membutuhkan keahlian di bidang ilmu komputer. Karena mereka menggunakan teknologi untuk memperebutkan set data yang sangat besar, bekerja dengan algoritma yang rumit, dan itu membutuhkan alat yang jauh lebih canggih daripada Excel.

Para data scientists harus mampu membuat kode untuk solusi cepat prototype, serta mengintegrasikan dengan sistem data yang kompleks. Bahasa inti yang terkait dengan bidang ilmu data termasuk SQL, Algorithm beserta pemrograman dengan Python, R, Scala, SAS, dan lain-lain. Tetapi tidak hanya mengetahui dasar-dasar bahasa, namun mampu secara kreatif menavigasi jalan mereka untuk membuat kode mereka bekerja.

Mereka harus berpengalaman dalam pengolahan data menggunakan query SQL untuk bisa memahami aliran data yang rumit dan menggunakan logika mereka dengan baik. Beberapa ilmu lain yang harus mereka pahami adalah Advanced Database dan Data Warehouses.


Kemampuan Untuk Bekerja Dengan Data Tidak Terstruktur





Hal ini berhubungan dengan Big Data. Big Data bisa diartikan dengan suatu cara untuk mengambil, menyimpan, menganalisis data-data yang sebelumnya tidak memungkinkan untuk diambil, disimpan, diproses, dan dianalisa. sehingga memungkinkan ada data yang error dan tidak bisa diproses dengan hal-hal yang biasa. Maka seorang data scientist harus menemukan cara bagaimana nantinya data diproses dan menjadikan data itu bisa disimpan dan diatur dengan cara yang sistematis.


Statistika 




Selanjutnya, pemahaman akan statistika juga merupakan suatu hal yang mendasar bagi kalian yang ingin menjadi seorang data analyst atau data scientist. Selain berguna untuk menentukan algoritma seperti apa yang akan diaplikasikan, ilmu statistika juga dibutuhkan dalam pengembangan software machine learning. Hal ini membuktikan bahwa data science adalah suatu profesi menarik yang memerlukan banyak skill sekaligus. 


Memahami Beberapa Fungsi Analisis





Analisis cukup populer dalam istilah bisnis populer beberapa tahun terakhir. Analisis dimaksudkan untuk menggambarkan pemikiran kritis yang bersifat kuantitatif. Secara teknis, analitik adalah “ilmu analisis” — dengan cara lain, praktik menganalisis informasi untuk membuat suatu keputusan. Analis dapat berinteraksi dengan data pada tingkat database atau tingkat laporan yang dirangkum.

Dalam kondisi jika data yang diperlukan sudah siap, tugas berikutnya lebih banyak melibatkan ilmu statistika, optimasi, dan penalaran matematis. Tak heran, seorang Data Scientist harus menguasai Statistics for Data Science, Bayesian Decision Theory, Predictive Analytics, serta Probabilities and Data. Sehingga mereka bisa menganalisis data dengan baik dan benar melalui cara pemrosesan sinyal, model probabilitas, program komputer dan hal yang berkaitan dengan ilmu Sains.


Memahami Machine Learning




Istilah Machine Learning dapat didefinisikan sebagai hasil dari penggunaan algoritma untuk menggunakan data, dipelajari dan kemudian memprediksinya. Software Machine Learning terdiri dari analisis statistik dan analisis prediktif yang digunakan untuk menemukan pola dan menangkap wawasan tersembunyi berdasarkan data yang dirasakan.


Contoh bagus dari implementasi Machine Learning adalah Facebook. Algoritma Machine Learning Facebook mengumpulkan informasi perilaku untuk setiap pengguna di platform sosial. Berdasarkan perilaku sebelumnya, algoritma memprediksi minat dan merekomendasikan artikel dan pemberitahuan di Umpan Berita.


Contoh lainnya adalah pada Google Translate, Google tidak menerjemahkan kata demi kata. Diambil dari konferensi internasional, publikasi ilmiah, dan koleksi perpustakaan, aneka teks disandingkan dengan terjemahannya, lalu disimpan dalam bentuk digital. Tiap frasa dan kalimat dikaitkan dengan terjemahannya, lalu dicari korelasinya.


Intinya dengan algoritma tertentu, data yang satu dikaitkan dengan data lain secara statistik. Ketika jumlah data bertambah, komputer menghasilkan lebih banyak korelasi. Intinya, komputer jadi makin pintar jika disuplai lebih banyak data. Inilah yang disebut Machine Learning.


Komunikasi dan Visualisasi Data 




Selain itu, skill komunikasi dan visualisasi data juga menjadi skill yang penting untuk kamu yang ingin terjun ke bidang ini. Terutama jika kamu masuk ke dalam sebuah perusahaan yang manajemennya data-driven. Biasanya, sebagai seorang data analyst, kamu juga diminta untuk membantu menentukan arah kebijakan. Dalam hal ini, kemampuan komunikasi dan visualisasi data menjadi penting untuk dimiliki.


Pengetahuan-pengetahuan spesifik mengenai masalah yang dianalisis (domain knowledge)


Seorang data scientist harus mengerti tentang masalah yang dihadapi di dunia nyata. Misalnya adalah tentang bagaimana sebuah aplikasi pengantaran makanan bisa merekomendasi restoran atau menu yang mirip dengan yang dia biasa ia pesan. Katakanlah seperti menu A. Menu A ini berisi ayam geprek nasi dengan sambal taichan level 5. Aplikasi tersebut harus bisa memberikan sebuah rekomendasi yang baru bedasarkan data tersebut agar konsumen tidak melulu memesan masakan tersebut. Asumsikan setelah membuat program, meneliti, dan menganalisa, data didapatkan hasil rekomendasi berupa Restoran X dengan menu Ayam Pedas Geprek Taichan. Contoh lainnya adalah ketika menggunakan ojek online yaitu rute yang sudah disiapkan—direkomendasikan tiap harinya dengan tepat.


APAKAH DATA SCIENTIST ITU SAMA DENGAN DATA ENGINEER ?





Tidak juga. Data Scientist membangun model machine learning dan algoritma statistik. Sedangkan Data Engineer adalah orang yang menciptakan titik awal pekerjaan Data Analyst dan Data Scientist.

Seorang Data Scientist perlu memiliki pengetahuan yang kuat pada bidang kuantitatif, seperti ilmu komputer, statistika, dan matematika karena mereka perlu menciptakan algoritma baru dan membuat prediksi terhadap permasalahan bisnis berdasarkan data.

Data Engineer bertanggung jawab terhadap pengumpulan data, data warehouse modeling, dan transformasi data. Mereka perlu memiliki pengetahuan yang dalam seputar teknologi berbasis Hadoop, SQL, teknologi NoSQL, dan solusi data warehousing.

2 Komentar

  1. If you're attempting to lose fat then you absolutely need to try this totally brand new custom keto meal plan.

    To produce this keto diet service, certified nutritionists, fitness couches, and professional cooks have united to provide keto meal plans that are productive, decent, money-efficient, and fun.

    From their first launch in 2019, 1000's of individuals have already transformed their figure and health with the benefits a certified keto meal plan can offer.

    Speaking of benefits: in this link, you'll discover 8 scientifically-confirmed ones provided by the keto meal plan.

    BalasHapus
  2. artikel menarik sangat bermanfaat. saya juga ingin berbagi informasi yang lain, silahkan dikunjungin : http://news.unair.ac.id/2021/04/30/kupas-tuntas-data-science-dalam-kesehatan-bersama-alumni-s2-fkm-unair/

    BalasHapus

Posting Komentar

Lebih baru Lebih lama