Berdasarkan Future of Jobs Survey 2020, yang dilakukan oleh World Economic Forum, diperkirakan data analyst dan data scientist menjadi pekerjaan yang memiliki permintaan tinggi pada tahun 2025 di Indonesia.
Selain itu, menurut Indonesia’s Critical Occupation List 2018, data scientist juga termasuk ke dalam 35 daftar pekerjaan kritis di Indonesia.
Meningkatnya permintaan posisi data scientist tersebut, harusnya juga bisa diimbangi dengan kesesuaian skill yang dimiliki oleh para data scientist yang ada.
Secara umum, terdapat tiga skills yang harus dikuasai oleh seorang data scientist, yaitu:
- Statistika dan matematika
- domain/business knowledge
- programming
Tiga skills itu bisa diperoleh dan ditingkatkan melalui berbagai cara dan media. Misalnya:
- Mengikuti kursus data science secara online/offline
- Menonton tutorial di platform streaming
- Mengikuti komunitas data science
- Membaca artikel, paper ataupun buku terkait dengan data science
Bagi Anda yang menyukai sistem pembelajaran yang sifatnya terstruktur dan mendetail, buku bisa dijadikan sebagai pilihan media pembelajaran utama atau tambahan.
Biasanya, topik-topik pembahasan di dalam buku dijabarkan secara lebih mendetail dan komprehensif.
Artikel ini membahas beberapa rekomendasi buku data science yang diharapkan bisa menambah skill, insight, dan pemahaman Anda terkait dengan data science.
Rekomendasi buku ini, terbagi menjadi dua bagian, yaitu rekomendasi buku untuk kebutuhan teknikal (Matematika, Statistika dan dasar Programming) dan juga yang bersifat bisnis.
Berikut ini ulasan 8 rekomendasi buku tentang data science yang wajib dibaca data scientist di tahun 2022 ini:
Practical Statistics for Data Scientist
Buku ini menyajikan materi komprehensif dari ilmu statistik.
Selain itu, terdapat panduan praktis dari penerapan metode statistik menggunakan bahasa pemrograman Python dan R.
Poin-poin pembahasan di dalam buku ini adalah:
- Exploratory Data Analysis (EDA)
- Pengambilan sampel dan distribusi data
- Eksperimen statistik
- Uji signifikansi
- Penggunaan metode regresi untuk melakukan prediksi data
- Penggunaan metode klasifikasi untuk prediksi kategori data
- Penggunaan statistical machine learning serta unsupervised learning
Penulis: Peter Bruce (Founder of the Institute for Statistics Education at Statistics.com), Andrew Bruce (Principal Research Scientist at Amazon), dan Peter Gedeck (Research Informatics Senior Scientist at Collaborative Drug Discovery).
Penerbit: O’Reilly Media, Inc.
Harga: $29,92 (Amazon) untuk versi e-book
Rating: 4,6 dari 5 (457 ratings) di Amazon, dan 4,23 dari 5 (74 ratings) di Goodreads.
Storytelling with Data
Buku Storytelling with Data menyajikan informasi tentang dasar visualisasi data beserta cara efektif untuk mengkomunikasikannya.
Buku ini menjelaskan tentang kekuatan dari proses storytelling atau cara untuk membuat cerita menjadi lebih menarik dan informatif menggunakan data.
Beberapa hal yang menjadi topik utama dalam buku ini mencakup:
- Cara menentukan grafik/chart berdasarkan situasi tertentu;
- Cara memahami betapa pentingnya konteks dan audiens;
- Cara menghilangkan informasi yang kurang relevan pada data yang disajikan;
- Cara mengarahkan fokus audiens ke bagian informasi yang diinginkan;
- Cara menggabungkan konsep desain ke dalam visualisasi serta cara untuk memanfaatkan kekuatan storytelling agar pesan atau informasi yang penting bisa lebih efektif tersampaikan ke audiens.
Buku ini direkomendasikan untuk praktisi data yang ingin belajar tentang tips menyajikan hasil visualisasi data serta cara untuk meyakinkan audiens.
Penulis: Cole Nussbaumer Knaflic (Founder storytelling with data dan ex People Analytics Manager di Google).
Penerbit: Wiley
Harga: $18,29 (Amazon) untuk versi e-book
Rating: 4,6 dari 5 (2.848 ratings) di Amazon, dan 4,4 dari 5 (4.696 ratings) di Goodreads.
Introduction to Probability
Buku ini merupakan hasil dari pengembangan kuliah statistika (Introduction to Probability), Harvard University.
Menyajikan berbagai contoh eksplorasi penerapan konsep probabilitas; mulai dari coincidences dan paradoks hingga ke penerapan konsep probabilitas di Google PageRank dan Markov Chain Monte Carlo (MCMC).
Selain itu, terdapat pembahasan pengaplikasian konsep probabilitas di domain lain, seperti pada bidang genetika, kedokteran, ilmu komputer serta teori informasi.
Buku ini mencakup banyak penjelasan intuitif, ilustrasi diagram serta soal latihan.
Setiap bagian akhir dari masing-masing bab di buku ini menyediakan simulasi dan perhitungan yang relevan dengan memanfaatkan bahasa pemrograman R.
Poin-poin pembahasan lain yang disajikan dalam buku ini termasuk probability, conditional probability, random variables, expectation, continuous random variables, moments, joint distributions, transformations, conditional expectation, inequalities dan teorema limit, markov chains monte carlo, proses poisson dan konsep dasar matematis.
Penulis: Joe Blitzstein (Professor of the Practice in Statistics at Harvard University) dan Jessica Hwang (PhD in Statistics at Stanford University).
Penerbit: CRC Press, Taylor and Francis Group
Harga: $73,88 (Amazon) untuk versi e-book
Rating: 4,5 dari 5 (80 ratings) di Amazon dan 4,53 dari 5 (113 ratings) di Goodreads.
Naked Statistics
Pernah mendapat titel A New York Times Bestseller, buku ini menyajikan konsep statistika sederhana dan menyenangkan, disertai dengan contoh kasus penerapan statistika di dunia nyata. Hal tersebut membuat statistik terasa lebih mudah untuk dipahami dan diaplikasikan.
Buku ini bisa membantu Anda untuk bisa lebih bersikap kritis terhadap argumen dan berita yang mengandung konsep statistik di dalamnya.
Buku ini juga menjabarkan beberapa konsep statistika seperti, inferensi, korelasi dan analisis regresi.
Selain itu, buku ini juga menyajikan cara kreatif untuk bisa memanfaatkan data yang berharga melalui proses natural experiment guna menjawab suatu permasalahan.
Beberapa topik lain yang dibahas di buku ini adalah statistika deskriptif, probabilitas, dan teorema Central Limit.
Penulis: Charles Wheelan (an American professor, journalist, speaker, and is the founder and co-chairman of Unite America, senior lecturer and policy fellow at the Rockefeller Center at Dartmouth College).
Penerbit: W. W. Norton & Company
Harga: $10,35 (Amazon) untuk versi e-book
Rating: 4,6 dari 5 (2.052 ratings) di Amazon dan 3,9 dari 5 (12.160 ratings) di Goodreads.
Data Science from Scratch
Jika Anda memiliki pengetahuan dasar matematika/statistika dan skill pemrograman, buku ini akan membantu Anda untuk lebih memahami pengetahuan dasar tersebut.
Buku ini dikemas dengan materi terbaru tentang deep learning, statistik, Natural Language Processing (NLP).
Selain itu, buku ini juga membantu Anda untuk dapat menguasai libraries, system modules dan toolkits data science disertai dengan konsep dasarnya.
Poin-poin yang dibahas pada buku ini di antaranya cara untuk mengumpulkan, mengeksplorasi, membersihkan, dan memanipulasi data, visualisasi data, aljabar linear, konsep statistik, probabilitas, hipotesis dan inferensi, gradient descent, cara mendapatkan data, fundamental/dasar dari machine learning.
Selain itu, dibahas juga terkait implementasi model machine learning seperti K-Nearest Neighbors, Naive Bayes, Linear Regression, Logistic Regression, Decision Trees, Neural Networks, Clustering, Deep Learning.
Terdapat eksplorasi pembahasan tentang Recommender Systems, Natural Language Processing (NLP), Network Analysis, MapReduce, Data Ethics, dan Databases.
Penulis: Joel Grus (Principal Engineer at Capital Group, ex Software Engineer at the Allen Institute for AI and Google).
Penerbit: O’Reilly Media
Harga: $26,92 (Amazon) untuk versi e-book
Rating: 4,4 dari 5 (514 ratings) di Amazon dan 3,9 dari 5 (931 ratings) di Goodreads.
Data Science for Business
Lewat buku ini, Anda akan diperkenalkan dengan dasar-dasar ilmu informasi yang akan memandu menerapkan keterampilan data-analytic-thinking dengan tujuan mengekstraksi insight serta nilai bisnis (business value) yang berguna dari data yang sudah dikumpulkan.
Buku ini menggunakan contoh studi kasus permasalahan bisnis dunia nyata untuk menggambarkan suatu proses penerapan prinsip bisnis.
Selain mengajarkan cara untuk meningkatkan kemampuan komunikasi di antara para stakeholders bisnis, buku ini juga mengajarkan cara untuk bisa berpartisipasi secara efektif dalam proses pengerjaan proyek data science.
Poin-poin lain yang dibahas pada buku ini mencakup pencarian solusi dari business problems dan data science, predictive modeling (korelasi, supervised segmentation), cara melakukan fitting model ke data, overfitting model, clustering dan similarity, decision analytic thinking, visualisasi performa model, text mining, serta strategi bisnis.
Penulis: Foster Provost (Professor of Data Science at NYU), Tom Fawcett (Ph.D. in machine learning and has worked in industry R&D for more than two decades for companies such as GTE Laboratories, NYNEX/Verizon Labs, and HP Labs.
Penerbit: O’Reilly Media
Harga: $24,49 (Amazon) untuk versi e-book
Rating: 4,5 dari 5 (870 ratings) di Amazon dan 4,15 dari 5 (2.051 ratings) di Goodreads.
The Lean Startup
Buku ini menceritakan pengalaman dari Eric Ries saat menciptakan dan mengembangkan startup selama bertahun-tahun.
Pendekatan yang terdapat di dalam The Lean Startup mendorong perusahaan agar bisa lebih efisien dalam hal menggunakan modal dan meningkatkan kreativitas secara lebih efektif.
Selain itu, buku ini juga menawarkan strategi yang memungkinkan startup untuk bisa beradaptasi dengan risiko minimal dalam waktu singkat.
Konsep yang cukup populer dalam buku ini adalah konsep Build-Measure-Learn, Validated Learning, dan Innovation Accounting.
Daripada membuang waktu untuk membuat rencana bisnis rumit, The Lean Startup menawarkan kepada entrepreneurs di perusahaan untuk menguji visi mereka secara kontinu agar bisa beradaptasi dan menyesuaikan diri sebelum terjadinya suatu keterlambatan.
Penulis: Eric Ries (an American entrepreneur, blogger, CEO)
Penerbit: Currency
Harga: $8,63 (amazon.com) e-book
Rating: 4,6 dari 5 (9.621 ratings) di Amazon dan 4,11 dari 5 (278.043 ratings) di Goodreads.
Thinking, Fast and Slow
Thinking, Fast and Slow memaparkan secara populer konsep bagaimana otak manusia bisa mengenali dan menganalisis sekelilingnya.
Ketika otak sedang membuat penilaian ataupun memutuskan suatu pilihan melalui dua sistem, yaitu:
- Sistem 1 (yang bersifat cepat, intuitif, dan emosional), dan
- Sistem 2 (yang bersifat lebih pelan, bertujuan, dan lebih logis).
Buku ini banyak dijadikan sebagai bahan referensi dari berbagai buku seperti buku psikologi, bisnis, sampai self-development.
Penulis: Daniel Kahneman (Peraih Nobel di bidang Ekonomi)
Penerbit: Farrar, Straus and Giroux
Harga: $8,23 (24.684 ratings, amazon.com)
Rating: 4,6 dari 5 (24.684 ratings) di Amazon dan 4,17 dari 5 (401.909 ratings) di Goodreads.
Demikian rekomendasi buku dari Pacmann yang diharapkan dapat menjadi referensi pembelajaran data science baik, untuk pemula (beginner) maupun intermediate.
Pemanfaatan buku sebagai media pembelajaran data science bisa menjadi pilihan bagi Anda yang menyukai sistem pembelajaran mandiri, terstruktur dan mendetail.
Proses pembelajaran data science akan lebih efektif dan lebih komprehensif jika menggunakan learning path dan kurikulum yang sesuai dengan perkembangan dan kebutuhan dari industri.
Upgrade Skill Data Science di Sekolah Data Pacmann
Pacmann menyediakan Sekolah Data Pacmann dengan berbagai program di bawahnya, antara lain:
- Analytics and Data Science
- Statistics
- Artificial Intelligence and Machine Learning Engineer
. Melalui program-program ini, Anda akan mendapatkan pengalaman belajar data science, yang diadaptasi dengan kurikulum terpadu dan berkualitas.
Selain itu Anda juga akan dibekali skill untuk menyelesaikan real-case di dunia data.
Ditambah lagi, dengan mengikuti program ini, Anda juga bisa membangun portofolio dan berpeluang besar untuk meniti karier sebagai data scientist andal.
Untuk mengetahui informasi lebih lanjut mengenai program ini, silakan menuju halaman Sekolah Data Pacmann.
Further Reading:
The Future of Jobs Report 2020
Indonesia’s Critical Occupations List 2018
Data Science Books You Should Read in 2022
Towards Data Science: 7 Must-Read Books for Data Scientists in 2022
Sparks Search: The Four Best Statistics Books I’ve Ever Read
Books on Code: 7 Best Books to Become a Data Scientist in 2022
Artikel Popular
Big Data dan Data Mining: Perbedaan dan Hubungannya
June 5, 2023
Mengenal Lebih Jauh tentang Neural Network
June 2, 2023
10 Rekomendasi Blog Data Science Terbaik untuk Diikuti
June 1, 2023
Rekomendasi Course Data Engineering Bersertifikat
May 31, 2023
Bagaimana Machine Learning (ML) Dapat Bantu Mencegah Serangan Phishing
May 30, 2023