Memilih Teknik Visualisasi Data yang Tepat
Nuzulul Khairu Nissa Juni 1, 2022 10 min read
Visualisasi data mengacu pada teknik mengomunikasikan data atau informasi yang terdapat pada data dengan cara mengubahnya menjadi objek visual seperti diagram, grafik, peta, dan sebagainya.
Bagi audiens target yang mungkin masih awam dengan konteks data tersebut, visualisasi data berguna untuk merepresentasikan hasil analisis data agar lebih jelas dan efisien.
Pertanyaan mendasar yang biasanya sering muncul ketika ingin membuat visualisasi data antara lain, “Jenis chart apa yang tepat untuk data ini?”.
Memilih jenis chart, grafik atau bentuk visual lainnya yang tepat adalah hal fundamental yang harus kita pahami sebelum melakukan visualisasi data.
Hal ini bertujuan supaya representasi atau informasi yang kita peroleh dari proses analisis data, menjadi lebih valid dan bisa tersampaikan dengan baik.
Terdapat beberapa panduan yang bisa membantu agar teknik visualisasi data yang diterapkan dapat menghasilkan suatu informasi yang tepat sasaran dan sesuai tujuannya.
Salah satu panduan yang dapat membantu kamu dalam memilih jenis chart/grafik adalah panduan bernama Chart Selection Diagram dari Dr. Andrew Abela.
Berikut contoh diagramnya (Credit: Dr. Andrew Abela).
Panduan tersebut merupakan bagian dari metode Extreme Presentation.
Chart Selection Diagram bisa membantu dalam memilih visualisasi data yang tepat berdasarkan tujuan, kesesuaian jenis chart/grafik, dan variabel data yang tersedia.
Penggunaan Chart Selection Diagram bisa kita mulai dengan menjawab pertanyaan “Apa yang ingin kamu tunjukkan?”.
Kemudian Chart Selection Diagram akan memberikan jalur cabang sesuai dengan tujuan dari informasi yang ingin disampaikan.
Empat kategori tujuan yang terdapat dalam Chart Selection Diagram adalah:
- Comparison (perbandingan)
- Relationship (hubungan)
- Composition (komposisi)
- Distribution (distribusi)
Selanjutnya setelah memilih kategori tujuan yang ingin disampaikan, kamu akan memasuki jalur cabang penentuan keputusan untuk menyesuaikan jumlah variabel dan jenis dimensi yang terdapat pada data.
Cabang terakhir merupakan rekomendasi jenis chart/grafik yang bisa kamu pilih untuk memvisualisasikan data yang dimiliki.
Terkait empat kategori tujuan informasi dari Chart Selection Diagram, berikut ini penjelasannya:
Visualisasi perbandingan
Comparison (perbandingan) berfungsi untuk membandingkan nilai antara variabel satu dengan variabel lainnya.
Selain itu, ia bisa juga berguna untuk menemukan nilai tertinggi ataupun terendah dari data dan untuk membandingkan beberapa kategori dalam satu variabel data.
Contoh pertanyaan yang bisa comparison chart jawab adalah:
- Produk apa yang memiliki total penjualan tertinggi di tahun ini?
- Bagaimana kondisi naik-turunnya tingkat penjualan produk selama 24 bulan terakhir?
Beberapa contoh pilihan jenis comparison chart:
Bar chart
Untuk melihat perbandingan beberapa jenis kategori nilai.
Sumbu X pada bar chart menunjukkan jenis kategori yang dibandingkan, sedangkan sumbu Y menunjukkan nilai/besaran untuk setiap jenis kategori.
Selain itu, Stacked Bar Chart juga bisa menjadi alternatif, yang merupakan tipe grafik bertumpuk dalam 1 column chart vertikal yang mampu membandingkan semua kategori data dari waktu ke waktu berdasarkan masing-masing kategori.
Line chart
Untuk memperlihatkan fluktuasi trend data atau perubahan suatu kondisi dari waktu ke waktu secara kontinu.
Tipe visualisasi ini juga berguna untuk membandingkan antar kategori dengan cara memberikan warna yang berbeda pada setiap kategori tersebut.
Combo chart
Untuk membandingkan dua set nilai ukuran yang biasanya sulit untuk dibandingkan karena adanya perbedaan skala.
Chart ini pada dasarnya adalah diagram batang (Bar Chart) yang dikombinasikan dengan diagram garis (Line Chart).
Visualisasi hubungan
Relationship (hubungan) berguna untuk memperlihatkan bagaimana nilai antar variabel saling berhubungan satu sama lain.
Relationship chart memungkinkan juga untuk memperlihatkan bagaimana korelasi, outliers, dan cluster dari data.
Contoh pertanyaan yang dapat terjawab oleh relationship chart adalah:
- Apakah terdapat korelasi/hubungan antara pengeluaran biaya iklan dan tingkat penjualan dari suatu produk?
- Bagaimana variasi dari pendapatan berdasarkan region?
Beberapa contoh pilihan jenis chart relationship:
Scatter plot
Untuk menampilkan suatu pola hubungan antara dua variabel.
Scatter plot juga bisa menunjukan apakah hubungan/korelasi tersebut termasuk korelasi/hubungan yang positif, negatif atau tidak berkorelasi.
Bubble chart
Merupakan bentuk variasi dari scatter plot dengan adanya tambahan dimensi data yang dipresentasikan dalam ukuran gelembung.
Bubble chart memvisualisasikan data menggunakan tiga dimensi variabel.
Visualisasi komposisi
Composition (komposisi) memperlihatkan komposisi komponen suatu nilai dibandingkan terhadap nilai total keseluruhan.
Chart komposisi dapat bersifat statis yang fungsinya menunjukkan komposisi nilai total saat ini, atau dapat juga menunjukkan bagaimana komposisi nilai total berubah seiring berjalannya waktu.
Contoh pertanyaan yang dapat terjawab oleh composition chart adalah:
- Berapa persentase total penjualan berdasarkan region tertentu?
- Berapa alokasi total anggaran triwulanan dari setiap departemen, selama satu tahun terakhir?
Beberapa contoh pilihan jenis chart komposisi:
Pie chart
Memperlihatkan bagaimana proporsi statis suatu nilai terhadap keseluruhan nilai total.
Ini hanya cocok untuk sedikit variabel data.
Treemaps
Memperlihatkan komposisi statis dari suatu akumulasi nilai terhadap nilai total secara hierarkis dengan menggunakan bentuk persegi panjang (persegi panjang yang lebih kecil di dalam persegi panjang yang lebih besar).
Waterfall chart
Menggambarkan bagaimana nilai awal dipengaruhi oleh serangkaian perubahan nilai positif ataupun perubahan nilai negatif dari data.
Nilai awal dan nilai akhir digambarkan sebagai bar chart yang ‘utuh’ sedangkan nilai tengah digambarkan sebagai floating bar chart.
Visualisasi distribusi
Distribution (distribusi) menunjukkan/mengeksplorasi bagaimana nilai dalam suatu data dikelompokkan.
Chart distribusi dapat memperlihatkan bagaimana bentuk data, bagaimana rentang nilainya serta bagaimana kemungkinan adanya outlier pada data.
Contoh pertanyaan yang bisa dijawab oleh chart composition adalah:
- Berapa jumlah pelanggan per kelompok umur?
- Kota mana yang paling banyak menggunakan layanan ini?
Beberapa contoh pilihan jenis chart distribusi:
Histogram
Memperlihatkan bagaimana data terdistribusi berdasarkan interval nilai tertentu.
Histogram sangat cocok untuk memvisualisasikan suatu distribusi frekuensi data numerik berdasarkan interval yang kontinu, ataupun berdasarkan pada periode waktu tertentu.
Sumbu x pada histogram merepresentasikan bin dari data dan sumbu y dari histogram merepresentasikan frekuensi dari setiap bin.
Scatter plot
Scatter plot menampilkan suatu pola hubungan antara dua variabel. Selain itu, scatter plot juga bisa membantu untuk memperlihatkan bagaimana distribusi ketersebaran data serta bisa mengidentifikasi outlier.
Box plot
Box plot dapat dimanfaatkan ntuk menunjukkan ringkasan distribusi data, ukuran tendensi sentral dan ukuran penyebaran (keragaman) data.
Terdapat lima ukuran statistik yang dapat kita peroleh dari boxplot, yaitu:
- Nilai minimum
- Nilai maksimum
- Nilai kuartil pertama (Q1)
- Nilai kuartil kedua (Q2) atau median
- Nilai kuartil ketiga (Q3)
Selain itu, boxplot bisa menampilkan nilai ekstrim dari suatu data serta outlier.
Proses pemilihan jenis chart/grafik dengan tepat merupakan hal yang penting dan fundamental bagi data analyst atau data scientist.
Itu bertujuan agar informasi yang terdapat di dalam data bisa terekstraksi secara optimal.
Beberapa cara untuk meningkatkan skill visualisasi data di antaranya yaitu:
- Membaca referensi teknik visualisasi data
- Memperbanyak latihan untuk membuat beberapa chart/grafik visualisasi data
- Meminta feedback kepada seorang expertise terkait hasil visualisasi data yang telah dibuat
- Mengikuti pelatihan/program membuat visualisasi data/analisis data
Upgrade skill visualisasi data di Sekolah Data Pacmann
Salah satu course dalam program-program Sekolah Data Pacmann adalah materi pembelajaran tentang visualisasi data.
Oleh karena itu jika tertarik untuk meningkatkan skill visualisasi data dan tertarik untuk menjadi seorang data scientist, silakan menuju halaman Sekolah Data Pacmann.
Further reading:
Designing Charts and Graphs: How to Choose the Right Data Visualization Types
Best practices for choosing visualization types
Data Visualization Resources: Types of Charts and Graphs for Data Viz
Data Visualization 101: How to Choose the Right Chart or Graph for Your Data
Artikel Popular
Big Data dan Data Mining: Perbedaan dan Hubungannya
June 5, 2023
Mengenal Lebih Jauh tentang Neural Network
June 2, 2023
10 Rekomendasi Blog Data Science Terbaik untuk Diikuti
June 1, 2023
Rekomendasi Course Data Engineering Bersertifikat
May 31, 2023
Bagaimana Machine Learning (ML) Dapat Bantu Mencegah Serangan Phishing
May 30, 2023