Blog Memilih Teknik Visualisasi Data yang Tepat

Memilih Teknik Visualisasi Data yang Tepat

Nuzulul Khairu Nissa Juni 1, 2022 10 min read

Visualisasi data mengacu pada teknik mengomunikasikan data atau informasi yang terdapat pada data dengan cara mengubahnya menjadi objek visual seperti diagram, grafik, peta, dan sebagainya.

Bagi audiens target yang mungkin masih awam dengan konteks data tersebut, visualisasi data berguna untuk merepresentasikan hasil analisis data agar lebih jelas dan efisien. 

Pertanyaan mendasar yang biasanya sering muncul ketika ingin membuat visualisasi data antara lain, “Jenis chart apa yang tepat untuk data ini?”.

Memilih jenis chart, grafik atau bentuk visual lainnya yang tepat adalah hal fundamental yang harus kita pahami sebelum melakukan visualisasi data.

Hal ini bertujuan supaya representasi atau informasi yang kita peroleh dari proses analisis data, menjadi lebih valid dan bisa tersampaikan dengan baik.

Terdapat beberapa panduan yang bisa membantu agar teknik visualisasi data yang Anda terapkan dapat menghasilkan suatu informasi yang tepat sasaran dan sesuai tujuannya.

Salah satu panduan yang dapat membantu Anda dalam memilih jenis chart/grafik adalah panduan bernama Chart Selection Diagram dari Dr. Andrew Abela.

Panduan tersebut merupakan bagian dari metode Extreme Presentation

Chart Selection Diagram bisa membantu dalam memilih visualisasi data yang tepat berdasarkan tujuan, kesesuaian jenis chart/grafik, dan variabel data yang tersedia. Penggunaan Chart Selection Diagram bisa kita mulai dengan menjawab pertanyaan “Apa yang ingin Anda tunjukkan?”.

Kemudian Chart Selection Diagram akan memberikan jalur cabang sesuai dengan tujuan dari informasi yang ingin Anda sampaikan.

Empat kategori tujuan yang terdapat dalam Chart Selection Diagram adalah:

  • Comparison (perbandingan)
  • Relationship (hubungan)
  • Composition (komposisi)
  • Distribution (distribusi)

Selanjutnya setelah memilih kategori tujuan yang ingin Anda sampaikan, Anda akan memasuki jalur cabang penentuan keputusan untuk menyesuaikan jumlah variabel dan jenis dimensi yang terdapat pada data.

Cabang terakhir merupakan rekomendasi jenis chart/grafik yang bisa Anda pilih untuk memvisualisasikan data yang Anda miliki. 

Terkait empat kategori tujuan informasi dari Chart Selection Diagram, berikut ini penjelasannya:

Visualisasi Data – Perbandingan

Comparison (perbandingan) berfungsi untuk membandingkan nilai antara variabel satu dengan variabel lainnya. Selain itu, ia bisa juga berguna untuk menemukan nilai tertinggi ataupun terendah dari data dan untuk membandingkan beberapa kategori dalam satu variabel data. 

Contoh pertanyaan yang bisa comparison chart jawab adalah:

  • Produk apa yang memiliki total penjualan tertinggi di tahun ini?
  • Bagaimana kondisi naik-turunnya tingkat penjualan produk selama 24 bulan terakhir?

Beberapa contoh pilihan jenis comparison chart:

Bar Chart

Untuk melihat perbandingan beberapa jenis kategori nilai.

Sumbu X pada bar chart menunjukkan jenis kategori yang dibandingkan, sedangkan sumbu Y menunjukkan nilai/besaran untuk setiap jenis kategori.

Ilustrasi Bar Chart via Qlik

Selain itu, Stacked Bar Chart juga bisa menjadi alternatif, yang merupakan tipe grafik bertumpuk dalam 1 column chart vertikal yang mampu membandingkan semua kategori data dari waktu ke waktu berdasarkan masing-masing kategori.

Ilustrasi Stacked Bar Chart via Qlik

Line Chart

Untuk memperlihatkan fluktuasi trend data atau perubahan suatu kondisi dari waktu ke waktu secara kontinu.

Tipe visualisasi ini juga berguna untuk membandingkan antar kategori dengan cara memberikan warna yang berbeda pada setiap kategori tersebut.

Ilustrasi Line Chart via Qlik

Combo Chart

Untuk membandingkan dua set nilai ukuran yang biasanya sulit untuk dibandingkan karena adanya perbedaan skala.

Chart ini pada dasarnya adalah diagram batang (Bar Chart) yang dikombinasikan dengan diagram garis (Line Chart).

Ilustrasi Combo Chart via Qlik

Visualisasi Data – Hubungan

Relationship (hubungan) berguna untuk memperlihatkan bagaimana nilai antar variabel saling berhubungan satu sama lain.

Relationship chart memungkinkan juga untuk memperlihatkan bagaimana korelasi, outliers, dan cluster dari data.

Contoh pertanyaan yang dapat terjawab oleh relationship chart adalah:

  • Apakah terdapat korelasi/hubungan antara pengeluaran biaya iklan dan tingkat penjualan dari suatu produk?
  • Bagaimana variasi dari pendapatan berdasarkan region?

Beberapa contoh pilihan jenis chart relationship:

Scatter Plot

Untuk menampilkan suatu pola hubungan antara dua variabel. Scatter plot juga bisa menunjukan apakah hubungan/korelasi tersebut termasuk korelasi/hubungan yang positif, negatif atau tidak berkorelasi.

Ilustrasi Scatter Plot via Qlik

Bubble Chart

Merupakan bentuk variasi dari scatter plot dengan adanya tambahan dimensi data yang dipresentasikan dalam ukuran gelembung. Bubble chart memvisualisasikan data menggunakan tiga dimensi variabel.

Ilustrasi Bubble Chart via Qlik

Visualisasi Data – Komposisi

Composition (komposisi) memperlihatkan komposisi komponen suatu nilai dibandingkan terhadap nilai total keseluruhan. Chart komposisi dapat bersifat statis yang fungsinya menunjukkan komposisi nilai total saat ini, atau dapat juga menunjukkan bagaimana komposisi nilai total berubah seiring berjalannya waktu. 

Contoh pertanyaan yang dapat terjawab oleh composition chart adalah:

  • Berapa persentase total penjualan berdasarkan region tertentu?
  • Berapa alokasi total anggaran triwulanan dari setiap departemen, selama satu tahun terakhir?

Beberapa contoh pilihan jenis chart komposisi: 

Pie Chart

Memperlihatkan bagaimana proporsi statis suatu nilai terhadap keseluruhan nilai total. Ini hanya cocok untuk sedikit variabel data.

Ilustrasi Pie Chart via Qlik

Treemaps

Memperlihatkan komposisi statis dari suatu akumulasi nilai terhadap nilai total secara hierarkis dengan menggunakan bentuk persegi panjang (persegi panjang yang lebih kecil di dalam persegi panjang yang lebih besar). 

Ilustrasi Tree Maps via Qlik

Waterfall Chart

Menggambarkan bagaimana nilai awal dipengaruhi oleh serangkaian perubahan nilai positif ataupun perubahan nilai negatif dari data. Nilai awal dan nilai akhir digambarkan sebagai bar chart yang ‘utuh’ sedangkan nilai tengah digambarkan sebagai floating bar chart.

Ilustrasi Waterfall Chart via Qlik

Visualisasi Data – Distribusi

Distribution (distribusi) menunjukkan/mengeksplorasi bagaimana nilai dalam suatu data dikelompokkan. Chart distribusi dapat memperlihatkan bagaimana bentuk data, bagaimana rentang nilainya serta bagaimana kemungkinan adanya outlier pada data.

Contoh pertanyaan yang bisa dijawab oleh chart composition adalah:

  • Berapa jumlah pelanggan per kelompok umur?
  • Kota mana yang paling banyak menggunakan layanan ini?

Beberapa contoh pilihan jenis chart distribusi:

Histogram

Memperlihatkan bagaimana data terdistribusi berdasarkan interval nilai tertentu.

Histogram sangat cocok untuk memvisualisasikan suatu distribusi frekuensi data numerik berdasarkan interval yang kontinu, ataupun berdasarkan pada periode waktu tertentu.

Sumbu x pada histogram merepresentasikan bin dari data dan sumbu y dari histogram merepresentasikan frekuensi dari setiap bin.

Ilustrasi Histogram via Qlik

  • Scatter plot: menampilkan suatu pola hubungan antara dua variabel. Selain itu, scatter plot juga bisa membantu untuk memperlihatkan bagaimana distribusi ketersebaran data serta bisa mengidentifikasi outlier.

Ilustrasi Scatter via Qlik

  • Box plot: untuk menunjukkan ringkasan distribusi data, ukuran tendensi sentral dan ukuran penyebaran (keragaman) data. Terdapat lima ukuran statistik yang dapat kita peroleh dari boxplot. Mereka adalah nilai minimum, nilai maksimum, nilai kuartil pertama (Q1), nilai kuartil kedua (Q2) atau median, nilai kuartil ketiga (Q3). Selain itu, boxplot bisa menampilkan nilai ekstrim dari suatu data serta outlier.

Ilustrasi Box Plot via Qlik

Proses pemilihan jenis chart/grafik dengan tepat merupakan hal yang penting dan fundamental bagi data analyst atau data scientist.

Itu bertujuan agar informasi yang terdapat di dalam data bisa terekstraksi secara optimal.

Beberapa cara untuk meningkatkan skill visualisasi data di antaranya yaitu:

  • Membaca referensi teknik visualisasi data
  • Memperbanyak latihan untuk membuat beberapa chart/grafik visualisasi data
  • Meminta feedback kepada seorang expertise terkait hasil visualisasi data yang telah dibuat
  • Mengikuti pelatihan/program membuat visualisasi data/analisis data

Upgrade Skill Visualisasi Data di Non-Degree Program Data Scientist Pacmann

Salah satu kurikulum dari program Pacmann menawarkan materi pembelajaran tentang visualisasi data.

Oleh karena itu jika Anda tertarik untuk meningkatkan skill visualisasi data dan tertarik untuk menjadi seorang data scientist, silakan menuju halaman Non-Degree Program Data Scientist.

Further reading: