Supervised vs Unsupervised Learning: Apa Bedanya?
Haryo Baskoro September 27, 2022 5 min read
Machine learning menjadi bagian mendasar bagi sistem yang kerap kita gunakan sekarang–mulai dari mesin pencari, aplikasi streaming, sampai dengan e-commerce. Machine learning diterapkan untuk dapat membantu dan juga memecahkan persoalan yang dialami oleh pengguna.
Dua contoh sederhana aplikasi machine learning dalam kehidupan sehari-hari adalah recommendation system dan face recognition.
Pernahkah Anda perhatikan ketika membeli sebuah barang di e-commerce, dan di hari berikutnya terdapat beberapa produk di beranda muncul dengan kriteria yang mirip dengan barang yang sudah Anda beli sebelumnya?
Jika iya, maka itu yang disebut dengan recommendation system.
Contoh lain dari recommendation system adalah halaman beranda YouTube dan Netflix Anda–tentu halaman ini akan berisi video hasil kurasi berdasarkan riwayat tontonan Anda.
Contoh machine learning yang kedua adalah fitur lock screen pada smartphone yang memungkinkan Anda unlock hanya dengan wajah Anda, hal ini adalah penaplikasian machine learning dan artificial intelligence yaitu yang disebut face recognition.
Pada dasarnya, machine learning terbagi dua, yaitu supervised learning dan unsupervised learning.
Apa itu supervised learning?
Supervised learning adalah pendekatan machine learning yang menggunakan data-data yang sudah diberi label atau dataset-nya sudah diketahui oleh perancangnya.
Data-data yang telah dirancang ini diharapkan melatih “supervise” algoritma untuk klasifikasi ataupun prediksi sebuah kasus dengan akurat.
Supervised learning biasanya digunakan untuk dua hal utama:
- Classification
- Regression
Apa itu unsupervised learning?
Unsupervised learning adalah pendekatan machine learning yang menggunakan algoritma untuk menganalisis dan menemukan pola dari suatu data tanpa bantuan maupun intervensi dari manusia.
Di sini kita tidak memberikan info tentang output apa yang diharapkan dari sebuah input terhadap algoritma, dan algoritma mencari tahu pola yang mungkin didapatkan dari suatu dataset.
Umumnya unsupervised learning digunakan untuk tiga hal utama:
- Clustering
- Association
- Dimensionality reduction
Kapan digunakan supervised learning?
Lalu muncul pertanyaan, kapan waktu yang tepat untuk menggunakan supervised learning ataupun unsupervised learning?
Seperti yang sudah disinggung di atas, supervised learning umumnya meliputi klasifikasi maupun regresi.
Di mana output yang diharapkan adalah menemukan hubungan atau relasi dari dataset awal yang telah dimasukkan dan menghasilkan output secara efektif.
Contohnya ketika mengajarkan anak-anak untuk mengetahui nama-nama buah, di mana kita memberikan informasi kepada mereka tentang karakteristik dari setiap buah, misal buah “pisang” berwarna kuning, bentuknya lonjong, dan memiliki daging buah berwarna putih kekuningan.
Karakteristik warna, bentuk, dan daging buah ini adalah label dari data tertentu.
Semakin banyak data label untuk menjelaskan buah, akan memberikan daya pengetahuan lebih efektif.
Namun kekurangannya adalah ketika kita tidak memiliki pengetahuan tentang suatu buah beserta data labelnya, maka si anak juga tidak dapat mengenali nama buah tersebut.
Misalnya kekita memberikan informasi hanya untuk nama buah pisang, mangga, jambu. Ketika terdapat buah durian, maka si anak tidak dapat mengetahui buah apa itu, karena tidak pernah diberikan informasi mengenai buah durian tersebut sebelumnya.
Jadi, ketika kita sudah mengetahui klasifikasi suatu data, kita dapat membangun algoritma untuk mengklasifikasikan data sesuai label yang sudah ditentukan.
Kapan digunakan unsupervised learning?
Selanjutnya, penggunaan unsupervised machine learning umumnya untuk pengelompokan.
Berbeda dengan supervised learning yang memberikan konteks informasi terkait outputnya, pada unsupervised learning kita sama sekali tidak memberikan data label ataupun informasi dari output-nya dengan harapan kita menemukan pattern tertentu dari data yang ada.
Jika kita menggunakan contoh yang sama terkait buah-buahan, kita berada pada supermarket yang menjual buah-buahan selama beberapa waktu.
Dengan catatan bahwa tidak ada informasi sama sekali mengenai harga buah, nama buah, dsb. Lalu kita membiarkan anak tadi untuk menganalisis sendiri buah-buahan tersebut, dengan harapan bahwa si anak dapat mengetahui pattern atau karakteristik yang mungkin kita tidak tahu sebelumnya.
Atau bisa disimpulkan bahwa anak dapat melakukan analisis eksplorasi dari keadaan yang dia hadapi dan menemukan informasi dari keadaan tersebut.
Namun, tantangan dari unsupervised learning adalah dibutuhkan waktu training yang lebih lama untuk mendapatkan informasi dari sebuah kasus.
Contoh penggunaan supervised learning
Kita coba untuk menggunakan algoritma supervised learning untuk menyelesaikan problem yang kita alami, kita ambil contoh untuk keputusan “Apakah kita harus menggunakan ojek online untuk ke kantor atau menggunakan bus?”
Pertanyaan yang terdapat dalam decision tree ini disebut nodes, dan hasil dari decision (menggunakan bus dan menggunakan ojek online) disebut dengan leaf.
Setiap pertanyaan membantu individu untuk sampai pada keputusan akhir dan berusaha menemukan pemisahan terbaik untuk setiap keputusan dengan tujuan memberikan gambaran keputusan yang diambil dari sebuah case.
Contoh penggunaan unsupervised learning
Contoh yang dapat diambil adalah recommender system dalam pemilihan berita, YouTube, Netflix, dll.
Misal, Anda tertarik dengan membaca sebuah berita hasil pertandingan basket di Indonesia pada hari Senin, lalu machine learning akan membaca berita olahraga itu sebagai input, dan mencari kemungkinan berita yang Anda sukai di lain hari.
Jika dilihat, maka kemungkinan yang akan muncul ketika Anda pernah membaca berita olahraga adalah berita tentang informasi transfer pemain basket di negara Indonesia. Dengan asumsi bahwa data yang digunakan adalah meliputi karakteristik dari sport dan basket.
Berikut diagram bagaimana recommender system bekerja:
Lalu apa sebenarnya perbedaan mendasar dari kedua pendekatan ini? Perbedaan utama antara kedua pendekatan tersebut adalah penggunaan kumpulan data berlabel.
Sederhananya, supervised learning menggunakan data input dan output berlabel, sedangkan unsupervised learning tidak.
Belajar lebih banyak tentang Artificial Intelligence dan Machine Learning di Sekolah Data Pacmann–mulai dari fundamental sampai dengan advanced.
Further Reading
Supervised vs. Unsupervised Learning: What’s the Difference?
Artikel Popular
Data Engineer dan ML Engineer: Perbedaan Tanggung Jawab, Skill, dan Gaji
July 23, 2023
Mengenal Data Preprocessing: Langkah Awal dalam Data Mining
July 21, 2023
Apa yang Dimaksud dengan Machine Learning?
July 21, 2023
Ini Dia Alasan Mengapa Data Scientist Digaji Besar!
July 20, 2023
Pentingnya Business Intelligence (BI) Dashboard untuk Pengambilan Keputusan Bisnis
July 19, 2023