Blog Dataset Search: Search Engine Khusus Data

Dataset Search: Search Engine Khusus Data

Juni 12, 2022 5 min read

Apa itu Dataset Search?

Dataset Search adalah mesin pencari atau search engine khusus dataset buatan Google yang bisa diakses di datasetsearch.research.google.com.

Ditujukan untuk para peneliti, jurnalis data, termasuk juga data scientist, Google merilis produk ini pada 5 September 2018 dan pada 23 Januari 2020 resmi keluar dari versi beta.

Berdasarkan observasi yang dilakukan oleh tim konten Pacmann, Dataset Search adalah hasil iterasi dari Google Public Data Directory/Explorer yang pertama kali dirilis pada 8 Maret 2010 sebagai visualization tool yang digunakan di lingkungan Google Labs.

Produk Google satu ini dapat diakses secara gratis, menyediakan akses pada lebih dari 25 juta dataset, dan dilengkapi dengan fitur untuk melakukan filter terhadap data yang dicari.

Halaman hasil (SERP) dari Dataset Search ini tidak mengarahkan user langsung kepada halaman sumber datasetnya, melainkan halaman deskripsi dari dataset yang teindeks–kamu tetap bisa akses ke sumber data aslinya di halaman hasil pencarian ini.

Google Dataset Search Result Page Screenshot

Info yang tersedia di halaman hasil pencarian ini tergantung pada seberapanya banyak informasi yang diberikan oleh mereka yang mempublikasikan data ini.

Kamu dapat membaca product update-nya di sini.

Sebagai pelengkap, Google juga merilis Datasets and Pre-built Solutions di bawah Google Cloud mereka.

Kamu dapat menemukan dataset untuk kebutuhan analitik dan AI, serta mengakses dataset marketplace di Google Cloud Platform.

Namun, berbeda dengan dataset yang diperoleh dari Dataset Search, dataset di Google Cloud ini paywalled alias berbayar–mereka menyediakan Free Trial mulai dari $300.

Misi dari Dataset Search

Berawal dari 2017, Google merilis blog post tentang bagaimana mereka ingin memfasilitasi discovery of public datasets dan fostering an open data ecosystem.

Mengutip dari rilis Google,

“We built Dataset Search in an attempt to create a tool that will positively impact the discoverability of data. The decision to rely on open standards (schema.org, W3C DCAT, JSON-LD, etc.) for markup is intentional, as Dataset Search can only be as good as the open-data ecosystem that it supports.”

Bagaimana cara kerja Dataset Search?

Jawabannya adalah dengan menggunakan structured data atau schema.

Dataset Search sangat bergantung pada penggunaan metadata oleh penyedia dataset yang sesuai dengan standar yang ditentukan oleh konsorsium schema.org.

Penjelasan lengkapnya tentang produk Google yang satu ini sudah dipublikasikan dengan sangat baik di Google Search Central.

Cara menggunakan Dataset Search

Caranya sama seperti menggunakan search engine biasa.

Masukkkan keyword atau queries yang berkaitan dengan dataset yang ingin kamu cari.

Untuk mulai menggunakannya kamu harus akses ke datasetsearch.research.google.com terlebih dahulu.

Untuk penggunaan yang lebih mendalam dan detail, simak penjelasan dari Google’s Head of Decision Intelligence, Cassie Kozyrkov tentang penggunaan Dataset Search di blog Towards Data Science.

Cara agar datamu dapat dicari lewat Dataset Search

Seperti yang sudah dijelaskan di atas, aplikasi Dataset Search bergantung pada penggunaan structured data.

Oleh karena itu, bagi siapa saja yang mempublikasikan dataset ke internet dan ingin dataset-nya dapat dicari lewat search engine khusus data ini, mereka harus menyematkan structured data dengan baik pada halaman publikasinya.

Simak breakdown dari dataset yang tersedia dan best practices dalam mempublikasikan dataset di sini dan di Google Search Central.

Further reading:

Google Just Published 25 Million Free Datasets
Google Dataset Search — Origin & Mission
Did you meet Google Dataset Search?
How Google’s Dataset Search Engine Work