Istilah federated search berkaitan dengan upaya melakukan pencarian (searching) secara serempak terhadap beberapa pangkalan data. Ide dasarnya adalah: memudahkan orang mencari informasi; seseorang tidak perlu mengunjungi dan mencari secara lokal di setiap pangkalan data satu per satu, melainkan melakukan satu kali pencarian (atau mengajukan satu pertanyaan alias query) dan “menugaskan” sebuah sistem komputer untuk melakukan kunjungan-kunjungan itu. Setelah menjenguk dan mampir di setiap pangkalan data, sistem mengumpulkan hasil pencarian itu dan menyerahkannya sekaligus ke hadapan pengguna. Dengan ide dasar seperti itu, orang sering juga menamakannya distributed search atau broadcast search.

Perlu digarisbawahi, federated search melakukan kegiatan ini terhadap beberapa pangkalan data, bukan seperti search engine di Internet seperti Google, Yahoo!, AltaVista, dan sebagainya, yang melakukan pencarian terhadap situs-situs di Web. Sebuah search engine sebenarnya membuat sebuah pangkalan data dan mendaftar situs-situs di Internet, menggunakan sebuah program komputer (sering disebut spiders atau robots) untuk mengumpulkan informasi dan membuat indeks dari situs-situs itu. Sedangkan federated search merupakan kegiatan yang pertama-tama harus mengunjungi pangkalan data, membukanya (atau “mengetok pintu” untuk masuk ke dalamnya), melakukan pencarian di sana, dan mengambil data yang diperlukan (biasanya yang diambil adalah metadatanya dahulu), sebelum berpindah ke pangkalan data berikutnya untuk melakukan hal yang sama. Pangkalan-pangkalan data ini belum tentu tersedia secara terbuka di Internet, walaupun seringkali merupakan bagian dari sebuah situs di Web.

Kemudian juga ada meta-search engine, yang dapat digunakan untuk mencari katakunci untuk dikirim ke beberapa search engines. Lalu hasilkan dikumpulkan dan disajikan sekaligus. Sebuah meta-search engine tidak memiliki sebuah pangkalan data sendiri, melainkan mengolah dan mengirim pertanyaan kita ke pangkalan-pangkalan data yang dimiliki berbagai search engines. Walaupun ada kecenderungan menukar-nukar pemakaian istilah ‘metasearch system’ dengan ‘federated search system’ tetapi keduanya agak berbeda. Metasearching, sering disebut juga sebagai integrated searching (pencarian terpadu), simultaneous searching (pencarian bersamaan sekaligus), cross-database searching (pencarian lintas pangkalan data), parallel searching (pencarian paralel), atau broadcast searching (pencarian menyebar luas), mengandung sebuah proses di mana seorang pencari informasi memasukkan sebuah pertanyaan atau permintaan (query) ke sejumlah sumber informasi secara bersamaan atau simultan. Sumber-sumber ini bersifat heterogen, baik dari segi lokasi, format informasinya, dan apa yang terkandung di dalamnya. Perangkat lunak yang memakai metasearching sebenarnya mengandalkan kenyataan bahwa setiap sumber informasi itu memiliki search engine. Nah, sebenarnya sebuah metasearch system mengirim permintaan pemakai ke setiap search engine di masing-masing sumber informasi. Setelah mendapat jawaban dari semua search engine, hasilnya ditampilkan kepada pencari informasi

Dalam federated searching seringkali digunakan strategi yang agak berbeda, yaitu dengan terlebih dahulu mengambil data dari berbagai sumber untuk dihimpun di satu tempat, baru kemudian dilakukan pencarian terhadap himpunan itu. Ini disebut juga dengan harvesting. Dalam strategi atau model seperti ini, maka sebenarnya ada kegiatan pemrosesan sebelum pengguna memulai pencarian. Walaupun model ini berbeda, tetapi dari sisi pandang pengguna, sebenarnya federated search maupun meta-search seolah-olah sama, yaitu sama-sama melakukan pencarian di berbagai pangkalan data sekaligus. Padahal di balik persamaan itu ada perbedaan dalam pemrosesan datanya. Dengan terlebih dahulu menghimpun informasi dari berbagai pangkalan data, maka federated searching dapat melakukan program-program yang mengantisipasi kebutuhan pengguna. Misalnya, menggunakan algoritme untuk membuat urut-urutan (ranking) nilai relevansi data terhadap potensi kebutuhan pengguna, atau membuat semacam pengelompokan (clustering) yang memudahkan pengguna mengaitkan satu data dengan data lainnya, sehingga pencarian dapat dikembangkan atau disusutkan sesuai keperluan. Contoh perangkat lunak yang dapat digunakan untuk membangun federated search adalah: dbWiz[1] dan MasterKey[2]. Keduanya merupakan program Open Source.

Kegiatan federated searching dengan demikian pada dasarnya adalah sebuah teknologi yang memungkinkan pengguna mencari di dalam jaringan sumber informasi, bukan di satu sumber saja. Untuk keperluan perpustakaan digital, pembuatan federated search engines biasanya dilakukan dengan memperhatikan kebutuhan lokal. Perpustakaan digital biasanya menginginkan akses ke sumber-sumber di luar dirinya, misalnya katalog perpustakaan lain, pangkalan-pangkalan data komersial yang menyediakan abstrak dan indeks, penyedia layanan full-text seperti jurnal elektronik dan buku elektronik, dan “gudang-gudang” digital lainnya. Untuk memudahkan pemakai, dibuatlah satu antarmuka (interface) yang biasanya juga menjadi bagian dari portal perpustakaan itu. Berhubung setiap perpustakaan mungkin memiliki keperluan berbeda, maka federated search engine cenderung dibuat secara khusus atau tailor made.

Pada umumnya, perangkat lunak federated search menggunakan protokol yang sudah terstandar, seperti Z39.50. Artinya, perangkat lunak maupun berbagai pangkalan data yang hendak diakses sama-sama menggunakan struktur data yang sama, sehingga komunikasi antar keduanya dapat berjalan lancar. Namun saat ini belum semua pangkalan data dikembangkan dengan standar Z39.50 sehingga pengembang federated search engine seringkali harus membuat semacam program penerjemah yang mengandung semacam jembatan (crosswalk dan application profiles). Tentu saja, untuk melakukan ini si pengembang perlu tahu protokol dan struktur data di pangkalan data yang bersangkutan. Dalam praktiknya, seringkali pula sumber-sumber informasi yang diperlukan oleh sebuah perpustakaan tidak pernah mengungkapkan protokol dan struktur data mereka, sehingga akhirnya pangkalan data mereka tidak dapat diakses.

Perkembangan teknologi federated search jelas sangat dipengaruhi oleh tingkat keterbukaan, kerjasama, dan keseragaman dalam penggunaan standar data. Hal ini sering menjadi isu utama dalam perpustakaan digital dan menjadi bagian dari diskusi tentang interoperability. Beberapa persoalan lain yang juga muncul ketika mengembangkan sistem yang memakai federated search adalah:

  • Ketidakseragaman dan ketiadaan kesepakatan dalam hal autentifikasi. Sebuah federated search amat bergantung pada sistem autentifikasi, karena setiap kali sebuah program ingin mengunjungi sebuah pangkalan data, pasti ada prosedur identifikasi yang harus dilalui. Tidak nyelonong begitu saja. Persoalan autentifikasi ini bukan melulu soal password, tetapi juga menyangkut aspek manajemen kerjasama, legalitas, dan sebagainya.
  • Kemungkinan duplikasi data masih sangat besar. Pencarian terhadap 2 pangkalan data mungkin saja menghasilkan ratusan atau ribuan data yang sama. Misalnya, pencarian di dua universitas yang sama-sama memiliki koleksi ilmu ekonomi dan manajemen mungkin saja menghasilkan temuan yang sama, apalagi kalau pencarian diperluas ke 10 atau lebih universitas. Duplikasi seperti ini seringkali mengurangi kenyamanan pengguna, dan juga menambah kerumitan pengolahan jika struktur data yang digunakan berbeda-beda. Kalau kasus ini yang terjadi, duplikasi itu seringkali juga tidak terdekteksi sehingga dua data yang serupa terlihat seolah-olah berbeda. Ini tentunya akan mengecewakan si pencari informasi.
  • Kesulitan dalam membuat urut-urutan (ranking) relevansi, terutama jika menggunakan pembobotan berdasarkan kemunculan suatu kata atau istilah. Kesulitan muncul karena kualitas metadata di masing-masing pangkalan data seringkali berbeda, atau bahkan metadata yang digunakanpun tidak seragam. Selain itu, sebuah pangkalan data jarang mengijinkan sembarang pengguna masuk ke lapisan yang lebih dalam seperti abstrak, indeks dan apalagi isi fulltext. Akibatnya, program federated search hanya mengandalkan data seadanya ketika membuat urut-urutan relevansi dan cara ini seringkali tidak terlalu ampuh untuk benar-benar membuat pengurutan yang sesuai kebutuhan si pencari informasi.
  • Kesalahpahaman mengenai federated search sebagai semata-mata perangkat lunak, padahal seharusnya federated search adalah bagian dari sebuah jasa yang dilengkapi dengan berbagai layanan pendukung. Memperhatikan kelemahan-kelemahan di atas, seharusnya pengelola perpustakaan digital memperkenalkan fasilitas federated search ini sebagai bagian dari keseluruhan layanan pencarian dan penemuan informasi, bukan sebagai sebuah fasilitas yang berdiri sendiri. Ada beberapa perpustakaan yang secara tunggal mengandalkan federated search sebagai bukti bahwa mereka sudah menjadi “perpustakaan digital”. Hal ini hanya akan menimbulkan kekecewaan bagi pengguna, yang mungkin sudah terlanjur berharap terlalu besar dari satu fasilitas itu. Untuk mengurangi kekecewaan seperti ini, seharusnya perpustakaan menjadikan federated search sebagai salah satu alat bantu saja, misalnya alat bantu di meja rujukan (referensi) atau sebagai bagian dari jasa bimbingan penelitian.
  • Kesalahpahaman bahwa federated search dapat menggantikan pencarian secara spesifik di sebuah pangkalan data. Ini muncul karena kesalahpahaman dalam promosi pula, mirip dengan fenomena googleism yang membuat para pengguna bergantung pada satu search engine, padahal kualitas data yang ditemukannya akan jauh lebih baik jika dia menggunakan fasilitas satu pangkalan data tertentu. Dalam konteks pencarian informasi, seharusnya federated search digunakan sebagai strategi awal saja, ketika seseorang belum punya bayangan yang terlalu persis tentang apa yang dia butuhkan. Pada saat itu, sebenarnya dia hanya memerlukan perawakan (browsing) secara umum terhadap berbagai pangkalan data. Namun, kalau dia sudah mulai memfokuskan diri kepada satu subjek atau isu tertentu, federated search tentu saja kurang berguna lagi. Pengelola perpustakaan digital selalu harus wanti-wanti dalam hal ini.

________________________________________
[1] http://cufts2.lib.sfu.ca:8033/trac/dbwiz/wiki/dbWizAbout
[2] http://www.care-affiliates.com/care-products.html