Salah satu masalah terbesar dalam dunia digital umumnya dan perpustakaan digital pada khususnya adalah kenyataan bahwa sumber-sumberdaya digital sudah terlebih dahulu ada sebelum Internet dan Web hadir. Setelah ada Internet, orang-orang membangun konsep sekaligus ilusi tentang keterbukaan dan kemudahan menemukan informasi. Padahal dalam kenyataannya, sumber-sumberdaya digital sudah dibangun dengan pemikiran untuk menyediakan layanan khusus bagi pengunjungnya saja. Bagaimana jika seseorang ingin mencari di sekian banyak pangkalan data, tanpa harus mengunjunginya satu per satu? Dari persoalan ini lahir ide tentang cross searching, lalu juga muncul konsep harvesting dan federated searching.

Secara konseptual, cross searching bermaksud memudahkan pencari yang tinggal mengetikkan istilah yang ingin dicari, lalu membiarkan komputer menjelajah berbagai pangkalan data untuk menemukan istilah itu. Secara teknis, hal pertama yang harus diatasi adalah persoalan ketidaksamaan ‘bahasa’ antar berbagai pangkalan data. Ini coba diatasi dengan membuat protokol dan standar yang dikenal dengan nama Z39.50. Namun penerapan protokol tersebut kurang begitu berhasil, terutama ketika ukuran pangkalan data semakin besar, jumlah dan jenisnya semakin beragam, dan lalu-lintas di jaringan komputer semakin ramai. Dalam forum internasional yang mengulas masalah ini, dijelaskan bahwa akhirnya cross searching cenderung memperlambat proses pencarian untuk menyesuaikan diri dengan kecepatan pangkalan data yang paling lambat di antara pangkalan-pangkalan data yang ditelusuri[1]. Ketika pangkalan data yang dikunjungi berjumlah sedikit, kecepatan cross searching masih lumayan. Begitu jumlah pangkalan data melewati angka 100, proses cross searching menjadi lambat, karena kemungkinan jumlah pangkalan data yang berkecepatan rendah juga semakin banyak.

Selain itu, cross searching tidak dapat melakukan semacam “seleksi awal” sebelum melakukan pencarian sebab belum tentu setiap pangkalan data memiliki profil atau informasi tentang kandungannya. Apalagi, ada perbedaan dalam sintaks bahasa pencarian di setiap pangkalan data, atau ada perubahan dalam fasilitas pencarian sejalan dengan waktu. Cross searching dalam kondisi yang demikian akan menjadi sangat rumit dan memakan waktu. Dari kelemahan-kelamahan inilah muncul ide untuk menghimpun dulu semua metadata dari pangkalan-pangkalan data yang akan dikunjungi, lalu himpunan metadata inilah yang ditelusur. Cara ini disebut dengan harvesting.

________________________________________
[1] http://www.oaforum.org/tutorial/english/page2.htm