Dalam dunia perpustakaan, terutama perpustakaan khusus dan perpustakaan akademik, abstrak bukanlah sesuatu yang asing. Sejak masa awal kepustakawanan, bersama dengan pembuatan indeks (pengindeksan), pembuatan abstrak selalu menjadi salah satu kegiatan terpenting para pustakawan. Ketika perpustakaan memasuki era digital, memang ada beberapa perubahan mendasar dalam sikap dan cara pustakawan maupun pengguna jasanya memandang fungsi abstrak. Juga ada teknologi baru seperti automatic abstracting (pengabstrakan otomatis), automatic text summarization, maupun text mining. Namun, secara umum tetap dapat dikatakan, abstrak adalah upaya para pustakawan dan pengelola sistem informasi untuk memudahkan pemanfaatan koleksi atau dokumen oleh penggunanya, terutama dokumen tekstual. Dalam konteks penyimpanan dan penemuan-kembali, abstrak berfungsi sebagai wakil dokumen, merupakan ringkasan isi atau bagian terpenting yang dapat dipakai oleh orang untuk mengira-ngira apakah dokumen bersangkutan memang relevan untuk kepentingannya. Lancaster (1991) menyatakan bahwa sebuah abstrak adalah representasi yang ringkas tetapi akurat dari isi suatu dokumen. Ia membedakan abstract dari extract, karena sebuah extract adalah versi singkat (abbreviated version) dari sebuah dokumen yang dibuat dengan jalan mengambil kalimat-kalimat dari dokumen tersebut. Sedangkan abstract, walaupun memakai berbagai kalimat yang ada dalam dokumen, merupakan sepenggal teks yang diciptakan oleh si pembuat abstrak, bukan kutipan langsung dari penulisnya [1].

Sebagaimana dikatakan oleh Bernier (2003), setidaknya ada 7 manfaat terpenting kegiatan pembuatan abstrak, yaitu:

  1. Memudahkan pembaca (terutama peneliti dan akademisi) menentukan dokumen yang akan dibacanya, sebab perkembangan ilmu pengetahuan demikian pesat dan luas, melibatkan lebih dari 50 bahasa dunia. Pembuatan abstrak dalam bahasa yang dikenali pengguna akan sangat membantu proses penentuan apakah sebuah dokumen perlu diambil untuk dibaca atau tidak.
  2. Jumlah jurnal ilmiah dan akademik terlalu banyak untuk diperiksa satu persatu oleh para ilmuwan, sehingga sebuah kumpulan abstrak akan sangat membantu proses pemutakhiran pengetahuan. Ilmuwan tidak perlu membaca dulu satu per satu artikel di bidangnya, sebelum memutuskan untuk memilih artikel yang paling dia perlukan.
  3. Seringkali abstrak dapat menggantikan fungsi artikel aslinya, terutama kalau jenis abstrak itu adalah abstrak informatif (lihat penjelasan tentang jenis abstrak di bawah).
  4. Dengan membaca abstrak terlebih dahulu, para peneliti dan akademisi dapat menghemat banyak waktu sebelum membaca artikel aslinya. Tanpa abstrak yang berkualitas, seringkali artikel yang dipilih untuk dibaca belum tentu benar-benar relevan.
  5. Kumpulan abstrak seringkali lebih mudah dihimpun ke dalam satu bidang atau sub-bidang yang sejenis dan saling berkait, daripada kumpulan artikel di jurnal yang seringkali tidak selalu benar-benar berkaitan satu sama lainnya. Kumpulan abstrak, dengan demikian, sangat membantu peneliti dan akademisi memahami bidang pengetahuan dan batas-batasnya.
  6. Abstrak semakin “ampuh” jika disertai indeks dan klasifikasi yang semakin memudahkan pencari menelusuri belantara artikel ilmiah. Tanpa abstrak yang demikian, sangatlah tidak praktis jika seorang peneliti harus menelusuri setiap bidang pengetahuan secara satu per satu.
  7. Tanpa abstrak yang berkualitas, pemilihan artikel atau dokumen untuk diambil dan dibaca menjadi kurang akurat. Abstrak yang baik akan sangat meningkatkan akurasi pemilihan dokumen. Tanpa abstrak, seringkali peneliti atau akademisi hanya menebak-nebak isi dokumen sebelum mengambil dan membacanya. Secara umum ada 4 jenis abstrak, yaitu abstrak informatif, abstrak indikatif, abstrak kritis, abstrak yang memakai sisi pandang khusus (slanted). Di dunia perpustakaan dan dokumentasi, pembuatan abstrak dilakukan dengan memenuhi standar tertentu, misalnya di Amerika Serikat digunakan ANSI/NISO Z39.14 Guidelines for Abstracts.
    Di dalam standar itu dijelaskan bahwa abstrak informatif pada umumnya digunakan untuk tulisan yang mengandung penelitian ilmiah. Di dalam abstrak ini ada tujuan, metodologi, hasil, dan kesimpulan penelitian. Sedangkan abstrak indikatif biasanya adalah untuk tulisan yang tidak terstruktur rapi seperti tulisan ilmiah, misalnya dalam bentuk esei, opini, atau untuk dokumen yang panjang seperti buku, prosiding, atau direktori. Abstrak kritis dan abstrak bersisi-pandang-khusus, pada umumnya mengandung komentar evaluatif, baik tentang isi maupun gaya penulisan dan penyajian, dari si pembuat abstrak yang ahli di bidang tertentu.

Standar pembuatan abstrak itu juga menentukan bahwa panjang abstrak bergantung pada jenis dokumen yang diabstrak, jenis abstrak, dan tujuan penulisannya. Tentu saja, bahasa yang digunakan juga menentukan panjang-pendek abstrak. Dokumen berbahasa Inggris yang panjang (misalnya buku), pada umumnya memiliki abstrak dengan panjang maksimum 300 kata. Dalam bahasa Indonesia, mungkin sekitar 400 kata. Standar itu juga menetapkan bahwa abstrak di jurnal ilmiah harus muncul di bawah judul dan nama pengarang. Jika abstrak itu merupakan bagian dari bibliografi, maka abstrak ditampilkan setelah sitasi (kutipan). Ketika abstrak menjadi bagian dari pangkalan data yang dapat ditelusur, maka abstrak itu juga harus mengandung katakunci yang kemungkinan akan dipakai oleh para pencari informasi.

Ketika pertumbuhan informasi ilmiah semakin pesat, pembuatan abstrak menciptakan kepusingan tersendiri di dunia perpustakaan. Pembuatan secara hastawi (manual) selalu lebih lambat dari pertumbuhan karya ilmiah yang harus diabstrak, dan jumlah pengabstrak (abstractor) profesional juga tak selalu memadai. Sudah sejak tahun 70an Borko dan Bernier (1975) mengingatkan bahwa kualitas abstrak yang dibuat oleh penulisnya sendiri seringkali tidak menentu, walaupun sudah ditulis oleh orang yang paling mengerti tentang apa yang diabstraknya. Pembuatan abstrak yang baik membutuhkan latihan dan pengalaman yang cukup, yang seringkali tidak dimiliki oleh penulis-penulis. Akhirnya muncul semacam “industri” pembuatan abstrak yang digolongkan sebagai secondary services, mendampingi primary services, yaitu industri penerbitan jurnal dan laporan penelitian. Di Indonesia, industri seperti ini belum ada, selain karena industri utamanya juga belum tumbuh dengan baik, juga karena kegiatan pembuatan abstrak tampaknya belum menjadi kebutuhan.

Seorang pembuat abstrak seringkali adalah seorang spesialis subjek (subject specialist) yang mengandalkan pengetahuannya tentang suatu subjek, dan demikian ia diharapkan dapat membuat abstrak dengan cepat karena mengerti istilah-istilah yang dipakai seorang penulis di suatu bidang ilmu tertentu. Kualitas abstrak, yang dibuat oleh penulisnya sendiri maupun oleh orang lain, sangat menentukan kualitas komunikasi antara penulis dengan pembaca sebuah artikel ilmiah atau laporan penelitian. Kualitas komunikasi ini pada gilirannya mempengaruhi pertumbuhan keilmuan. Komunikasi informasi ilmiah, kita ketahui, melibatkan penggunaan jurnal-jurnal ilmiah yang menjadi forum bagi bertemunya ide-ide keilmuan. Jika jurnal-jurnal tidak ada, maka makalah-makalah asli, sebagai sebuah sumber utama (primary source) menjadi penting. Tetapi seringkali tidak ada cukup banyak waktu untuk membaca semua makalah-makalah yang ada, sehingga dalam hal ini sumber kedua (secondary source) akan berperan. Kumpulan abstrak sebagai sumber kedua, misalnya, dapat menjadi sebuah titik penting dalam rangkaian komunikasi informasi ilmiah. Kalau sumber kedua ini tidak ada, maka dapat dipastikan bahwa telah terjadi gangguan yang sangat serius dalam arus informasi ilmiah di suatu bidang.

Ketika komputer mulai digunakan dalam komunikasi ilmiah, maka segera muncul harapan untuk membuat solusi terhadap persoalan pengabstrakan[2]. Eksperimen-eksperimen pun dilakukan untuk membuat apa yang disebut peringkasan teks sercara otomatis (automatic text summarization) yang merupakan bagian dari kajian Pengolahan Bahasa Alamiah (Natural Language Processing, atau NLP). Kajian ini biasanya bersifat interdisipliner, menggabungkan Ilmu Linguistik, Komputer, Statistik, dan Kognitif. Para peneliti Automatic Text Summarization pada dasarnya berupaya menciptakan program dan sistem komputer yang dapat meringkas dokumen tekstual, dan dalam perkembangannya terbagi menjadi dua pendekatan.

Pendekatan pertama mengandalkan kesederhanaan dan bertujuan mengambil sari (extract) dokumen tekstual, untuk menghasilkan ringkasan dengan menghimpun istilah, frasa, dan kalimat yang terdapat di dalam dokumen bersangkutan. Untuk menentukan apa yang diambil dan dihimpun, digunakanlah rumus statistik guna menghitung kehadiran dan frekuensi kata atau kalimat. Melalui cara ini, secara cepat komputer dapat menghasilkan sebuah ringkasan yang jauh lebih pendek dari dokumen aslinya, namun isi ringkasan ini dianggap kurang mengandung pengetahuan (knowledge-poor), walau sangat cocok untuk sistem temu kembali yang mengandalkan pembobotan istilah (term-weighting).

Pendekatan kedua dianggap menghasilkan teks yang lebih “kaya” (knowledge-rich) dan dianggap sebagai pembuatan abstrak, bukan semata-mata sari (extract). Eksperimen dalam pendekatan kedua ini bertujuan menghasilkan sebuah teks baru setelah komputer melakukan analisis dan sintesis (dan juga mengambil sari) dari dokumen yang bersangkutan. Teks yang dihasilkan dengan cara ini diharapkan mengandung sari dokumen, namun juga diolah lebih lanjut oleh komputer agar menjadi sebuah tulisan baru yang dapat dipahami pembaca. Dengan kata lain, pendekatan kedua ini lebih menyerupai kegiatan mengabstrak, sementara pendekatan pertama lebih merupakan kegiatan membuat sari.

Pendekatan kedua ini mengandalkan apa yang disebut sebagai “pemahaman oleh mesin” (machine understanding) sebagai bagian dari kajian komputer dalam bidang kecerdasan buatan (artificial intelligence) dan linguistik. Program komputernya juga dirancang untuk menerima permintaan atau pencarian informasi (dikenal dengan istilah query) dari pemakai sistem. Permintaan ini kemudian dikaitkan dengan fasilitas di dalam sistem yang mengandung alat-alat bantu untuk menetapkan wilayah atau area pengetahuan yang dibutuhkan pemakai. Alat-alat tersebut antara lain adalah thesaurus, ontologi, atau daftar kosa-kata. Di sini terlihat persamaan antara sistem komputer dengan sistem perpustakaan tanpa komputer. Ketiga alat yang disebut dalam sistem komputer tersebut sebenarnya juga tersedia dalam bentuk buku panduan di perpustakaan sebelum masa digital. Jadi, pengabstrakan berbantuan komputer sebenarnya meniru proses yang sudah lama dilakukan oleh perpustakaan, tetapi kali ini dengan maksud memperingkas serta mempercepatnya, sekaligus membebaskan pustakawannya dari pekerjaan itu!

Kegiatan pengabstrakan berbantuan komputer ini dikenal juga dengan kegiatan menyarikan fakta (fact extraction) dan bukan menyarikan teks (text extraction). Dalam sebuah artikel yang ditulis Jones (1999), kedua pendekatan ini tegas-tegas dibedakan. Dikatakan oleh Jones bahwa kegiatan menyarikan teks adalah kegiatan komputer yang berdasarkan apa yang terbaca oleh komputer itu atau “what you see is what you get.” Komputer tidak punya pengetahuan sebelumnya tentang teks yang terbaca, dan hanya mengandalkan jumlah atau frekuensi untuk menentukan apakah sebuah istilah atau kata merupakan bagian yang penting mewakili pemikiran sebuah dokumen. Ini dikenal juga dengan pendekatan “terbuka” (open approach) yang hanya menghasilkan sekumpulan kata, frasa, atau kalimat, seringkali tanpa struktur yang jelas, sebab komputer tidak memperhitungkan kemungkinan adanya sinonim atau keterkaitan antar makna.

Sebaliknya dengan itu adalah kegiatan komputer yang mampu menyarikan fakta dengan menggunakan pendekatan “tertutup” (closed approach). Maksudnya adalah, komputer membekali dirinya dengan berbagai pengetahuan sebelumnya tentang suatu bidang, dalam bentuk berbagai fasilitas seperti yang sudah disebut di atas, sehingga hasil kerjanya adalah “What you see is what you know”. Seringkali, pengetahuan yang dihimpun oleh komputer sebelum melakukan abstraksi secara otomatis, tidak secara eksplisit terdapat di dalam dokumen yang diabstraknya. Inilah yang kemudian juga membuat pengabstrakan berbantuan komputer jauh lebih rumit dari segi pemrograman, dibandingkan penyarian teks otomatis. Teknologi yang terkait dengan ontologi, pembuatan kosakata secara terkendali berbantuan komputer, thesaurus, dan berbagai teknologi kecerdasan buatan lainnya, amat menentukan nasib perkembangan pengabstrakan berbantuan komputer. Sampai saat ini, teknologi-teknologi tersebut masih dalam tahap perkembangan.

Sementara menunggu teknologi tersebut, pertumbuhan informasi digital tidak dapat dibendung. Itu sebabnya, sementara belum ada teknologi yang lebih canggih, orang masih ingin mengandalkan teknologi “sederhana” dalam bentuk penyarian teks. Keinginan orang untuk segera memiliki alat bantu penyarian teks ini juga semakin mendesak karena pertumbuhan situs Web yang luar biasa di Internet, dan pada dasarnya situs-situs tersebut terutama mengandung teks. Dari sinilah kemudian muncul istilah baru yaitu text mining (pendulangan teks) yang mendampingi istilah sebelumnya, yaitu data mining (pendulangan data). Secara sepintas, pendulangan teks ini sebenarnya adalah penyarian teks juga, seperti yang sudah diuraikan di atas, tetapi fokusnya adalah dengan memanfaatkan timbunan teks yang terdapat di Internet dalam bentuk situs Web.

Sementara itu, untuk mengetahui lebih lanjut tentang teknologi ini, dapat ditengok beberapa proyek peringkasan teks sercara otomatis sebagai bagian dari kerja besar dalam Natural Language Processing berikut ini: • SweSum – Automatic Text Summarizer yang diciptakan Martin Hassel and Hercules Dalianis dari Royal Institute of Technology Swedia, dapat dilihat di situs mereka ( http://swesum.nada.kth.se/index-eng.html) . Perangkat lunak ini juga dibuat untuk bahasa lain selain bahasa Swedia dan Inggris, seperti bahasa Denmark, Norwegia, Spanyol. Perancis, Italia, Parsi, dan Jerman. • Summ-it Summarisation Applet Version 1.1, sebuah program kecil (applet) yang dapat ditanam di browser , dibuat dengan bahasa pemrograman Java oleh System Quirk, bagian dari School of ECM di University of Surrey, Inggris, dapat dilihat di situs merek( http://www.computing.surrey.ac.uk/SystemQ ) • Megaputer text mining adalah salah satu produk komersial, dapat dilihat di situs mereka ( http://www.megaputer.com/ ) • Raksasa IBM punya program Automatic Text Summarization, tetapi baru dalam satu bahasa, yaitu Jepang. Kegiatan riset di bidang ini dapat dilihat di situs mereka ( http://www.research.ibm.com/trl/projects/langtran/abst_e.htm ) • KENiA® (Knowledge Extraction and Notification Architecture) buatan PERTINENCE MINING, sebuah perusahaan Perancis. Contoh produk mereka dapat dilihat di http://www.pertinence.net/index_en.html

________________________________________ [1] Sebenarnya ada berbagai istilah yang menunjukkan upaya pembuatan ringkasan atau wakil dokumen, seperti abridgment, annotation, aphorism, axiom, brief, code, command, compendium, conclusion, databook, epitome, excerpt, extract, maxim, percept, precis, resume, review, selection, summary, summation, synopsis, dan terse conclusion. Varian lain dari ini misalnya adalah excecutive summary, atau executive brief. Di dunia perpustakaan dan informasi, istilah abstrak lah yang digunakan. [2] Banyak tulisan menyatakan bahwa tokoh yang mengawali upaya eksperimen ini adalah Hans Peter Luhn (1896 – 1964) yang pada tahun 1955 melakukan kajian terhadap sistem temu-kembali di laboratorium IBM. Namun kajiannya lebih untuk keperluan pembuatan indeks. Kajian yang lebih serius tentang program peringkasan teks ini baru marak bersamaan dengan kajian tentang kecerdasan buatan (artificial intelligence) di tahun 1970an.