Dalam konteks infrastruktur dan arsitektur sumberdaya digital di Internet, sebuah objek digital (digital object) merupakan objek yang memiliki struktur yang tidak terikat pada jenis mesin ataupun landasan pijak (platform) teknologinya. Sebagai sebuah objek, ia dapat diidentifikasi, diakses, dan dilindungi bilamana perlu. Sebuah objek digital tidak hanya mengandung elemen informasi (misalnya dalam bentuk hasil digitasi sebuah buku, rekaman video), tetapi juga punya identitas unik dan metadata. Termasuk dalam metadata ini adalah informasi tentang aturan akses, catatan kepemilikan, dan perjanjian mengenai pemakaian. Dengan kata lain, objek digital dalam pengertian ini adalah objek yang punya aspek hukum dan ekonomi, selain aspek teknis dan fisik. Dalam konteks preservasi, sebuah objek digital merupakan salah satu dari 5 entitas yang menjadi bagian utama dari kegiatan preservasi digital (digital preservation activities)[1], yang perlu dicatat sebagai bagian dari metadata preservasi.

Kelima entitas itu adalah: Entitas Intelektual (Intellectual Entity), Obyek (Objects), Kejadian (Events), Hak (Rights), dan Agen (Agents). Di gambar model di bawah, entitas-entitas ini terlihat sebagai kotak-kotak, sementara hubungan atau relasi di antara mereka diperlihatkan dalam bentuk garis. Tanda panah menandai arah kaitan hubungan atau relasi. Misalnya, tanda panah dari Hak menuju Agen berarti bahwa metadata untuk Hak mencakup di dalamnya unit semantik yang mengidentifikasi Agen. Kalau ada dua tanda panah bolak-balik, berarti ada relasi bolak-balik antara keduanya.

Image:OD.jpg

Keterangan selanjutnya dari masing-masing entitas itu adalah sebagai berikut:
• Objek (Object), atau disebut juga Digital Object, merupakan sebuah unit informasi yang berdiri sendiri dalam bentuk digital.
• Entitas Intelektual (Intellectual Entity) adalah serangkaian isi yang padu, dan yang dapat dianggap sebagai sebuah unit. Misalnya, sebuah buku, peta, foto, atau sebuah pangkalan data. Sebuah Entitas Intelektual dapat mengandung atau terdiri dari beberapa entitas intelektual. Misalnya, sebuah situs Web mengandung halaman Web, dan sebuah halaman Web mengandung sebuah foto. Sebuah Entitas Intelektual juga dapat mengandung lebih dari satu representasi atau bentuk digital.

• Kejadian (Event) adalah sebuah tindakan atau kegiatan yang melibatkan atau mengenai setidaknya satu objek atau agen yang ada di tempat preservasi.
• Agen (Agent) adalah seseorang, atau sebuah organisasi, atau sebuah perangkat lunak yang berkaitan dengan usaha atau kegiatan-kegiatan preservasi di daur hidup sebuah obyek.
• Hak (Rights), atau disebut juga Rights Statements, adalah pernyataan tentang adanya satu atau beberapa hak atau ijin yang berkaitan dengan penggunaan sebuah Obyek dan/atau sebuah Agen. Di antara ke lima entitas di atas, dapat terjadi relasi (relationship) yang berupa sebuah pernyataan tentang kaitan antara beberapa entitas. Dalam model PREMIS, relasi ini dipakai untuk menggambarkan asosiasi antara dua atau lebih Objek, atau antara dua entitas yang berbeda (misalnya antara Objek dan Agen). Sebuah Objek Digital memiliki tiga komponen penting yang disebut subtypes: yaitu file, bitstream, dan representation. Penjelasan ringkasnya adalah sebagai berikut:
• Sebuah file (berkas) adalah serangkaian bytes yang memiliki nama dan dikenali oleh operating system. Sebuah file bisa berukuran 0 byte atau lebih dan memiliki format, ijin akses, dan informasi statistik, misalnya besaran (size) dan tanggal terakhir diubah (last modification date).
• Sedangkan bitstream adalah data dalam suatu file baik yang berdampingan maupun yang tidak berdampingan (contiguous atau non-contiguous). Data ini memiliki ciri dan karakter (property) yang sama untuk kepentingan preservasi. Sebuah bitstream tidak dapat diubah menjadi file yang berdiri sendiri, kecuali kalau diubah strukturnya atau dilakukan format ulang (reformatting).
• Sebuah representation adalah serangkaian files, termasuk di dalamnya metadata struktural, yang diperlukan untuk interpretasi (rendition) sebuah Entitas Intelektual.

 

Misalnya, sebuah artikel jurnal mungkin terdiri dari satu berkas PDF saja, sehingga berkas tunggal ini saja sudah menjadi representation. Tetapi ada artikel jurnal lain yang mungkin terdiri dari satu berkas SGML dan dua berkas gambar. Maka ada tiga berkas yang bersama-sama menjadi representation. Lalu ada juga artikel lain yang representasinya berupa 12 berkas TIFF dan satu berkas XML sebagai metadata strukturalnya. Dalam hal ini 13 berkas itulah yang merupakan representation. Sebuah file dalam model data PREMIS sama saja dengan berkas komputer (computer file) dalam pengertian sehari-hari: yaitu serangkaian bytes yang berjumlah 0 atau lebih yang dikenali oleh sebuah operating system. Sebuah berkas dapat dibaca, ditulis, dan disalin. Setiap berkas juga punya nama dan format. Tetapi bitstream di dalam model data PREMIS adalah “a set of bits embedded within a file” (serangkaian bits yang tertanam di dalam satu berkas). Ini agak berbeda dari artian sehari-hari di bidang komputer, karena dalam bidang ini bitstream secara teoritis dapat berada di lebih dari satu berkas. Contoh paling bagus tentang bitstreams yang tertanam di sebuah berkas adalah satu berkas TIFF yang mengandung gambar (images).

Menurut spesifikasi format TIFF, sebuah berkas harus mengandung header yang berisi informasi tentang berkas itu. Mungkin saja berkas itu mengandung satu atau lebih gambar. Di dalam model data PREMIS setiap gambar merupakan bitstream dan setiap bitstream dapat memiliki properti sendiri seperti identifiers, lokasi, inhibitors, dan rincian teknis (mis: rentang warna atau color space). Ada bitstreams yang memiliki properti serupa dengan berkasnya, tetapi ada juga yang tidak. Gambar-gambar yang berada di dalam berkas TIFF jelas memiliki properti berbeda dari berkas itu sendiri. Namun, ada juga contoh ketika tiga berkas TIFF dapat digabung dalam satu tar file yang lebih besar. Dalam hal ini maka ketiga berkas TIFF tersebut dianggap bitstreams, tetapi masing-masingnya punya properti TIFF sendiri-sendiri. Dalam model data PREMIS, definisi bitstream menjadi lebih spesifik karena hanya merujuk ke embedded bitstream (bitstream yang tertanam di dalam berkas) yang tidak dapat diubah menjadi berkas tersendiri, kecuali jika strukturnya diubah (misalnya diberi headers baru) atau jika dilakukan format ulang agar menjadi berkas lain. Contoh bitstreams yang demikian adalah gambar di dalam berkas TIFF 6.0, data audio di dalam berkas WAVE, atau gambar di dalam berkas Microsoft Word. <p style=”text-align: justify;”> Semua adalah embedded bitstreams yang dapat diubah menjadi berkas sendiri-sendiri tanpa menambahkan apa-apa, walaupun diperlukan proses ‘pencabutan’ atau ekstrasi, dan dalam proses ekstrasi ini perlu ada transformasi berupa decompression, decryption, atau decoding. Misalnya, jika ingin memasukkan TIFF ke dalam sebuah tar file, atau EPS ke dalam berkas XML. Dalam model data PREMIS maka bitstreams seperti ini dikatakan sebagai “filestreams” atau sebenarnya adalah “true files embedded within larger files” (berkas yang tertanam di berkas lain). Filestreams memiliki properti sebagaimana semua berkas lainnya, sementara bitstreams tidak punya properti itu. Di dalam Data Dictionary, kolom untuk “File” berlaku untuk berkas biasa dan filestreams. Kolom untuk “Bitstream” berlaku untuk bitstreams yang bukan filestreams dan yang sesuai dengan pengertian sempit dari PREMIS. Sedangkan lokasi (contentLocation) sebuah berkas biasanya adalah lokasi penyimpanan (storage), sementara lokasi filestream atau bitstream biasanya adalah awal informasi di dalam sebuah berkas. Tujuan utama dari penyimpanan untuk preservasi adalah mempertahankan usable versions dari Entitas Intelektual sepanjang waktu. Agar sebuah Entitas Intelektual dapat ditampilkan, dimainkan, atau digunakan oleh manusia, semua berkas yang menjadi bagian dari Entitas Intelektual itu harus dapat diidentifikasi, disimpan, dan dipelihara, sedemikian rupa sehingga berkas-berkas tersebut dapat dirakit dan digunakan (rendered) bagi pengguna ketika dibutuhkan.

Dalam konteks inilah maka sebuah representation merupakan serangkaian berkas yang diperlukan untuk memungkinkan semua ini terjadi. PREMIS menggunakan istilah “representation” untuk menghindari penggunaan istilah “manifestation” sebagaimana yang digunakan dalam FRBR. Dalam FRBR, sebuah entitas manifestation adalah “all the physical objects that bear the same characteristics in respect to both intellectual content and physical form.” (semua objek fisik yang memiliki karakteristik serupa baik dalam hal isi intelektual maupun bentuk fisiknya). Dalam model PREMIS, sebuah representation merupakan a single digital instance of an intellectual entity held in a preservation repository (sebuah perwujudan atau keberadaan digital tunggal dari entitas intelektual yang tersimpan dalam sebuah tempat preservasi). <p style=”text-align: justify;”> Sebuah tempat preservasi mungkin saja menyimpan lebih dari satu representation untuk satu entitas intelektual yang sama. Misalnya, sebuah organisasi preservasi mungkin memperoleh sebuah gambar tunggal (mis. “patung seekor kuda”) dalam bentuk berkas TIFF. Di suatu masa, organisasi tersebut membuat sebuah turunan berupa berkas JPEG2000 dari berkas TIFF itu, dan kini kedua berkas disimpan untuk keperluan preservasi. Masing-masing dari berkas ini merupakan representation dari “patung seekor kuda”. Bisa menjadi lebih rumit lagi jika “patung seekor kuda” adalah bagian dari sebuah artikel yang mengandung gambar TIFF tadi, ditambah dengan berkas teks SGML. Jika organisasi yang bersangkutan membuat versi JPEG2000 dari gambar TIFF, maka bagian preservasi akan memiliki dua representations dari artikel tersebut, yaitu:

gambar TIFF dan teks SGML sebagai satu representation, sementara gambar JPEG2000 dan teks SGML adalah representation yang lainnya. Bagaimana kedua representation ini disimpan, merupakan persoalan teknis. Sebuah bagian preservasi mungkin menyimpan satu berkas SGML yang kemudian dijadikan bagian dari dua representation. Atau, bisa juga dibuat duplikasi dari berkas SGML sehingga kini ada dua berkas SGML. Masing-masing representasi kemudian terdiri dari berkas TIFF dan SGMLcopy 1, dan JPEG2000 dan SGML copy 2. Tidak semua institusi yang melakukan preservasi peduli tentang representation. Ini terjadi misalnya, jika sebuah lembaga penyimpanan memilih melakukan preservasi objek-objek (atau berkas) saja dan menggunakan agen eksternal (misalnya sebuah perangkat lunak) untuk merakit objek-objek tersebut agar dapat dimanfaatkan oleh pengguna.

Jika sebuah badan penyimpanan tidak mengelola representation, maka tidak diperlukan rekaman metadata tentang representasi itu. Dengan menggunakan berbagai definisi dan pengertian di atas, relasi antara Entitas Intelektual dan Objek dapat digambarkan dengan beberapa contoh berikut:

 

Contoh 1, Animal Antics: Sebuah buku berjudul Animal Antics diterbitkan tahun 1902. Lalu sebuah perpustakaan membuat versi digital dari Animal Antics, yaitu dengan membuat satu berkas TIFF untuk setiap halaman yang berjumlah 189 itu. Sebagai metadata strukturalnya, dibuatlah berkas XML yang akan memberitahu komputer bagaimana ke-189 berkas tersebut dapat dilihat sebagai rangkaian halaman yang membentuk satu buku lengkap. Perpustakaan kemudian melakukan kegiatan pemindaian karakter (Optical Character Reading alias OCR) terhadap semua berkas TIFF, sehingga terciptalah sebuah berkas besar berisi teks yang kemudian di-markup dengan SGML. Maka sekarang perpustakaan itu menyimpan berbagai objek digital, yaitu:
• 189 berkas TIFF,
• satu berkas XML, dan
• satu berkas SGML berisi teks hasil pemindaian. Dari sisi pandang preservasi, maka Animal Antics adalah sebuah Intellectual Entity, sebab ia merupakan sebuah unit yang dapat digambarkan sebagai satu kesatuan, lengkap dengan properti seperti pengarang, judul, dan tanggal publikasi. Selain itu, bagian penyimpanan memiliki dua representation. Pertama, terdiri dari 189 berkas TIFF dan sebuah berkas XML. Kedua, sebuah berkas SGML. Masing-masing representation dapat dianggap dan digunakan sebagai sebuah versi lengkap dari Animal Antics, walaupun mungkin untuk fungsi yang berbeda. <p style=”text-align: justify;”> Bagian preservasi lalu perlu memiliki metadata tentang:

• 2 objek representation dan
• 191 objek digital (189 berkas TIFF + 1 berjas XML + 1 berkas SGML). Contoh 2, Welcome to U: Sebuah video Welcome to U diserahkan ke bagian preservasi dalam bentuk AVI (Audio Video Interleaved), berisi film berdurasi 10 menit yang memperkenalkan kehidupan kampus kepada para mahasiswa baru. Dalam hal ini Welcome to U adalah sebuah Entitas Intelektual. Bagian preservasi menyimpan satu representasi yang terdiri dari satu berkas AVI. Kalau strategi preservasinya memerlukan pemisahan antara suara dan gambar, maka diperlukan metadata tentang satu objek representasi (Welcome to U), satu objek berupa berkas (AVI file), dan dua bitstream (audio bitstream dan video bitstream).
________________________________________ [1] Sebagaimana dirumuskan oleh Preservation Metadata: Implementation Strategies (PREMIS), sebuah kelompok kerja yang disponsori oleh OCLC dan RLG (lihat: www.oclc.org/research/projects/pmwg/ )