21 Des 2011

Thesaurus Untuk Temu Kembali Informasi

Definisi dan Makna Thesaurus


            Thesaurus berasal dari bahasa Yunani dan Latin yang berarti “sebuah himpunan yang berharga” atau lebih spesifik lagi "sebuah kekayaan" (treasury). Selama berabad-abad kata thesaurus dipakai untuk merujuk ke kata “lexicon” atau “treasury of words” alias himpunan kata-kata yang tentunya dianggap sangat berharga.
            Pemakaian modern dimulai tahun 1852, di edisi pertama sebuah buku berjudul amat panjang: Thesaurus of English Words and Phrases : classified and arranged so as to facilitate the expression of ideas an to assist in literacy composition diterbitkan oleh Peter Mark Roget. Inilah thesaurus yang dianggap paling konsisten dan selalu diperbarui sampai sekarang. Mudah dilihat, thesaurus sangat berkaitan dengan linguistik dan perhatian masyarakat terhadap bahasa mereka. Tidaklah sebuah kebetulan bahwa thesaurus moderen lahir di Inggris, negara yang bahasanya kini menjadi bahasa internasional.
            Kehadiran thesaurus pada sebuah bangsa berkaitan dengan keseriusan bangsa itu menggunakan kata dan memberlakukan bahasa mereka. Keseriusan tersebut terwujud dalam bentuk upaya memastikan bahwa setiap kata dipakai dengan benar dan setiap kata yang benar berhubungan dengan kata lain dengan benar pula.
            Menurut Fungsi dan kegunaan thesaurus terletak pada struktur yang mengaitkan satu konsep dengan konsep lainnya melalui berbagai hirarki dan maknanya. Di dalam definisi yang dibuat oleh World Science Information System of Unesco (UNISIST) sebagaimana dikutip oleh Foskett (1997) terungkap bahwa: Sebuah thesaurus dapat didefinisikan baik dari segi fungsi maupun strukturnya.
  1. Dari segi fungsi, sebuah thesaurus adalah alat pengendali terminologi yang digunakan dalam penerjemahan dari bahasa alamiah di dalam dokumen, indeks, atau pengguna menjadi sebuah “bahasa sistem” (bahasa dokumentasi, bahasa informasi) yang lebih terbatas.
  2. Dari segi struktur, sebuah thesaurus adalah kosa kata yang terkendali tetapi dinamis, berisi istilah-istilah yang secara semantik dan generik saling terkait dalam lingkup sebuah bidang pengetahuan tertentu.
            Dari penyataan diatas dapat di simpulkan bahwa Thesaurus adalah himpunan kata-kata terkendali yang berhubungan satu sama lain secara semantik dan hierarkis, yang dapat dipergunakan untuk menterjemahkan bahasa sehari-hari ke dalam bahasa indeks dalam bidang ilmu pengetahuan tertentu. Thesaurus dipergunakan secara luas untuk mengendalikan kosa kata (vocabulary control) dalam sistem terkoordinasi, kemudian menggunakan sistem komputerisasi dan sistem “Pre –coordinate”.

Manfaat Thesaurus

Ada beberapa manfaat dari Thesaurus diantaranya adalah:
  1. Menyediakan sebuah kosakata yang berstandar untuk bidang tertentu, sehingga para pengindeks (manusia) dapat secara konsisten menetapkan istilah yang akan dipakai sebagai indeks.
  2. Menjadi sebuah panduan bagi pengguna sistem informasi ketika memilih istilah untuk digunakan dalam pencarian berdasarkan subjek.
  3. Menjadi sumber bagi istilah-istilah yang sudah terstandardisasi di bidang pengetahuan tertentu.
  4. Menyediakan hirarki berkelas sehingga sebuah proses pencarian dapat diperluas atau dipersempit.

Peran Thesaurus dalam Pengelolaan Informasi

Dalam kaitanya dengan pengelolaan informasi, Thesaurus berperan penting di dalamnya diantaranya:
  1. Sebagai  sarana temu kembali informasi yang berbasis komputer.
  2. Sebagai pedoman dalam mengolah dokumen seperti pembuatan indeks dan penentuan tajuk.
  3. Mempermudah dalam mengelola data yang telah ada.
  4. Mempercepat diketemukannya informasi yang di cari.


Algoritma Thesaurus

Dalam ditemukannya data oleh thesaurus tidak begitu saja ditemukan. Ini menggunakan algoritma tertentu dan algoritma yang digunakann adalah algoritma stemming.

Algoritma Stemming
Algoritma ini didahului dengan pembacaan tiap kata dari file sampel. Sehingga input dari algoritma ini adalah sebuah kata yang kemudian dilakukan: 

1. Pemeriksaan semua kemungkinan bentuk kata. Setiap kata diasumsikan memiliki 2 awalan / prefiks dan 3 akhiran / sufiks. Sehingga bentuknya menjadi :
Prefiks 1 + Prefiks 2 + Kata Dasar + Sufiks 3 + Sufiks 2+ Sufiks 1
Seandainya kata tersebut tidak memiliki imbuhan sebanyak imbuhan di atas, maka imbuhan yangkosong  diberi tanda x untuk prefiks dan diberi tanda xx untuk sufiks. Untuk mewujudkannya maka dibuatlah struktur data untuk menampung setiap kata yang bentuknya sebagai berikut : 
enum awalan_t {AwalanError=0,x, 
     me, pe, be, di, se, ke, te, 
     mem=100, men, per, pem, ber, ter,
pen, 
    ber_luluh, ter_luluh, per_luluh, 
     mem_luluh, pem_luluh, men_luluh,
pen_luluh, meny=200, peny, meng, 
     meng_luluh, peng_luluh, peng 
    }; 
enum akhiran_t {AkhiranError=0, i, kan, an, ku, mu, lah, pun,  nya, kah, xx}; 
struct arrkata_t {
 enum awalan_t p1,p2;
 char kd[30];
 enum akhiran_t s3,s2,s1; 
 };

2. Dengan struktur data di atas, maka langkah awal pemotongan bisa dari mana saja. Dalam hal ini pemotongan dilakukan secara berurutan sebagai berikut :
 a. Awalan I, hasilnya disimpan pada p1 
b. Awalan II, hasilnya disimpan pada p2 
c. Akhiran I, hasilnya disimpan pada s1 
d. Akhiran II, hasilnya disimpan pada s2 
e. Akhiran III, hasilnya disimpan pada s3 
Pada setiap tahap pemotongan di atas diikuti dengan pemeriksaan di kamus apakah hasil pemotongan itu sudah berada dalam bentuk dasar. Kalau pemeriksaan ini berhasil maka proses dinyatakan selesai dan tidak perlu melanjutkan proses pemotongan imbuhan lainnya.

3.  Namun jika sampai pada pemotongan akhiran III, belum juga ditemukan di kamus, maka dilakukan proses kombinasi. Kata dasar yang dihasilkan dikombinasikan dengan imbuhanimbuhannya dalam 12 konfigurasi berikut :
 a. Kata Dasar
 b. Kata Dasar + Akhiran III
 c. Kata Dasar + Akhiran III + Akhiran II
 d. Kata Dasar + Akhiran III + Akhiran II + Akhiran I
 e. Awalan I + Awalan II + Kata Dasar
 f. Awalan I + Awalan II + Kata Dasar + Akhiran III
 g. Awalan I + Awalan II + Kata Dasar + Akhiran III + Akhiran II
 h. Awalan I + Awalan II + Kata Dasar + Akhiran III + AkhiranII + AkhiranI
 i. Awalan II + Kata Dasar
 j. Awalan II + Kata Dasar + Akhiran III
 k. Awalan II + Kata Dasar + Akhiran III + Akhiran II 3  
 l. Awalan II + Kata Dasar + Akhiran III + Akhiran II + Akhiran I


Daftar pustaka

Previous
Next Post »

Posting Komentar

Silahkan memberikan Komentar untuk kritik dan saran pada kolom dibawah ini