Cara Penyelesaian dengan Teknik Boolean Retrieval Model

Cara Penyelesaian dengan Teknik Boolean Retrieval Model

APA SIH..? Boolean Retrieval Model

Boolean Retrieval Model (BRM) adalah salah satu contoh Information Retrieval yang merupakan model proses pencarian informasi dari query yang menggunakan ekspresi boolean. Dengan ekspresi boolean dengan menggunakan operator logika AND, OR dan NOT.  Sedangkan dalam menentukan hasil perhitungannya hanya berupa nilai binary (1 atau 0). Dengan hal itu, Boolean Retrieval Model (BRM) yang ada hanya dokumen relevan atau tidak sama sekali. Sehingga keunggulan dari Boolean Retrieval Model (BRM) tidak menghasilkan dokumen yang  mirip.

Dalam pengerjaan operator boolean (AND, NOT, OR) ada urutan pengerjaannya (Operator precedence). Dalam implementasinya akan memprioritaskan yang berada dalam kurung (). Didalam struktur data, Boolean merupakan sebuah tipe data yang bernilai “True” atau “False” (benar atau salah). Sehingga didalam IR, logika boolean berarti bahwa data yang di crawler sesuai atau tidak antara variable – variablenya.

Query adalah kombinasi dari indeks Boolean.
·    X AND Y  : merupakan doc yang berisi X dan Y
·    X OR Y      : merupakan dokumen yang berisi X atau Y
·    NOT X       : mewakili dokumen yang tidak mengandung X

Yuk Kita coba Studi Kasusnya biar bisa dipahami

Sebagai contoh terdapat 5 dokumen berikut ini:
udb_1.txt yang berisi text:
Tutorial pemrograman web dan basis data

udb_2.txt yang berisi text:
Mata Kuliah basis data mysql

udb_3.txt yang berisi text:
Mysql adalah basis data

udb_4.txt yang berisi text:
Kuliah sistem temu kembali informasi

udb_5.txt yang berisi text
Mata Kuliah di Teknik informatika

Membuat Indeks Model Boolean

Pertama-tama kita membuat matriks istilah yang mewakili daftar semua istilah yang berbeda dan keberadaan mereka pada setiap dokumen/file. Jika dokumen berisi kata kunci maka bernilai 1 jika tidak bernilai 0. Berikut ini matriknya:

Istilah udb_1.txt udb_2.txt udb_3.txt udb_4.txt udb_5.txt
tutorial 1 0 0 0 0
pemrograman 1 0 0 0 0
web 1 0 0 0 0
dan 1 0 0 0 0
basis 1 1 1 0 0
data 1 1 1 0 0
mata 0 1 0 0 1
kuliah 0 1 0 1 1
mysql 0 1 1 0 0
adalah 0 0 1 0 0
sistem 0 0 0 1 0
temu 0 0 0 1 0
kembali 0 0 0 1 0
informasi 0 0 0 1 0
di 0 0 0 0 1
teknik 0 0 0 0 1
informatika 0 0 0 0 1

Proses Query Boolean

Penarikan Kesimpulan

Berdasarkan hasil query di atas maka dokumen yang paling relevan adalah file udb_5.txt