Cara Penyelesaian dengan Teknik Boolean Retrieval Model
APA SIH..? Boolean Retrieval Model
Boolean Retrieval Model (BRM) adalah salah satu contoh Information Retrieval yang merupakan model proses pencarian informasi dari query yang menggunakan ekspresi boolean. Dengan ekspresi boolean dengan menggunakan operator logika AND, OR dan NOT. Sedangkan dalam menentukan hasil perhitungannya hanya berupa nilai binary (1 atau 0). Dengan hal itu, Boolean Retrieval Model (BRM) yang ada hanya dokumen relevan atau tidak sama sekali. Sehingga keunggulan dari Boolean Retrieval Model (BRM) tidak menghasilkan dokumen yang mirip.
Dalam pengerjaan operator boolean (AND, NOT, OR) ada urutan pengerjaannya (Operator precedence). Dalam implementasinya akan memprioritaskan yang berada dalam kurung (). Didalam struktur data, Boolean merupakan sebuah tipe data yang bernilai “True” atau “False” (benar atau salah). Sehingga didalam IR, logika boolean berarti bahwa data yang di crawler sesuai atau tidak antara variable – variablenya.
Query adalah kombinasi dari indeks Boolean.
· X AND Y : merupakan doc yang berisi X dan Y
· X OR Y : merupakan dokumen yang berisi X atau Y
· NOT X : mewakili dokumen yang tidak mengandung X
Yuk Kita coba Studi Kasusnya biar bisa dipahami
Sebagai contoh terdapat 5 dokumen berikut ini:
udb_1.txt yang berisi text:Tutorial pemrograman web dan basis data
udb_2.txt yang berisi text:Mata Kuliah basis data mysql
udb_3.txt yang berisi text:Mysql adalah basis data
udb_4.txt yang berisi text:Kuliah sistem temu kembali informasi
udb_5.txt yang berisi textMata Kuliah di Teknik informatika
Membuat Indeks Model Boolean
Pertama-tama kita membuat matriks istilah yang mewakili daftar semua istilah yang berbeda dan keberadaan mereka pada setiap dokumen/file. Jika dokumen berisi kata kunci maka bernilai 1 jika tidak bernilai 0. Berikut ini matriknya:
Istilah | udb_1.txt | udb_2.txt | udb_3.txt | udb_4.txt | udb_5.txt |
tutorial | 1 | 0 | 0 | 0 | 0 |
pemrograman | 1 | 0 | 0 | 0 | 0 |
web | 1 | 0 | 0 | 0 | 0 |
dan | 1 | 0 | 0 | 0 | 0 |
basis | 1 | 1 | 1 | 0 | 0 |
data | 1 | 1 | 1 | 0 | 0 |
mata | 0 | 1 | 0 | 0 | 1 |
kuliah | 0 | 1 | 0 | 1 | 1 |
mysql | 0 | 1 | 1 | 0 | 0 |
adalah | 0 | 0 | 1 | 0 | 0 |
sistem | 0 | 0 | 0 | 1 | 0 |
temu | 0 | 0 | 0 | 1 | 0 |
kembali | 0 | 0 | 0 | 1 | 0 |
informasi | 0 | 0 | 0 | 1 | 0 |
di | 0 | 0 | 0 | 0 | 1 |
teknik | 0 | 0 | 0 | 0 | 1 |
informatika | 0 | 0 | 0 | 0 | 1 |
Proses Query Boolean
Penarikan Kesimpulan
Berdasarkan hasil query di atas maka dokumen yang paling relevan adalah file udb_5.txt