Silakan dikerjakan PR berikut ini, waktunya 1 minggu.
TUGAS 5
KULIAH
INFORMATION RETRIEVAL
Dosen :
Surya Agustian, S.T., M.Kom.
Dikerjakan
oleh setiap mahasiswa secara pribadi, setiap mahasiswa melakukan analisis
sendiri-sendiri. Dikumpulkan hari: Senin, 18 Juni 2012, maksimal jam 13:00 WIB
(untuk kelas Pil A & B)
1. Gunakan salah satu search engine yang biasa anda
pakai untuk query expansion (perluasan kueri) menggunakan 1 dan 4 sinonim kata.
a.
Lakukan pencarian terhadap kueri : potong gaji
Perhatikan hasil pencariannya, capture dan catat tingkat relevansinya
dengan topik/masalah pencarian tersebut
b.
Tambahkan masing-masing kata dengan satu
padanan kata pada kueri di atas. Gunakan kamus thesaurus: http://www.sinonimkata.com
Lakukan analisa yang
sama dengan point a.
c.
Ulang lagi pencarian dengan menambahkan 1 sinonim
kata pada kueri di atas pada masing-masing kata (total kata pada kueri 4 kata),
analisa kembali
d.
Ulang lagi pencarian dengan menambahkan 4 sinonim
kata pada kueri di atas pada masing-masing kata (total kata pada kueri 10
kata), analisa kembali
e.
Apa kesimpulan anda atas penambahan kueri pada
hasil pencarian di atas?
2. Dari dokumen di bawah ini:
Dok1 Gedung uin sukajadi selalu bermasalah karena gedung tua
yang tidak terawat.
Dok2 Penganugerahan gelar doktor honoris
causa di kampus uin suska riau dijaga ketat oleh polisi, karena dihadiri oleh gubernur riau
dan pejabat dari negara serumpun.
Dok3 Kunjungan pejabat menteri
perindustrian ke uin malang mendapat tanggapan positif dari segenap civitas
akademika.
Dok4 UIN suska riau memiliki gedung-gedung yang modern dan arsitektur
yang indah.
Lakukan proses indexing menggunakan stemming dengan TF IDF, kemudian cari dokumen yang relevan dengan metode ruang vector untuk kueri :
Lakukan proses indexing menggunakan stemming dengan TF IDF, kemudian cari dokumen yang relevan dengan metode ruang vector untuk kueri :
a.
- Pejabat uin malang berkunjung ke riau
- Gedung uin diresmikan menteri
- Urutkan dari dokumen yang paling relevan sampai tidak relevan berdasarkan nilai similarity nya.
- Bandingkan bila tidak melakukan normalisasi, hitung similarity antara dokumen dan kueri. Bagaimana urutan hasil pencariannya ?
- Apa kesimpulan anda dari kedua cara perhitungan di atas (dengan normalisasi dan tanpa normalisasi) ?
No comments:
Post a Comment