Sunday, June 10, 2012

PR 5 Kuliah Information Retrieval

Kepada mahasiswa yang budiman,

Silakan dikerjakan PR berikut ini, waktunya 1 minggu.


TUGAS 5
KULIAH INFORMATION RETRIEVAL
Dosen : Surya Agustian, S.T., M.Kom.

Dikerjakan oleh setiap mahasiswa secara pribadi, setiap mahasiswa melakukan analisis sendiri-sendiri. Dikumpulkan hari: Senin, 18 Juni 2012, maksimal jam 13:00 WIB (untuk kelas Pil A & B)

1.    Gunakan salah satu search engine yang biasa anda pakai untuk query expansion (perluasan kueri)  menggunakan 1 dan 4 sinonim kata.
a.       Lakukan pencarian terhadap kueri : potong gaji
Perhatikan hasil pencariannya, capture dan catat tingkat relevansinya dengan topik/masalah pencarian tersebut
b.      Tambahkan masing-masing kata dengan satu padanan kata pada kueri di atas. Gunakan kamus thesaurus:  http://www.sinonimkata.com
Lakukan analisa yang sama dengan point a.
c.       Ulang lagi pencarian dengan menambahkan 1 sinonim kata pada kueri di atas pada masing-masing kata (total kata pada kueri 4 kata), analisa kembali
d.      Ulang lagi pencarian dengan menambahkan 4 sinonim kata pada kueri di atas pada masing-masing kata (total kata pada kueri 10 kata), analisa kembali
e.      Apa kesimpulan anda atas penambahan kueri pada hasil pencarian di atas?

2.   Dari dokumen di bawah ini:
Dok1              Gedung uin sukajadi selalu bermasalah karena gedung tua yang tidak terawat.
Dok2              Penganugerahan gelar doktor honoris causa di kampus uin suska riau dijaga ketat oleh  polisi, karena dihadiri oleh gubernur riau dan pejabat dari negara serumpun.
Dok3              Kunjungan pejabat menteri perindustrian ke uin malang mendapat tanggapan positif dari segenap civitas akademika.
Dok4              UIN suska riau memiliki gedung-gedung yang modern dan arsitektur yang indah.

Lakukan proses indexing menggunakan stemming dengan TF IDF, kemudian cari dokumen yang relevan dengan metode ruang vector untuk kueri :
a.
  • Pejabat uin malang berkunjung ke riau
  • Gedung uin diresmikan menteri
  1. Urutkan dari dokumen yang paling relevan sampai tidak relevan berdasarkan nilai similarity nya.
  2. Bandingkan bila tidak melakukan normalisasi,  hitung similarity antara dokumen dan kueri. Bagaimana urutan hasil pencariannya ?
  3. Apa kesimpulan anda dari kedua cara perhitungan di atas (dengan normalisasi dan tanpa normalisasi) ?

No comments:

Post a Comment