Monday, March 13, 2017

Watashi wa Tookoodai no ryugakusei desu (#1)

First Impression of Japan

Alhamdulillah, sudah sebulan menjadi mahasiswa lagi. Di kampus Tokyo Kogyo Daigaku (Tokodai), atau dalam bahasa Inggris: Tokyo Institute of Technology, kampus institut teknologi negeri di Jepang.

Menjadi mahasiswa Ph.D di kampus ini, didahului dengan beberapa persiapan yang cukup panjang dan matang. Mungkin satu hal yang tidak sempat saya persiapkan adalah: belajar bahasa Jepang.

Menarikkah kuliah di kampus ini? Saya belum bisa cerita banyak. Tapi dari kelas bahasa Jepang intensif yang saya ikuti :... I like it.

Untuk menumbuhkan minat anda untuk belajar ke negeri Sakura, akan saya share beberapa nilai plusnya.

Pelayanan administratif di Jepang yang berorientasi pelanggan. 

Sejak datang di Bandara (Imigrasi), menaiki moda transportasi (bus atau kereta), sampai kepada pelayanan administrasi di kampus dan kantor lurah (Ward Office) dan bank, sangat mengutamakan "Pelayanan Prima" bagi masyarakat yang dilayani. Termasuk kepada orang-orang Indonesia. (Jadi lupa kalau nenek kakek kita pernah dijajah mereka). Customer satisfaction. Mulai dari petugas imigrasi, sangat ramah melayani proses kedatangan di Jepang.

Kebersihan lingkungan sangat diperhatikan. 

Sampah dipisahkan antara yang bisa didaur ulang, dan sampah yang dibakar/sampah rumah tangga. Sampah berbahaya juga dibuang dengan cara dibungkus yang rapi sehingga tidak membahayakan orang lain, seperti pecahan kaca, logam. Buku/majalah bekas yang akan dibuang, diikat yang rapi. Botol air mineral dipisahkan tersendiri, dan juga kaleng minuman atau kotak minuman. Pengangkutan sampah terjadwal, jenis sampah diangkut sesuai dengan harinya, misalnya senin sampah plastik, selasa sampah kaleng, dst. Cari tong sampah umum di sini.... susah.  Di stasiun aja tidak ada. Tapi tidak tampak sampah berserakan.

Antri dengan tertib


Budaya antri dan tidak menyerobot, diamalkan di setiap tempat. Antri naik bis, naik kereta, bayar kasir di supermarket, kantin, bank, bahkan antri untuk mendapatkan taksi ketika larut malam setelah turun dari kereta. Mendahulukan yang keluar, seperti mau masuk kereta atau lift. Mobil antri di lampu merah atau zebra cross, mendahulukan pejalan kaki. Berhenti di belakang garis stop, walaupun jaraknya jauh dari posisi lampu merah. Antri di super market atau peron kereta pun, sudah ada garis batas antriannya.

Tidak mau menyusahkan/mengganggu orang lain.

Misalnya di kereta, tidak mau menyenggol maupun tersenggol orang lain. Kalau kita tidak sengaja menyenggol orang lain, maka dia akan bergeser tempat, mungkin menganggap tempat kita terlalu sempit sehingga butuh ruang tambahan, maka dia yang bergeser. Mungkin terlihat seperti paham individualistis, tidak mau bersinggungan dengan orang lain.

Suka membantu sampai beres urusan.

Kalau dimintai bantuan, tidak segan-segan membantu. Ketika baru datang, saya naik bus dari bandara Haneda menuju stasiun kerta Tama Plaza. Saat sampai di pos perhentian bis, saya diminta menunggu di antrian depan posisi pintu masuk bis dan meninggalkan 2 koper yang berat-berat. Kemudian petugasnya yang mengangkat/menggeserkan koper tersebut ke pinggir jalan di posisi bagasi bis. Sampai di Tama Plaza, saya bingung mau naik kereta, di mana beli tiketnya, dan di mana pintu masuk stasiunnya. Waktu itu masih pagi hari, kira-kira jam 6.05 waktu Jepang. Saya masuk ke ruangan tempat mesin yang menjual karcis. Tapi saya bingung karena tulisan "pagar rusak" semua. Dan ada pilihan tujuan beserta angkanya. Tambah bingung lagi, kenapa di atas 1000 Yen, padahal menurut petunjuk yang dikirim oleh pihak kampus, dari stasiun tersebut ke stasiun tujuan saya (terdekat dengan asrama mahasiswa) cuma sekitar 100-200 yen. Kemudian saya bertanya kepada 2 orang gadis yang kebetulan mungkin akan pergi sekolah (perkiraannya bisa bahasa Inggris). Ternyata orang jepang banyak yang tidak bisa bahasa Inggris.

Sunday, June 17, 2012

PR 6 (terakhir) Kuliah IR

Kepada Mahasiswa peserta IR yang budiman
silakan dikerjakan PR terakhir berikut, semoga bisa menambah pemahaman terhadap bahan kuliah, dan juga persiapan untuk UAS.


TUGAS 6
KULIAH INFORMATION RETRIEVAL
Dosen : Surya Agustian, S.T., M.Kom.

Dikerjakan oleh setiap mahasiswa secara pribadi, setiap mahasiswa melakukan analisis sendiri-sendiri. Dikumpulkan hari: Kamis, 21 Mei 2012, Sebelum UAS dimulai.

1.       Gunakan salah satu search engine yang biasa anda pakai,  untuk pengujian CLIR (cross language IR)  menggunakan terjemahan dari google translate. Kita akan mencari topik dalam bahasa Indonesia dengan kueri bahasa Inggris dan bahasa Indonesia.
a.       Lakukan pencarian terhadap kueri pendek bahasa Inggris (yang diterjemahkan ke bahasa Indonesia) dan Indonesia berikut ini:
English : Information retrieval (terjemahkan terlebih dahulu)
Indonesia: temu kembali informasi
Perhatikan hasil pencarian kedua kueri, capture hasil pencariannya, dan catat tingkat relevansinya dengan topik/masalah pencarian tersebut pada halaman 1 hasil pencarian saja. (penentuan relevan atau tidak sangat subjektif, tuliskan alasan anda menyatakan ia relevan atau tidak relevan)
b.      Bandingkan hasil pencarian (precision dan recall) menggunakan kueri berbahasa Indonesia, dan kueri hasil terjemahan bahasa Indonesia dari bahasa Inggris di atas.
c.       Perbandingan dibuat dalam bentuk grafik precision terhadap recall pada 10 titik.
d.      Apakah kesimpulan anda tentang penggunaan kueri pendek dalam CLIR di atas? Mana yang lebih baik menggunakan kueri bahasa Indonesia atau kueri bahasa Inggris yang diterjemahkan ke dalam bahasa Indonesia untuk koleksi dokumen berbahasa Indonesia?

2.       Lakukan pengujian kueri panjang untuk pengujian CLIR (cross language IR)  menggunakan terjemahan dari google translate seperti soal nomor 1, untuk topik berikut:
English : number one information retrieval machine in the world  (terjemahkan terlebih dahulu)
Indonesia: mesin temu kembali informasi nomor satu di dunia
Buat analisa seperti soal nomor 1.

Sunday, June 10, 2012

PR 5 Kuliah Information Retrieval

Kepada mahasiswa yang budiman,

Silakan dikerjakan PR berikut ini, waktunya 1 minggu.


TUGAS 5
KULIAH INFORMATION RETRIEVAL
Dosen : Surya Agustian, S.T., M.Kom.

Dikerjakan oleh setiap mahasiswa secara pribadi, setiap mahasiswa melakukan analisis sendiri-sendiri. Dikumpulkan hari: Senin, 18 Juni 2012, maksimal jam 13:00 WIB (untuk kelas Pil A & B)

1.    Gunakan salah satu search engine yang biasa anda pakai untuk query expansion (perluasan kueri)  menggunakan 1 dan 4 sinonim kata.
a.       Lakukan pencarian terhadap kueri : potong gaji
Perhatikan hasil pencariannya, capture dan catat tingkat relevansinya dengan topik/masalah pencarian tersebut
b.      Tambahkan masing-masing kata dengan satu padanan kata pada kueri di atas. Gunakan kamus thesaurus:  http://www.sinonimkata.com
Lakukan analisa yang sama dengan point a.
c.       Ulang lagi pencarian dengan menambahkan 1 sinonim kata pada kueri di atas pada masing-masing kata (total kata pada kueri 4 kata), analisa kembali
d.      Ulang lagi pencarian dengan menambahkan 4 sinonim kata pada kueri di atas pada masing-masing kata (total kata pada kueri 10 kata), analisa kembali
e.      Apa kesimpulan anda atas penambahan kueri pada hasil pencarian di atas?

2.   Dari dokumen di bawah ini:
Dok1              Gedung uin sukajadi selalu bermasalah karena gedung tua yang tidak terawat.
Dok2              Penganugerahan gelar doktor honoris causa di kampus uin suska riau dijaga ketat oleh  polisi, karena dihadiri oleh gubernur riau dan pejabat dari negara serumpun.
Dok3              Kunjungan pejabat menteri perindustrian ke uin malang mendapat tanggapan positif dari segenap civitas akademika.
Dok4              UIN suska riau memiliki gedung-gedung yang modern dan arsitektur yang indah.

Lakukan proses indexing menggunakan stemming dengan TF IDF, kemudian cari dokumen yang relevan dengan metode ruang vector untuk kueri :
a.
  • Pejabat uin malang berkunjung ke riau
  • Gedung uin diresmikan menteri
  1. Urutkan dari dokumen yang paling relevan sampai tidak relevan berdasarkan nilai similarity nya.
  2. Bandingkan bila tidak melakukan normalisasi,  hitung similarity antara dokumen dan kueri. Bagaimana urutan hasil pencariannya ?
  3. Apa kesimpulan anda dari kedua cara perhitungan di atas (dengan normalisasi dan tanpa normalisasi) ?

Tuesday, June 5, 2012

Mesin IR: Information Retrieval atau Search Engine

Untuk mengakali Search Engine (SE) seperti google, yahoo, atau lebih kerennya meng-OPTIMASI Search Engine, sehingga muncul terminologi SEO : Search Engine Optimization, ada baiknya kita tahu cara kerja mesin pencari secara umum.


Introduction

Ada beberapa teknik yang digunakan oleh mesin pencari untuk menemukan dokumen yang relevan sesuai dengan kueri (kata kunci) pengguna, dan tentu saja tidak sama dengan pencarian database dengan Select ... Where ....
Semua teknik pada intinya berusaha menghitung kemiripan antara dokumen yang ditemukan terhadap kueri yang diinputkan pengguna. Pada akhirnya, teknik-teknik tersebut menentukan cara penyusunan index dari seluruh dokumen pada koleksi.

Wah, di sini kita ketemu beberapa istilah baru. Ok, sebelum membahas lebih mendalam tekniknya, kita perjelas dulu istilahnya.
  • Kueri : inputan kata kunci pencarian yang diberikan pengguna kepada mesin IR seperti google, yahoo, bing, etc
  • Indexing : proses penyusunan index dari seluruh dokumen pada koleksi, yang terdiri dari kata-kata (token)
  • Koleksi : adalah kumpulan dokumen yang disalin ke mesin IR (istilah IR-nya korpus). Misalnya Google "menjepret" seluruh halaman website yang bisa diakses umum (tanpa login terlebih dahulu) kemudian menyalinnya ke mesin IR di ruang servernya google (kira-kira total halaman internet seluruh dunia berapa Terrabyte ya?).
Cara menjepretnya gimana? tanya sama Google ... ! hehehe.
Biasanya menggunakan program robot atau crawler untuk menelusuri halaman-halaman internet,... seluruhnya, termasuk blog yang anda baca ini.
Setelah halaman dijepret dan disalin ke server Google (dokumen baru), maka proses indexing akan dilakukan kembali. Tentu saja tidak mengindeks ulang seluruhnya, tapi lebih kepada proses update index terhadap kata-kata yang ketemu pada dokumen baru tersebut.
  • Tokenisasi : proses pembentukan token dari suatu dokumen, dengan memecah dokumen menjadi kata-kata, dapat berupa array kata.
  • Retrieving : proses menemukan dokumen dari koleksi sesuai dengan kata kunci (kueri) user 
Cukup dulu istilahnya. Nah, ada 2 isitlah penting yang menjadi dasar cara kerja mesin IR atau search engine:
1. Proses Indexing
2. Proses Retrieving


Metode Sistem IR

Beberapa metode dapat melalui sub-tahap yang berbeda pada proses indexing dan retrieving. Misalnya sistem IR dengan model Boolean, yang hanya memeriksa ada atau tidak kata-kata kueri pada file index. Bila menggunakan model TF-IDF, maka proses indexing-nya pun akan sedikit berbeda. Model Probabilistik juga akan berbeda.
Perbedaan yang mencolok adalah antara model Boolean dan model statistik (TF-IDF dan probabilistik), yaitu adanya perhitungan bobot.

Ketemu lagi istilah baru:
TF-IDF, bobot, boolean. Wah kayaknya semakin informatika nanti bahasanya nih. OK, saya coba jelaskan dengan bahasa yang umum saja.

Model Boolean:
Kata-kata diberi nilai 1 bila ada pada dokumen koleksi, dan nol bila tidak ada. Jadi bisa dikatakan bobotnya adalah 0 atau 1. Meskipun beberapa usaha modifikasi bobot dilakukan untuk meningkatkan relevansi hasil pencarian.

Model Statistik:
Kata-kata diberi nilai sesuai dengan frekuensi kemunculan pada dokumen. Beberapa formulasi matematika dilakukan untuk menghitung bobot yang berbeda antara kata yang penting dan kata yang tidak penting. Tentu saja mesin tidak tahu mana kata yang penting atau tidak penting. Penilaian dilakukan melalui formulasi tersebut, berdasarkan fakta bahwa:
  • suatu kata dianggap penting dalam dokumen kalau sering muncul, tetapi tidak terlalu sering. Maka term frequency (TF) yang tinggi akan lebih baik.
  • suatu kata dianggap lebih spesifik dalam dokumen, bila tidak banyak dokumen pada koleksi yang mengandung kata tersebut.Maka document frequency (DF) yang rendah akan lebih baik. Karena berlawanan, digunakanlah formulasi  'lawan' atau dalam bahasa matematika: inverse. Sehingga yang dihitung adalah IDF (inverse document frequency)
  • Selanjutnya, bobot kata dapat diformulasikan dalam bentuk perkalian atau kombinasi antara TF dan IDF.
Model statistik sederhana, bobot adalah perkalian sederhana antara TF dan IDF untuk setiap kata.
Model statistik yang lebih kompleks (probabilistik), bobot adalah perkalian atau kombinasi yang agak kompleks sedikit antara TF, IDF dan komponen probabilistik tentunya.

Beberapa search engine untuk mengindeks dokumen web juga memperhatikan kata-kata penting tidak hanya berdasarkan kemunculan atau frekuensi. Misalnya bila suatu kata pada dokumen web mengandung tag-tag khusus, seperti bold, italic, anchor text (link), dan seterusnya, ia akan diberi bobot yang lebih tinggi atau penambahan bobot di luar konteks term frequency (kemunculan kata) tadi.

Bagaimana mengurutkan dokumen dari yang paling relevan (cocok) dengan preferensi pengguna?

Bobot setiap kata pada kueri dijumlahkan, kemudian dihitung nilainya untuk semua dokumen yang mengandung kata-kata tersebut, baik sebagian maupun seluruhnya (selanjutnya saya sebut sebagai dokumen yang ditemukan).
Kemudian nilai tersebut diurutkan secara menurun (descending). Maka penjumlahan bobot yang paling besar, tentu dianggap paling relevan oleh pengguna. Itulah yang mesin IR simpulkan.


Meningkatkan Ranking Dokumen (relevansi)

Beberapa model sistem IR mengembangkan teknik pengolahan bobot yang lebih advance, tidak hanya sekedar penjumlahan bobot. Nah, ada lagi besaran yang akan dihitung, yang disebut dengan kemiripan (similarity) antara dokumen yang ditemukan dengan kueri user.
Pada umumnya, perhitungan kemiripan yang digunakan adalah model ruang vektor, setiap penjumlahan bobot kata dari dokumen-dokumen yang ditemukan dilakukan secara vektor, dengan dimensi n (atau sejumlah kata pada kueri). Penjumlahan bobot kata untuk kueri pun sama, dilakukan secara vektor.

Dalam ruang berdimensi n, maka vektor itu dapat menuju ke segala arah. (bayangkan saja dimensinya ada 3 atau vektor di dalam ruang XYZ).
Bila vektor kueri menunjuk ke arah atas tegak lurus misalnya, maka dokumen yang paling mirip dengan kueri tentu saja yang arah vektornya ke atas juga, tidak mungkin yang agak horizontal misalnya.
Nah, cara yang paling mudah, adalah hitung sudut yang dibentuk antara vektor kueri dengan vektor dokumen.
Semakin mirip, maka sudutnya akan semakin mendekati nol. Kalau dokumen sama dengan kueri, maka vektornya akan berhimpitan, atau sudutnya NOL.

Kalau sudah pakai konsep itu, maka perhitungan kemiripan dapat dilakukan dengan menggunakan rumus cosinus, dan disebutlah teknik ini dengan cosine similarity antara dokumen dengan kueri.
Kenapa cosinus (COS) ? karena cosinus kan menghitung antara kaki-kaki yang membentuk sudut. Kaki-kaki ini adalah vektor dokumen dan vektor kueri.

Kalau kata anak-anak SMA:  SINCOSTAN  = de-mi sa-mi, de-sa
de-mi (depan - miring) SIN,    sa-mi (samping - miring) COS,  de-sa (depan - samping) TAN

Apaan tuh?
Itu adalah trigonometri segitiga siku-siku, untuk menghitung sudut teta dalam SINUS, COSINUS dan TANGEN
Kalau lupa rumusnya, buka buku SMA lagi aja deh....

Setelah similarity diperoleh, maka nilai yang mendekati 1 (atau sudutnya mendekati 0) dianggap paling mirip. Jadi, kembali urutan dokumen dari yang paling relevan sampai yang tidak relevan dapat diperoleh dari mengurutkan nilai similarity antara kueri user dengan masing-masing dokumen yang ditemukan.

Selesai deh kerjaan mesin IR.


Search Engine Optimization (SEO)

Trus, apa yang bisa dilakukan untuk halaman web kita bisa paling relevan (muncul di peringkat atas) saat user memasukkan kata kunci?
Nah, langkah-langkah mengoptimasinya, ilmunya ada pada pakarSEO Ali Akbar.

Cara mudahnya adalah, pilih kata-kata penting yang kira-kira akan dicari pengguna, tentu saja topiknya adalah yang sedang kita bahas dalam web atau blog kita.
Seringlah sebutkan kata itu di dalam dokumen, tapi jangan terlalu sering (meningkatkan frekuensi).
Karena mesin pencari menambahkan bobot lain selain dari frekuensi kemunculan, maka tandai kata itu dengan tag-tag khusus, misalnya bold, italic, underline, font increase, font color, dsb.
Selain itu, karena mesin pencari juga memberi bobot lebih pada zone (istilah baru lagi), maka masukkan kata penting itu di dalam zone.


Zone

Istilah baru lagi muncul.
Zone adalah beberapa area di dalam dokumen yang penting, seperti judul dokumen (title), nama file, nama URL, alamat URI, maupun informasi meta dokumen lainnya (kalau dokumen web, berarti yang berada di dalam tag HEADER). Silakan masukkan kata penting tersebut di dalam zone tadi, maka bobotnya akan menjadi lebih tinggi, sehingga kemungkinan masuk ke halaman 1 mesin pencari semakin besar.

Silakan mencoba. semoga bermanfaat.

Bila anda merujuk blog ini untuk tulisan ilmiah, sebaiknya rujuk buku text nya: Modern Information Retrieval  (Ricardo Baeza) atau Introduction to Information Retrieval (Christopher D. Manning). Di sana bahasannya lebih lengkap, dan rumus-rumus juga ada.

Sunday, June 3, 2012

Information Retrieval - kupas yuk

Alhamdulillah, blog ini berhasil direcover...karena sudah lama mati suri tidak diupdate.

Dalam kuliah IR, dibahas mengenai teknik-teknik dasar pengolahan teks atau dokumen sehingga kita dapat menemukan suatu dokumen yang relevan sesuai dengan kata yang dicari, yang diinputkan pada kueri.

Pendahuluan dan promosi bidang IR,... silakan baca posting lainnya di blog ini. Maaf tulisan ini sempat terhenti, pas mau dilanjutkan, password lupa lagi. Maklum sudah tua.... (lihat dong foto profilnya, hehehe)

Kuliah Information Retrieval

Mungkin belum terlambat menulis mengenai topik INFORMATION RETRIEVAL, karena masa perkuliahan akan berakhir. Information Retrieval, atau dalam "bahasa" sering diterjemahkan menjadi beberapa terminologi:
  • Temu Kembali Informasi
  • Temu Balik Informasi
  • Perolehan Informasi
  • dan lainnya
Suatu keberuntungan bagi saya, pernah mengikuti kuliah Information Retrieval di Fakultas Ilmu Komputer Universitas Indonesia, karena diajarkan langsung oleh peneliti awal bidang IR di Indonesia, ibu Mirna Adriani, Ph.D., walaupun tunggang langgang mengerjakan tugas, kaki jadi kapalo kata orang Padang, bidang ini menjadi topik yang paling saya minati walaupun dari segi perolehan nilai, inilah nilai terendah yang menghias transkrip S2 saya di UI. Terima kasih banyak Ibu, dari ibu saya mendapat banyak pencerahan.Dan di lab ibu pula saya menyelesaikan tesis saya di bidang IR, dengan pembimbing pak Maruli Hisar Manurung, PhD.
Tujuan saya mengambil S2 di UI adalah untuk mencerahkan, mencari ilmu, beda dari waktu S1 dulu, yang mungkin cuma punya 1 target, lulus dan bisa kerja di perusahaan bonafid. Seandainya kesadaran ini dimiliki waktu masih S1, ....

Oleh sebab itu, saat ini saya berusaha memotivasi dan menyadarkan mahasiswa, agar jangan menyia-nyiakan waktu di S1. Agar belajar dengan benar, sehingga dapat memahami ilmu dengan mendalam. Karena kata orang bijak, ilmu itulah yang menjaga kita. Dengan ilmu kita bisa punya harta. Tapi dengan harta ilmu tidak serta merta bisa dipunya.

Coba ikuti perjuangan Lin Rong-Zong, seorang anak petani miskin di pelosok Taiwan, dengan 10 orang bersaudara, dia berhasil menjadi dokter dan akhirnya saat ini menjadi Direktur Rumah Sakit di Taiwan. Semata-mata karena kejujuran dan kegigihannya dalam belajar, walaupun serba kekurangan dan tidak punya biaya (DAAI TV).

Balik ke topik....


Sesuai dengan topiknya, mengenai informasi, porsi terbesar riset-riset di bidang ini tentu saja adalah bahasa, lebih spesifik lagi adalah tulisan atau teks.
Perkembangan selanjutnya, IR juga melingkupi bidang-bidang kajian informasi multimedia, seperti gambar (image retrieval), suara (voice/speech/music retrieval), dan video. Tidak jarang disiplin ilmu IR berkolaborasi dengan bidang ilmu lainnya, seperti soft computing, machine learning, neural network serta digital signal processing.

Perlu dicatat, kuliah IR beda sama SEO (search engine optimization). Mungkin ada beberapa orang (termasuk mahasiswa saya) menyangka bahwa dalam kuliah Information Retrieval, mereka akan diajarkan bagaimana mengakali google agar website-nya menempati urutan teratas pencarian. Maaf, anda salah masuk kuliah.

Salah satu pelajaran dasar dalam bahan kuliah Information Retrieval memang ada mempelajari cara kerja mesin pencari (search engine), termasuk melakukan simulasi atau perancangan sistem pencari, bahkan membangun software mesin pencari sebagai tugas akhir kuliah. Lebih jauh, kuliah ini juga menjelaskan cara perhitungan relevansi dokumen yang dihasilkan mesin pencari, meliputi precision (presisi, ketepatan) dan recall (seberapa banyak dokumen yang bisa dikembalikan/ditemukan). Umpan balik relevan (relevance feedback) dari pengguna juga dapat digunakan untuk meningkatkan hasil pencarian, dan ini juga tercakup dalam materi kuliah.

IR Overview

Overview dari pengembangan bidang IR selanjutnya juga disampaikan, seperti image retrieval, music retrieval, text classification, cross language IR, mesin penerjemah, mesin peringkas dokumen, deteksi plagiarisme, dan masih banyak lagi. Dan memang, kami tidak mengajarkan SEO. Kalau mau belajar SEO, mungkin bisa ikut seminarnya pakar SEO saja, Ali Akbar @pakarSEO. Silakan simak TL nya.

Karena mempelajari bahasa, pertemuan ilmiah di bidang IR pun sangat bergengsi karena bersifat multinasional. Sebutlah skala terkecil, antara Malaysia-Indonesia-Singapura, ada pertemuan rutin tahunan yang disebut MALINDO. Tingkat lebih besar, Asia Pasifik (ke Timur mencakup Jepang, Korea, ke selatan sampai di Australia, Selandia Baru, Ke Barat sampai ke India dan Pakistan, dan ke Utara termasuk Cina dan Tibet), sudah memasuki tahun ke 26, yaitu PACLIC (Pacific Asia Conference on Language Information and Computation), dan tingkat dunia seperti CLEF (Conference and Labs of Evaluation Forum), TREC (Text Retrieval Conferece) dan lainnya.

So, mari belajar Information Retrieval dengan benar, karena saat ini adalah zaman informasi, dan bidang ini senantiasa di atas daun (kalau sedang naik daun artinya baru nge-trend, bidang IR sudah lama nge-trend, cuman saat ini lebih booming lagi)... hehehe

Sunday, January 2, 2011

Contoh kueri MYSQL dalam skrip PHP

Dear students,
Berikut saya share beberapa file yang berisi dasar kueri MySQL dari tabel-tabel relasional yang telah kita bahas dan simulasikan di kelas. Silakan dicopy untuk dijalankan pada komputer masing-masing.

1. File skrip php dan capture halaman web-nya.
Jangan lupa, sebelum menjalankan skrip ini, databasenya diimport dulu melalui program phpmyadmin (akses dari Mozilla/internet explorer atau web browser lainnya ke alamat http://localhost/phpmyadmin), kemudian jalankan tools import dengan menggunakan file berikut ini:

2. File backup database dalam bentuk txt (extension file adalah .sql)
Untuk import database, jangan lupa buat dulu database dengan nama upi_si7, kemudian lakukan import database dari file di atas pada database tadi.
Bila anda membuat database dengan nama lain, maka ganti konfigurasi skrip php pada bagian host databasenya. Lihat baris berikut:

$user="root";
$password=""; //sesuaikan dengan password root pada mysql
$database="upi_si7"; //sesuaikan dengan nama database yang dibuat
$server="localhost";

Semoga bisa digunakan untuk berlatih.
terima kasih