Anda di halaman 1dari 2

Latar belakang Seiring dengan perkembangan teknologi informasi, maka proses dan media penyimpanan data pun semakin

berkembang. Dengan adanya personal computer (PC), seseorang dapat menyimpan, mencari dan mengolah data dengan cepat dan mudah. Data dapat disimpan di dalam PC tanpa khawatir terjadi kerusakan. Ada berbagai macam tipe data yang dapat disimpan di PC, antara lain Text File (.txt), Rich Text Format (.rtf), Portable Document File (.pdf), Word Document (.doc). Keberadaan informasi yang jumlahnya tidak terhitung serta kebutuhan manusia akan penggunaan informasi-informasi tersebut mendorong berkembangnya suatu ilmu untuk melakukan pencarian. Salah satu bentuk information retrieval yang sering digunakan adalah search engine yang memfasilitasi pengguna untuk melakukan pencarian suatu informasi dari seluruh dokumen yang ada dengan query yang dimasukkan oleh pengguna yang biasanya berupa kata-kata kunci dari informasi yang diinginkan. Salah satunya dalam kasus web milik BPPT yang bernama PortalTelusurInovasi(POTENSI) merupakanportalyangmemfasilitasipublikuntukpencarianartikelterkaitinovasi,mencakupberita nasional,artikelilmiah,industriterkait,peraturandanlainnyayangterkaitdenganinovasi.Dalamkasus POTENSI, pencarian artikel dapat dilakukan dengan menelusuri keseluruhan isi sebuah artikel (pencarianfulltext)denganmenggunakanSphinxsearchengine. Pencarianfulltextdenganmenggunakansphinxserachenginedapatdilakukandi halaman POTENSImelaluikotakpencarian.Padaawalnyasphinxsearchengineinimencariberdasarkanjudul artikelyangterkaitinovasiatauilmiah,beritanasional,peraturan,danlainnyayangterkaitdengan inovasi. Bila ditemukan judul yang sama persis dengan query pengguna maka halaman tersebut langsung ditampilkan. Tetapi bila judul artikel yang dimaksud tidak ditemukan maka halaman POTENSI akan mencari dengan operasi pencarian fulltext. Pencarian fulltext akan mencari keberadaankataquerypenggunadidalamartikel. Kelemahandarisphinxsearchengineyakni,penggunaharusmemasukkankatayangtepatagar menemukanartikelyangdimaksud.Kelemahanlainnyaterjadioperasiperbandingankatayangbesar antarakataquerypenggunadengankatadidalamartikel.Disisiyanglainhasilpencarianfulltextbisa berupadaftaryangsangatpanjang.Initerjadibilakataquerypenggunaterdapatdibanyakartikel. Untukmencariartikelyangrelevanpenggunaharusmenceksatupersatu. Pencarianinformasiyangtepatdansesuaikebutuhanmenjadisangatpenting dengansemakinmudahnyamemperolehinformasi.Sebagaiakibat perkembanganteknologiinformasidankomunikasiyangsemakinpesat.Olehkarena itu,teknikuntukmemperolehdokumendenganisiyangsesuaidengankebutuhan informasisangatdiperlukan. .Daripermasalahan yangada,makapenulisingin mengoptimalkanquerypada aplikasisearchenginewebPOTENSImenggunakan salah satu enterprise search platform yang besifat open source dari Apache, yakni bernama ApacheSolr.

Dalamhalinipenulismenggunakan enterprise serach platform bernama Apache Solr. Apache Solr dapat membantu pengguna dalam pencariandata(fiturfulltextsearchdanindexing),karenapadaportaltelusurinovasidatayangtelah dimasukkandidalamdatabasesebanyak191288datasehinggamempunyaibanyaksekalidocumentdan kesulitanuntukmelakukanpencarianpadadocumenttersebutbisamenggunakanapachesolragarlebih mudah. Selain itu apache mempunyai fitur utamanya adalah pencarian berbasis text, hit highlight, faceted search, dynamic clustering, database integration dan penanganan terhadap rich document (word,pdfdsb).PencarianmenggunakansolrbisamenggunakanURLdanhasilpencariannyabisa berupa xml maupun JSON. Sehingga memudahkan programmer untuk menggunakannya dalam berbagaibahasapemrograman. Apache Solr ini dapat berintegrasi dengan Nutch untuk mempercepat dalam sebuah mesin pencariandengandenganmenggunakancrawler.Dengandemikianmesinpencaridengancrawlerdapat menemukankeywordsebuahartikeldimetatagkeyword.selainitujugaApacheSOLRinimemiliki kemampuanpemberianskorpadahasilpencarian,solrbukanhanyamenampilkanhasilberdasarkan katayangcocoktetapijugaterurutberdasarkanberapabanyakkatayangcocokdenganpencarianyang dilakukan. Rumusanmasalah Berdasarkan uraian latar belakang di atas, dapat dirumuskan permasalahan yang 4dihadapi, yaitu bagaimana mengintegrasikan Apache Solr pada web Portal Telusur Inovasi (POTENSI), sehingga didapatkan optimasi query berdasarkan berapa banyak kata yang cocok dengan pencarian yang dilakukan. studipustaka 1. informationretrieval 2. docsimilarity

Anda mungkin juga menyukai