net/publication/279480483
CITATIONS READS
0 2,325
1 author:
Choerul Afifanto
Statistics Indonesia
2 PUBLICATIONS 0 CITATIONS
SEE PROFILE
All content following this page was uploaded by Choerul Afifanto on 01 July 2015.
C. Analisis Data
Data tidak terstruktur yang berupa artikel berita
dari SINDONEWS pertama kali diubah formatnya
terlebih dahulu menjadi data terstruktur dengan
teknik text tagging dan annotation. Sedangkan
data terstruktur berupa data mentah ekspor
nonmigas Indonesia bulan Mei 2015. Kemudian Figure 3 Mendapatkan inteligensi pasar dari artikel berita
kedua jenis data, terstruktur dan tidak terstruktur,
dilakukan proses ekstrak, transform maupun muat mengumpulkan data yang tidak terstruktur tersebut
dengan alat ETL agar bisa diintegrasikan dan tidaklah mudah dan butuh waktu cukup lama untuk
melakukan review dan analisa. Kualitas dari
sebuah keputusan yang strategis dan taktis terletak
pada kualitas masukan informasi tersebut. tahun organisasi
Sehingga sangatlah penting untuk menganalisa
kualitas informasi sebaik mungkin dalam rentang
waktu yang terbatas.
Figure 3 mengilustrasikan sebuah skenario Tahun ini saja, Transpacific Foods Japan berencana
mengimpor pisang Cavendish dari PT Nusantara
dalam mendapatkan informasi dengan cara Tropical Farm (NTF) sebanyak 8.147 ton dan nanas
mencari informasi dari sumber berita harian, sebanyak 1.673 ton.
forum, blogs, artikel dan laporan. Kebanyakan
komoditi
orang mendapatkan informasi secara cepat dari kuantitas
artikel berita yaitu dengan cara membaca
headline/judulnya. Namun jika diimplementasikan Text annotator
oleh sistem, hal itu tidaklah mudah untuk
dilakukan dengan melakukan query pada natural
language text dari headline/judul untuk bisa XML
Output tahun organisasi komoditi kuantitas
dianalisis maksudnya. Kemudian bagaimana peran
dari text annotation tool dalam data tidak Tahun Transpacific pisang 8147 ton
ini Food Japan
terstruktur sehingga makna dari hasil bisa diterima
dengan baik.
Salah satu contoh kalimat dalam artikel berita <TAHUN>Tahun ini</TAHUN> saja,
SINDONEWS adalah: <ORGANISASI>Transpacific Foods
“Tahun ini saja, Transpacific Foods Japan Japan</ORGANISASI> berencana mengimpor
<KOMODITI>pisang</KOMODITI> Cavendish dari
berencana mengimpor pisang Cavendish dari PT PT Nusantara Tropical Farm (NTF) sebanyak
Nusantara Tropical Farm (NTF) sebanyak 8.147 <KUANTITAS>8.147 ton</KUANTITAS> dan nanas
ton dan nanas sebanyak 1.673 ton” sebanyak 1.673 ton
Entitas yang bisa didapat dari cuplikan berita Figure 4 Text annotation and tagging
tersebut diantaranya tahun, komoditi, organisasi, Keuntungan yang bisa diperoleh dari
dan kuantitas. Seperti yang ditampilkan pada penggabugan data terstruktur dengan data tidak
Figure 4, text annotator mengidentifikasi entitas terstruktur bisa dirasakan jika kita ingin
serta memberikan tags pada cuplikan berita mengetahui jawaban dari pertanyaan misal seperti
tersebut. Output yang dihasilkan dapat berupa berikut: “Perusahaan apa saja yang berencana
dokumen XML dan tabel database. Memberikan mengimpor pisang dari Indonesia, serta berapa
tag pada informasi yang penting dapat presentase pisang yang diimpor terhadap total
mempermudah dalam mendapatkan link entitas ekspor komoditas buah-buahan Indonesia?” Jika
dan analisis relasinya. Tag XML dan skema tabel untuk menjawab pertanyaan tersebut hanya
database harus didefinisikan terlebih dahulu menggunakan sumber data tunggal yaitu data
sebelumnya. Selain itu, text annotator tool juga terstruktur. Pertanyaan tersebut belum bisa
harus diatur dan diprogram supaya bisa mendeteksi terjawab secara sempurna. Namun, jika
entitas tertentu secara spesifik. Sehingga query menggunakan informasi yang tersimpan dalam
pada SQL bisa secara mudah dilakukan pada tabel CDW yang merupakan integrasi dari data
yang telah dihasilkan melalui proses text tagging terstruktur dan tidak terstruktur, maka pertanyaan
dan annotation. tersebut bisa terjawab dengan lengkap.
V. KESIMPULAN memanfaatkan data dari berbagai sumber baik itu
data terstruktur maupun tidak terstruktur.
Text tagging dan annotation berperan sangat
significant dalam integrasi data terstruktur dan
tidak terstruktur. Output dari integrasi data
tersebut, complete data warehouse, memberikan REFERENSI
landasan yang kuat dalam pendukung pengambilan [1] Coker, Frank (2014). Pulse: Understanding the Vital
keputusan dan inteligensi bisnis. Signs of Your Business. Ambient Light Publishing.
Menghilangkan pembatas antara data terstruktur hlm. 41-42. ISBN 978-0-9893086-0-1.
dan tidak terstruktur berdampak pada cara [2] Evelson, Boris (21 November 2008). "Topic
Overview: Business Intelligence"
perusahaan dalam memperlakukan dan mengolah [3] Knox, Rita, T. Eid, & A. White. “Management
datanya. Memang secara alami, data tidak Update: Companies should align their structured
terstruktur tersebut sangat sulit untuk diekstraks and unstructured data,” Gartner Research, Feb 2005
dan diintegrasikan dengan data terstruktur. Namun [4] K.P. Byung & Y.S. Il. “Toward Total Business
output dari integrasi data terstruktur dan tidak Intelligence Incorporating Structured and
Unstructured Data”. 2011.
terstruktur tersebut memberikan manfaat yang [5] Sukumuran. Sreekumar & Sureka, Ashish.
besar bagi perusahaan/organisasi. “Integrating Structured and Unstructured Data
Seperti yang telah diperlihatkan pada Using Text Tagging and Annotation”
pembahasan, teknologi ini bisa membantu [6] http://ekbis.sindonews.com/read/1018103/34/wow-
perusahaan dalam mengambil keputusan yang butuh-tujuh-tahun-pisang-ri-tembus-jepang-
1435564455 [terakhir diakses 30 Juni 2015]
strategis dan taktis dalam inteligensi bisnis dengan [7] https://id.wikipedia.org/wiki/Inteligensi_bisnis