62 168 1 PB PDF
62 168 1 PB PDF
PENGOLAHAN DATABASE
(Pentaho as a Solution of Database Processing Problems)
Nurtriana Hidayati
Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang
Abstract
JURNA
AL TRANSF
FORMATIKA
A, Volume 9,, No. 2, Janu
uari 2012 : 8
86 – 95 89
a. Arsitektur Mondrian
Gambar 4 : Arsitektur Mondrian
Gambar
G 6 : Coontoh Data Prreview
92 Pen
ntaho Sebag
gai Solusi Ma
asalah … (N
N. Hidayati)
3.5 Pentaho Data Mining 4.7,3.2,1.3,0.2,Iris-setosa
Weka terdiri dari koleksi 4.6,3.1,1.5,0.2,Iris-setosa
algoritma machine learning yang dapat 5.0,3.6,1.4,0.2,Iris-setosa
digunakan untuk melakukan generalisasi / 5.4,3.9,1.7,0.4,Iris-setosa
formulasi dari sekumpulan data 4.6,3.4,1.4,0.3,Iris-setosa
sampling.Walaupun kekuatan Weka terletak • Comma Separated Values (CSV), file teks
pada algoritma yang makin lengkap dan dengan pemisah tanda koma (,) yang
canggih, kesuksesan data mining tetap terletak cukup umum digunakan
pada faktor pengetahuan manusia data.csv
implementornya.Tugas pengumpulan data Nama, Kondisi, Aksi
yang berkualitas tinggi dan pengetahuan Feris, lapar, makan
pemodelan dan penggunaan algoritma yang Feris, kenyang, tidur
tepat diperlukan untuk menjamin keakuratan Budi, lapar, makan
formulasi yang diharapkan. Budi, kenyang, tidur
a. Algoritma Pemodelan / Classifier PHI, lapar, makan
Weka saat ini sudah cukup banyak PHI, kenyang, makan
mendukung algoritma untuk pemodelan data Jon, lapar, makan
atau biasa disebut classifier, diantaranya Jon, kenyang, tidur
adalah sebagai berikut : • Format C4.5, untuk penjelasan dan contoh
• J48, atau kloning versi open source dari dari format file ini dapat dilihat
algoritma C4.5 yang dapat digunakan untuk dihttp://www.cs.washington.edu/dm/vfml/ap
pembentukan pohon keputusan (decision pendixes/c45.htm
tree) • Serialisasi data biner oleh Weka
• Linear Regression, algoritma untuk
menghasilkan formulasi numerik dengan 4. KESIMPULAN DAN SARAN
metode statistik regresi linear a. Kesimpulan
• Naive Bayes, salah satu classifier numerik Pentaho adalah kumpulan aplikasi
• dan lain-lain Business Intelligence (BI),Pentaho telah dia
b. Format Data Masukan / Input dopsi untuk melakukan pengolahan data besar
Format-format data yang dapat dijadikan input oleh berbagai institusi/perusahaan di
Weka adalah sebagai berikut : Indonesia dan sampai saat ini sudah cukup
• Attribute-Relation File Format (ARFF), banyak. Pentaho memiliki berbagai fungsi
adalah tipe file teks yang berisi dengan produk yang dimiliki antara lain
berbagai instance data yang berhubungand Pentaho, Pentaho Analysisa, Pentaho
dengan suatu set atribut data yang Dashboards, Pentaho Data Integration (ETL),
dideskripsikan juga dalam file tersebut. Pentaho Data Mining.
iris.arff - contoh data Weka dengan format b. Saran
ARFF Untuk mengerti dan memahami Aplikasi/
@RELATION iris Tool Pentaho bahasa Query Sql, OLAP,
@ATTRIBUTE sepallength REAL MOLAP dan ROLAP. Dengan Pentaho dapat
@ATTRIBUTE sepalwidth REAL menyelesaikan integrasi data yang besar dan
@ATTRIBUTE petallength REAL kompleks.
@ATTRIBUTE petalwidth REAL
@ATTRIBUTE class {Iris-setosa,Iris- 5. DAFTAR PUSTAKA
versicolor,Iris-virginica} http://pentaho.phi-
@DATA integration.com/reporting/pentaho-report-
5.1,3.5,1.4,0.2,Iris-setosa designer, diunduh 10 April 2012.
4.9,3.0,1.4,0.2,Iris-setosa
JURNAL TRANSFORMATIKA, Volume 9, No. 2, Januari 2012 : 86 – 95 93
Roldal, M.C, “Pentaho 3.2 Data Integration http://pentaho.wikia.com/wiki/Kategori:Solusi_
Beginner’s Guide”. Packet masalah_kemiskinan_negara_indonesia.d
http://pentaho.phi- iunduh 10 April 2012
integration.com/reporting/mengambil-
berbagai-sumber-data-dari-etl-
transformation. Diunduh 10 April 2012