Anda di halaman 1dari 2

 Cari informasi mengenai perangkat lunak yang merupakan tools untuk melakukan data

mining. Uraikan penjelasan mengenai data mining task yang didukung oleh tools
tersebut!

1. Rstudio
R studio merupakan integrated development environment (IDE) dari bahasa pemrograman
R yang merupakan bahasa pemrograman standar untuk pengembangan perangkat lunak
statistik. Pengguna R studio dituntut harus menggunakan baris kode untuk melakukan
analisis sangat berbeda dengan Orange dan Weka yang hanya butuh klik-klik saja. RStudio
merupakan integrated development environment (IDE) khusus bagi bahasa pemrograman R.
Software ini menyediakan R console, code editor dengan syntax highlighting, code
completion dan direct execution, environment, history, connections, dan fitur-fitur
tambahan lainnya seperti file manager, packages manager, help, plot viewer, hingga project
versioning menggunakan git. RStudio sebenarnya memiliki dua versi, yaitu open source
(gratis) dan commercial edition (berbayar). RStudio juga tidak hanya terbatas dalam bentuk
aplikasi dekstop, melainkan terdapat versi RStudio Server, yaitu RStudio yang dapat diakses
melalui browser yang terhubung dengan suatu jaringan komputer.

R sangat baik dan mudah digunakan dalam visualisasi data. Ada banyak sekali packages yang
mendukung R untuk membangun visualisasi menarik, seperti GGPLOT2 untuk membuat
grafik, lattice untuk menampilkan hubungan varibel, dan rCharts untuk menerbitkan
visualisasi Java Script dengan R.

Fungsi dasar pada Rstudio:


 Visualisasi data: grafik titik, grafik garis, histogram maupun pie chart
 Manipulasi data: mencari sample, stack
 Antarmuka ke weka: menjalankan program weka pada R

Fungsi dan package Data Mining pada R :

 Clustering
o k-means: kmeans(), kmeansruns()10 I k-medoids: pam(), pamk()
o Hierarchical clustering: hclust(), agnes(), diana()
o DBSCAN: fpc
o BIRCH: birch

 Klasifikasi
o Decision trees: rpart, party
o Random forest: randomForest, extendedForest, party
o SVM: e1071, kernlab
o Neural networks: nnet, neuralnet, RSNNS
o Performance evaluation: ROCR

 Assosisasi
o Association rules : apriori(), eclat() in package arules
o Sequential patterns : arulesSequence
o Visualisation of associations : arulesViz

 Sequential Pattern : arulesSequences

 Time Series
o Time series decomposition: decomp(), decompose(), arima(), stl()
o Time series forecasting: forecast
o Time Series Clustering: TSclust
o Dynamic Time Warping (DTW): dtw
 Statistik
o Statistika dasar : rata-rata, varian, median;
o Grafik statis : scatter-plot, peta, histogram; dan
o Distribusi peluang : beta, binomial.

Anda mungkin juga menyukai