mining. Uraikan penjelasan mengenai data mining task yang didukung oleh tools
tersebut!
1. Rstudio
R studio merupakan integrated development environment (IDE) dari bahasa pemrograman
R yang merupakan bahasa pemrograman standar untuk pengembangan perangkat lunak
statistik. Pengguna R studio dituntut harus menggunakan baris kode untuk melakukan
analisis sangat berbeda dengan Orange dan Weka yang hanya butuh klik-klik saja. RStudio
merupakan integrated development environment (IDE) khusus bagi bahasa pemrograman R.
Software ini menyediakan R console, code editor dengan syntax highlighting, code
completion dan direct execution, environment, history, connections, dan fitur-fitur
tambahan lainnya seperti file manager, packages manager, help, plot viewer, hingga project
versioning menggunakan git. RStudio sebenarnya memiliki dua versi, yaitu open source
(gratis) dan commercial edition (berbayar). RStudio juga tidak hanya terbatas dalam bentuk
aplikasi dekstop, melainkan terdapat versi RStudio Server, yaitu RStudio yang dapat diakses
melalui browser yang terhubung dengan suatu jaringan komputer.
R sangat baik dan mudah digunakan dalam visualisasi data. Ada banyak sekali packages yang
mendukung R untuk membangun visualisasi menarik, seperti GGPLOT2 untuk membuat
grafik, lattice untuk menampilkan hubungan varibel, dan rCharts untuk menerbitkan
visualisasi Java Script dengan R.
Clustering
o k-means: kmeans(), kmeansruns()10 I k-medoids: pam(), pamk()
o Hierarchical clustering: hclust(), agnes(), diana()
o DBSCAN: fpc
o BIRCH: birch
Klasifikasi
o Decision trees: rpart, party
o Random forest: randomForest, extendedForest, party
o SVM: e1071, kernlab
o Neural networks: nnet, neuralnet, RSNNS
o Performance evaluation: ROCR
Assosisasi
o Association rules : apriori(), eclat() in package arules
o Sequential patterns : arulesSequence
o Visualisation of associations : arulesViz
Time Series
o Time series decomposition: decomp(), decompose(), arima(), stl()
o Time series forecasting: forecast
o Time Series Clustering: TSclust
o Dynamic Time Warping (DTW): dtw
Statistik
o Statistika dasar : rata-rata, varian, median;
o Grafik statis : scatter-plot, peta, histogram; dan
o Distribusi peluang : beta, binomial.