Kelas : 3B
Nim : 20090074
Kelima fungsi tersebut digunakan untuk membaca data tabular atau data yang disusun
kedalam format tabel. Fungsi read.table() merupakan bentuk umum dari keempat fungsi
lainnya. Fungsi tersebut dapat digunakan untuk membaca data dalam kedua format yang
telah disebutkan sebelumnya. Fungsi lainnya lebih spesifi, dimana
fungsi read.csv() dan read.csv2() digunakan untuk membaca data dengan ekstensi .csv,
sedangkan read.delim() dan read.delim2() untuk membaca data dengan ekstensi .txt.
Berikut adalah contoh bagaimana cara membaca data dengan nama data.csv yang ada
pada working directory dengan pemisah antar data berupa ; dan tanda koma berupa ,:
Catatan :
file : lokasi dan nama file yang akan dibaca diakhiri dengan format file.
Secara default fungsi akan membaca file yang ada pada working directory. Untuk
mengetahui lokasi working directory, jalankan fungsi getwd(). Salin file yang akan
dibaca pada lokasi working directory.
header : nilai logik yang menunjukkan apakah baris pertama pada file yang dibaca
akan dibaca sebagai nama kolom.
sep : simbol yang menujukkan pemisah antar data. Pemisah antar data dapat berupa
“",”;“,”.", dll.
dec : simbol yang menujukkan desimal. Pemisah desimal dapat berupa “.” atau “,”.
stringsAsFactors : nilai logik yang menunjukkan apakah jenis data string akan
dikonversi menjadi factor.
1.2 Membaca Data Dari Library
Untuk keperluan pendidikan atau pengujian sebuah fungsi biasanya dalam
sebuah library disediakan dataset yang siap
digunakan. R melalui library datasets menyediakan sejumlah data yang dapat
digunakan untuk berlatih menggunakan R. Berikut adalah fungsi yang digunakan untuk
mengecek dataset apa saja yang tersedia pada sebuah library:
contoh untuk melakukan pengecekan pada dataset yang tersedia di library datasets:
Fungsi-fungsi lainnya yang dapat digunakan untuk melakukan analisis statistika deskriptif
adalah sebagai berikut:
Contoh inputnya :
Hasil outputnya :
Inputnya:
Outputnya :
Inputnya:
Outputnya :
Inputnya
Outputnya:
1.4 Uji Normalitas Data Tunggal
Merupakan prosedur uji parametrik. Terdapat dua buah cara untuk melakukan uji tersebut,
antara lain:Metode grafis (qq-plot, ECDF, plot densitas, histogram, dan boxplot).Metode
matematis (Shapiro-Wilk, Cramer-von Mises, Shapiro-Francia, Anderson-Darling,
Liliefors, Pearson Chi-square, dll).
Untuk lebih memahami impelementasi fungsi tersebut pada data, berikut adalah
contoh:
Inputnya:
Outputnya:
Catatan:
Inputnya
Outputnya:
Outputnya:
Kendall:
Outputnya:
Outputnya
Ouputnya
Output
Output
Pengelompokan menggunakan algoritma K-Mean
k-means melakukan pengelompokan n pengamatan ke dalam k cluster di mana
setiap pengamatan akan tergabung dengan pusat cluster terdekat. Pengguna
harus menentukan jumlah pusat (cluster) yang diinginkan sebagai output. Untuk
melakukan pengelompokan dengan algoritma k-means pada R dapat
menggunakan fungsi kmeans(). Format fungsi tersebut secara umum adalah
sebagai berikut:
Out[put
Output
Pengelompokan menggunakan algoritma PAM
pam mem-partisi data menjadi k cluster di sekitar medoid. Medoid dari set data
yang terbatas merupakan titik data dengan nilai ketidaksamaan rata-rata untuk
semua titik data adalah minimum. Hal tersebut menujukkan bahwa medoid
merupakan pusat dari set cluster. Menurut halaman bantuan pam(), pendekatan
k-medoid lebih kuat daripada pendekatan k-means “karena meminimalkan
jumlah ketidaksamaan daripada jumlah jarak euclidean kuadrat”. Format umum
fungsi pam() adalah sebagai berikut:
Output