Anda di halaman 1dari 18

Kelas E

LAPORAN PRAKTIKUM
Analisis Data Kategorik
Modul 1 : Pengantar Program R

Nama Nomor Tanggal Tanda Tangan


Praktikan Mahasiswa Kumpul Praktikan
Rizki Alifah
15611036 04/10/2017
Putri

Tanggal Tanda tangan


Nama Penilai Nilai
Koreksi Asisten Dosen
Mega Cahaya
Dewi
Norma Fikria
Jaka Nugraha
S.Si.,M.Si.

JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2017
Daftar Isi

1 Pendahuluan .................................................................................................... 1
1.1 Software R ............................................................................................... 1
1.1.1 Menu Default R-RGUI........................................................................ 1
1.2 Library dan fungsi dasar dalam R ........................................................... 2
1.3 Management Data ................................................................................... 2
2 Deskripsi Kerja................................................................................................ 3
2.1 Studi Kasus ............................................................................................. 3
2.2 Langkah Kerja ......................................................................................... 4
2.2.1 Pembuatan Plot Data dan Grafik ................................................................ 4
2.2.2 Perhitungan Distribusi Statistik Menggunakan Script R .................... 4
2.2.3 Pembuatan Data Frame pada R ........................................................... 5
Gambar 2.5. Pendeskripsian data untuk data frame ................................................ 6
2.2.4 Perkalian Matriks dengan Menggunakan R ........................................ 6
3 Pembahasan ..................................................................................................... 7
3.3 Syntax Pembuatan Data Frame ............................................................. 11
4 Penutup.......................................................................................................... 13
5 Daftar Pustaka ............................................................................................... 14

ii
Daftar Tabel

Tabel 2.1 Penerimaan Mahasiswa Baru ................Error! Bookmark not defined.

iii
Daftar Gambar

Gambar 2.1. Script histogram ................................................................................ 4


Gambar 2.2. Script pembuatan plot ....................................................................... 4
Gambar 2.3. Script perhitungan distribusi Poisson ............................................... 5
Gambar 2.4. Script perhitungan distribusi Normal ............................................... 5
Gambar 2.5. Pendeskripsian data untuk data frame .............................................. 6
Gambar 2.6. Pembuatan Data Frame ..................................................................... 6
Gambar 2.7. Perhitungan rata-rata menggunakan script R .................................... 6
Gambar 3.1. Syntax Histogram ............................................................................. 7
Gambar 3.2. Hasil perhitungan histogram ............................................................. 8
Gambar 3.3. Syntax Plot ........................................................................................ 7
Gambar 3.4. Hasil output plot ............................................................................... 9
Gambar 3.5. Hasil output dpois ........................................................................... 10
Gambar 3.6. Hasil output dnorm ......................................................................... 10
Gambar 3.7. Hasil output ppois ........................................................................... 10
Gambar 3.8. Hasil output pnorm ......................................................................... 10
Gambar 3.9. Hasil output qpois ........................................................................... 11
Gambar 3.10. Hasil output qnorm ....................................................................... 11
Gambar 3.11. Syntax data frame ......................................................................... 11

iv
1 Pendahuluan

1.1 Software R
Secara garis besar R adalah Bahasa pemograman open source yang
berhubungan dengan komputasi dan pengolahan data untuk statistika dan yang
berhubungan dengan penampilan grafik menggunakan tools yang disediakan oleh
paket-paketnya yang sangat berguna di dalam penelitian dan industry. (Ro'fah,
2013).
1.1.1 Menu Default R-RGUI
Didalam software R mengenal beberapa menu default yang terdapat pada
tampilan menu utama R console. Diantaranya sebagai berikut :
A. Menu File
Menu ini menampilkan diantaranya : cara mengambil kode sumber R yang
sudah ada atau tersimpan di computer praktikan dengan menggunakan menu Source
R code. Menu ini juga memudahkan praktikan dalam menyimpan ruang
kerja/workspace yang sedang praktikan kerjakan (menu save workspace) di R
console ke dalam folder computer praktikan dan menggunakan menu load
workspace.
B. Menu Edit
Menu ini adalah menu editor yang diantaranya berisikan : menu editor yang
umum seperti copy, paste, select all, dan menu editor lainnya seperti menempelkan
(paste) hanya commands, membersihkan console R sehingga console R yang penuh
dengan commands akan putih bersih sediakala ketika memulai R.
C. Menu Misc
Menu ini adalah menu tambahan diantaranya : memberhentikan seketika
perhitungan yang sedang berlangsung dengan mengunakan tombol ESC;
menampilkan objek (List Objects) dan membuang objek (Remove all objects).
D. Menu Packages
Menu ini berisikan fasilitas untuk menambahkan paket statistic dan paket
lainnya dalam menu load package dan instalasi paket dalam install package(s) dan

1
update paket dalam update package serta memungkinkan instalasi paket dari file
zip yang ada di computer praktikan (local) dengan menggunakan menu install
package(s)from local zip files.

1.2 Library dan fungsi dasar dalam R


Ketika praktikan telah melakukan instalasi R maka praktikan akan
mendapatkan R dengan koleksi library dan fungsi standar, diantaranya sebagai
berikut :
A. Base : Paket dasar R
B. Chron : Objek kronologis yang mengatasi masalah penanggalan
hari dan waktu.
C. Class : Fungsi untuk pengklasifikasian.
D. Cluster : Fungsi untuk klastering (clustering)
E. Datasets : Paket kumpulan data-data R (contoh data-data)
F. Foreign : Membaca data yang tersimpan dalam bentuk file dari
software seperti minitab, SAS, SPSS, Stata, dll.
G. Methods : Metode formal dan pengkelasan (classes)

1.3 Management Data


Pada software R mengenal suatu system managemen data. Dimana, R
memungkinkan praktikan untuk membuat berbagai jenis objek penyimpanan data,
seperti angka, vector, matrik, string, dan dataframe. Dimana, dalam hal ini
mengenal perintah :
A. Is() : memberikan daftar semua objek data yang tersedia saat ini
B. rm() : menghapus objek data yang diberikan sebagai argument.

2
2 Deskripsi Kerja

2.1 Studi Kasus


Pada laporan kali ini praktikan akan membuat berdasarkan studi kasus
sebagai berikut :
1. Buatah histogram dan interpretasikan hasilnya berdasarkan data berikut ini
10,11,12,13,12,12,14,20,19,18,17,23,26,12,19,20,14,12,11,20
2. Buatlah plot dan interpretasikan hasilnya berdasarkan data berikut ini
x = 30,40,21,23,43,33,41,23,43,52,22,12,13,20,21,13,12,31,12,20
y = 13,12,10,21,12,14,15,17,10,23,30,12,15,15,14,19,21,21,17,24
3. Variabel random X berdistribusi poisson dengan λ=10 hitunglah P(X=5),
P(X≤5), dan P(X≤5) > 0.5
4. Variabel random X berdistribusi normal dengan µ=20 dan σ=4 hitunglah
P(X=3), P(X≤3), dan P(X≤3) > 0.1
5. Terdapat data penerimaan mahasiswa baru di Universitas X sebagai
berikut
Tabel 2.1. Penerimaan Mahasiswa Baru
Kota Lulusan Jurusan Jumlah
Mahasiswa
Jakarta SMA Statistika 4
Bandung SMA Kimia 12
Surabaya SMK Kimia 5
Yogyakarta SMK Farmasi 6
Tanggerang SMA Statistika 10
Lombok MAN Farmasi 5
Medan SMA Farmasi 6
Pekanbaru MAN Kimia 3
a. Buatlah data frame berdasarkan data berikut ini
b. Hitunglah rata-rata untuk kolom jumlah mahasiswa
6. Diketahui:

3
3 4 2
Matriks A: 2 3 2 Matriks B: 6 4 2
5 2 4
Lakukan perkalian matriks A x matriks B
2.2 Langkah Kerja
2.2.1 Pembuatan Plot Data dan Grafik
a. Langkah pertama yang dilakukan praktikan ialah praktikan megerjakan studi
kasus yang pertama dimana dengan mengetikkan syntax untuk membuat
histogram pada R script dengan meng klik file > New Script > lalu ketikkan
syntax nya sebagai berikut :

Gambar 2.1. Script Histogram


b. Jika sudah ditulis syntaxnya maka dapat me-run nya dengan meng-klik ctrl+r.
lalu dapat melanjutkan ke studi kasus yang kedua. Dimana dengan
mengetikkan syntax untuk membuat plot data nya yaitu sebagai berikut :

Gambar 2.2. Script Pembuatan Plot


2.2.2 Perhitungan Distribusi Statistik Menggunakan Script R
a. Langkah selanjutnya ketika praktikan telah menyelesaikan studi kasus
pertama dan kedua. Maka, yang dilakukan selanjutnya ialah melakukan
perhitungan untuk studi kasus ketiga dan keempat menggunakan script
perhitungan distribusi pada R.
b. Dalam menghitung distribusi menggunakan script R pada studi kasus ketiga
diperlukan syntax script distribusi poisson. Untuk penjelasan syntax nya
akan dijelaskan pada bagian pembahasan. Namun untuk komponen
penulisan syntaxnya sebagai berikut :

4
Gambar 2.3. Script perhitungan distribusi Poisson
Lalu, untuk menjalankan script tersebut maka dapat di Run dengan menekan
tombol ctrl+r pada keyboard.
c. Kemudian dilanjutkan menghitung distribusi normal pada studi kasus ke 4.
Dimana dalam penghitungan distribusi normal pada software R
membutuhkan script syntax sebagai berikut :

Gambar 2.4. Script perhitungan distribusi Normal


Lalu, untuk menjalankan script tersebut maka dapat di Run dengan menekan
tombol ctrl+r pada keyboard.

2.2.3 Pembuatan Data Frame pada R


a. Dalam pembuatan data frame langkah pertama yang diperlukan
pendeskipsian masing-masing data terlebih dahulu. Dimana dalam hal ini
pendeskripsian dilakukan pada variabel kota, lulusan, jurusan dan jumlah
mahasiswa. Untuk pendeskripsian diperlukan syntax sebagai berikut

5
Gambar 2.5. Pendeskripsian data untuk data frame
b. Kemudian yang dilakukan selanjutnya yaitu menuliskan rumus untuk data
frame. Dimana rumus untuk pembuatan data frame yaitu sebagai berikut :

Gambar 2.6. Pembuatan Data Frame


c. Ketika data frame telah dibuat maka yang dilakukan praktikan selanjuttnya
yaitu menghitung rata-rata jumlah mahasiswa pada kolom data frame diatas
dengan menggunakan syntax sebagai berikut :

Gambar 2.7. Perhitungan rata-rata menggunakan script R

2.2.4 Perkalian Matriks dengan Menggunakan R


Berdasarkan soal studi kasus diatas maka soal diatas tidak dapat dikerjakan
dikarenakan orde matriks nya berbeda.

6
3 Pembahasan

Pada bagian bab sebelumnya telah dijelaskan mengenai software R beserta


tools yang ada didalamnya juga lengkap mengenai langkah kerja dalam menjawab
setiap studi kasus yang ada. Pada bagian ini praktikan akan menjelaskan mengenai
syntax yang terdapat pada langkah kerja. Dalam menjelaskan syntax ini praktikan
bagi sesuai dengan langkah kerja yang telah ada sebelumnya. Berikut
penjelasannya.
3.1 Syntax Pembuatan Plot Data
Seperti yang telah diketahui pada bagian pendahuluan bahwa menu file pada
R salah satunya ialah menampilkan tentang cara mengambil kode sumber R yang
telah ada atau tersimpan di computer dengan menggunakan menu source R code.
Didalam menu file terdapat suatu sub menu yang bernama new script atau biasa
dikenal dengan sebutan lembar RScript. Biasanya, ketika praktikan ingin
melakukan pemograman praktikan dengan menulis program praktikan dalam file
naskah dan kemudian praktikan mengeksekusi skrip di command prompt praktikan
dengan bantuan R interpretes. Lembar naskah itulah yang disebut RScript.
Untuk studi kasus pertama yaitu mengenai pembuatan histogram pada data
praktikan. Perlu diketahui sebelumnya bahwa R program sudah menyediakan
fungsi default untuk semua penggunanya agar dapat membuat diagram histogram
dengan mudah yaitu cukup memanggil fungsi hist() dan mengisikan dengan nama
parameter yang telah dibuat sebelumnya.

Gambar 3.1. Syntax Histogram


Pada gambar diatas terihat bahwa penamaan dengan huruf “x”. huruf “x”
pada gambar tersebut merupakan himpunan angka yang sudah praktikan deklarasi
di awal. Berikut hasilnya :

7
Gambar 3.2. Hasil perhitungan histogram
Pada histogram diatas terlihat bahwa data tertinggi pada data yang
berjumlah 8 sedangkan data terendah pada data yang jumlahan data ialah 1. Berbeda
halnya dengan studi kasus kedua. Dimana, studi kasus kedua berisi tentang
pembuatan plot seperti diagram pencar. Diagram pencar (Scatterplot) sendiri
merupakan representasi grafik dari distribusi dua peubah acak yang disajikan dalam
bentuk . Seperti yang telah diketahui untuk menangani grafik, R memiliki beberapa
fungsi. Diantaranya fungsi ini adalah untuk membuat lay out lembaran grafik yang
dibagi menjadi matriks sublembaran kecil (axb) dan masing-masing sublembaran
dapat memiliki judul dan absis sendiri. Untuk syntax dan hasil outputnya sebagai
berikut :

Gambar 3.3. Syntax Plot

8
Gambar 3.4. Hasil output plot
Pada bagian syntax terlihat bahwa terdapat penamaan huruf x dan y.
Penamaan x dan y pada syntax tersebut menunjukkan angka yang telah di
deklarasikan sebelumnya. Hasil output pun menunjukkan pola data yang acak pada
bagian scatterplot. Selain itu jika diperhatikan lebih dalam lagi hasil output
scatterplot diatas menunjukkan bahwa pola data cenderung berpencar atau
mengumpul kebagian sebelah kiri. Selain itu pada scatterplot terlihat 2 nilai outlier
yang menjauhi pola data dimana nilai yang pertama yaitu pada titik x=50 dengan
nilai y=23 dan titik x=20 dengan nilai y=30.
3.2 Syntax Distribusi Statistik
Disamping fungsi dasar yang telah dibahas pada bagian 3.1, R juga memiliki
fungsi-fungsi statistika lain yang banyak dipergunakan dalam simulasi data.
Fungsi-fungsi ini sebenarnya merupakan fungsi yang bertujuan utuk membagkitkan
data dari peubah acak dengan berbagai distribusi yang banyak dijumpai, seperti
normal, poisson, dan gamma dengan jumlah / ukuran sampel n. pada dasarnya ada
empat jenis fungsi terkait dengan distribusi peubah acak diantaranya yaitu terdapat
rdistribusi yang memiliki fungsi untuk membangkitkan data acak/random dari suatu
distribusi dengan parameter tertentu. Untuk ddistribusi memiliki tujuan dalam
mencari nilai fungsi kepadatan f(x) pada suatu nilai x tertentu. Dimana dalam hal
ini praktikan menggunakan perintah ddistribusi pada studi kasus ketiga dan
keempat.

9
Gambar 3.5. Hasil output dpois

Gambar 3.6. Hasil output dnorm


Pada gambar 3.5 menjelaskan penggunaan fungsi distribusi poisson dimana
dengan ketentuan sama seperti penggunaan yang secara manual. Untuk penggunaan
distribusi pada poisson ini angka 5 dan 10 pada dpois(5,10) masing-masing
menunjukkan nilai batasan x nya untuk yang 5, sedangkan nilai 10 menunjukkan
nilai lambda sehingga diperoleh hasil untuk yang dpois ialah sebesar 0,03783327.
Untuk distribusi normal penulisan syntax nya ditunjukkan dengan dnorm(3,20,4)
dimana untuk angka 3 menunjukkan nilai batasan x, angka 20 menunjukkan nilai
rata-rata (miu), sedangkan angka 4 menunjukkan nilai dari standar deviasi nya dan
diperoleh hasil akhir untuk dnorm yaitu sebesar 1,192966e-05.
Selain ddistribusi didalam fungsi R terdapat juga perintah pdistribusi.
Dimana, pdistribusi memiliki fungsi untuk mencari luas daerah (nilai peluang)
suatu distribusi yang dibatasi oleh nilai x tertentu.

Gambar 3.7. Hasil output ppois

Gambar 3.8. Hasil output pnorm


Pada penulisan syntax an diatas pada dasarnya sma seperti penulisan syntax
pada ddistribusi. Hanya saja hasil akhir dan tujuan pemakaiannya yang berbeda.
Untuk ppois memiliki hasil 0,06708596 sedangkan untuk pnorm memiliki hasil
yaitu 1,068853e-05.
Kemudian terdapat pula qdistribusi. Dimana, qdistribusi berfungsi untuk
mencari nilai x yang membatasi luas daerah (nilai peluang) tertentu dari suatu

10
distribusi. Sama sperti dpois, ppois, dnorm dan pnorm penulisan nya mengikuti dari
masing-masing distribusi. Berikut merupakan penulisan syntax dan hasilnya .

Gambar 3.9. Hasil output qpois

Gambar 3.10. Hasil output qnorm


Berdasarkan kedua gambar diatas dapat dikethui bahwa hasil untuk qpois
yaitu sebesar 10 dan hasil untuk nilai qnorm yaitu sebesar 14,87379.
Berdasarkan semua hasil perhitungan distribusi statistic diatas, distribusi
diatas merupakan nama-nama distribusi yang tersedia pada R diantaranya beberapa
yang penting dan banyak digunakan yaitu norm(normal), binom(binomial),
gamma(Gamma), t(t), F(F), chisq(X2), pois(Poisson).
3.3 Syntax Pembuatan Data Frame
Pada studi kasus kelima terdapat perintah untuk membuat sebuah data frame
dari data yang ada. Seperti yang diketahui, data frame merupakan objek yang
mempunyai bentuk sama dengan matriks, yaitu terdiri atas baris dan kolom.
Perbedaannya adalah data frame dapat terdiri atas mode data yang berbeda-beda
untuk setiap kolomnya. Misalkan saja, kolom pertama adalah numeric, kolom
kedua adalah string/character, dan kolom ketiga adalah logical. Objek data frame
dapat dibuat dengan menggunakan perintah “data.frame”. sesuai dengan fungsinya
bahwa data frame digunakan untuk meyimpan data table.

Gambar 3.11. Syntax data frame

11
Dalam menyimpan data table diperlukan rumus atau syntax dalam
mengolahnya. Dimana syntax penulisan data.frame terdapat pada gambar diatas dan
ketika di klik run jika berhasil akan langsung muncul table yang dibuat berdasarkan
syntax tersebut. Kemudian, jika sudah menggunakan data frame maka yang dapat
dilakukan selanjutnya berdasarkan studi kasus yaitu menghitung rata-rata
berdasarkan data tersebut. Dimana untuk rumus rata-rata menggunakan perintah
mean. Dan untuk memanggilnya cukup panggil dengan mengetikkan perintah
rata_rata.

12
4 Penutup

Berdasarkan bagian pembahasan dan deskripsi kerja mengenai apa yang telah
dilakukan. Maka, dengan ini dapat ditarik kesimpulan sebagai berikut :
1. Dalam pembuatan syntax program R perlu diperhatikan bahwa jika program
sudah benar tidak akan menampilkan tulisan error.
2. Dalam membuat plot dibutuhkan syntax “histogram=hist(x)” atau
“plotxy=plot(x,y)”.
3. Dalam melakukan perhitungan distribusi terbagi menjadi 3 yaitu ddistribusi,
pdistribusi, dan qdistribusi yang masing-masing rumus tersebut memiliki
fungsi perintahnya tersendiri.
4. Dalam membuat data frame perlu diketahui bahwa jumlah isian pada kolom
dan baris pada data frame haruslah sama. Jika tidak sama maka program
akan membacanya menjadi error.
5. Tujuan dari pembuatan data frame pada dasarnya untuk membuat table pada
program R.
6. Dalam perhitungan rata-rata dapat dilakukan dengan memasukkan rumus
syntax berupa mean.

13
5 Daftar Pustaka

K, W. (2009, Mei 18). Analisis Data Kategorik. Diambil kembali dari


https://winkonadi.wordpress.com/2009/05/15/analisis-data-kategorik/
name, n. (2014, 11 03). Memakai Bahasa Pemograman R untuk Analisa Statistik.
Retrieved 10 02, 2017, from The Solid Snake:
https://thesolidsnake.wordpress.com/2014/11/03/memakai-bahasa-
pemograman-r-untuk-analisa-statistik/
NRo'fah, W. B. (2013). Pengantar Praktis Pemograman R untuk Ilmu Komputer.
Jakarta Barat: Halaman Moeka Publishing.
Yudistira, A. (2008, 12 25). Maipulasi Data dan Grafik menggunakan Bahasa R.
Retrieved from Bahasa R (The R language): http://bahasa-
r.blogspot.co.id/2008/12/manipulasi-data-dan-grafik-menggunakan.html

14

Anda mungkin juga menyukai