Versi 3.0
Tahun Penyusunan 2011
Tim Penyusun 1.Diana Ikasari
2.Tristyanti Yusnitasari
3.Heru Purnomo
4.Fendy Christian
5. Aditya
6.Yuliana Savitri
2
Pertemuan 1
Objektif:
1. Mahasiswa dapat mengetahui Software R-Programming
2. Mahasiswa dapat mengetahui dasar-dasar instruksi Pada R-Programming
3. Mahasiswa dapat menggunakan dan menjalankan software R-Programming
Software R ialah suatu program analisis data statistika dan komputasi yang termasuk
golongan software Open Source yang dibangun setelah paket program S-Plus dengan
bahasa pemrograman S. Proyek pembuatan software R pertama kali dikerjakan oleh
Robert Gentleman dan Ross Ihaka dari Departemen Statistika Universitas Auckland
pada tahun 1995. Karena kedua perintisnya berinisial R, maka software ini diberi nama R.
Sampai saat ini software R dikembangkan oleh semua penggunanya yang terhimpun
dalam naungan R-core team yang merupakan pekerja keras dan sukarelawan (voulentir).
R merupakan sebuah lingkungan interaktif untuk komputasi secara statistik dan
grafik-grafik. Tutorial ini dianggap menggunakan R 1.9.0 pada sebuah PC. R dapat
berjalan pada Sistem Operasi Windows, UNIX dan mesin-mesin Macintosh. R dapat
didownload secara gratis pada http://r-project.org/.
3
Saat memasuki R akan mendapatkan jendela putih yang di dalamnya dapat diketikan
perintah-perintah (seperti pada DOS) dengan prompt: > . Pada R menyebutnya sebagai
Workspace atau ruang kerja.
Untuk keluar dari R, ketik perintah ini:
>q( )
P1.2. Tipe Data pada R-Programming
Contoh :
1. Ketikan pada R
a=c(1,2,3) ,kemudian enter
a kemudian enter
4
Maka didapat [1] 1 2 3
2. Ketikan pada R,
mode(a)
3. Ketikan pada R,
b=array(1:4,dim=c(2,2))
b, kemudian enter
5
Maka hasil yang didapat adalah
[,1] [,2]
[1,] 1 3
[2,] 2 4
Maka didapat
[1] "numeric"
6. Ketikan pada R
mode(c)
6
Maka didapat hasilnya
[1] "character"
8. Ketikan pada R
mode(d)
7
Maka hasilnya
[1] "logical"
9. Ketikan pada R
e=function(x)
+{
+ (x^2)+(2*X)+19
+}
e, kemudian enter
Hasil
f=edit(data.frame())
f
8
Maka akan tampil window
Isikan dengan
Menu Harga
1 bakso 3500
2 ayam 3000
9
3 nasi goreng 3000
4 soto ayam 3500
5 soto babat 4000
Kemudian isikan dengan isian yang diinginkan seperti tampak dibawah ini
10
Ketikan mode(f)
Maka hasilnya
[1] "list"
11
P1.3. Dasar-dasar Instruksi Pada R-Programming
Sebelum masuk ke bahasan selanjutnya, maka perlu kami ingatkan bahwa R merupakan
software yang mengusung pola CASE SENSITIVE pada setiap instruksi ataupun fungsi
yang digunakan di dalamnya.
1. Bantuan yang disediakan
Untuk mengetahui ada atau tidaknya instruksi yang kita inginkan atau apa saja
yang disediakan oleh R, serta mengetahui cara penggunaannya, maka dapat
mengetikkan instruksi ini pada prompt yang tersedia :
a. > help(‘instruksi’) => untuk melihat keterangan dari sebuah instruksi yang
> ?’instruksi’ disediakan oleh R.
b. > example(‘instruksi’) => untuk melihat contoh penggunaan dari instruksi
yang ada.
c. > demo() => untuk melihat keterangan paket-paket tambahan
(misalnya grafik, dsb) yang terdapat pada R.
d. > demo(‘paket’) => untuk mendemokan paket-paket tambahan tersebut.
Bantuan lainnya :
a. > ls() => untuk melihat variabel-variabel yang pernah digunakan.
b. > rm(‘variabel’) => untuk menghapus variabel yang disebut.
c. CTRL+L => untuk membersihkan layar workspace atau ruang kerja
12
word processor sederhana lainnya. File yang akan
dipanggil sebaiknya disimpan satu folder program R yang
telah terinstall.
13
sebelumnya menggunakan notepad atau
word processor sederhana lainnya. Perlu
diingat, file tersebut harus disimpan bersama
dengan program R yang telah terinstall. File
tersebut juga harus berekstensi R.
14
15
Pertemuan 2
Objektif:
1. Mahasiswa dapat mengetahui Input data tersebar
2. Mahasiswa dapat menentukan Kelas, Tabel distribusi frekuensi dan titik tengah
3. Mahasiswa mampu membentuk tabel distribusi frekuensi Pada R-Programming
Dalam suatu penelitian biasanya dilakukan suatu kegiatan pengumpulan data. Data-data ini
digunakan untuk mendukung penelitian, dimana hasil dari penelitian ini bergantung pada banyak
dan ketepatan data-data yang berhasil dikumpulkan. Untuk memudahkan penggunaan data-data
itu dalam penelitian, maka data-data itu dapat diringkaskan atau disusun. Salah satu cara untuk
mengatur atau menyusun data adalah dengan mengelompokan data-data berdasarkan ciri-ciri
penting dari sejumlah besar data ke dalam beberapa kelas dan kemudian dihitung banyaknya
pengamatan yang masuk ke dalam setiap kelas. Susunan demikian dalam bentuk tabel
dinamakan Distribusi Frekuensi. Selain itu dapat disajikan dalam bentuk diagram dan grafik.
1. Sampel
2. Populasi
16
Data pada pengukuran statistika terdiri dari :
1. Data tersebar
2. Data berkelompok
Contoh :
1. Data tersebar
41 45 49 51 52 53 55 56 63 57 57 58 59 60 61 67 62 56 63 35 65 65 65 67 67 73 61 69 69
96 69 70 71 71 77 79 73 93 73 81 75 75 77 77 89 67 79 79 81 59 83 83 87 89 71 92 81 65
84 73
2. Data Berkelompok
Kelas Frekuensi
35-43 2
44-52 4
53-61 12
62-70 15
71-79 15
80-88 7
89-97 5
Σ 60
Pada pembahasan kali ini, hanya akan menggunakan data tersebar untuk membentuk data
berkelompok.
Langkah pertama yang harus dilakukan adalah menginput data tersebut ke variabel yang
tersimpan di R. Metode yang dapat dilakukan dapat anda pilih sesuai dengan kebutuhan.
Studi kasus :
17
1. Data Tersebar
Data Jumlah Pengunjung Toko ”Maju Mundur” Dalam 2 Bulan Terakhir adalah sbb :
41 45 49 51 52 53 55 56 63 57 57 58 59 60 61 67 62 56 63 35 65 65 65 67 67 73 61 69 69
96 69 70 71 71 77 79 73 93 73 81 75 75 77 77 89 67 79 79 81 59 83 83 87 89 71 92 81 65
84 73
Tentukan kelas, tabel distribusi frekuensi dan titik tengah dari data diatas !
Langkah-langkah Pengerjaan :
1. Input data ke variabel yang tersimpan di R
Ketikan data=
c(41,45,49,51,52,53,55,56,63,57,57,58,59,60,61,67,62,56,63,35,65,65,65,67,
67,73,61,69,69,96,69,70,71,71,77,79,73,93,73,81,75,75,77,77,89,67,79,79,81,59,83,83,87,
89,71,92,81,65,84, 73),enter
18
Maka didapat hasilnya adalah
[1] 41 45 49 51 52 53 55 56 63 57 57 58 59 60 61 67 62 56 63 35 65 65 65 [24] 67 67 73
61 69 69 96 69 70 71 71 77 79 73 93 73 81 75 75 77 77 89 67 [47] 79 79 81 59 83 83 87 89
71 92 81 65 84 73
3. Lakukan sortir data, penentuan nilai terbesar dan terkecil serta jumlah data untuk
memudahkan pendokumentasian
Ketikan sort(data)
19
Maka didapat hasilnya adalah
[1] 35 41 45 49 51 52 53 55 56 56 57 57 58 59 59 60 61 61 62 63 63 65 65 [24] 65 65 67
67 67 67 69 69 69 70 71 71 71 73 73 73 73 75 75 77 77 77 79 [47] 79 79 81 81 81 83 83 84
87 89 89 92 93 96
20
Maka diperoleh hasilnya
[1] 96
[1] 35
[1] 60
Dalam menentukan berapa buah kelas yang harus dibentuk hal ini tergantung pada keadaan dan
banyaknya data, dimana harus dihindarkan terlalu banyak ataupun terlalu sedikit terbentuknya kelas.
Semakin sedikit banyaknya data semakin sedikit pula banyaknya kelas yang diambil.
Ketikan pada R
21
jmlkelas=1+(3.322*log10(length(data))) kemudian tekan enter
Maka diperoleh
[1] 6.907018
[1] 7
Untuk menentukan interval kelas maka harus diperoleh nilai jangkauan dan
22
jumlah kelas.
Ketikan pada R,
[1] 61
Pembulatan
Maka diperoleh
[1] 8.714286
23
Untuk pembulatan menggunakan round, maka diperoleh
[1] 9
Setelah didapat data yang dibutuhkan, maka langkah selanjutnya adalah membentuk
tabel distribusi frekuensi dengan terlebih dahulu membuat fungsi untuk menyeleksi data
terhadap kelas yang tersedia. Fungsi yang dibuat dapat menggunakan metode-metode
24
Kemudian jalankan fungsi tersebut pada konsol dengan memasukkan data yang akan
frek(data,35,43)
frek(data,44,52)
frek(data,53,61)
frek(data,62,70)
frek(data,71,79)
frek(data,80,88)
frek(data,89,97)
[1] 2
25
[1] 4
[1] 12
[1] 15
[1] 15
[1] 7
[1] 5
Ketikan pada R
median(35:43)
median(44:52)
median(53:61)
median(62:70)
median(71:79)
median(80:88)
median(89:97)
26
Maka hasilnya adalah
[1] 39
[1] 48
[1] 57
[1] 66
[1] 75
[1] 84
[1] 93
27
Pertemuan 3
Objektif:
1. Mahasiswa dapat memahami Tabel distribusi frekuensi dalam bentuk histogram dan
polygon
2. Mahasiswa mampu menggambarkan Tabel distribusi frekuensi dalam bentuk histogram
pada R-Programming.
3. Mahasiswa mampu menggambarkan Tabel distribusi frekuensi dalam bentuk Polygon
pada R-Programming.
POLYGON
Berbeda dengan penyajian-penyajian sebelumnya, pada penyajian berikut ini, data tidak
lagi disajikan dalam bentuk tabel-tabel, melainkan dalam bentuk diagram-diagram. Penyajian
dalam bentuk diagram-diagram ini akan memudahkan setiap orang yang ingin membaca data
28
dengan cepat. Hanya saja, informasi yang diperoleh oleh pembaca tidak lagi jelas dan rinci.
A. Histogram
Histogram merupakan sekumpulan empat persegi panjang yang digambar dalam suatu
bagan salib sumbu. Sumbu tegak histogram menggambarkan frekuensi data dan sumbu
data.
Terakhir")
29
B. Polygon
ttktengah=c
fi
Terakhir")
30
31
32
Pertemuan 4
Objektif:
1. Mahasiswa dapat mengetahui maksud dari mean,median,dan modus
2. Mahasiswa dapat menentukan nilai mean,median,modus pada R-Programming
Rata-rata hitung, atau lebih dikenal dengan rata-rata, merupakan ukuran pusat data yang
paling sering digunakan, karena mudah dimengerti oleh siapa saja dan penghitungannya pun
mudah.
Keterangan :
n = banyaknya data
2. Ketikan pada R, m
33
Maka nilai rata-rata hitung(mean) dengan R
[1] 68.66667
Keterangan :
n = banyaknya data
34
Maka rata-rata hitung (mean)dengan R didapat
[1] 39 48 57 66 75 84 93
2. Ketikan pada R, fi
[1] 2 4 12 15 15 7 5
35
Maka hasilnya adalah
Maka hasilnya
[1] 4122
[1] 68.7
Median adalah ukuran pusat data yang nilainya terletak di tengah-tengah rangkaian data
36
yang terurut.
Ketikan data[length(data)/2]
[1] 96
Keterangan :
md = median
i = interval kelas
n = banyaknya data
37
Contoh mencari median dengan R :
NB:
Bm = Batas bawah kelas median = 61,5
Fkm =frekuensi kumulatif sebelum kelas median =(2+4+12) = 18
Fm =frekuensi median = 15
38
Kemudian ketikan pada R, interval, kemudian enter
Ketikan md<-bm+(interval*(((length(data)/2)-fkm)/fm)), kemudian enter
Ketikan md, kemudian enter
Kemudian ketik round(md) untuk pembulatan
[1] 9
[1] 68.7
[1] 69
Modus adalah suatu nilai yang terdapat dalam serangkaian data yang memiliki frekuensi
39
tertinggi.
Keterangan :
mo = modus
i = interval kelas
> mds<-bm+(interval*(d1/(d1+d2)))
40
Pertemuan 5
Objektif:
1. Mahasiswa dapat mengetahui maksud dari quartil, decil
2. Mahasiswa dapat menentukan nilai quarti dan decil pada R-Programming
QUARTIL
Jika dalam menentukan titik letak median, sederetan data terurut dibagi menjadi dua,
maka kuartil membagi sederetan data terurut menjadi empat bagian yang sama. Dengan
demikian, nantinya akan terdapat tiga kuartil : yaitu kuatrtil pertama (Q1), kuartil kedua atau
median, dan kuartil ketiga (Q3). Letak kelas ketiga kuartil (untuk data yang telah
Jika sudah mengetahui letak kelas masing-masing quartil, maka nilai quartil dapat dicari
dengan rumus :
41
Keterangan :
i = interval kelas
42
- q3 =70,5
Fkq =frekuensi kumulatif sebelum kelas quartil
- q1 = 2+4 =6
- q3 = 2+4+12+15 = 33
Fq =frekuensi kelas quartil
- q1 =12
- q3 =15
> lq1=15
> lq3=45
> bq1=52.5
> bq3=70.5
> fkq1=6
> fkq3=33
> fq1=12
> fq3=15
> q1<-bq1+(interval*(((length(data)/4)-fkq1))/fq1)
> q3<-bq3+(interval*(((3*length(data)/4)-fkq3))/fq3)
> lq1
[1] 15
> lq3
[1] 45
> bq1
[1] 52.5
> bq3
[1] 70.5
> fkq1
[1] 6
> fkq3
[1] 33
> fq1
[1] 12
> fq3
[1] 15
> q1
[1] 59.25
> q3
[1] 77.7
43
DESIL
Jika pada kuartil deretan data terurut dibagi menjadi empat, maka pada desil deretan
data dibagi menjadi sepuluh bagian yang sama. Perumusan yang digunakan pun tidak jauh
berbeda. Yang berbeda hanya bagian rumus yang menentukan letak kelas desil.
44
45
Pertemuan 6
Objektif:
1. Mahasiswa dapat mengetahui maksud dari persentil, deviasi rata-rata.
2. Mahasiswa dapat menentukan nilai persentil dan deviasi rata-rata pada R-Programming
PERSENTIL
Persentil membagi sederetan data menjadi seratus bagian yang sama. Sama pada desil,
.....
.....
.....
.....
.....
46
DEVIASI RATA-RATA
Deviasi rata-rata adalah rata-rata beda absolut antara data observasi secara individual
Keterangan :
X = rata-rata (mean)
n = banyaknya data
+{
+ print((sum(abs(x-mean(x))))/length(x))
+}
47
dev
function(x)
print((sum(abs(x-mean(x))))/length(x))
dev(data)
[1] 10.34444
Keterangan :
48
Contoh mencari deviasi rata-rata dengan R :
Ketikan deviasi<-function(x,y,z)
+{
+ print(sum(abs(x-mean(y))*z)/length(y))
+}
deviasi
function(x,y,z)
print(sum(abs(x-mean(y))*z)/length(y)
deviasi(ttktengah,data,fi)
[1] 10.76667
49
Pertemuan 7
Objektif:
1. Mahasiswa dapat mengetahui maksud dariVarians, Simpangan Baku.
2. Mahasiswa dapat menentukan nilai varians dan Simpangan baku pada R-Programming
VARIANS
Varians adalah alat ukur variabilitas serangkaian data yang dihitung dengan mencari rata-
rata selisih/beda kuadrat antara data observasi dengan pusat datanya (biasanya menggunakan
rata-rata).
Keterangan :
X = rata-rata (mean)
n = banyaknya data
+{
50
+ sum((x-mean(x))^2)/(length(x)-1)
+}
function(x)
sum((x-mean(x))^2)/(length(x)-1)
v(data)
51
Maka hasilnya adalah
[1] 169.1412
Keterangan :
+{
+ print(sum(((x-mean(y))^2)*z)/(length(y)-1))
+}
variasi
function(x,y,z)
print(sum(((x-mean(y))^2)*z)/(length(y)-1))
variasi(ttktengah,data,fi)
52
Maka didapat hasilnya,
[1] 176.5537
SIMPANGAN BAKU
Dalam praktisnya, ukuran variabilitas yang sering digunakan adalah simpangan baku yang
Ketikan pada R, sb
function(x)
53
{
sqrt(sum((x-mean(x))^2)/(length(x)-1))
sb(data)
[1] 13.00543
function(x,y,z)
print(sqrt(sum(((x-mean(y))^2)*z)/(length(y)-1)))
smb(ttktengah,data,fi)
54
Maka didapat hasilnya adalah
[1] 13.28735
55