Anda di halaman 1dari 21

PENGENALAN BAHASA R UNTUK ANALISIS DATA DAN GRAPHIK

I G.A. Anom Yudistira (D1392)


e-mail: anom1392 le!"#$e$%&in#'%a!%i(

)URUSAN STATISTIKA *AKULTAS +ATE+ATIKA DAN IL+U PENGETAHUAN ALA+ UNI,ERSITAS BINA NUSANTARA

2--. 1. Pengantar R adalah suatu sistem untuk analisis statistik dan grafik yang diciptakan oleh Ross Ihaka dan Robert Gentleman. Kelebihan yang diperoleh bila menggunakan bahasa R untuk pengajaran statistik adalah: R dapat diperoleh dengan gratis. R merupakan suatu open-source dan dapat digunakan pada berbagai sistem operasi seperti UNIX !indo"s #inu$ dan %acintosh. R memiliki sistem bantuan &help' yang canggih. R memiliki kemampuan membuat grafik yang canggih. %ahasis"a dapat dengan mudah berpindah ke sistem komersial S-Plus bila soft"are komersial diperlukan. (ahasa R mempunyai kemampuan yang tangguh sinta$nya mudah dipelajari dengan banyak fungsi)fungsi statistik yang terpasang &built-in'. (ahasa R dapat dengan mudah diperluas dengan menciptakan fungsi)fungsi buatan pengguna sendiri. R merupakan bahasa pemrograman komputer sehingga bagi pemrogram menjadi lebih akrab sedangkan bagi pemakai a"al akan merupakan langkah yang mudah untuk memulai sebagai pemrogram komputer.

*pa yang menjadi kelemahan R dibandingkan dengan soft"are)soft"are statistik yang lain. R memiliki antarmuka untuk grafik yang terbatas &+),lus memiliki lebih banyak'. -idak tersedia dukungan komersial &tetapi mailing list internasional dapat menggantikannya'. ,erintah)perintahnya merupakan bahasa pemrograman jadi mahasis"a harus mempelajari sintaksnya.

+ebagaian besar fungsi)fungsi +),lus dapat digunakan pada R. .ungsi)fungsi tersebut dapat dilihat di: http://""".insightful.com/products/splus/default.html atau di http://stat.cmu.edu/+/. +edangkan alamat "eb untuk bahasa R adalah http://""".r) project.org file instalasi R dapat di do"nload gratis di 0R*N pada "eb ini. 2. Bagaimana R bekerja R adalah bahasa pemrograman berorientasi objek yang artinya semua peubah data fungsi hasil dan sebagainya disimpan dalam memori aktif komputer dalam bentuk objek yang mempunyai nama. ,engguna dapat melakukan aksi terhadap objek ini dengan menggunaka operator &aritmatik logikal dan pembanding' dan fungsi &yang dia sendiri merupakan objek'. +emua aksi R dilakukan pada objek)objek yang ada pada memori aktif komputer: tampa menggunakan file temporer &temporary file'. ,roses membaca dan menulis file hanya digunakan untuk input dan ouput data dan hasil &grafik 1'. ,engguna mengeksekusi fungsi melalui serangkaian perintah dan hasilnya ditampilkan langsung pada layar disimpan pada objek atau ditulis ke hard disk &khususnya grafik'. Karena hasil itu sendiri merupakan objek maka ia dapat dipandang sebagai data dan dianalisa sebagaimana halnya data. .ile)file data dapat dibaca dari disk lokal atau ser2er malalui internet.
2/21

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

.ungsi)fungsi yang tersedia untuk pengguna disimpan pada sebuah library di disk dalam sebuah direktori bernama R345%6/library &R345%6 adalah direktori dimana R terpasang'. 7irektori ini berisi fungsi)fungsi packages yang mana mereka tersusun dalam direktori)direktori. ,ackage yang bernama base merupakan inti dari R yang berisi fungsi)fungsi dasar dari bahasa R untuk membaca dan memanipulasi data beberapa fungsi)fungsi grafik dan sebagian fungsi)fungsi statistik. +etiap package berada pada direktori R dan direktorinya diberi nama sama dengan nama package tersebut. %isal package base file)filenya ada pada R345%6/library/base/R/base. 3. Data Starting R +atelah anda membuka R maka pada console akan tampil sebagai berikut

-anda 8 disebut prompt. -anda ini muncul secara otomatis tidak perlu diketik yang mana berguna sebagai penunjuk dimana anda akan mengetikkan perintah)perintah R seperti pada teladan di ba"ah ini. 9ika sebuah perintah terlalu panjang maka anda dapat melanjutkan ke baris berikutnya &dengan menekan enter' dan akan muncul tanda : sebagai prompt yang berarti kelanjutan dari baris di atasnya.

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

3/21

%enciptakan object dalam memori aktif +ebuah object dapat diciptakan dengan operator ;<- atau ->< untuk 2ersi =.> ke atas dapat dengan operator ;?<. -eladan: (uatlah objek n yang bernilai =@ &dalam bahasa sehari)hari objek n adalah 2ariabel n'
> n<-1 > n !1" 1 > 1 ->n > n !1" 1 > n#1$ > n !1" 1$

% nilai ob&e' n (an) lama (1 ) di*a+us , di)anti den)an 1$

+emua kata dibelakan tanda A tidak akan diproses oleh R. (ahasa R sensitif terhadap huruf besar atau kecil &case sensitive' "alaupun menggunakan sistem operasi "indo"s. 9adi objek $ dan X merupakan objek yang berbeda.
> -<-1 > .<-1$ > !1" 1 > . !1" 1$

Nilai yang diberikan pada sebuah objek dapat merupakan hasil dari suatu operasi dan/atau fungsi.
> n<- /2 > n !1" 0 > n<-2/rnorm(1) > n !1" 2.023230

% 1un)si rnorm(1) memban)'it'an sebua* +euaba* aca' normal ba'u

*nda dapat menuliskan ekpresi tanpa menyimpan hasilnya ke objek &memori' tetapi menampilkan secara langsung ke layar.
> (1$/2)43 !1" 32 > s5rt(12) % 1un)si a'ar 'uadrat !1" 6

%emasukkan 7ata dengan fungsi c 7ata dengan jumlah kecil lebih efisien dimasukkan dengan menggunakan fungsi c. %isalakan anda akan memasukkan data jumlah salah ketik per halaman untuk B lembar halaman ketikan datanya adalah: 2 3 $ 3 1 $ $ 1
Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

6/21

> salti'<-c(2737$73717$7$71) > salti' !1" 2 3 $ 3 1 $ $ 1

Rata)rata median ragam dan simpangan baku dari data yang disimpan pada peuabah saltik diperoleh dengan menggunakan fungsi)fungsi berikut:
> mean(salti') !1" 1.2 > median(salti') !1" 1 > 8ar(salti') !1" 1.2623 0 > sd(salti') !1" 1.23106 % rata-rata % median % ra)am sam+el % sim+an)an ba'u sam+el

Ringkasan statistiknya diperoleh dengan fungsi summary


> summar((salti') 9in. 1st :u. 9edian $.$$ $.$$ 1.$$ 9ean 3rd :u. 1.2 2.2 9a-. 3.$$

(ila anda bermaksud untuk mengambil satu persatu nilai ringkasan statistik dari saltik maka lakukan serangkaian perintah berikut.
> rin)'as<-summar((salti') > rin)'as!1" % ambil nilai ob&e' rin)'as +ada urutan 1 9in. $ > rin)'as!2" % ambil nilai ob&e' rin)'as +ada urutan 2 1st :u. $ > rin)'as! " % ambil nilai ob&e' rin)'as +ada urutan 3rd :u. 2.2

7ata sebagai vektor +ebagaimana telah terlihat sebelumnya data oleh R diperlakukan sebagai sebuah 2ektor. +ehingga urutan pemasukkan datanya akan terlacak.
> salti'!2" % data salti' +ada urutan 27 +er*ati'an )una'an 'urun) si'u !1" 3 > salti'!3" % data salti' +ada urutan 3 !1" 1

mempunyai dua buah data salah ketik sebagai berikut. dimasukkan ke objek salti'.dra11 dan data $737$737$7$71 dimasukkan ke objek salti'.dra12. ,eubah salti'.dra12 hanya berbeda pada data urutan = dengan salti'.dra12 maka lebih efisien memasukkan datanya adalah sebagai berikut.
2737$73717$7$71 > salti'.dra11<-c(2737$73717$7$71)
Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

%isalkan

kita

/21

> salti'.dra12<-salti'.dra11 % co+( data salti'.dra11 'e salti'.dra12 > salti'.dra12!1"<-$ % )anti nilai data +ada urutan satu den)an $ > salti'.dra11 !1" 2 3 $ 3 1 $ $ 1 > salti'.dra12 !1" $ 3 $ 3 1 $ $ 1 > salti'.dra12!6" % data urutan 6 !1" 3 > salti'.dra12!-6" % semua data 'ecuali urutan 6 !1" $ 3 $ 1 $ $ 1 > salti'.dra12!c(17273)" % data urutan 172 dan 3 !1" $ 3 $

%isalkan anda ingin mengetahui jumlah salah ketik yang paling banyak dan ada pada halaman mana sajaC maka gunakan rangkain perintah berikut.
> ma-(salti'.dra12) !1" 3 > salti'.dra12##3 % o+erator com+arison ## berarti sama den)an !1" ;A<=> ?@A> ;A<=> ?@A> ;A<=> ;A<=> ;A<=> ;A<=> > B*ic*(salti'.dra12##3) % 1un)si ini mencari urutan data (an) bernilai ?@A> !1" 2 6

(ila anda tidak menggunakan fungsi "hich maka dapat dilakukan dengan cara yang lebih meutar yaitu.
> n<-len)t*(salti'.dra12) % bera+a ban(a' data (*alaman) > *al<-1:n % cara untu' mmmenda+at'an nomor *alaman > *al !1" 1 2 3 6 2 0 3 > *al!salti'.dra12##3" !1" 2 6

perintah *al<-1:n adalah cara ringkas untuk menuliskan perintah *al<-c(1:n). 0ara yang lebih ringkas untuk menuliskan perintah)perintah untuk mendapatkan nomor halaman dengan salah ketik terbanyak adalah.
> (1:len)t*(salti'.dra12))!salti'.dra12##3" !1" 2 6

%ungkin anda ingin mengetahui berapa jumlah salah ketik dari seluruh draf D mungkin juga ingin mengetahui berapa banyak halaman dengan salah ketik lebih dari D dan terakhir berapa perbedaan salah ketik untuk setiap halaman yang bersesuaian. Untuk mendapatkan ja"abannya perhatikan perintah)perintah berikut.
> sum(salti'.dra12) % bera+a &umla* sala* 'eti' ($/3/$/3/1/$/$/1) !1" 3 > sum(salti'.dra12>2) % bera+a ban(a' *al. d). sala* 'eti' lebi* dari 2 !1" 2 > salti'.dra11-salti'.dra12 !1" 2 $ $ $ $ $ $ $

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

2/21

Latihan =. %asukkanlah data di ba"ah ini dengan fungsi c dan letakkan pada objek $ >@ >E >F >B @= >F @G >H >F >@ D. 0arilah nilai rata)rata median maksimum dan minimum E. a. b. c. d. -ambahkan data objek $ dengan >B >I @= @G >I (aerapa banyak datanya sekarang &gunakan fungsi len)t*'C (erikan nilai >= pada objek $ sebagai data ke =F &gunakan -!12"). -ambahkan datanya dengan >G EB E@ >G &gunakan -!10:2$").

Antarmuka (interface) Data Entri Gra hi! R menyediakan banyak cara lain untuk mengedit data melalui antarmuka spreadsheet. *ntar muka ini mungkin lebih disukai mahasis"a. (erikut ini adalah beberapa contohnya.
> data.entr((-) % muncul s+reads*eet untu' men)edit data > -<-de(-) % idem7 coba +er*ati'an +er bedaann(a den)an men)eti' > -<-edit(-) % muncul note+ad editor untu' men)edit -

+emua perintah di atas mudah untuk digunakan. hanya saja objek data yang akan diedit harus telah didefinisikan sebelumnya bila objek belum ada maka akan timbul pesan kesalahan seperti berikut ini.
> data.entr((C) % )a)al7 ob&e' C belum terde1inisi >rror in de(...7 9odes # 9odes7 Dames # Dames) : Eb&ect FCF not 1ound > data.entr((C#c(DA)) % muncul s+reads*eet > CC<-numeric() % de1inisi'an 8aribel/ob&e' CC den)an ti+e numeri' > data.entr((CC) % muncul s+reads*eet Geteran)an:

9ika objek JJ bertipe karakter maka gunakan fungsi c*aracter().

Latihan =. 7ata berikut ini adalah jumlah mahasis"a yang hadir kuliah pada suatu kelas tertentu di uni2ersitas (ina Nusantara selama =D kali pertemuan. 62 33 39 30 62 3$ 63 32 69 3 3$ 63 a. b. c. d. 6ntri data ke 2ariabel hadir gunakan antarmuka spreadsheet. 4itunglah berapa banyak pertemuan dengan kehadiran kurang dari >G mahasis"a. -ampilkan semua data kecuali data pertemuan D > F B dan =G. Gunakan fungsi range untuk mendapatkan kehadiran terbanyak dan terrendah

> ran)e(*adir) !1" 3$ 69

e. Gunakan fungsi diff untuk mencari selisih kehadiran yang berurutan.


9 -12 13 -12 10 -16 13

> di11(*adir) !1" -13 2 -2

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

0/21

> di11(ran)e(*adir)) % rentan) data !1" 19

f.Gunakan fungsi cumma$ untuk mendapatkan kehadiran terbanyak secara komulatif. g. Gunakan fungsi cummin untuk mendapatkan kehadiran terrendah secara komulatif. h. Rentang antar kuartil diperoleh dengan menggunakan fungsi IKR

> cumma-(*adir) !1" 62 62 62 62 62 62 63 63 69 69 69 69 > cummin(*adir) !1" 62 33 33 33 33 3$ 3$ 3$ 3$ 3$ 3$ 3$

> i5r<-H:@(*adir) % nilai H:@ disim+an di ob&e' i5r > i5r !1" 13.0

%enampilkan daftar objek dan menghapusnya. Untuk melihat objek apa saja yang telah dibuat adalah sebagai berikut.
> ls() % meli*at da1tar ob&e' (an) tela* dibuat
!1" Fc(DA)F !2" FnF !11" F-F F*adirF Frin)'asF F.F F*alF Fsalti'F FC2F Fi5rF Flast.Barnin)F Fsalti'.dra11F Fsalti'.dra12F FCCF

*nda mungkin saja mendapatkan daftar objek yang berbeda dengan di atas.
> rm(*adir) % men)*a+us ob&e' *adir > ls() % ob&e' *adir *ilan) dari da1tar !1" Fc(DA)F F*alF Fi5rF Flast.Barnin)F FnF !2" Frin)'asF Fsalti'F Fsalti'.dra11F Fsalti'.dra12F F-F !11" F.F FC2F FCCF > rm(list#ls()) % men)*a+us semua ob&e' dari memori a'ti1 > ls() c*aracter($)

Untuk membersihkan layar &console' tekan 0tr:# ". Data #nivariate *da bermacam)macam tipe data dalam statistik dan R dapat membedakan hal itu. Khususnya data dapat dibagi dalam tiga tipe dasar yaitu katagorik numerik diskret dan numerik kontinu. 7ata Katagorik 7ata katagorik biasa disajikan dalam bentuk tabel grafik batang &bar graph' diagram kue &pie chart' dan sebagainya. ,enggunaan -abel .ungsi table digunakan menyajikan data katagorik dalam bentuk tabel. Teladan. Survei Merokok
Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

3/21

+ebuah sur2ei menanyakan @ orang apakah ia seorang perokok atau tidak. 7atanya adalah: La -idak -idak La La. %asukkan data tersebut dalam R dengan fungsi c() menggunakan fungsi table() sebagai berikut.
> -<-c(FYaF7F?ida'F7F?ida'F7FYaF7FYaF) > table(-) ?ida' Ya 2 3

dan ringkaskan dengan

7ata katagorik umumnya mengklasifiksikan datanya dalam beberapa le2el atau faktor. .ungsi factor mendapatkan le2el dari data katagorik.
> 1act-<-1actor(-) > 1act!1" Ya ?ida' ?ida' Ya <e8els: ?ida' Ya

Ya

5bjek fact$ sekarang mempunyai le2el tetapi $ tidak. memperlihatkan hal itu.
> le8els(1act-) !1" F?ida'F FYaF > le8els(-) DA<<

,erintah berikut ini

(ila nama le2el diubah -idak menjadi non)perokok dan La menjadi perokok hasilnya adalah.
> le8els(1act-)<-c(Fnon-+ero'o'F7 F+ero'o'F) > le8els(1act-) !1" Fnon-+ero'o'F F+ero'o'F > 1act!1" +ero'o' non-+ero'o' non-+ero'o' +ero'o' <e8els: non-+ero'o' +ero'o' > - % nilai ob&e' - tida' beruba* !1" FYaF F?ida'F F?ida'F FYaF FYaF > table(1act-) 1actnon-+ero'o' +ero'o' 2 3

+ero'o'

Grafik (atang &Bar Graph' Garfik batang menampilkan sebuah batang yang tingginya sesuai dengan pencacahan dalam tabel &yang dilakukan oleh fungsi table()'. -inggi batang dapat mencerminkan frekuensi atau proporsi keduanya akan nampak sama kecuali skalanya. Teladan. Survei Olah Raga Permainan
Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

9/21

*da D@ mahasis"a ditanyakan tentang permainan olah raga yang paling disukai. Kategorinya adalah sebagai berikut : &='. +epak (ola &D'. (ola Moli &E'. (asket &>'.lainnya. 7ata mentahnya adalah sebagai berikut. 3 6 1 1 3 6 3 3 1 3 2 1 2 1 2 3 2 3 1 1 1 1 6 3 1 (erikut ini akan digunakan fungsi scan untuk membaca data di atas
> or<-scan() 1: 3 6 1 1 3 6 3 3 1 3 2 1 2 1 2 3 2 3 1 1 1 1 6 3 1 22: @ead 2 items > bar+lot(or) % sala*7 (an) ditam+il'an data indi8idual

> bar+lot(table(or)) % benar7 (an) ditam+il'an 1re'uensi

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

1$/21

> bar+lot(table(or)/len)t*(or)7col#rainboB(6)) %benar7 (an) ditam+il'an +ro+orsi

Keterangan: argumen col#rainboB(6) pada fungsi bar+lot akan memberikan tampilan "arna yang berbeda)beda untuk tiap batang.

-ampaknya disini perintah table(or)/len)t*(or)akan memberikan nilai tabel proporsional.


> table(or)/len)t*(or) or 1 2 3 6 $.6$ $.12 $.32 $.12

Diagram Roti (Pie Chart) 7ata yang sama dapat dianalisis dengan menggunakan diagram roti dengan menggunakan fungsi +ie. (erikut ini adalah sebuah teladan dalam penggunaan fungsi +ie.
> +ie(or.1re') % 1re'uensi data or disim+an +ada ob&e' or.1re' > +ie(or.1re') % menam+il'an dia)ram roti

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

11/21

> names(or.1re')<-c(F=e+a'In JolaF7 FKoliF7FJas'etF7F<ainn(aF) % beri > +ie(or.1re'7 col#c(F+ur+leF7F)reen2F7Fc(anF7Fred1F) % tamba* Barna

nama

(ila anda ingin mengetahui lebih jauh tentang fungsi barplot dan pie gunakan perintah berikut.
> Lbar+lot > L+ie

Data $umerik (Numerical data) *da berbagai pilihan untuk memperagakan data numerik antara lain ringkasan numerik pemusatan &center' dan dispersi &spread'.
12/21

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

Ukuran numerik untuk pemusatan dan dispersi Untuk menggambarkan distribusi data perlu diketahui lebih dahulu dimana pemusatan datanya dispersi datanya. Ukuran)ukuran itu dicari dengan menggunakan fungsi mean7 8ar7 sd7 median atau dalam bentuk ringkasan seperti summar( dan 1i8enum. .ungsi terakhir ini memberikan hasil ringkasan lima angka. R khususnya dalam package base menyediakan banyak fungsi terpasang & built-in'. .ungsi data() digunakan untuk melihat semua data yang tersedia seperti berikkut ini.
> data() % meli*at data ter+asan) a+a sa&a (an) tersedia > data(1ait*1ul) % meman))il data 1ait*1ul > 1ait*1ul % meli*at isi dari ob&e' data 1ait*1ul eru+tions Baitin) 1 3.2$$ 09 2 1.3$$ 6 MM. dst MMM 202 6.620 06

Untuk menampilkan object eruptions gunakan perintah 1ait*1ulNeru+tions perhatikan karakter N sebagai penyambung. .ungsi attac*() digunakan agar dapat langsung memanggil 2ariabel eruptions yang berada pada posisi di ba"ah faithful.
> eru+tions % sala*7 ob&e' tida' ditemu'an > 1ait*1ulNeru+tions % ob&e' eru+tions ada di baBa* 1ait*1ul !1" 3.2$$ 1.3$$ 3.333 2.233 6. 33 2.333 M dst M. > attac*(1ait*1ul) % mela'u'an +encarian di baBa* 1ait*1ul > eru+tions % eru+tions da+at dicari secara lan)sun) !1" 3.2$$ 1.3$$ 3.333 2.233 6. 33 M dst M > eru+<-eru+tions % menci+ta'an ob&e' eru+ (an) berisi data eru+tions > detac*(1ait*1ul) % a'*iri +encarian

+ekarang kita dapat bekerja pada objek erup saja "alaupun objek faithful dihapus dari memori aktif.
> mean(eru+) !1" 3.630033 > mean(eru+7.1$) % rataan d). meman)'as 1$O data di atas , di baBa* !1" 3. 293$0 > sd(eru+) !1" 1.161301 > summar((eru+) 9in. 1st :u. 9edian 9ean 3rd :u. 9a-. 1.2$$ 2.123 6.$$$ 3.633 6.6 6 .1$$ > 1i8enum(eru+) % min7 en)sel baBa*7 median7 en)sel atas7 ma!1" 1.2$$$ 2.1 3 6.$$$$ 6.6 3 .1$$$

,erhatikanlah perbedaan antara summar( dan 1i8enum. %edian adalah Nuantile ke @GO Nuartil = adalah Nuantile G.D@ sedangkan Nuartil E adalah Nuantil G.H@. 9adi Nuantile p adalah persentil ke =GGpO. .ungsi Nuantile digunakan untuk menampilkan nilai persentil yang dimaksud.
> 5uantile(eru+7$.2 ) % memberi'an +ersentil 'e 2 O
Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

13/21

2 O 2.1220 > 5uantile(eru+7$.0 ) % memberi'an +ersentil 'e 0 O 0 O 6.6 62 > 5uantile(eru+7$. $) $O 6 > 5uantile(eru+7$.1 ) 1 O 1.910 > 5uantile(eru+7c($.1 7$.2 7$. $7$.0 7$.3 )) % mem+era)a'an se'ali)us 1 O 2 O $O 0 O 3 O 1.910$$ 2.1220 6.$$$$$ 6.6 62 6.2$$$$

+impangan rata)rata median &%*7' merupakan suatu ukuran dispersi yang resisten terhadap pencilan rumusnya sebagai berikut median PXi Q median&X'P &=.>BDF' Konstanta =.>BDF merupakan faktor pembanding terhadap simpangan baku normal. .ungsi mad() mendapatkan nilai simpangan tersebut.
> mad(eru+) !1" $.9 1$309

7iagram dahan)dan)daun &stem-and-leaf chart' Untuk melihat pola data khususnya untuk data dengan jumlah sedikit biasa digunakan diagram dahan)dan)daun. .ungsi stem() memperagakan diagram ini. -eladan: 7ata berikut ini adalah lamanya "aktu &dalam menit' yang diperlukan untuk menunggu lift di U(INU+ kampus anggrek sehingga dapat digunakan. 2 3 12 23 16 12 6 13 2 $ $ $ 2 23 31 16 6 3 2
> li1t<-scan() 1: 2 3 12 23 16 12 6 13 2 $ $ $ 2 23 31 16 6 3 2 21: @ead 2$ items

(ila lupa nama persisnya dari fungsi stem maka dapat dicari dengan menggunakan fungsi a+ro+os().
> a+ro+os(FstemF) !1" FstemF Fs(stemF > stem(li1t) Fs(stem.1ileF Fs(stem.timeF

?*e decimal +oint is 1 di)it(s) to t*e ri)*t o1 t*e P $ P $$$222366 23 1 P 23662 2 P 33 3 P 1 > stem(li1t7scale#2)
Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

16/21

?*e decimal +oint is 1 di)it(s) to t*e ri)*t o1 t*e P $ $ 1 1 2 2 3 P P P P P P P $$$222366 23 2366 2 3 3 1

%embuat data numerik dalam bentuk kategorik Kembali pada data erup disini kita akan membaginya dalam I kelas &karena 2Q3<len)t*(eru+)<2Q9'. #ebar kelasnya dipilih G.> &pembulatan ke atas dari di11(ran)e(eru+))/9'. +ehingga diperoleh kelas)kelas sebagai berikut.
!1. 7 1.9" (1.97 2.3" (2.37 2.0" (3.97 6.3" (6.37 6.0" (6.07 .1" (2.07 3.1" (3.17 3. "

(3. 7 3.9"

> eru+.'at<-cut(eru+7brea's#c(1. 71.972.372.073.173. 73.976.376.07 .1)) > eru+.'at


!1" (3. 73.9" (1. 71.9" (3.173. " (1.972.3" (6.376.0" (2.073.1" (6.376.0" M.. M.. M.. M. dst M. M. M. M. M. !220" (6.07 .1" (3.976.3" (1.972.3" (6.376.0" (1. 71.9" (6.376.0" 9 <e8els: (1. 71.9" (1.972.3" (2.372.0" (2.073.1" (3.173. " ... (6.07 .1"

> table(eru+.'at) eru+.'at


(1. 71.9" (1.972.3" (2.372.0" (2.073.1" (3.173. " (3. 73.9" (3.976.3" (6.376.0" 6$ 62 12 6 3 21 2 20 (6.07 .1" 22

4istogram (entuk grafik yang paling sering digunakan untuk memperagakan data numerik adalah histogram. .ungsi *ist() menghasilkan histogram yang dimaksud.
> *ist(eru+7col#)ra(($.3)) % 'elas ditentu'an secara automati' > % &i'a 'elas ditentu'an ole* user7 misal'an se+erti 'elas () tela* > % dicari sebelumn(a ma'a M
> *ist(eru+7brea's#c(1. 71.972.372.073.173. 73.976.376.07 .1)7col#)ra(($.3 ))

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

1 /21

> *ist(eru+7col#)ra(($.3)7+robabilit(#?@A>) % mem+era)a'an +ro+orsi > ru)(&itter(eru+)) % menamba*'an tanda tic'

7iagram Kotak Garis &Boxplots' ,eragaan diagram kotak garis memberikan informasi secara cepat mengenai kesimetrikan data dan munculnya pencilan &outliers'. .ungsi bo-+lot() memberikan peragaan diagram kotak garis.
> bo-+lot(eru+7main#FDia)ram Gota' Raris >ru+siF7*oriContal#?@A>7 / col#)ra(($.3 ))

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

12/21

,eragaan 4istogram dan Kotak Garis secara bersamaan ,ackage +imple menyediakan fungsi sim+le.*ist.and.bo-+lot() untuk memperagakan histogram dan kotak garis secara bersama)sama. ,erintah librar(() adalah untuk melihat library apa saja yang telah di install. ,erintah librar((=im+le) akan memanggil package =im+le.
> librar(() % meli*at +ac'a)e a+a sa&a () tersedia > librar((=im+le) % meman))il +ac'a)e =im+le > a+ro+os(Fsim+leF) % 1un)si sim+le a+a sa&a (an) tersedia !1" Fsim+le.c*utesF Fsim+le.densit(+lotF !3" Fsim+le.densit(+lot.de1aultF Fsim+le.densit(+lot.1ormulaF ! " Fsim+le.edaF Fsim+le.eda.tsF !0" Fsim+le.1anc(.stri+c*artF Fsim+le.1re5+ol(F !9" Fsim+le.*ist.and.bo-+lotF Fsim+le.la)F !11" Fsim+le.lmF Fsim+le.median.testF !13" Fsim+le.+lot.*ist.and.bo-F Fsim+le.scatter+lotF MMMMMMM dst MMMMMM > sim+le.*ist.and.bo-+lot(eru+)

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

10/21

,oligon .rekuensi ,oligon frekuensi menggambarkan garis)garis lurus yang menghubungkan puncak) puncak dari segi)empat pada histogram. (erikut ini adalah rangkaian perintah untuk membuat poligon frekuensi.
> *is.eru+<-*ist(eru+7col#)ra(($.3)) > str(*is.eru+) % meli*at a+a sa&a (an) di'andun) ole* ob&e' *is.eru+ <ist o1 0 N brea's : num !1:9" 1. 2 2. 3 3. 6 6. . N counts : int !1:3" 30 9 36 0 6 3 N intensities: num !1:3" $.6$66 $.2021 $.$323 $.$222 $.2 $$ ... N densit( : num !1:3" $.6$66 $.2021 $.$323 $.$222 $.2 $$ ... N mids : num !1:3" 1.0 2.2 2.0 3.2 3.0 6.2 6.0 .2 N -name : c*r Feru+F N e5uidist : lo)i ?@A> - attr(47 FclassF)# c*r F*isto)ramF > lines(c(min(*is.eru+Nbrea's)7*is.eru+Nmids7ma-(*is.eru+Nbrea's))7 / c($7*is.eru+Ncounts7$)7t(+e#FlF) % menamba*'an )aris lurus

%. Data A&ak (Random Data)


6instein berkata -uhan tidak bermain dadu tidak demikian halnya dengan R ia dapat melakukannya. -eladan: (erikut ini adalah percobaan melambungkan sebuah dadu setimbang sebanyak =G kali.
> sam+le(1:271$7re+lace#?@A>) % anda mun)'in sa&a menda+at'an *asil berbeda !1" 1 1 2 1 2 2 6 2

berikut ini adalah fungsi buatan untuk mendapatkan sampel dari pelambungan sebuah dadu sebanyak n kali.
> Dadu<-1unction(n) sam+le(1:27n7re+lace#?@A>) > Dadu( ) % melambun)'an sebua* dadu seban(a' !1" 3 3 6 6 'ali

9ika percobaan pelambungan sebuah dadu sebanyak =G kali dilakukan =GG kali dan peubah acak $ didefinisikan sebagai banyaknya mata F yang muncul pada setiap kali pelambungan. R dapat melakukannya sebagai berikut.
> > > / / > dad2<-Dadu(1$)##2 -<-len)t*(dad2!dad2##?@A>") 1or (& in 1:99) Sdad2<-Dadu(1$)##2 -2<-len)t*(dad2!dad2##?@A>") -<-c(-7-2)T -

!1" 2 1 1 3 1 3 1 $ 1 1 2 1 $ 1 $ 1 6 $ 1 2 1 2 3 1 1 $ 2 1 1 1 $ 3 1 3 2 $ 1 !33" 6 1 1 $ 1 2 1 1 3 2 $ 3 3 $ 2 1 6 1 1 2 2 1 3 1 2 1 6 2 1 1 3 1 3 1 3 $ 2 !0 " 3 1 1 1 2 $ 1 2 2 2 1 1 1 6 3 1 $ 2 2 1 1 6 2 6 1 1

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

13/21

,eluang $?G dapat dicari dengan pendekatan frekuensi relatif adalah sebagai berikut.
> len)t*(-!-##$")/len)t*(-) !1" $.13

4asil di atas dapat dibandingkan dengan peluang $?G untuk percobaan binomial dengan n?=G dan p?=/F.
> Ldbinom % a+a sa&a ar)umen 1un)si iniL > dbinom(-#$71$71/2) !1" $.121 $ 2

Latihan =. +ebuah percobaan melambungkan sebuah koin E kali. ,eluang munculnya *ngka &;*<' adalah R dan peluang munculnya Gambar &;G<' adalah S untuk setiap kali pelambungan. a. ,erintahkanlah R untuk melakukan percobaan tersebut sebanyak =GGG kali dan $ didefinisikan sebagai banyaknya ;G< yang muncul. b. 4itunglah frekuensi relatif untuk -<#2. c. (andingkan dengan nilai .&D' dari suatu percobaan binom dengan n?E dan p?E/>.
> sam+le(c(FAF7FRF)737+rob#c(1/673/6)7re+lace#?@A>) % > +binom(27373/6) % nilai ;(2) untu' binom n#37 +#3/6
satu 'ali +elambun)an

,embangkit ,eubah *cak Uniform R dapat membangkitan nilai)nilai peubah acak dengan fungsi r/nama sebaran. %isalkan untuk membangkitan angka acak Qyaitu nilai peubah acak yang berasal dari sebaran uniform &G =') dilakukan oleh fungsi runi1(n). (entuk umum fungsi ini adalah runi1(n7min#$7ma-#1)7 jika min dan ma$ tidak dinyatakan pada fungsi maka nilai min?G dan ma$?= yang digunakan.
> u<-runi1(1$) % ban)'it'an an)'a aca' seban(a' 1$ bua* > runi1( 7276) % ban)'it'an uUuni1orm(276) !1" 3.32306$ 3.331 2 2. 36632 2.032$39 2.$23969

,embangkit ,eubah *cak Normal +ebagaimana telah diketahui sebaran normal mempunyai dua parameter yaitu rataan dan simpangan baku . Keduanya tersebut masing)masing merupakan parameter lokasi dan dispersi. ,erintah R untuk membangkitkan peubah acak normal dengan rata) rata =GG dan simpangan baku =F adalah.
> rnorm(171$$712) !1" 113.0$9 > rnorm(1$7mean#23$7sd#1$) % ban)'it'an 1$ +.a -UD(23$71$)
!1" 2 2.$361 296.2036 236.2202 3$$.6930 232.2 12 23$.0231 206.1319 23$.2002 !9" 20 .3 32 201.9212

> rnorm( ) % ban'it'an +euba* aca' normal ba'u !1" 1.229093$ -$.2939$2$ -$.32091 1.2136212 -1.932 211

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

19/21

-eladan: ,erintahkanlah R untuk mengambil =GG sampel yang berasal dari sebaran normal baku kemudian buatlah histogram dari sampel tersebut dan gambarkan kur2a normal baku pada histogram tersebut.
> > / > -<-rnorm(1$$) *ist(-7+robabilit(#?@A>7col#Fc(an3F7 main#FVisto)ram =am+el Dormal Ja'uF) cur8e(dnorm(-)7add#?@A>)

-eladan: ,ada sebaran diskret seperti binomial nampaknya kurang tepat menggambar) kan sampelnya dengan menggunakan histogram. ,erintah R berikut menggunakan fungsi +lot() untuk menggambarkan sampel binomial n?@ p?.D@.
> > > / n<- W +<-1/6 -<-rbinom(1$$7n7+) +lot(table(-)/len)t*(-)7t(+e#F*F7lBd#37 col#Fblue3F7main#FRra1i' =ebaran =am+lin) Jinomial n# 7+#.2 F)

(andingkan dengan grafik sebaran binomialnya yaitu


> > / / nil-<-$:n +lot(nil-7dbinom(nil-7n7+)7t(+e#F*F7lBd#37 col#Fblue3F7main#FRra1i' =ebaran Jinomial n# 7+#.2 F7 (lab#FXeluan)F7-lab#Fnilai -F)

,ada kebanyakan buku)buku teks statistik selalu dilengkapi dengan tabel normal baku J. -abel itu tidak diperlukan lagi karena R menyediakn fungsi yang canggih untuk medaptakan nilai J dengan menggunakan fungsi 5norm() yaitu fungsi untuk mendapatkan nilai J jika peluang ekor kirinya diketahui. -eladan: ,erintahkanlah R untuk mendapatkan J sehingga peluang ekor kirinya adalah G.G@ atau .&J'?G.G@.
> 5norm($.$ ) !1" -1.2663 6

,ada berbagai sebaran normal dapat kita cari nilai Nuantilenya sebagai berikut.
> 5norm(c($.$2 7$.2 7$. $7$.0 7$.90 )7mean#1$$7sd#1$) !1" 3$.6$$32 93.2 1$ 1$$.$$$$$ 1$2.0669$ 119. 9926

Latihan (ila =GGG sampel masing)masing berukuran =GG diambil dari sebaran e$ponensial dengan rate?D. Kemudian setiap sampel dihitung rata)ratanya. Gambarkan histogram untuk rata) rata tersebut bandingkan dengan kur2a normal dengan mean?=/D dan sigma?=/DG. *pakah dalil limit pusat berlakuC ,erintahkan R untuk memeriksanya. petunjuk:
> re-+(1$$72.) % sebua* sam+el beru'uran 1$$ dari -U>-+(2.$)

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

2$/21

'. Re(eren!i
MerJani 9ohn. DGGD. simpleR Q Using R for Introductory +tatistics. UR#: http://""".math.csi.cuny.edu/+tatistics/R/simpleR Menable !. N. and 7.%. +mith. DGGE. *n Introduction to R UR#: http://""".r)project.org %aindonald 9.4. DGG=. Using R for 7ata *nalysis and Graphics *n Introduction. *ustralian National Uni2ersity. ,aradis 6manuel. DGGD. R for (eginners. Uni2ersite %ontpellier II. .rance. Institut des +ciences de lT62olution.

Anom Yudistira (D1392) e-mail:anom1392@lecturer.binus.ac.id

21/21