BAB I
PENDAHULUAN
1.1. Latar Belakang
Satistika yaitu ilmu yang mempelajari tentang sampel. Dalam ilmu statistik,
sampel diambil dari sebuah populasi yang kemudian dianalisis untuk menaksir
keadaarn sebenarnya dalam populasi tersebut atau yang disebut dengan parameter
populasi. Sesuai teori, bahwa makin banyak sampel yang diambil dalam sebuah
populasi, maka semakin akurat estimasi parameter populasinya.
Namun demikian, dapat bidayangkan jika populasi yang dimaksud adalah
populasi yang isinya mungkin sangat banyak hingga tak dapat dihitung. Maka untuk
menaksirnya juga dibutuhkan jumlah sampel yang banyak pula untuk mencapai suatu
keakuratan. Yang terjaidi adalah untuk mengnalisis itu semua dibutuhkan waktu
yang lama jika dilakukan analisis secara manual atau bahkan dengan kalkulator
sekalipun. Akan terjadi banyak errors pada hasil analisis yang dilakukan jika
dilakukan dengan tidak teliti. Namun adakan solusi untuk itu?
Di era yang modern ini, telah dikembangkan aplikasi pengolah data yang
dapat sangat membantu dalam anasisi yang dilakukan terhadap suatu statistika atau
sampel. Beberapa diantaranya ialah program R, SPSS, SAS, Minitab, dll. Prgoram
aplikasi yang demikian itu memberikan hasil anasisis data yang telah diinputkan.
Dengan bantuan program aplikasi tersebut, maka tugas kita hanyalah menginput data
sampel yang telah diambil dari sebuah populasi.
Sebagai mahasiswa yang diharapkan dapat menjadi manusia yang modern
maka mahasiswa dibekali dengan kemampuan untuk mengoperasikan aplikasi seperti
yang disebutkan di atas sekurang kurangnya satu. Diantara beberapa contoh program
aplikasi yang disebutkan diatas, Program R memiliki kelebihan yang paling
menonjol yakni penggunaanya yang gratis. Sehingga untuk melakukan praktikum
dengan aplikasi tersebut sangat membantu karena dapat diinstal oleh setiap
praktikan. Dengan demikian, mahasiswa di Jurusan Matematika, Fakultas MIPA,
Universitas Halu Oleo, pada matakluliah metode statistika, melaksanakan praktikum
tetang penggunaan aplikasi Program R.
1.2. Tujuan
Tujuan dilaksanakannya praktikum Metode Statistika adalah untuk:
1. Mengenali beberapa program aplikasi yang berhubungan dengan pengolahan
sampel, baik kelebihan maupun kekurangnnya serta mengenali sejarah
perkembangan aplikasi Program R.
2. Mengetahui jenis – jenis operator, syntax, serta tipe data dalam program R.
3. Mengetahui cara membuat, mengakses, dan memodifikasi vektor, serta
menggunakannya untuk membuat data frame, juga mengenal mengenal dan
mengetahui cara membuat matriks dalam program R.
4. Mengenal matriks dalam Program R, serta mengetahui cara mengakses dan
memodifikasi matriks. Juga bertujuan untuk mengetahui cara membuat data
frame dengan menggunakan matriks dan dengan mengkonversi file
berekstensi .csv.
5. Mengenal lebih lanjut mengenai data frame, mengetahui cara membuat data
frame dengan menu data editor, serta dapat membuat plot sederhana.
6. Mengetahui plot tidak sederhana serta mengetahui cara membuat berbagai
jenis plot tidak sederhana. Juga mengenal sebaran data.
7. Mengenal sebaran data kuantitatif dan kualitatif, serta mengetahui cara
membuat plot yang berkenaan dengan kedua sebaran data tersebut.
8. Mengenal distribusi peluang diskrit serta jenis – jenisnya juga membuat plot
sehubungan dengan sebaran peluang diskrit.
9. Megetahi cara membuat plot sebaran distribusi normal.
10. Mengenal uji rata – rata sampel serta mengetahui cara membuat plot yang
berhubungan dengan materi uji rata -rata.
1.3. Manfaat
Manfaat dilakukannnya praktikum metode statistika adalah:
1. Mengenali beberapa program aplikasi yang berhubungan dengan pengolahan
sampel, baik kelebihan maupun kekurangnnya serta mengenali sejarah
perkembangan aplikasi Program R.
2. Mengetahui jenis – jenis operator, Syntax, serta tipe data pada program R.
Alat dan bahan dalam praktikum metode statistika disajikan dalam tabel
berikut:
Tabel 1.1. Alat dan Bahan
BAB II
PEMBAHASAN
2.1. Praktikum 1
Pada praktikum pertama dibahas mengenai beberapa jenis program aplikasi
pengolah data sampel.
2.1.1. Program Aplikasi Analisis Sampel
1. EViews
EViews yaitu programvkomputer berbasis windows yang banyak dipakai
untuka analisis statistika dan ekonometri jenis runtun-waktu yang mana perangkat ini
dikembangkan oleh perusahaan Quantitive Macro Software pada tahun 1994.
Kelebihan Eviews adalah sebangai berikut:
a. Memliki user interface yang bagus dan mudah dimengerti
b. Perhitungan menggunakan tingkat presisi yang tinggi hingga jenis double atau
10 kali perangkat 16 di belakang koma.
c. Dapat digunakan untuk perhitungan dengan sampel yang sangat besar.
d. Memiliki fitur yang termasuk lengkap untuk berbagai jenis model peramalan
terutama model runtun waktu dan model data panel.
e. Dilengkapi dengan berbagai pilihan koefisien estimasi yang robust pada
berbagai jenis model regresi.
f. Output baik table ataupun gambar mudah dicopy paste ke word.
Kekurangan Eviews adalah sebagai berikut:
a. Lebih condong atau lebih special untuk analisis ekonometrik sedangakn untuk
non ekonometrik fiturnya sangat berbatas.
b. Untuk software ekonometrika, tingkat kemampuannya masih tidak seluas
pesaingnya yaitu STATA dan SAS.
c. Untuk non ekonometrika masih tidak selengkap SPSS, dan dari sisi data base
masih tidak bias disejajarkan dengan system data base SPSS.
2. SPSS
SPSS merupakan singaktan dari Statistical Package For Social Science. SPSS
adalah sebuah program komputer yang digunakan untuk membuat analisis statistika
sosial. SPSS dipublikasikan oleh SPSS Inc. SPSS digunakan oleh peneliti pasar,
peneliti kesehatan, perusahaan survei, pemerintah, peneliti pendidikan, organisasi
pemasaran, dan sebagainya. Selain analisis statistika, manajemen data (seleksi kasus,
penajaman file, pembuatan data turunan) dan dokumentasi data (kamus metadata ikut
dimasukkan bersama data) juga merupakan fitur-fitur dari software dasar SPSS.
Kelebihan yang dimiliki oleh SPSS ini adalah:
a. SPSS mampu mengakses data dari berbagai macam format data yang tersedia
seperti Base, Lotus, Access, text file, spreadsheet, bahkan mengakses database
melalui ODBC (Open Data Base Connectivity) sehingga data yang sudah ada,
dalam berbagai macam format, bisa langsung dibaca SPSS untuk dianalisis.
b. SPSS memberi tampilan data yang lebih informatif, yaitu menampilkan data
sesuai nilainya (menampilkan label data dalam kata-kata) meskipun
sebetulnya kita sedang bekerja menggunakan angka-angka (kode data).
c. SPSS memberikan informasi lebih akurat dengan memperlakukan missing
data secara tepat, yaitu dengan memberi kode alasan mengapa terjadi missing
data.
d. SPSS melakukan analisis yang sama untuk kelompok-kelompok pengamatan
yang berbeda secara sekaligus hanya dalam beberapa mouse click saja.
e. SPSS mampu merangkum data dalam format tabel multidimensi (crosstabs),
yaitu beberapa field ditabulasikan secara bersamaan.
Kekurangan yang dimiliki oleh SPSS ini adalah:
a. Walaupun friendly user namun program ini tetap tergolong rumit, pengguna
program ini minimal harus mengetahui dasar dari ilmu statistik untuk bisa
menjalani program ini.
b. SPSS tergolong memiliki perkembangan yang cepat. Sehingga kadang
tampilan secara fisik berbeda dengan SPSS yang lama dan user harus
beradaptasi kembali dengan sistem yang baru. Dan efek lainnya adalah user
harus pintar-pintar memilih seri SPSS yang tepat untuk komputernya.
c. Terdapat banyak versi spss yang beredar, sehingga pemilihan spss harus
sesuai dengan komputer yang kita gunakan (KN).
3. Minitab
Minitab adalah program komputer yang dirancang untuk melakukan
pengolahan statistik. Minitab mengkombinasikan kemudahan penggunaan layaknya
Microsoft Excel dengan kemampuannya melakukan analisis statistik yang kompleks.
Minitab dikembangkan di Pennsylvania State University oleh periset Barbara F.
Ryan, Thomas A. Kelebihan Minitab ini adalah sebagai berikut:
a. Minitab menyediakan StatGuide yang menjelaskan cara melakukan
interpretasi table dan grafik statistika yang dihasilkan oleh Minitab dengan
cara yang mudah dipahami.
b. Minitab memiliki ukuran worksheet dinamis dan memuat kolom sampai
4.000.
c. Minitab memiliki dua layar primer yaitu Worksheet (lembar kerja) dan sesi
command (layar untuk menampilkan hasil).
d. Tampilan menu di Minitab, lebih lengkap dan disertai toolbar-toolbar
sehingga akan memudahkan anda dalam menjalankan perintah.
e. Mempunyai file Minitab Worksheet (MTW) dan Minitab Project (MPJ) yang
digunakan untuk membedakan file worksheet dan file project.
f. Minitab menyediakan ReportPad agar mudah membuat laporan project yang
telah dibuat.
g. Minitab memberikan kebebasan pada anda dalam membuat nama yang
panjang pada file tanpa harus menyingkat nama file.
h. Minitab menyediakan fasilitas makro untuk membuat program yang
berulangkali dipakai, memperluas fungsi Minitab, atau mendesain perintah
sendiri. Selain itu Minitab memiliki Bahasa pemrograman makro lebih mudah.
Kekurangan dari minitab adalah sebagai berikut:
a. Rentang analysis statistic yang dapat dilakukan minitab langsung setelah
instalasi tidak selebabar paket lain seperti SPSS ataupun SAS.
Paket program dibutuhkan dalam mata kuliah metode statistic yaitu mengingat
perkembangan zaman telah maju. Dimana proses perhitungan dapat dilakukan
dengan lebih cepat dan akurat dengan menggunakan komputer. Penting bagi
mahasiswa dibekali kemapuan untuk menjalankan program untuk statistic sebab
tidak menunutuk kemungkinan mahasiwa suatu saat bekerja di sebuah perusahaan
dimana dibutuhkan kemampuan untuk membuat menganalisis dan suatu data
statistic. Dengan ini pekerjaan itu dapat dilakukan dengan mudah, cepat, dan akurat.
2.1.4. Pengertian Metode Statistika
Metode didefinisikan dengan cara kita melakukan sesuatu. Sdangkan statistika
yaitu ilmu yang mempelajari tentang statistik dimana dalam kuliah pertama kami
diperkenalkan bahwa satistik adalah tentang sampel baik. Dengan demikian saya
menyimpulakn bahwa metode statistic yaitu cara yang dilakukan untuk mengolah,
mengumpulkan, mengintepretasikan, dan mempresentasikan data atau dalam hal ini
adalah sampel.
Statistika merupakan disiplin ilmu yang mempelajari mengenai metode atau
Teknik mengumpulkan, mengola, meneganalisa, dan menyajikan data secara ilmiah.
Sedangkan statistic adalah hasil data atau kumpulan data baik berupa bilangan
ataupun non bilangan yang didapatkan dari pengumpulan data yang sudah diproses
melalui statistika.
2.2. Praktikum 2
Pada praktikum kedua dibahas mengenai operator – operator, syntax, serta
tipe data yang ada dalam program R.
2.2.1. Operator Dalam R
1. Operator Aritmatika
Operator Aritmatika adalah operator yang digunakan untuk menghitung
secara matematika. Operator aritmatika dalam program R disajikan dalam tabel
berikut:
Tabel 2.1. Operator Aritmatika
Contoh
No. Operator Fungsi
> gue=1
Digunakan untuk menjumlahkan > elo=2
1. +
> gue+elo
angka – angka.
[1] 3
> gue=1
Digunakan untuk melakukan > elo=2
2. -
> gue-elo
pengurangan.
[1] -1
> gue=3
Digunakan untuk melakukan > elo=2
3. *
> gue*elo
operasi perkalian.
[1] 6
> gue=3
Digunakan untuk melakukan > elo=2
4. /
> gue/elo
operasi pembagian
[1] 1.5
Digunakan untuk operasi
perpangkatan dimana angka > gue=3
5. ^ setelah operator tersebut > gue^2
[1] 9
merupakan pangkat dari angka
sebelum operator tersebut.
2. Operator Logika
Operator logika adalah operator yang hanya untuk menentukan apakah dua
atau lebih pernyataan bernilai benar atau salah. Berikut tabel operator logika:
Tabel 2.2. Tabel operator logika
No. Operator Fungsi Contoh
Berfungsi untuk mengecek apakah >I<-c(2,4,9,70)
>N<-c(2,5,11,100)
setiap elemen vector pertama yang
1. == > I==N
bersesuaian sama dengan elemen [1] TRUE FALSE
pada vector kedua. FALSE FALSE
Berfungsi untuk mengecek apakah >I<-c(2,4,9,70)
>N<-c(2,5,11,100)
setiap elemen pafa vector pertama
2. < > I<N
lebih kecil dari setiap vector [1] FALSE TRUE
pemabading yang bersesuaian. TRUE TRUE
Berfungsi untuk mengecek apakah > I<-c(2,4,9,70)
> N<-c(2,5,3,100)
setiap elemen pafa vector pertama
3. > > I>N
lebih besar dari setiap vector [1] FALSE FALSE
pemabading yang bersesuaian. TRUE FALSE
Berfungsi untuk mengecek apakah
> I<-c(2,4,9,70)
setiap elemen pafa vector pertama > N<-c(2,5,3,100)
4. >= lebih besar atau sama dengan setiap > I>=N
[1] TRUE FALSE
elemen vector pemabading yang TRUE FALSE
bersesuaian.
Berfungsi untuk mengecek apakah
> I<-c(2,4,9,70)
setiap elemen pafa vector pertama > N<-c(2,5,3,100)
5. <= lebih kecil atau sama dengan setiap > I<=N
[1] TRUE TRUE
elemen vector pemabading yang FALSE TRUE
bersesuaian.
6. != Berfungsi untuk mengecek apakah > I<-c(2,4,9,70)
> N<-c(2,5,3,100)
setiap elemen vector pertama yang > I!=N
3. Operator Aneka
Operator aneka adalah operator yang memiliki fungsi yang khusus tentang
matrikx. Operator aneka disajikan dalam program R disajikan dalam table berikut:
Tabel 2.3. Operator Aneka
No
Operator Fungsi Contoh
.
Berfungsi untuk menciptakan > indra <- 0:10
> print(indra)
1. : rangkaian angka secara berurutan [1] 0 1 2 3 4 5 6
untuk sebuah vector. 7 8 9 10
> I<-9
> N<-7.5
Berfungsi untuk memeriksa > D<-5:11
2. %in% apakah suatu elemen termasuk > print(I%in%N)
[1] FALSE
fungsi. > print(I%in%D)
[1] TRUE
>I=matrix(c(3,7,3,2,8,5),
nrow=3, ncol=2)
>N=matrix(c(1,2,3,4),
nrow=2, ncol=2)
Berfungsi untuk mengalikan > Alamsyah=I%*%N
3. %*% > print(Alamsyah)
matrix. [,1] [,2]
[1,] 7 17
[2,] 23 53
[3,] 13 29
> mean(Indra)
rata – rata. [1] 5.125
> Indra<-
Berfungsi untuk menghitung nilai c(4,6,2,7,8,3,9,2)
2. median
> median(Indra)
tengah data terurut
[1] 5
> Indra<-
c(4,6,2,7,8,3,9,2)
4. rev Berfungsi untuk membalik data > rev(Indra)
[1] 2 9 3 8 7 2 6 4
> Indra<-
Digunakan untuk menjumlahkan c(4,6,2,7,8,3,9,2)
5. sum
> sum(Indra)
data.
[1] 41
> Indra<-
Berfungsi untuk menetukan data c(4,6,2,7,8,3,9,2)
6. max
> max(Indra)
terbesar dari gugus data.
[1] 9
> Indra<-
Berfungsi untuk menetukan data c(4,6,2,7,8,3,9,2)
7 min
> min(Indra)
terkecil dari gugus data.
[1] 2
1.3. Tipe Data dalam Program R
Tipe data adalah jenis atau mode yang dipahami oleh program tentang
masukan yang diberikan sehingga program dapat berjalan sesuai dengan yang
diinginkan. Untuk mengecek tipe data suatu input digunakan format “>mode
(b)”lalu tekan enter. Berikut adalah tipe data dalam R-Programming:
1. Numeric
Numeric adalah tipe data yang hanya berisikan angka – angka saja.
Contoh:
2. Function
Function adalah tipe data yang berisikan fungsi – fungsi matematika.
Contoh:
4. Tabel
Untuk membuat tabel pada program R, statement yang digunakan yaitu
edit(data.frame()). Berikut langkah – langkah membuat tabel:
(I) Membuat statement
Contoh:
(IV) Setelah selesai memasukkan data, tutup jendela data editor kemudia ketik “x”
pada jendela R console (x variabel yang digunakan untuk menampung tabel
tadi).
Contoh:
2.3. Praktikum 3
Dalam praktikum ketiga, dibahas mengenai vektor dan matriks. Dimana
vektor dibuat dalam program R yang kemudian dapat digunakan untuk membuat data
frame. Matriks diperkenalkan dan kemudian dibuat dalam program R.
2.3.1. Vektor
Vektor adalah objek paling dasar yang dikenal dalam program R, yang
merupakan himpunan dari suatu data dengan tipe yang sama (numeric, logica, atau
charatcer).
1. Membuat Vektor
Vektor dalam program R dapat dibuat dengan cara seperti dalam tabel berikut:
Tabel 2.5. Cara Membuat Vektor
No. Format Fungsi Contoh
Membuat vektor
dengan elemen terurut > 3:8
1. >a:b
[1] 3 4 5 6 7 8
dari a sampai b
dengan beda satu.
Membuat vektor
dengan elemen sesuai > c(1,5,3,8,2,9)
2. >c(a,b,c,d,e)
[1] 1 5 3 8 2 9
dengan yang
diinginkan.
3. >seq Membuat vektor
dengan elemen terurut > seq(3,8)
>seq(a,b)
dari a sampai b [1] 3 4 5 6 7 8
dengan beda satu.
>seq(a,b, Membuat vektor > seq(3,8,by=2)
by=c) [1] 3 5 7
dengan elemen
didaftarkan terurut
dari a sampai b
dengan beda c.
Membuat vektor
>seq(from
dengan elemen terurut >seq(from=7,to=15,by=2)
=a, to=b,
dari a sampai b [1] 7 9 11 13 15
by c)
dengan beda c.
Membuat vektor
dengan elemennya
> seq(3,11,length=6)
>seq(a,b, sebanyak c yang
[1] 3.0 4.6 6.2 7.8
length=c bedanya sama, dan 9.4 11.0
nilainya terurut dari a
sampai b.
2. Mengakses Vektor
Mengakses vector dalam program R dapat dilakukan dengan cara - cara
tertentu. Misalnya x adalah sebuah vector dinotasikan “>x=a:b” di dalam program,
maka untuk mengakses vector tersebut dapat dilakukan dengan cara – cara seperti
berikut:
Tabel 2.6. Cara Mengakses Vektor
No
Format Fungsi Contoh
.
> x=2:11
Menampilkan elemen ke-m dalam
1. >[m] > x[6]
vector x. [1] 7
> x=2:11
Menampilkan elemen ke-m dan ke n
2. >x[c(m,n)] > x[c(4,8)]
dari vector x [1] 5 9
> x=2:11
Menampilkan semua elemen vector > x[-5]
3. >x[-n]
[1] 2 3 4 5
yang bukan elemen ke-n
7 8 9 10 11
> x=2:11
Menampilakan semua elemen vector > x[-c(2,6)]
4. >x[-c(m,n)]
[1] 2 4 5 6
yang buka ke-m dan juga buka ke-n
8 9 10 11
> x=2:11
Menampilkan semua elemen vector > x[x>5]
5. >x[x>n]
[1] 6 7 8 9
dari ke-n sampai akhir.
10 11
> x=2:11
Menampilkan elemen vektor mulai
6. >x[m:n] > x[4:7]
dari ke-m sampai ke-n. [1] 5 6 7 8
3. Memodifikasi Vektor
Mengulangi elemen
vector v yang elemenya > rep(4:8,rep(3:3))
3.
>rep(a:b,rep(b:b) dari a sampai b sebanyak [1] 4 5 6 7 8 4 5 6
c kali. 7 8 4 5 6 7 8
>rep(a:b,each=c)
> rep(1:3,each=4)
[1] 1 1 1 1 2 2 2 2
3 3 3 3
r=matrix(2:10,nrow=3,ncol=3)
> r
[,1] [,2] [,3]
×2 [1,] 2 5 8
[2,] 3 6 9
[3,] 4 7 10
> rbind(2,5,3,8,4)
[,1]
[1,] 2
[2,] 5
Membuat matriks dengan rbind dan [3,] 3
2. [4,] 8
cbind.
[5,] 4
> cbind(2,5,3,8,4)
[,1] [,2] [,3] [,4] [,5]
[1,] 2 5 3 8 4
> i=array(1:9,dim=c(3,3))
> i
[,1] [,2] [,3]
3. Membuat matriks menggnakan array [1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9
2.3.3. Data Frame Program R
Data Frames di R adalah fungsi yang dapat digunakan untuk membuat
kerangka data, koleksi dari variabel-variabel yang mana memiliki karakteristik
seperti matriks. Ibaratnya data frame membuat data yang anda susun mirip seperti
tabel yang terdiri dari baris dan kolom pada Excel atau Calc. Contoh penggunaannya
adalah sebagai berikut:
> nama = c("Indra","Master","Alona","Marisa")
> berat = c(70,65,40,30)
Lalu ketikkan:
> df = data.frame(nama,berat)
Bisa dilihat bahwa pada df vektor-vektor nama dan berat disusun menjadi tabel
dalam bentuk kolom dan baris layaknya matriks. Dengan menyusun data menjadi
> summary(df)
nama berat
data frame,
Alona :1 kita dapat :30.00
Min. memperoleh kesimpulan-kesimpulan seperti keterangan
Indra :1 1st Qu.:37.50
ataupun sebaran Median
Marisa:1 dan pusat:52.50
data dengan fungsi summary seperti pada contoh verikut
Master:1 Mean :51.25
ini: 3rd Qu.:66.25
Max. :70.00
Selain itu kita juga dapat memanggil elemen-elemen yang terdapat pada data frame
berdasarkan kolom dan baris seperti berikut:
> df[1,]
nama berat
1 Indra 70
Pada fungsi diatas kita memanggil elemen pada baris 1 pada data frame.
> df[,"nama"]
[1] Indra Master Alona Marisa
4 Levels: Alona ... Master
Pada fungsi diatas kita memanggil elemen pada kolom “nama” pada data frame.
> df[1,"nama"]
[1] Indra
Pada fungsi diatas kita memanggil elemen pada baris 1 pada kolom “nama” pada
data.frame. Selain itu kita dapat juga melakukan manipulasi data dengan
menggunakan data frame yang telah dibuat.
> df[1,"berat"]=80
Pada fungsi diatas kita mencoba melakukan manipulasi data pada kerangka data df di
baris 1 kolom “berat” menjadi 80 sehingga jika kita panggil kembali df maka akan
terlihat perubahan datanya.
> df
nama berat
1 Indra 80
2 Master 65 F-MIPA
Jurusan Matematika 23
Universitas Halu40
3 Alona Oleo
4 Marisa
2019 30
METODE STATISTIKA
2.4. Praktikum 4
Para praktikum keempat dibahas mengenai pengenalan matriks dalam
Program R, cara mengakses dan memodifikasi matriks. Juga cara membuat data
frame dengan menggunakan matriks dan dengan mengkonversi file berekstensi .csv.
2.4.1. Matriks pada Program R
Matriks adalah sekumpulan bilangan yang disusun secara baris dan kolom
yang dibatasi oleh tanda kurung baik kurung biasa maupun kurung siku. Matriks
meiliki ukurang yang disebut juga ordo matriks. Misalnya suatu matriks memiliki m
baris dan n kolom, maka ordo dari matriks tersebut adalah m x n.
1. Mengakses matriks pada program R
Dalam program R kita dapat mengakses sebuah matrix dengan beberapa cara
tertentu. Misalkan m adalah jumlah baris dan n adalah jumlah kolom pada matriks a
atau matriks p, maka untuk mengakses matriks tersebut dapat dilakukan dengan cara
atau format – format seperti berikut:
Tabel 2.9. Mengakses Matrix pada Program R
No. Format Fungsi Contoh
> x=12:20
>
a=matrix(x,ncol=3,nrow=3
)
Menampilkan entri – entri > a
>a[,n] [,1] [,2] [,3]
dalam matriks pada
1. Dan [1,] 12 15 18
>a[m,] kolom ke-n dan pada baris [2,] 13 16 19
ke-m [3,] 14 17 20
> a[,2]
[1] 15 16 17
> a[2,]
[1] 13 16 19
2. >p[m,n]=a Berturut – turut berfungsi > x=12:20
>p[,n]=c(x, >a=matrix(x,ncol=3,nrow=
y,z) untuk mengganti entri 3)
>p[m,]=c(x, pada baris m kolom n > a
),nrow =3,ncol=3)
> a%*%b
[,1] [,2] [,3]
matriks [1,] 319 682 1045
[2,] 407 881 1355
[3,] 507 1110 1713
>
a=matrix(c(4,9,16,36,49,64,81,100,121
Untuk ),nrow =3,ncol=3)
> t(a)
4. t(a) mentranspose [,1] [,2] [,3]
matriks a [1,] 4 9 16
[2,] 36 49 64
[3,] 81 100 121
>
Untuk mebalik a=matrix(c(4,9,16,36,49,64,81,100,121
matriks ),nrow =3,ncol=3)
> solve(a)
5. solve(a) (mencari [,1] [,2] [,3]
invers [1,] 1.4017857 -2.464286 1.0982143
matriks) [2,] -1.5208333 2.416667 -0.9791667
[3,] 0.6190476 -0.952381 0.3809524
>
a=matrix(c(4,9,16,36,49,64,81,100,121
Untuk ),nrow =3,ncol=3)
memangkatka > a^2
6. a^n
[,1] [,2] [,3]
n n setiap entri
[1,] 16 1296 6561
pada matriks a [2,] 81 2401 10000
[3,] 256 4096 14641
Untuk >
a=matrix(c(4,9,16,36,49,64,81,100,121
menghitung
7. det(a) ),nrow =3,ncol=3)
determinan > det(a)
matriks a [1] -336
>
Untuk
a=matrix(c(4,9,16,36,49,64,81,100,121
membagi ),nrow =3,ncol=3)
setriap entri > a/b
8. a/b pada matriks a [,1] [,2] [,3]
[1,] 4.000000 9.00000 11.57143
dan matriks b [2,] 4.500000 9.80000 12.50000
yang [3,] 5.333333 10.66667 13.44444
bersesuaian
>
Untuk a=matrix(c(4,9,16,36,49,64,81,100,121
menujukan ),nrow =3,ncol=3)
entri entri > a
[,1] [,2] [,3]
9. Diag(a) yang letaknya [1,] 4 36 81
sebagai [2,] 9 49 100
diagonal [3,] 16 64 121
> diag(a)
matriks a
[1] 4 49 121
>
Untuk a=matrix(c(4,9,16,36,49,64,81,100,121
),nrow =3,ncol=3)
menghitung > sqrt(a)
10. sqrt(a) akar setiap [,1] [,2] [,3]
entri pada [1,] 2 6 9
[2,] 3 7 10
matriks a
[3,] 4 8 11
Hasil run :
2.5. Praktkum 5
Praktikum kelima membahas lebih lanjut mengenai data frame, cara membuat
data frame dengan menu data editor, serta dapat membuat plot sederhana.
Syntax:
> plot(cbind(c(2,5,8,1,9,2),c(1,10,1,7,7,1)),type="l")
Hasil run:
2.6. Praktikum 6
Hasil run:
Hasil run:
2.7. Praktikum 7
Pada praktikum ketujuh dibahas tentang sebaran data kuantitatif dan kualitatif
seta pembuatan plot yang berkenaan dengan kedua jenis sebaran data tersebut.
2.7.1. Sebaran Data Kuantitatif.
Sebaran data kantitatif yaitu data – data bertipe numeric yang disajikan dalam
bentuk – bentuk tertentu. Dalam program R, data kuantitatif dapat disebar dalam
beberapa cara dibawah ini dengan merujuk pada data frame berikut:
> indra<- read.csv(file.choose(), header=TRUE)
> indra
Nama Nilai Predikat
1 Ihzan 20.00 Tidak Baik
2 Parto 62.75 Baik
3 Asikin 71.35 Baik
4 Retno 48.75 Tidak Baik
5 Indra 100.00 Baik
6 Azimsyah 76.00 Baik
7 Abyan 81.50 Baik
8 Farhan Badilla 48.00 Tidak Baik
9 Zakariah 73.25 Baik
10 Farhan Adima 73.50 Baik
1. Scatter Plot
Scatter Plot adalah sebaran data yang disajikan dalam bentuk titik. Plot ini
dapat dibuat dengan syntax seperti pada contoh berikut berikut:
> plot(indra$nilai,main="Nilai Mahasiswa",col="blue",ylab="Nilai")
Hasil run:
2 | 0
4 | 89
6 | 31346
8 | 2
10 | 0
2.7.2. Sebaran Data Kualitatif
Sebaran data kualitatif yaitu sebaran data yang menggunakan tipe data
character. Sebaran data Kuantitatif dapat dibuat seperti di bawah ini dengan
menggunakan data frame berikut:
> indra<- read.csv(file.choose(), header=TRUE)
> indra
Nama Nilai Predikat
1 Ihzan 20.00 Tidak Baik
2 Parto 62.75 Baik
3 Asikin 71.35 Baik
4 Retno 48.75 Tidak Baik
5 Indra 100.00 Baik
6 Azimsyah 76.00 Baik
7 Abyan 81.50 Baik
8 Farhan Badilla 48.00 Tidak Baik
9 Zakariah 73.25 Baik
10 Farhan Adima 73.50 Baik
1. Tabel Frekuensi
Tabel frekuesni adalah sebaran data kualitatif yang berfungsi untuk
menampilkan frekuansi dari karakter – karakter dalam data frame di atas. Berikut
contoh syntax tabel frekuensi:
> alamshah=table(indra$Predikat)
Jurusan Matematika F-MIPA 44
Universitas Halu Oleo
2019
METODE STATISTIKA
> alamshah
Keterangan:
Jurusan Matematika F-MIPA 45
Universitas Halu Oleo
2019
METODE STATISTIKA
round, befungsi untuk mendefinisikan apa dan bagaimana isian pada bagian -
bagian dalam plot Pie Chart
pie, merupakan kode untuk membuat plot Pie Chart
col=, merupakan kode untuk meberikan warna pada plot
3. Bar Plot
Plot jenis ini merupakan plot yang berfungsi membuat kode batang
bedasarkan sebaran data kualitatif. Berikut contoh bar plot:
> alamshah=table(indra$Predikat)
> barplot(alamshah,main="Data Mahasiswa",col="pink")
Hasil run:
> alamshah
> dotchart((alamshah),main="Nilai Mahasiswa",col="green")
Hasil run:
Hasil run:
2.8. Praktikum 8
2. Distribusi Binomial
3. Distribusi Hipergeometrik
Karakteristik distribusi Hipergeometrik yaitu:
a. Populasi/percobaan sebanyak N terbagi dalam 2 kategori. Kategori I sebanyak
M dan kategori 2 sebanya N-M.
b. Diambil sampel sebanyak n.
Jika X menyatakan banyaknya elemen kategori I yang terambil, distribusi
peluang peubah/variabel acak Hipergeometrik X adalah:
Fungsi kepadatan peluang (pdf)
M N−M
h ( x ; n , M , N )=¿
( x )( n−x )
;x=0,1,2,…,min(n,M)
N
(n)
Selanjutnya dinotasikan sebagai X HYP( n , M , N) dengan parameter n,M, dan N.
Jika X HYP( n , M , N) maka:
nM
a. E ( X )=
N
M M
)(1− )( N −n)
(
b. N N
Var ( X )=
N −1
Penggunaan distribusi Hipergeometril terdapat banyak bidang, antara lain
pada penerimaan sampel, pengujian elektronik dan pengendalian mutu.
4. Distribusi Geometrik
Karakteristik distribusi Geometrik yaitu:
a. Percobaan Bernoulli
b. X menyatakan banyaknya percobaan yang dibutuhkan untuk memperoleh
sukses.
Distribusi peluang peubah/variabel acak Geometri X adalah:
Fungsi kepadatan peluang (pdf)
1−x
g ( x ; p )= p (1− p)
{ 0 ; x yanglain
x = 1,2,3,…
5. Distribusi Poisson
1
f ( x )= ; N =1 ,2 , … , N
N
Selanjutnya dinotasikan sebagai.
Jika X DU ( N ) maka:
N +1
a. E ( X )=
2
N 2−1
b. Var ( X )=
12
2.8.3. Syntax Distribusi Binomial
Berikut adalah contoh syntax pada materi distribusi binomial:
> qbinom(c(0.25),size=30,prob=0.5,lower.tail=TRUE)
[1] 13
> qbinom(c(0.25),size=30,prob=0.5,lower.tail=FALSE)
[1] 17
> qbinom(c(0.75),size=30,prob=0.5,lower.tail=FALSE)
[1] 13
> dbinom(6,size=20,prob=0.5)
[1] 0.03696442
> pbinom(c(6),size=20,prob=0.5,lower.tail=TRUE)
[1] 0.05765915
> pbinom(c(6),size=20,prob=0.5,lower.tail=FALSE)
[1] 0.9423409
> dbinom(0:20,size=20,prob=0.5)
[1] 9.536743e-07 1.907349e-05 1.811981e-04 1.087189e-03
4.620552e-03
[6] 1.478577e-02 3.696442e-02 7.392883e-02 1.201344e-01
1.601791e-01
[11] 1.761971e-01 1.601791e-01 1.201344e-01 7.392883e-02
3.696442e-02
[16] 1.478577e-02 4.620552e-03 1.087189e-03 1.811981e-04
1.907349e-05
[21] 9.536743e-07
> dbinom(0:20,size=20,prob=0.5)
[1] 9.536743e-07 1.907349e-05 1.811981e-04 1.087189e-03
4.620552e-03
[6] 1.478577e-02 3.696442e-02 7.392883e-02 1.201344e-01
1.601791e-01
[11] 1.761971e-01 1.601791e-01 1.201344e-01 7.392883e-02
3.696442e-02
[16] 1.478577e-02 4.620552e-03 1.087189e-03 1.811981e-04
1.907349e-05
[21] 9.536743e-07
> Table.CDF.Binomial=data.frame(Pr=dbinom(0:20,size=20,prob=0.5))
> rownames(Table.CDF.Binomial)=0:20
> Table.CDF.Binomial
Pr
0 9.536743e-07
1 1.907349e-05
2 1.811981e-04
3 1.087189e-03
4 4.620552e-03
5 1.478577e-02
6 3.696442e-02
7 7.392883e-02
8 1.201344e-01
9 1.601791e-01
10 1.761971e-01
11 1.601791e-01
12 1.201344e-01
13 7.392883e-02
14 3.696442e-02
15 1.478577e-02
16 4.620552e-03
17 1.087189e-03
18 1.811981e-04
19 1.907349e-05
20 9.536743e-07
> z=Table.CDF.Binomial
> x=z$Pr
> plot(x,xlab="Nomor Sukses",ylab="Kepadatan
Peluang",main="Distribusi Binomial: n=20,p=0.5",type="h")
> points(x,pch=8)
> abline(h=0,col="green")
> abline(h=0,col=green")
Hasil run:
2.9. Praktikum 9
Praktikum kesembilan membahas tentang sebaran peluang kontinu, serta
pembuatan plot yang berhubnga dengan distribusi normal.
2.9.1. Pengertian Distribusi Peluang Kontinu
Distribusi peluang kontinu adalah peubah acak yang dapat memperoleh semua
nilai pada skala kontinu. Ruang sampel kontinu adalah bila ruang sampel
mengandung titik sampel yang tak terhingga banyaknya. Syarat dari distribusi
kontinu adalah apabila fungsi f(x) adalah fungsi padat peluang peubah acak
kontinu X yang didefinisikan di atas himpunan semua bilangan riil R bila:
a. F(x) ≥ 0 untuk semua x є R
b. ∫∞∞ 𝑓(𝑥)𝑑𝑥 = 1
c. 𝑃(a < 𝑋 < 𝑏) = ∫∞∞ 𝑓(𝑥)𝑑x
2.9.2. Jenis-jenis Distribusi Peluang Kontinu
Distribusi peluang kontinu dibagi menjadi 4, yaitu distribusi normal, distribusi
student’s t, distribusi chi-kuadrat, dan distribusi f.
1. Distribusi Normal
Distribusi Normal (Gaussian) mungkin merupakan distribusi probabilitas
yang paling penting baik dalam teori maupun aplikasi statistik. Distribusi ini paling
banyak digunakan sebagai model bagi data riil di berbagai bidang yang meliputi
antara lain karakteristik fisik makhluk hidup (berat, tinggi badan manusia, hewan,
dll).
Distribusi Normal disebut juga Gausian distribution adalah salah satu fungsi
distribusi peluang berbentuk lonceng seperti gambar berikut.
Dimana :
𝜇𝑥 = mean
𝜎𝑥 = standar deviasi
𝜋 = nilai konstan yaitu 3, 1416
𝑒 = nilai konstan yaitu 2,7183
Untuk setiap nilai 𝜇𝑥 dan 𝜎𝑥, kurva fungsi akan simetris terhadap 𝜇𝑥 dan
memiliki total luas dibawah kurva tepat 1. Nilai dari 𝜎𝑥 menentukan bentangan dari
kurva sedangkan 𝜇𝑥 menentukan pusat simetrisnya.
Nilai 𝑧𝑥 dari variabel acak standard 𝑧𝑥 sering juga disebut sebagai skor z dari variabel
acak X.
2. Distribusi Student’s T
Berlaku untuk −∞ < 𝑡 < ∞ dan K merupakan tetapan yang besarnya tergantung dari
besar n sedemikian sehingga luas daerah antara kurva fungsi itu dan sumbu t adalah
1.
. Bilangan n – 1 disebut derajat kebebasan (dk). Yang dimaksudkan dengan dk
ialah kemungkinan banyak pilihan dari sejumlah objek yang diberikan. Misalnya kita
mempunyai dua objek yaitu A dan B. Dari dua objek ini kita hanya mungkin
melakukan 1 kali pilihan saja, A dan B. Seandainya terpilih A maka B tidak usah
dipilih lagi. Dan untuk itu dk = 2 – 1 = 1
Berikut ini diberikan rumusan beberapa ukuran statistik deskriptif untuk distribusi
chi-kuadrat.
Mean (Nilai Harapan)
𝜇𝑥 = () = 𝑣 Varians
𝜎2𝑥 = 2𝑣
Kemencengan (skewness) :
8
β 2=α 23=
v
Keruncingan (kurtosis) :
4. Distribusi F
Menurut Gasperz (1989:251), secara teori sebaran F merupakan rasio dari dua
sebaran chi kuadrat yang bebas. Oleh karena itu peubah acak F diberikan sebagai:
x21 /V 1
F= 2
x2 /V 2
Dimana :
2
x 1 = nilai dari sebaran chi-kuadrat dengan derajat bebas V1 = n1-1
x 21 = nilai dari sebaran chi-kuadrat dengan derajat bebas V1 = n1-1
Oleh karena itu sebaran F mempunyai dua derajat bebas yaitu 𝑉1 𝑑𝑎𝑛 𝑉2.
2.9.3. Syntax Distribusi Peluang Kontinu
Untuk melakukan distribusi peluang kontinu pada program R, dapat
melakukan dengan memasukan syntax berikut ini.
>pnorm(p, mean=0, sd=1)
Keterangan :
Argument p merupakan peluang suatu kejadian
Argument mean merupakan rata-rata hitung
Argument sd merupakan standard deviation.
Fungsi di atas hanya digunakan untuk mencari peluang distribusi peluang
kontinu yaitu kurang dari kejadian m atau p(x<m). Jika mencari fungsi
disrtibusi lebih dari kejadian m, maka digunakan 1- p(x<m).
Berikut syntax yang terkait dengan distribusi normal:
> qnorm(c(0.25),mean=0,sd=1,lower.tail=TRUE)
[1] -0.6744898
> dnorm(c(0.05),mean=10,sd=2)
[1] 8.420738e-07
> y=seq(-5,5,length=100)
> plot(y,dnorm(y,mean=0,sd=1),xlab="x",ylab="kepadatan peluang
distribusi normal",main=expression(paste("distribusi normal:
",mu,"=0",sigma,"=1")),type="l")
> abline(h=0,col="magenta")
> x=seq(-5,5,length=100)
Jurusan Matematika F-MIPA 59
Universitas Halu Oleo
2019
METODE STATISTIKA
> plot(y,pnorm(y,mean=0,sd=1),xlab="x",ylab="peluang
kumulatif",main=expression(paste("distribusi
normal:",mu,"=0",sigma,"=1")),type="l")
> abline(h=0,col="blue")
2.10. Praktikum 10
Praktikum kesepuluh membahas tentang uji rata – rata sampel serta syntax
yang berhubungan dengan uji rata – rata sampel.
2.10.1. Hipotesis Statistik
1. Uji Rata – Rata Satu Sampel
Untuk pengujian hipotesis satu rata-rata dengan sample besar (n > 30), uji
statistiknya menggunakan distribusi Z. Prosedur pengujian hipotesisnya adalah
sebagai berikut.
a. Formulasi hipotesis
Ho : µ = µo
H1 : µ > µo
Ho : µ = µo
H1 : µ < µo
Ho : µ = µo
H1 : µ ≠ µo
b. Penentuan nilai α (taraf nyata) dan nilai Z table (Zα)
X́−μ0 X́ −μ0
Z 0= =
s x́ s
√n
e. Kesimpulan
Menyimpulkan tentang penerimaan atau penolakan Ho (sesuai dengan kriteria
pengujiannya).
Jika H0 diterima maka H1 di tolak
Jika H0 di tolak maka H1 di terima
Namun untuk pengujian hipotesis satu rata-rata dengan sampel kecil (n ≤ 30),
uji statistiknya menggunakan distribusi t. Prosedur pengujian hipotesisnya adalah
sebagai berikut.
a. Formulasi hipotesis
Ho : µ = µo
H1 : µ > µo
Ho : µ = µo
H1 : µ < µo
Ho : µ = µo
H1 : µ ≠ µo
b. Penentuan nilai α (taraf nyata) dan nilai t- tabel
Menentukan nilai α sesuai soal, kemudian menentukan derajat bebas, yaitu db
= n – 1, lalu menentukan nilai tα;n-1 atau tα/2;n-1 ditentukan dari tabel.
c. Kriteria Pengujian
Untuk Ho : µ = µo dan H1 : µ > µo
Ho di terima jika to ≤ tα
Ho di tolak jika to > tα
Untuk Ho : µ = µo dan H1 : µ < µo
Ho di terima jika to ≥ - tα
Ho di tolak jika to < - tα
Untuk Ho : µ = µo dan H1 : µ ≠ µo
Ho di terima jika - tα/2 ≤ to ≤ tα/2
Ho di tolak jika to > tα/2 atau to < - tα/2
d. Uji Statistik
Simpangan baku populasi ( σ ) di ketahui :
X́−μ 0 X́ −μ0
t 0= =
σ x́ σ
√n
X́−μ 0 X́ −μ0
t 0= =
s x́ s
√n
e. Kesimpulan
X́ 1− X́ 2 σ 21 σ 22
Z 0=
σ x́ − x́
1
dengan σ x́ − x́ =
2
1
X́ 1− X́ 2 s 21 s 22
e. Kesimpulan
Z 0=
s x́ −x́
1 2
dengan σ x́ − x́ =
1 2
√ +
n1 n 2
e. Kesimpulan
Menyimpulkan tentang penerimaan atau penolakan Ho (sesuai dengan kriteria
pengujiannya).
Jika H0 diterima maka H1 di tolak
Jika H0 di tolak maka H1 di terima
3. Uji Rata – Rata Dua Sampel Berpasangan
a. Formulasi hipotesis
Ho : µ₁ ≥ µ2
H1 : µ₁ < µ2
Ho : µ₁ ≤ µ2
H1 : µ₁ >µ2
Ho : µ₁ = µ2
H1 : µ₁ ≠ µ2
b. Penentuan nilai α (taraf nyata) dan nilai t tabel (tα)
Mengambil nilai α sesuai soal, kemudian nilai tα atau tα/2 ditentukan dari tabel.
c. Kriteria Pengujian
Diterima bila |t hitung|≤tabel
Dimana
e. Kesimpulan
Menyimpulkan tentang penerimaan atau penolakan Ho (sesuai dengan kriteria
pengujiannya).
Jika H0 diterima maka H1 di tolak
Jika H0 di tolak maka H1 di terima
Keterangan:
Y = subyek dalam variabel dependen yang diprediksi
a = harga Y ketika harga X= 0 (harga konstan)
b = angka arah atau koefisien regresi, yang menunjukkan angka peningkatan
ataupun penurunan variabel dependen yang didasarkan pada perubahan
variabel independen. Bila (+) arah garis naik, dan bila (-) maka arah garis
turun.
X = subyek pada variabel independen yang mempunyai nilai tertentu.
Secara matematik harga b merupakan tangen dari perbandingan antara
panjang garis variabel dependen, setelah persamaan regresi ditemukan. Sehingga :
sy
Harga b=r
sx
Harga a=Y −bX
Dimana :
R = koefisien korelasi product moment antara variabel variabel X dengan variabel Y
Sy = simpangan baku variabel Y
Sx = simpangan baku variabel X
Jika harga b merupakan fungsi dari koefisien korelasi. Bila koefisien korelasi
tinggi, maka harga b juga besar, sebaliknya bila koefisien korelasi rendah maka harga
b juga rendah (kecil). Selain itu bila koefisien korelasi negatif maka harga b juga
negatif, dan sebaliknya bila koefisien korelasi positif maka harga b juga positif.
Selain itu harga a dan b dapat dicari dengan rumus berikut:
a=¿ ¿
b=n ∑ XY ❑−¿¿
Untuk menguji regresi sederhana ini digunakan untuk mengetahui apakah
variabel independen (X) berpengaruh secara signifikan terhadap variabel dependen
(Y). Signifikan berarti pengaruh yang terjadi dapat berlaku untuk populasi (dapat
digeneralisasikan). Rumus t hitung pada analisis regresi adalah sebagai berikut:
b 2 n−2
ataut hiung= √ 2
t hitung=
sb √1−r
Langkah-langkah pengujian koefisien regresi sederhana adalah sebagai berikut:
a. Menentukan Hipotesis
Ho = Tidak ada pengaruh yang signifikan
Ha = ada pengaruh yang signifikan
b. Menentukan tingkat signifikansi
Biasanya menggunakan a = 5% atau 0,05
c. Menentukan t hitung
d. Menentukan t tabel
e. Membandingkan t hitung dan t table dengan kriteria
Ho diterima jika: t hitung ≥ t tabel
Ho ditolak jika: t hitung < t tabel
Ho diterima jika: -t hitung ≤ t tabel
Ho di tolak jika: -t hitung > t tabel