Anda di halaman 1dari 21

Laporan Praktikum 1

Komputasi Statistika
Statistika deskriptif, korelasi dan regresi dengan software R








Disusun oleh :
Nama : Komet Rachmawansah
NIM : 105090502111001
Tanggal Praktikum : 17 Oktober 2012
Asisten 1 : 1. Teguh Prasetyo
2. Eka Putri Yuli T


LABORATORIUM KOMPUTER
PROGRAM STUDI STATISTIKA
JURUSAN MATEMATIKA FAKULTAS MIPA
UNIVERSITAS BRAWIJAYA
MALANG
2012



1

BAB I
PENDAHULUAN

1.1 Latar Belakang
Komputasi sangat berguna sekali untuk memecahkan masalah
mengenai data inputan yang menggunakan suatu algoritma tertentu.
Untuk penyelesaian komputasi sangat sulit jika tidak dengan bantuan
software computer. Di program studi statistika terdapat beberapa
software yang mendukung untuk analisisnya, contohnya software R,
minitab, spss, genstat, amos, eviews, dan lain sebagainya. Di dalam
software R terdapat beberapa fasilitas untuk manipulasi, perhitungan
dan penampilan grafik. Oleh karena itu, software R dapat digunakan
untuk analisis statistika. Namun, di dalam software R ini diperlukan
syntax untuk dapat mengetahui hasil dari analisis statistika tersebut,
misalnya untuk mencari nilai rata-rata dari suatu sampel digunakan
syntax >mean().
Untuk itu dalam praktikum ini akan membahas mengenai
pengenalan software R dan operasi-operasi matriks yang ada di dalam
software R.

1.2 Tujuan
1.2.1 Tujuan Umum
- Mahasiswa mampu memahami dan melakukan input data di
software R
1.2.1 Tujuan Khusus
- Mahasiswa mampu menganalisis data ringkasan 5 angka
- Mahasiswa mampu menganalisis korelasi
- Mahasiswa mampu menganalisis regresi











2

BAB II
TINJAUAN PUSTAKA

2.1 Statistika Deskriptif
Statistika deskriptif adalah bagian dari ilmu statistika yang hanya
mengolah, menyajikan data tanpa mengambil keputusan untuk populasi.
Dengan kata lain hanya melihat gambaran secara umum dari data yang
didapatkan. Statistika Deskriptif diantaranya:
Ukuran Lokasi: Modus, Mean, Median, dll.
Ukuran Variabilitas: Varians, Standar Deviasi, Range, dll.
Ukuran bentuk: Kurtosis, Skewness, dll.
Statistika deskriptif bisa didefinisikan sebagai metode yang berkaitan
dengan pengumpulan, peringkasan, penyajian data sehingga memberikan
informasi organization, summarization and presentation of data.
Iqbal Hasan (2004:185) menjelaskan : Analisis deskriptif adalah
merupakan bentuk analisis data penelitian untuk menguji generalisasi hasil
penelitian berdasarkan satu sample. Analisa deskriptif ini dilakukan dengan
pengujian hipotesis deskriptif. Hasil analisisnya adalah apakah hipotesis
penelitian dapat digeneralisasikan atau tidak. Jika hipotesis nol (H0)
diterima, berarti hasil penelitian dapat digeneralisasikan. Analisis deskriptif
ini menggunakan satu variable atau lebih tapi bersifat mandiri, oleh karena
itu analisis ini tidak berbentuk perbandingan atau hubungan.
Iqbal Hasan (2001:7) menjelaskan : Statistik deskriptif atau
statistik deduktif adalah bagian dari statistik yang mempelajari cara
pengumpulan data dan penyajian data sehingga mudah dipahami. Statistik
deskriptif hanya berhubungan dengan hal menguraikan atau memberikan
keterangan-keterangan mengenai suatu data atau keadaan atau fenomena.
Dengan kata lain statistik deskriptif berfungsi menerangkan keadaan,
gejala, atau persoalan. Penarikan kesimpulan pada statistik deskriptif (jika
ada) hanya ditujukan pada kumpulan data yang ada. Didasarkan pada ruang
lingkup bahasannya statistik deskriptif mencakup : 1. Distribusi frekuensi
beserta bagian-bagiannya seperti :
a. Grafik distibusi (histogram, poligon frekuensi, dan ogif);
b. Ukuran nilai pusat (rata-rata, median, modus, kuartil dan
sebagainya);
c. Ukuran dispersi (jangkauan, simpangan rata-rata, variasi,
simpangan baku, dan sebagianya);
d. Kemencengan dan keruncingan kurva 2. Angka indeks 3. Times
series/deret waktu atau berkala 4. Korelasi dan regresi sederhana
3

Bambang Suryoatmono (2004:18) menyatakan Statistika
Deskriptif adalah statistika yang menggunakan data pada suatu kelompok
untuk menjelaskan atau menarik kesimpulan mengenai kelompok itu saja
- Ukuran Lokasi: mode, mean, median, dll
- Ukuran Variabilitas: varians, deviasi standar, range, dll
- Ukuran Bentuk: skewness, kurtosis, plot boks
Pangestu Subagyo (2003:1) menyatakan : Yang dimaksud sebagai
statistika deskriptif adalah bagian statistika mengenai pengumpulan data,
penyajian, penentuan nilai-nilai statistika, pembuatan diagram atau gambar
mengenai sesuatu hal, disini data yang disajikan dalam bentuk yang lebih
mudah dipahami atau dibaca.
Sudjana (1996:7) menjelaskan : Fase statistika dimana hanya
berusaha melukiskan atau menganalisa kelompok yang diberikan tanpa
membuat atau menarik kesimpulan tentang populasi atau kelompok yang
lebih besar dinamakan statistika deskriptif.
Contoh lain Statistika Deskriptif:
Peringkasan data dalam bentuk:
1. Tabulasi Data (Tabel)
2. Diagram Balok (Histogram)
3. Diagram Kue (Pie Chart)

2.2 Korelasi
Nilai korelasi adalah nilai yang menggambarkan tingkat keeratan
hubungan linier antara dua variabel atau lebih. Nilai korelasi tidak
menggambarkan hubungan sebab akibat antara dua variabel atau lebih
tetapi semata-mata menggambarkan keterkaitan linier antar variabel. Nilai
korelasi sering dinotasikan dengan r dan nilainya dari 1 sampai 1
(-1s r s1), nilai r yang mendekati 1 atau 1 menunjukkan semakin erat
hubungan linier antara kedua variabel tersebut. Sedangkan nilai r yang
mendekati nol menggambarkan hubungan kedua variabel tersebut tidak
linier. Tanda dari nilai r dapat dilihat dari diagram pencar pengamatan dari
dua variabel tersebut. Bila titik-titik pengamatan menggerombol mengikuti
garis lurus dengan kemiringan positif, maka korelasi antar kedua variabel
tersebut positif. Sebaliknya bila titik-titik pengamatan tersebut
menggerombol mengikuti garis lurus dengan kemiringan negatif, maka
korelasi antar variabel tersebut bertanda negatif.
:
Salah satu ukuran keeratan hubungan linier antara dua variabel
adalah Koefisien Korelasi Pearson, rumus untuk menghitung korelasi
tersebut dari data sampel adalah sebagai berikut:
4

=


=

= =
=
= =
=
2
1
2 2
1
2
1
2
1
2
1
1
) ( ) (
) )( (
y n y x n x
y x n y x
y y x x
y y x x
r
n
i
i
n
i
i
n
i
i i
n
i
i
n
i
i
n
i
i i

yy xx
xy
S S
S
r =


dengan 1 s r s1

Inferensi terhadap p
Nilai r merupakan suatu nilai penduga bagi nilai korelasi populasi
yang dilambangkan dengan p maka apabila ingin mendapatkan suatu uji
yang menyatakan kapan r berada cukup jauh dari suatu nilai tertentu
0
p .
Hipotesis untuk menguji apakah dua varibel mempunyai hubungan linier
atau tidak adalah sebagai berikut :
H
o
: p = 0
Statistik uji :

2
1
2
r
n r
t

= , dengan v = n - 2
Wilayah kritis :
t < -t
o
untuk H
o
: p < 0
t > t
o
untuk H
o
: p > 0
t < -t
o/2
dan t > t
o/2
untuk H
o
: p = 0

2.3 Regresi
Analisis regresi mempelajari bentuk hubungan antara satu atau
lebih peubah bebas (X) dengan satu peubah tak bebas (Y). dalam penelitian
peubah bebas ( X) biasanya peubah yang ditentukan oelh peneliti secara
bebas misalnya dosis obat, lama penyimpanan, kadar zat pengawet, umur
ternak dan sebagainya. Disamping itu peubah bebas bisa juga berupa
peubah tak bebasnya, misalnya dalam pengukuran panjang badan dan berat
badan sapi, karena panjang badan lebih mudah diukur maka panjang badan
5

dimasukkan kedalam peubah bebas (X), sedangkan berat badan
dimasukkan peubah tak bebas (Y). sedangkan peubah tak bebas (Y) dalam
penelitian berupa respon yang diukur akibat perlakuan/peubah bebas (X).
misalnya jumlah sel darah merah akibat pengobatan dengan dosis tertentu,
jumlah mikroba daging setelah disimpan beberapa hari, berat ayam pada
umu tertent dan sebagainya.
Dalam kehidupan sehari-hari seringkali kita ingin melihat
hubungan antara dua variabel, seperti hubungan antara panjang bayi dan
bobot bayi, protein dan kadar hemoglobin, tinggi badan dan berat badan, IQ
anak dan nilai matematikanya. Umumnya suatu variabel bersifat
mempengaruhi variabel yang lainnya, variabel pertama disebut variabel
bebas (independent variable) sedangkan variabel yang kedua disebut
variabel tak bebas (dependent variable). Secara kuantitatif hubungan antara
variabel bebas dan variabel tak bebas dapat dimodelkan dalam suatu model
matematik. Metode yang digunakan untuk mencari pola hubungan
fungsional antara satu variabel bebas (independen / prediktor / X) dengan
satu variabel tak bebas (dependen / respons / y) adalah analisis regresi
sederhana. Model analisis regresi sederhana Y terhadap X adalah :

i i i
x y c | o + + =
dengan y
i
= variabel respon ke-i
x
i
= variabel prediktor ke-i
o = parameter intersep
| = parameter slope (kemiringan)
c
i
= error ke-i

Dengan menggunakan metode kuadrat terkecil (least square) persamaan
regresi diatas dapat diduga dengan :

i i
bx a y + =

dengan
x b y a
S
S
x n x
y x n y x
x x
y y x x
b
xx
xy
n
i
i
n
i
i i
n
i
i
n
i
i i
=
=

=
=
=
=
2
1
2
1
2
1
1
) (
) )( (



6

Koefisien determinasi
Untuk mengetahui kesesuaian model dan besarnya variasi nilai Y yang
dapat dijelaskan oleh model regresi digunakan nilai koefisien determinasi
dengan rumus sbb:

=
=

=
n
i
i
n
i
i
y y
y y
R
1
2
1
2
2
) (
) (

dengan 0 s R
2
s1
Untuk analisis regresi linier sederhana :
R
2
= r
2


























7

BAB III
METODOLOGI

1.1 Statistika Deskriptif
- Membuka software R 2.11.1, pilih menu packages> load
packages>Rcmdr












Lalu klik OK
- Untuk menginputkan data pilih data>data set baru
- Kemudian muncul kotak dialog seperti dibawah ini kemudian
masukkan nama untuk data set : DataHasilPanenPadi. klik OK.





- Klik kotak var 1 , kemudian muncul kotak dialog di bawah ini, isikan
variable name : Hasil Panen Padi/kwintal dan pilih type character.





- Isikan data sebanyak 25 pada kolom data hasil UTS Komstat
8






















- Untuk mencari ringkasan 5 angka (statistika deskriptif) maka tutup
terlebih dahulu Data Editor agar proses tetap berjalan, kemudian pilih
statistika pada toolbar > ringkasan> data set active> lalu OK.
- Setelah perintah OK maka output akan keluar ,










9

- Untuk memplotkan data ke dalam grafik pilih grafik pada menu
toolbar > histogram ,

klik OK.
- Maka didapatkan grfik histogram sebagai berikut ,

- Untuk mengetahui macam grafik yang lain maka pilih grafik > QQ plot
,klik OK.
- Maka dihasilkan plot indeks ,


10

1.2 Korelasi
- Seperti langkah-langkah untuk mencari ringkasan 5 angka, pertama
membuka software R 2.1.11 > load packages > Rcmdr > OK. Kedua
dengan cara yang sama , input data dengan 2 variabel.
Kasus :
Ingin diketui ada korelasi antara Pengeluaran/ bulan (Y) dan Pendapatan/
bulan yang diperoleh (X). Dengan responden sebanyak 30 penduduk di
suatu daerah.
- Masukkan nama untuk data set : korelasi lalu klik OK
- Kotak variabel 1 diganti nama dengan : Pengeluaran/ Bulan dan pilih type
character.
- Kotak variabel 2 diganti nama dengan : Pendapatan/ Bulan dan pilih type
character.








- Input data sebanyak 30 . Karena akan diketahui ada korelasi antara
lama belajar dan IP dari 30 mahasiswa statistika kelas A 2010 UB.
Maka hasil input data sebagai berikut :
11



- Untuk mengetahui korelasi antara lama belajar dan IP maka pilih
statistika pada menu toolbar > ringkasan > uji korelasi
> pilih dua peubah IP dan lama belajar, tipe korelasi produk-
momen pearson, hipotesis alternatif : dua arah , klik OK
- Output akan keluar di jendela keluaran ,








12













1.3 Regresi
- Seperti langkah-langkah untuk mencari ringkasan 5 angka, pertama
membuka software R 2.1.11 > load packages > Rcmdr > OK. Kedua
dengan cara yang sama , input data dengan 3 peubah eksplanatori
(X1,X2,X3).
- Kasus :
Suatu Penelitian ingin diketahui pengaruh tingkat pendapatan, IQ, dan
pengeluaran seseorang terhadap jumlah tabungan. Dalam analisis regresi
kita ingin memprediksi hal tersebut. Dengan responden sebanyak 35 orang.
Y = Jumlah Tabungan
X1 = Jumlah Pendapatan/ bulan
X2 = IQ
X3 = Jumlah Pengeluaran/ bulan
- Input data data > data set baru
- Masukkan nama untuk data set : regresi lalu klik OK
- Kotak variabel 1 diganti nama dengan : Tabungan dan pilih type
character ,variabel 2 diganti nama dengan : Pendapatan pilih type
character, variabel 3 diganti nama dengan : IQ pilih type character,
variabel 4 diganti nama dengan : Pengeluaran pilih type character,
- Input data sebanyak 41 pada kolom participation,citizenship,democracy,
dan implement democracy. Maka akan muncul tabel sebagai berikut :


13


















- Untuk mencari regresi pada data maka klik statistika pada menu
toolbar > pencocokan model > regresi linier ,
- Nama untuk model : RegModel.1
- Peubah respon : Participation
- Peubah eksplanatori : citizen, democracy, implement democracy , lalu
klik OK
- Maka akan muncul output :







14

BAB IV
HASIL DAN PEMBAHASAN
4.1 Output Software
4.1.1 Ringkasan 5 angka






Data dibuat grafik :
1. Grafik histogram










15

2. Grafik plot indeks


4.1.2 Korelasi















4.1.3 Regresi











16

4.2 Interprestasi
4.2.1 Ringkasan 5 angka
Dari output , dapat diketahui nilai minimal , nilai quartil, median,
nilai mean (rata-rata), dan nilai maksimum. Maka nilai UTS komputasi
statistik mahasiswa statistika kelas A 2010 Universitas Brawijaya
mempunyai ringkasan 5 angka sebagai berikut :
1. Nilai minimal komputasi statistik : 65.00
2. Quartil : - Quartil pertama = 70.00
- Quartil ketiga = 85.00
3. Nilai median : 79.00
4. Nilai mean : 78.64
5. Nilai maksimum : 95
Dari grafik histogram , sumbu y merupakan frekuensi data dan
sumbu x merupakan nilai komputasi statistik.
Dari grafilk plot indeks , banyaknya lingkaran kecil menunjukkan
banyaknya data sebanyak 25 yang menyebar acak. Sumbu x merupakan
banyaknya data sedangkan sumbu y merupakan nilai komputasi statistik.

4.2.2.Korelasi
Korelasi antara pengeluaran/bulan (Y) dan pendapata (X) adalah
0.982676, maka terdapat hubungan erat antara tingkat pengeluaran dan
tingkat pendapatan.
Dilihat dari nilai p-value = 2.2e 16 dibandingkan dengan nilai =
0.05 dengan Ho : Tidak ada hubungan antara lama belajar dan Ip , H1 : ada
hubungan antara tingkat pengeluaran dan tingkat pendapatan, maka p-value
< jadi kesimpulan tolak Ho dengan interpretasi ada hubungan antara lama
tingkat pengeluaran dan tingkat pendapatan atau belum cukup bukti untuk
mengatakan bahwa tidak terdapat hubungan antara tingkat pengeluaran dan
tingkat pendapatan.
Dilihat dari nilai selang kepercayaan 95% maka korelasi antara
tingkat pengeluaran dan tingkat pendapatan mempunyai selang
kepercayaan 95% = 0.9635195 0.9918150.







17

4.2.3 Regresi
Min 1Q Median 3Q Max
-6.2944 -2.1788 0.1548 2.4812 5.6104

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.36349 7.29553 0.735 0.467759
IQ -0.01689 0.06203 -0.272 0.787224
Pendapatan 1.93325 0.45098 4.287 0.000164 ***
Pengeluaran -1.80888 0.57128 -3.166 0.003453 ** ---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.662 on 31 degrees of freedom
Multiple R-squared: 0.4026, Adjusted R-squared: 0.3448
F-statistic: 6.963 on 3 and 31 DF, p-value: 0.001026

Interpretasi: Dari output , didapatkan nilai estimasi parameter untuk
Intercept (b
0
) sebesar 5.36349, untuk IQ (b
1
) sebesar 1.93325,
democracy (b
2
) sebesar -0.01689, implement.democracy (b
3
) sebesar
-1.80888. Sehingga model persamaan regresi liniernya adalah :

Y = 5.36349 + 1.93325 X - 0.01689X2 -1.80888 X3
Dimana :
o Y = Jumlah Tabungan
o X1 = Jumlah Pendapatan/ bulan
o X2 = IQ
o X3 = Jumlah Pengeluaran/ bulan
Interpretasi untuk b1 = 1,93325 pertambah 1 tingkat Jumlah
Pendapatan/ bulan maka akan menaikkan Jumlah Tabungan seseorang
sebesar 1.93325 dengan asumsi IQ dan Jumlah Pengeluaran/ bulan
adalah konstan.
Interpretasi untuk b2 = -0.01689 pertambah 1 IQ maka akan
menurunkan Jumlah Tabungan seseorang sebesar 0.01689 seseorang
dengan asumsi tingkat Jumlah Pendapatan/ bulan dan Jumlah
Pengeluaran/ bulan adalah konstan.
18

Interpretasi untuk b3 = -1.80888 pertambah 1 tingkat Jumlah
Pengeluaran/ bulan maka akan menurunkan Jumlah Tabungan sebesar
1.80888 dengan asumsi tingkat dan IQ adalah konstan.
Dilihat dari uji simultan maka di dapat nilai F stat = 6.93 dengan db 3
dan 31 dan p-value : 0.001026 dibandingkan dengan = 0.05 jadi p-
value < , maka F stat signifikan.
Dilihat dari nilai R-squared = 0.4026 maka model regresi tersebut
mampu menjelaskan 40.26 % keragaman dari data (model dapat
dikatakan kurang layak).
Dilihat dari uji Parsial maka,
Pr(>|t|) = 0.05
(Intercept) 0.467759 p-value > (tidak nyata)
IQ 0.787224 p-value > (tidak nyata)
Pendapatan 0.000164 *** p-value > (nyata)
Pengeluaran 0.003453 ** --- p-value > (nyata)


Y= 1,93325 X1 - 1.80888 X3


















19

BAB V
PENUTUP
5.1 Kesimpulan
Dengan meggunakan software R maka dapat menganalisis data
dengan ringkasan 5 angka yaitu : nilai minimal , nilai quartil, median, nilai
mean (rata-rata), dan nilai maksimum.
Selain itu juga bisa menganalisis korelasi. Seperti data diatas
setelah di uji korelasi ternyata terdapat hubungan antara lama tingkat
pengeluaran dan tingkat pendapatan
Software R juga bisa menganalisis regresi dengan beberapa
pengujian diantaranya uji simultan, uji parsial, R-squared, dan mengetahui
model yang layak digunakan.
5.2 Saran
Mestinya laboratorium dilengkapi dengan software R sehingga
praktikum tidak terganggu karena setiap praktikan harus menginstal
software R di komputer masing- masing.














20