Anda di halaman 1dari 112

PRAKTIKUM STATISTIKA

i MODUL 1
DAFTAR ISI

KATA PENGANTAR .............................................................. iii


DAFTAR ISI ..............................................................................iv
1 PENGENALAN MINITAB 15, DATA, DAN
TEKNIK PENGAMBILAN SAMPEL ................... 1-1
1.1 Menu-menu pada Minitab 15 ....................................... 1-2
1.2. Mengenal Data ............................................................. 1-14
1.2.1 Populasi dan sampel ................................................... 1-14
1.2.2 Skala pengukuran ....................................................... 1-15
1.3 Metode Sampling .......................................................... 1-17
1.4 Aplikasi dengan minitab ................................................ 1-19
2 STATISTIKA DESKRIPTIF ................................. 2-1
2.1 Ukuran Pemusatan........................................................... 2-2
2.2 Ukuran Penyebaran ......................................................... 2-2
2.5 Penyajian dalam Bentuk Grafik ........................................ 2-5
2.6 Aplikasi dengan minitab ................................................... 2-6
3 KENORMALAN DATA........................................ 3-1
3.1 Distribusi normal ............................................................. 3-2
3.2 Statistik uji kenormalan .................................................. 3-3
3.3 Aplikasi dengan minitab ................................................... 3-5
4 TRANSFORMASI DATA ..................................... 4-1
4.1 Transformasi untuk satu angkatan data ........................... 4-2
4.2 Transformasi untuk beberapa angkatan data (menyamakan
sebaran) ........................................................................ 4-3
4.3 Aplikasi Minitab............................................................. 4-5
5 UJI HIPOTESIS STATISTIK DAN PROPORSI 5-1
5.1 Hipotesis statistik ............................................................ 5-2
5.1.1 Pengujian hipotesis untuk satu nilai tengah ................. 5-3
5.1.2 Pengujian hipotesis untuk selisih dua nilai tengah ....... 5-4
iv MODUL 1
5.1.3 Aplikasi dengan minitab ................................................ 5-7
5.2 Uji proporsi .................................................................. 5-11
5.2.1 Uji terhadap satu nilai proporsi ................................. 5-11
5.2.2 Aplikasi dengan Minitab .............................................. 5-12
5.2.3 Pendekatan normal baku untuk uji terhadap satu nilai
proporsi ...................................................................... 5-15
5.2.4 Aplikasi dengan Minitab .............................................. 5-15
5.2.5 Pengujian perbandingan dua proporsi ....................... 5-17
5.2.6 Aplikasi dengan Minitab .............................................. 5-18
6 ANALISIS VARIANSI .......................................... 6-1
6.1 Asumsi-asumsi pada analisis variansi ............................... 6-2
6.2 Uji Kesamaan Ragam ....................................................... 6-2
6.3 Tabel analisis variansi ....................................................... 6-3
7 REGRESI LINIER DAN NON-LINIER
SEDERHANA ........................................................ 7-1
7.1 Regresi ............................................................................. 7-2
7.1.1 Model untuk regresi linier sederhana ......................... 7-2
7.1.2 Model regresi non linier .............................................. 7-4
7.1.2.1 Model eksponensial .................................................. 7-4
7.1.2.2 Model geometrik (power ) ....................................... 7-4
DAFTAR PUSTAKA ..........................................................

v MODUL 1
1 PENGENALAN MINITAB 15, DATA, DAN
TEKNIK PENGAMBILAN SAMPEL

Overview

Modul ini memberikan pengenalan singkat tentang software Minitab 15


kepada mahasiswa. Pengenalan tentang menu diberikan diawal, sehingga
diharapkan mahasiswa memiliki gambaran umum tentang penggunaan
software ini. Setelah dapat menjalankan software ini, mahasiswa akan
dikenalkan pada beberapa jenis data berdasarkan skala pengukurannya. Pada
tahap akhir, mahasiswa akan diajarkan tentang pengambilan sampel dari
populasi dengan menggunakan beberapa teknik sampling

Tujuan

1. Mahasiswa mendapatkan gambaran singkat tentang software Minitab


2. Mahasiswa dapat membedakan data berdasarkan skala pengukurannnya
3. Mahasiswa dapat melakukan pengambilan data sampel berdasarkan data
populasi dengan menggunakan beberapa metode sampling

1-1 MODUL 1
1.1 Menu-menu pada Minitab 15

Pada software minitab, tampilannya ada 2, yaitu windows worksheet dan


windows session. Worksheet merupakan tempat untuk mengetikkan data dan
menampilkan hasil pengolahan data. Sedangkan session merupakan tempat
untuk menampilkan semua perintah-perintah (command-command) yang
telah kita lakukan dalam bentuk program dan hasil dari pengolahan data yang
tidak dapat ditampilkan pada worksheet. Adapun tampilan minitab sebagai
berikut :

Adapun menu-menu pada minitab 15 yaitu :


1. File
Pada menu file terdapat sub-sub menu antara lain :
- New : menampilkan worksheet baru

1-2 MODUL 1
- Open project : menampilkan data yang telah disimpan pada file kita.
Di bawah open project, terdapat save projects, save projects as,
project description.

- Open worksheet : menampilkan data yang telah disimpan dan


disediakan software minitab. Di bawah sub menu ini, terdapat save
worksheet, save worksheet as.

1-3 MODUL 1
- Query database :

- Open graph : membuka grafik yang telah disimpan


- Other file : membuka data dari file lain
- Print session window : mencetak tampilan pada session.
- Print setup : mencetak dengan pengaturan tampilan pada worksheet
dan session.
- Exit : Keluar dari minitab
Adapun tampilan dari menu file sebagai berikut :

1-4 MODUL 1
2. Edit
Sub-sub menu pada menu edit adalah :

- undo : kembali ke pekerjaan ke- n-1 (bila kita diposisi n)


- redo : kembali ke pekerjaan ke- n+1 (bila kita diposisi n)
- Clear cells : membersihkan data pada sel-sel worksheet
- Delete cells : menghapus sel-sel
- Copy cells : menyalin data pada sel
- Cut cells : memotong sel (menyalin dan menghapus)
- Worksheet link : memindahkan data yang telah disalin baik dari sel,
atau file minitab atau word, excel, dan lain-lain.
- Select all cells : memilih atau menyorot semua data pada sel-sel
untuk pengolahan
- Edit last dialog : mengedit dialog terakhir
- Command line editor : digunakan untuk mengeksekusi perintah
secara cepat atau mengekseksekusi ulang atau mengedit perintah
yang digunakan pada sesi sebelumnya.

1-5 MODUL 1
3. Data
Menu data berisi perintah-perintah menampilkan data. Sub-sub menu
yang terdapat pada menu data yaitu :

- Subset worksheet : menampilkan sebagian worksheet


- Split worksheet : membagi worksheet menjadi beberapa worksheet
- Merge worksheet : menggabungkan beberapa worksheet
- Sort : mengurutkan data (mengurutkan suatu kolom berdasarkan
kolom lainnya )
- Rank : merangking data (membuat rangking suatu kolom)
- Delete rows : menghapus baris
- Erase variabels : menghapus variabel-variabel
- Copy columns : mengkopi kolom
- Stack/unstack : menggabung data pada kolom yang berbeda menjadi
satu kolom/ memisahkan data pada satu kolom menjadi beberapa
kolom berdasarkan kriteria tertentu
- Code : mengkonversi data (numerik ke numerik, numerik ke teks
dsb)
- Change data type : merubah tipe data
- Extract from Date/Time : ekstrak data numerik ke text atau
sebaliknya
- Concatenate : menggabung dua atau lebih kolom yang berisi data
text menjadi satu kolom, syarat penjang kolom sama.
- Display data : menampilkan data
1-6 MODUL 1
4. Calc (calculation)
Pada menu calc terdapat sub-sub menu :
- Calculator : untuk melakukan perhitungan (penjumlahan, perkalian,
pembagian, sinus, maksimum, eksponen, dan lain-lain)
- Column statistics : menghitung ukuran-ukuran statistik dari suatu
kolom
- Row statistics : menghitung ukuran-ukuran statistik dari suatu baris
- Standardize : menormalisasikan data
- Make patterned data : membuat suatu kolom(data) dengan pola
tertentu
- Make mesh data : Membuat sebuah fungsi dua dimensi seperti
permukaan berdasarkan pasangan nilai x dan y
- Make indicator variables : membuat variabel dummy untuk data
kualitatif
- Set base : menetapkan titik awal untuk pembangkitan data acak. Bila
kita tidak mengeset titik tersebut, maka titik tersebut akan
ditentukan oleh minitab.
- Random data : membangkitkan data acak dari berbagai distribusi
- Probability distributions : menghitung peluang dan distribusi
kumulatif peluang dan inversnya dari berbagai distribusi peluang.
- Matrices : merupakan sub menu untuk menghitung matriks dan
operasi-operasinya
Adapun tampilan menu calc adalah

1-7 MODUL 1
5. Menu Stat
Sub-sub menu pada menu stat adalah :
- Fit interceps : mendefault intersep pada persamaan regresi
- Basic statistics : a) descriptiv statistics : menampilkan ukuran-ukuran
statistics, seperti mean, median, trimean, standart deviasi, kuartil,
maksimum dan minimum, b) uji hipotesis 1 sampel, 2 sampel , c)
correlation, d) covariance, e) normallity test
- Regression : mencari persamaan regresi serta analisisnya, baik
regresi linier maupun non linier untuk kuantitatif maupun kualitatif
- Anova : menganalisis perbedaan lebih dari dua populasi berdasarkan
nilai ragam
- DOE : membuat desain rancangan percobaan faktorial
- Control charts : membuat bagan-bagan kendali
- Quality tools : mengalisis data untuk pengendalian kualitas
- Reliability/survival : membuat plot untuk analisis kehandalan sistem
- Multivariate : menganalisis data banyak peubah
- Time series : menganalisis data deret waktu untuk peramalan
- Tables : membuat tabel kontingensi dan analisis korespondensi
- Nonparametrik : menganalisis data kualitatif tanpa asumsi distribusi
tertentu
- EDA (Eksploratory Data Analysis) : memahami dan mengalisis data
melalui diagram dahan daun, box plot, garis resisten, dll
- Power and sample size : digunakan untuk menghitung power
(peluang kita akan menolak H0 ketika ia salah), ukuran sampel,
perbedaan minimum (ditampilkan sebagai nilai proporsi alternatif)
pada uji satu proporsi.

1-8 MODUL 1
Tampilan menu stat adalah sebagai berikut :

6. Menu Graph
Pada menu graph berisi sub-sub menu seperti pada tampilan di bawah
yang digunakan untuk membuat grafik-grafik seperti histogram, diagram
lingkaran, plot, countur, plot untuk data time series, box plot, diagram
dahan daun. Untuk grafik-grafik tertentu dapat ditampilkan dalam dua
dimensi maupun tiga dimensi.

1-9 MODUL 1
7. Menu Editor
Berikut adalah sub-sub menu editor pada worksheet :
- Next column : memindahkan kursor ke kolom berikutnya
- Go to active cell : memindahkan kursor ke sell yang aktif
- Format column : memformat kolom dalam numerik, tanggal, text.
- Column : mengatur ukuran-ukuran kolom
- Formulas : menampilkan formula-formula ke kolom dan menghitung
formula secara otomatis.
- Worksheet : mengedit sel yang sedang aktif dan merubah arah
inputan
- Define custom list : mengurutkan data
- Clipboard setting : merubah setting untuk data hilang

1-10 MODUL 1
Adapun tampilan menu editor adalah :

Berikut adalah sub-sub menu pada menu editor session :


- Next command : memindahkan kursor ke command berikutnya
- Previous command : memindahkan kursor ke command sebelumnya
- Enable command language : menampilkan bahasa pemrograman yang
dieksekusi , MTB >
- Output editable : mengeset tampilan output hanya dapat di baca
- Find : mencari kata tertentu dalam lingkup session
- Replace : mencari kata tertentu dan menggantinya dengan kata lain
dalam lingkup session
- Apply Font : command font untuk memberlakukan pemilihan font
untuk I/O, title, command.

1-11 MODUL 1
8. Tools
Adapun sub-submenu pada menu tools adalah
- Microsoft Calculator : Menampilkan menu calculator microsoft
- Notepad : Menampilkan notepad
- Windows Explorer : Menampilkan menu windows explorer
- Toolbars : Untuk men-setting tool – tool yang ingin ditampilkan atau
tidak
- Status Bar : Status bar terletak dibagian bawah layar dan
menampilkan pesan yang menjelaskan item menu dan toolbars yang
saat ini sedang aktif.
- Customize : Digunakan untuk mengedit/menambah/menampilkan
shortcut perintah (command), Toolbars, tool dan lain-lain pada
Minitab
- Options : Digunakan untuk merubah dan menyimpan settingan
standar untuk berbagai macam operasi
- Manage Profiles :Digunakan untuk membuat, menghapus,
mengaktifkan atau menonaktifkan satu atau beberapa profil termasuk
mengubah urutan nya.
- File Security :digunakan untuk melindungi file proyek dari pihak lain

1-12 MODUL 1
Tampilan menu tools adalah

9. Menu Windows
Sub-sub menu pada menu windows digunakan untuk mengatur tampilan
dari windows minitab dan menyimpan data, session, grafik yang telah
dibuat untuk sementara, yaitu :

1-13 MODUL 1
10. Menu Help
Menu ini digunakan untuk membantu user, apabila terdapat kesulitan
waktu menggunakan minitab, baik masalah teori, maupun commandnya.

1.2. Mengenal Data

1.2.1 Populasi dan sampel

Persoalan-persoalan yang muncul dalam berbagai bidang, hampir seratus


persen berhubungan dengan data. Data dalam bidang statistika merupakan
keterangan atau informasi mengenai suatu kejadian, biasanya dinyatakan
dengan angka. Diharapkan nantinya data dapat memberikan informasi lebih
banyak bagi yang bersangkutan. Sebelum membahas tentang data, terlebih
dahulu akan dibahas sekilas tentang statistika, populasi, dan sampel. Statistika
yaitu suatu ilmu yang mempelajari tentang data, meliputi teknik pengambilan
data, pengolahan dan penyajiannya, kemudian analisis dan kesimpulan serta
pengambilan keputusan dari kesimpulan yang diperoleh lewat analisis.
Sedangkan data itu sendiri merupakan keterangan yang menggambarkan
kondisi saat itu.
Berdasarkan sumbernya data dibedakan menjadi dua, yaitu 1) data primer dan
2) data sekunder. Data primer adalah keteranngan atau informasi secara

1-14 MODUL 1
umum yang diperoleh oleh dari penelitian peneliti sendiri. Sedangkan data
sekunder merupakan data yang diambil dari penelitian orang lain pada suatu
publikasi.

Berkaitan dengan pengambilan data, terdapat dua istilah yaitu populasi dan
sampel. Populasi adalah seluruh objek yang diamati. Sedangkan sampel adalah
objek yang diamati adalah sebagian dari populasi. Diharapkan pengambilan
sampel yang dilakukan dapat mewakili populasi. Beberapa hal yang mendasari
pengambilan sampel adalah :

1. Waktu
Bila waktu untuk penelitian terbatas, maka pengambilan sampel dapat
dipilih sebagai alternatif pengambilan data.

2. Biaya
Untuk penelitian mengenai suatu komponen yang harganya mahal, bila
pengambilan populasi dilakukan, maka biaya yang dikeluarkan akan besar.
Sehingga untuk biaya yang terbatas, perlu dilakukan pengambilan sampel.

3. Populasi tidak pasti


Salah satu contoh populasi tidak pasti adalah, bila penelitian kita tentang
orang berpenyakit flu burung, maka kita akan kesulitan menentukan
populasinya, karena tanpa pemeriksaan akan sulit ditentukan seseorang
kena flu burung atau tidak. Sehingga pengambilan sampel perlu dilakukan
yaitu pasien flu burung pada suatu rumah sakit.

4. Ketelitian
Hal ini berhubungan dengan waktu dan biaya yang terbatas. Misal biaya
dan waktu penelitian terbatas, maka jumlah tenaga yang membantu
penelitian akan menjadi pertimbangan, sehingga hasilnya pengolahannya
berpengaruh pada tingkat ketelitian.

1.2.2 Skala pengukuran

Skala pengukuran merupakan bagian yang paling mendekati pengukuran data


baik secara diskret maupun kontinu. Skala ini sangat penting, karena berkaitan
dengan pemilihan teknik analisis statistika yang sangat bergantung pada sifat
1-15 MODUL 1
data dan skala pengukuran yang digunakan. Ditinjau berdasarkan skala
pengukurannya, data dapat dibedakan menjadi beberapa kelompok, yaitu (
dari yang terendah sampai yang tertinggi ) :

a. Skala Nominal
Data yang termasuk dalam kelompok ini memiliki ciri bahwa data tidak
memiliki tingkatan. Satu – satunya operator matematika yang berlaku
adalah persamaan dan pertidaksamaan.
Contohnya adalah data tentang jenis kelamin, agama, jenis penyakit dan
sebagainya.

b. Skala Ordinal
Sudah ada tingkatan pada data yang masuk kelompok ini, hanya saja
belum ada ketentuan jarak yang sama antar tingkatan,serta ada hubungan
lebih dari.
Contohnya adalah data tentang golongan kepegawaian, kepangkatan, nilai
huruf, peserta kontes kecantikan, jenis komputer dan sebagainya.

c. Skala Interval
Selain sudah memiliki tingkatan seperti data pada skala ordinal, data yang
masuk dalam kelompok ini juga memiliki sifat bahwa jarak antar tingkatan
adalah sama. Hal ini diperiksa melalui selisih antar tingkatan selalu tetap
Sebagai contoh data suhu yang diukur dalam Celcius, selisih antara suhu
30 dan 29 akan sama dengan selisih suhu 10 dan 11 atau dengan yang
lainnya. Ciri lain dari data ini adalah nilai 0 belum memiliki arti sebenarnya
( tidak ada).
Contohnya adalah suhu 0 derajat bukan berarti tidak ada suhu, tahun 0
bukan berarti tidak ada tahun.

d. Skala Rasio
Data yang memiliki skala ini memiliki tingkatan yang paling tinggi. Semua
sifat pada skala interval juga ada pada data skala rasio ini. Tambahan sifat
untuk jenis data ini adalah nilai 0 sudah memiliki arti yang sebenarnya
( tidak ada ).
Contoh adalah data tentang berat, tinggi, harga, volume dan sebagainya.

1-16 MODUL 1
Dengan mengetahui jenis data yang akan diolah, maka kita dapat menentukan
analisis yang tepat untuk data tersebut. Sebagai contoh data yang memiliki
skala Nominal hanya dapat disajikan dalam bentuk pie chart, bar chart dan
tidak dapat ditentukan ukuran ukuran statistik seperti mean, standard
deviation dan sebagainya. Data yang berskala Ordinal selain dapat dianalisa
seperti nominal juga dapat dianalisa lebih lanjut tetapi sebelumnya harus
ditransformasi ke bentuk numerik. Tetapi, kadang untuk pengolahan lebih
lanjut, data berskala ordinal dan nominal dapat diolah dengan menggunakan
statistika nonparametrik. Sedangkan data yang berskala interval atau Rasio
dapat dilakukan analisa yang lebih lengkap secara langsung. Analisa yang dapat
dilakukan pada data dengan kedua skala terakhir ini relatif sama.

1.3 Metode Sampling

Ditinjau dari pengambilan sampelnya, ada beberapa metode sampling (metode


pengambilan sampel ) yaitu :

1. Acak sederhana
Pada metode ini, pertama kita tentukan populasi yang akan diambil
sampelnya. Misalkan jumlah populasi = 200, maka untuk setiap unit
populasi tersebut diberikan nomor dari 1 sampai 200. Bila diinginkan
jumlah sampel sama dengan 10, dengan menggunakan tabel random
(lampiran A) dapat ditentukan 10 angka yang akan menentukan nomor
unit populasi yang akan diambil.
Misalkan dipilih baris 5 kolom 4,5 dan 6 sebagai titik awal, dan dipilih arah
ke kanan (boleh ke atas,kiri atau bawah) maka nomor sampel secara
random yang diperoleh adalah
532, 115, 916, 239, 505, 956, 250, 961, 207, 868
Karena jumlah populasi = 200, maka angka – angka yang melebihi 200
akan dihilangkan digit ratusannya. Sehingga nomor sampel randomnya
menjadi
32, 115, 16, 39, 05, 56, 50, 61, 07, 68
Banyaknya digit bilangan random sebagai titik awal tergantung dari
banyaknya digit maksimal populasi.
1-17 MODUL 1
2. Random Berstrata ( berlapis )
Dalam metode ini, langkah pertama adalah populasi dikelompokkan
dalam beberapa kelompok agar lebih homogen, kemudian dari masing
masing kelompok diambil sampel berukuran tertentu ( secara
proporsional ) secara acak seperti pada metode pertama.
3. Sistematik
Dalam metode ini pertama tama populasi diberi nomor dari 1 sampai
N. Kemudian secara acak ditentukan sebuah nomor antara 1 sampai N
(misal k) dan dibuat suatu barisan aritmatika dengan suku awal k dengan
pertambahan tertentu sampai didapat n data. Bila suatu suku bernilai
lebih dari N maka suku tersebut harus dikurangi N atau kelipatannya.
Nilai penambahan adalah bilangan bulat sedemikian hingga nilainya dekat
N
dengan dengan N : ukuran populasi dan n : ukuran sampel.
n
Contoh
Sebuah populasi berukuran 100 dan akan diambil sampel berukuran 15.
Misalkan bilangan acak pertama dipilih 70 agar merata maka
pertambahannya bisa dipilih sekitar 7. Hasil selengkapnya bisa dilihat pada
tabel berikut :
No Barisan Sampel yg terpilih
1 70 70
2 77 77
3 84 84
4 91 91
5 98 98
6 105 5
7 112 12
8 119 19
9 126 26
10 133 33
11 140 40
12 147 47
13 154 54
14 161 61
15 168 68
1-18 MODUL 1
4. Bergerombol ( cluster )
Pada metode ini teknik yang digunakan mirip dengan metode acak
sederhana hanya saja disini yang menjadi unit sampelnya adalah berupa
cluster cluster yang mana masing masing cluster berisi elemen
elemen yang yang lebih kecil. Yang menjadi pedoman untuk
menentukan cluster adalah bahwa cluster cluster tersebut memiliki
karakteristik yang hampir sama.
Contoh
Sebuah populasi berukuran 1000 tetapi dapat dikelompokan dalam
kluster kluster yang berukuran 10, jadi total klusternya adalah 100.
Misalkan dari 100 cluster tersebut akan diteliti sebanyak 6 cluster
maka dengan metode acak sederhana dapat ditentukan 6 kluster yang
terpilih. Unit unit sampel yang diteliti adalah keseluruhan unit
populasi atau sebagian unit yang terletak didalam 6 kluster terpilih
tersebut.

1.4 Aplikasi dengan minitab


Menentukan sampel dengan beberapa metode sampling

A. Acak sederhana
Pada metode ini, pertama kita tentukan populasi yang akan diambil
sampelnya. Misalkan jumlah populasi = 200, maka untuk setiap unit
populasi tersebut diberikan nomor dari 1 sampai 200. Bila diinginkan
jumlah sampel sama dengan 20, dengan menggunakan tabel random dapat
ditentukan 20 angka yang akan menentukan nomor unit populasi yang
akan diambil.

1-19 MODUL 1
Adapun langkah-langkahnya adalah :
1. Pilih calc, make patterned Data kemudian Simple Set o Numbers
2. Isilah tabel yang keluar sesuai tabel berikut

Pada langkah ini merupakan proses pemberian nomor populasi

3. Pilih calc,Random Data kemudian Sample From Columns

4. Isilah tabel yang keluar sesuai tabel berikut ( proses ini merupakan
pengambilan sampel berukuran 20 secara acak ). Dalam langkah ini
kemungkinan setiap orang akan mendapatkan hasil yang berbeda.

1-20 MODUL 1
5. Hasil yang keluar diatas merupakan nomor nomor unit populasi yang
akan diambil sebagai sampel (pada kolom sampel) yaitu :

Sampel
72
10
102
156
64
169
2
15
147
164
126
117
121
48
176
110
114
199
79
135

B. Random Berstrata (berlapis)

Misalkan dimiliki data populasi yang terdiri atas 60 mahasiswa jurusan


Teknik Telekomunikasi, 50 mahasiswa Teknik Informatika dan 40
mahasiswa Teknik Industri. Bila ingin diambil sampel sebanyak 20
mahasiswa secara sistematis maka dilakukan dengan langkah – langkah
berikut .

1-21 MODUL 1
1. Buat nomor 1 sampai 60 untuk mahasiswa Teknik Telekomunikasi, 1
sampai 50 untuk Teknik Informatika dan 1 sampai 40 untuk Teknik
Industri.
2. Hitung jumlah sampel untuk masing – masing jurusan.
Teknik Telekomunikasi
60
n1 x 20 8
60 50 40
Teknik Informatika
50
n2 x 20 6
60 50 40
Teknik Industri
40
n3 x 20 6
60 50 40

3. Buat patterned data sebanyak 60,50 dan 40 seperti pada langkah


sebelumnya kemudian simpan(Store samples in) dalam kolom yang
terpisah(C3,C4 dan C5).

4. Lakukan pengambilan secara acak untuk masing – masing


jurusan(patterned data) seperti pada pengambilan sampel acak sederhana
dengan ketentuan 8 berasal dari jurusan Teknik Telekomunikasi(C3), 6
dari jurusan Informatika(C4) dan 6 orang dari jurusan Teknik
Industri(C5).

C. Sistematis

Misalkan dimiliki populasi sebanyak 200 dan akan diambil sampel sebanyak 30,
maka langkah – langkahnya adalah sebagai berikut

1. Tentukan salah satu nilai sebagai titik awal misalkan 50.


200
2. Nilai pertambahan 7
30
3. Buat patterned data pada file baru dengan nilai pertambahan (in step of)
= 7, nilai awal(From first value) = 50 dan nilai akhir (To last value) =
260.

1-22 MODUL 1
4. Ambil 30 nomor sampel yang pertama, hasilnya adalah

No Barisan Sampel yg terpilih


1 50 50
2 57 57
3 64 64
4 71 71
5 78 78
6 85 85
7 92 92
8 99 99
9 106 106
10 113 113
11 120 120
12 127 127
13 134 134
14 141 141
15 148 148
16 155 155
17 162 162
18 169 169
19 176 176
20 183 183
21 190 190
22 197 197
23 204 04
24 211 11
25 218 18
26 225 25
27 232 32
28 239 39
29 246 46
30 253 53

1-23 MODUL 1
D. Bergerombol

Misalkan akan diteliti kualitas suatu minuman mineral botol yang dikemas
dalam kotak. Jumlah kotak keseluruhan adalah 100 kotak dimana masing –
masing kotak berisi 10 botol dan sampel yang diinginkan adalah 50 botol.
Alternatif yang dapat dilakukan antara lain dari 100 kotak diambil 5 kotak
secara acak kemudian semua botol dalam kotak tersebut diteliti. Alternatif
lain yang dapat dipilih dari 100 kotak tersebut dipilih 10 kotak acak kemudian
dari 10 kotak tersebut dipilih 5 botol secara acak. Misalkan alternatif kedua
yang dipilih :
1. Beri nomor 1 sampai 100 semua kotak yang dimiliki.
2. Buat patterned data pada file baru sebanyak 100 seperti pada langkah
sebelumnya kemudian simpan dalam kolom yang tertentu(C1)
3. Ambil 10 sampel secara acak berdasarkan kolom C1 simpan pada C2.
4. Beri nomor 1 sampai 10 pada seluruh botol untuk 10 kotak yang terpilih.
5. Buat patterned data pada file baru sebanyak 10 seperti pada langkah
sebelumnya kemudian simpan dalam kolom C3
6. Ambil 5 sampel secara acak berdasarkan kolom C3 simpan pada C4,
ulangi sampai 10X dan simpan dalam kolom yang berbeda.
7. Semua nomor sampel yang terpilih pada masing – masing kotak
merupakan unit sampel yang akan diteliti.

Latihan
1. Tentukan sampel berukuran 30 dari populasi dengan ukuan 300
2. Tentukan sampel berukuran 30 yang diambil dari populasi yang
dikelompokkan dalam 4 kelompok dengan ukuran 25,50,75 dan 100
3. Tentukan sampel berukuran 20 yang diambil dari populasi berukuran
200 dengan metode sistematik
4. Suatu populasi berukuran 500 dan dikelompokkan dalam 25 kluster.
Bila nomor populasi 1 20 masuk dalam kluster 1, nomor populasi
21 40 masuk dalam kluster 2 dst. Bila dari 25 kluster tersebut
diambil 5 secara acak, tentukan nomor nomor populasi mana yang
akan masuk dalam sampel !

1-24 MODUL 1
2 STATISTIKA DESKRIPTIF

Overview

Modul ini memberikan panduan secara singkat tentang teknik penyajian dan
analisis data secara deskriptif. Pada tahap awal, mahasiswa dikenalkan serta
diajarkan menampilkan pada beberapa ukuran statistik seperti ukuran
pemusatan, ukuran penyebaran dan ukuran letak dengan menggunakan
software minitab. Ukuran – ukuran ini adalah ukuran – ukuran sering yang
digunakan dalam penyajian data secara deskriptif. Pada tahap selanjutnya
mahasiswa akan diajarkan cara menyajikan data dalam bentuk tabel frekuensi
dan juga dalam graph seperti : histogram, box plot dan diagram dahan daun
beserta analisa hasilnya

Tujuan

1. Mahasiswa dapat menentukan beberapa ukuran pemusatan dan


penyebaran data
2. Mahasiswa dapat membuat tabel distribusi frekuensi
3. Mahasiswa dapat menyajikan data dalam bentuk histogram, box plot dan
diagram dahan daun

2-1 MODUL 2
2.1 Ukuran Pemusatan

Terdapat beberapa ukuran pemusatan dalam statistika deskriptif antara lain


mean, median, dan modus.
Mean adalah rata rata dari data dan dinotasikan dengan x atau , di
mana x menyatakan rata rata sampel dan menyatakan rata rata
populasi. Secara umum mean memiliki rumusan sebagai berikut :
xi
x , n banyaknya sampel
n
xi
, N banyaknya populasi
N
Median adalah nilai yang membagi suatu gugus data yang telah terurut
menjadi 2 bagian yang sama. Median memiliki sifat bahwa di bawah nilai
median terdapat 50% data. Cara menentukan median sebagai berikut :
Misal X1, X2, …, Xn adalah data yang sudah terurut dari kecil ke besar,
maka untuk n ganjil median Xn dan untuk n genap
1
2

1
median Xn Xn .
2 1
2 2
Modus yaitu nilai yang paling sering muncul dalam suatu gugus data

Dalam penggunaannya, mean lebih sering digunakan dari pada ukuran


pemusatan lainnya karena keakuratannya dalam menentukan nilai tengah
suatu gugus data, walaupun ada beberapa kasus yang membuat nilai tengah
menjadi kurang tangguh, misalkan ada nilai yang dianggap ekstrim.

2.2 Ukuran Penyebaran


Beberapa ukuran penyebaran antara lain :
Range atau jangkauan yaitu menyatakan selisih antara nilai maksimum
dengan nilai minimum.

2-2 MODUL 2
Variansi adalah nilai tengah dari kuadrat penyimpangan antara xi terhadap
x . Variansi merupakan ukuran penyebaran yang sering digunakan dalam
statistika inferensia. Variansi dinotasikan S2 untuk sampel dan 2 untuk
populasi. Variansi memiliki rumusan sebagai berikut :
2
xi x
S2 , di mana n banyaknya sampel
n 1
2
xi
2
, di mana N banyayknya populasi
N
Simpangan baku merupakan akar dari variansi.

2.3 Ukuran Letak

Kuartil menyatakan nilai nilai yang membagi gugus data menjadi empat bagian
yang sama besar. Q1 menyatakan kuartil 1 yang memiliki sifat bahwa ¼ data
terletak di bawah Q1. Q2 sama dengan median. Sedangkan Q3 memiliki sifat
bahwa ¾ data terletak di bawah Q3. Untuk ukuran letak yang lainnya adalh
desil, persentil dll.

2.4 Distribusi Frekuensi

Distribusi frekuensi yaitu penyajian data dalam bentuk tabel. Di mana pada
tabel tersebut menampilkan ciri ciri penting sejumlah data yang diperoleh
dengan cara mengelompokkan data menjadi beberapa kelas, kemudian dari
masing masing kelas dihitung banyaknya pengamatan yang masuk.
Langkah-langkah membuat tabel frekuensi :
1. Menentukan banyaknya kelas dengan kaidah Sturges yaitu N 2 k 1 ,
dimana k 1 3.3 log N . Banyaknya kelas sebaiknya antara 5 sampai 15.
2. Menentukan interval kelas (KI)
range
KI
k
KI sebaiknya kelipatan 5.
3. Untuk komposisi kelas, perhatikan bahwa kelas tidak tumpang tindih.
4. Bila tabel distribusi frekuensi, nantinya digunakan untuk membuat
histogram atau poligon, maka komposisinya diubah ke bentuk batas kelas
(batas bawah kikurangi setengah dan batas atas di tambah setengah)

2-3 MODUL 2
Bila data disajikan sebagai data kelompok, maka ukuran pemusatan,
penyebaran dan letak dapat dihitung dengan menggunakan rumusan sebagai
berikut :
- Ukuran pemusatan
n
f i xi
i 1
Mean : x
n
fi
i 1
xi = titik tengan kelas, f i = frekuensi kelas
1 f f sm
2 t
Median : ~
x Bb p
fm
Bb = batas bawah kelas median f t = frekuensi total
f m = frekuensi kelas median p = interval kelas
f sm = frekuensi kumulatif sebelum median

a
Modus : xˆ Bb p
a b
a f m f am b fm f bm
f m = frekuensi kelas modus
f am = frekuensi sebelum kelas modus
f bm = frekuensi sesudah kelas modus

- Ukuran penyebaran
2
n 2 n
n f i ci f i ci
i 1 i 1
S2 p2
n n 1

2-4 MODUL 2
- Ukuran letak
Kuarti ( Qi , Q2 , Q3 )
i f f sp
4 t
Qi Bb p , i 1, 2, 3
fp
f p = frekuensi pada kelas kuartil ke-i
f sp = frekuensi sebelum kuarti

Pada tabel distribusi frekuensi, dapat juga diberikan coding untuk


mempermudah perhitungan statistik. Coding dilakukan dengan cara membagi
kelas menjadi dua yaitu kelas yang ditengah-tengah diberi kode nol, sedangkan
dua kelas di bawah dan di atasnya diberi kode negatif dan positif.

2.5 Penyajian dalam Bentuk Grafik

Histogram dibuat berdasarkan tabel distribusi frekuensi. Bila datanya


memiliki skala interval atau rasio, maka histogram dapat digunakan untuk
menyajikan data.

Box plot merupakan bentuk penyajian data yang hanya menggunakan


beberapa statistik yang disebut ringkasan lima angka yaitu nilai minimum,
Q1, median, Q3, nilai maksimum. Pada box plot dapat juga ditentukan
adanya pencilan atau tidak. Pencilan yaitu suatu nilai pada data yang
apabila dibandingkan dengan nilai data yang lain tidak konsisten. Pencilan
dibedakan menjadi pencilan jauh (dalam) dan pencilan jauh sekali (luar).
Untuk menentukan pencilan digunakan rumusan sebagai berikut :
Pagar dalam (p)
p1 Q1 1.5 Q3 Q1 p 2 Q3 1.5 Q3 Q1

Pagar luar (P)


P1 Q1 2 Q3 Q1 P2 Q3 2 Q3 Q1
Pencilan dikatagorikan sebagai pencilan jauh bila letaknya data di antara
pagar dalam dan pagar luar. Sedangkan pencilan jauh sekali, bila data di
luar pagar luar.

2-5 MODUL 2
Diagram dahan daun adalah salah satu teknik penyajian data yang
menggunakan data asli secara langsung. Pada dasarnya dalam diagram
dahan daun, penyajian data terbagi atas dua kolom yaitu dahan dan daun,
dimana dahan berisi data dengan satuan yang lebih besar dari pada kolom
daun.

Dari ketiga bentuk penyajian data di atas, dapat dilihat bentuk distribusi data,
apakah simetri, menjulur ke kiri atau ke kanan. Sedangkan untuk memeriksa
x ~ x
kemencengan digunakan metode Pearson yaitu . Jika 0 , data
S
menceng ke kiri dan 0 , data menceng ke kanan.

2.6 Aplikasi dengan minitab


Data adalah data penjualan voucher telepon di lima kota provinsi Jawa barat :

Bulan Bandung Sukabumi Garut Tasik Bogor


1 42 8 32 56 51
2 45 14 33 60 58
3 51 25 41 58 57
4 61 43 52 62 67
5 69 54 62 63 81
6 76 64 72 68 88
7 78 71 77 69 94
8 78 69 75 71 93
9 72 58 68 69 85
10 62 47 58 67 74
11 51 29 47 61 61
12 44 16 35 58 55

2-6 MODUL 2
Langkah-langkah menggunakan software minitab 15 adalah :
1. Ketikkan atau copy data tersebut pada worksheet minitab
2. Pilih menu stat, kemudian basic statistics, lalu klik summary graphics

2-7 MODUL 2
3. Pada kotak dialog, isi kolom tempat data pada variables, lalu klik OK

4. Hasil yang diperoleh adalah sebagai berikut :

2-8 MODUL 2
2-9 MODUL 2
Dari keempat kota (Bandung, Sukabumi, garut, dan tasik) rata-rata penjualan
voucher telepon tiap bulannya adalah kota tasik yaitu 63.5 dengan variansi
terkecil 26,091. Untuk kota Bandung dan Garut penjualan voucher tiap
bulannya hampir merata, kota sukabumi penjualan terbanyak pada bulan-bulan
terakhir, sedangkan untuk kota tasik penjualan terbanyak pada bulan-bulan
pertama. (Lakukan pengolahan data penjualan voucher di kota Bogor dan
analisis)

2-10 MODUL 2
Latihan
1. Jarak (mil) yang ditempuh oleh suatu tipe kendaraan per gallon bahan
baker adalah:
15.7 16.2 18.2 16.3 17.9 18.1 16.8
17.6 18.1 16.7 16.7 16.0 17.4 17.0
18.6 17.1 14.1 17.5 17.0 17.6 15.6
16.0 17.7 16.1 18.6 15.2 17.1 19.5
17.0 16.9 16.9 16.7 17.3 16.3 17.3
17.0 15.6 15.6 17.9 16.0 17.7 18.2
14.7 17.1 15.2 17.0 17.8 16.1 18.2
16.5 17.7 18.8 14.6 16.5 16.6 15.6
14.9 17.5 16.1 18.5 15.8 16.9 17.3
17.1 15.9 17.1 17.1 16.4 15.6 16.3

a. Buatlah diagram dahan daun


b. Buat tabel distribusi frekuensi dan histogramnya
c. Hitung ukuran pemusatan, penyebaran, dan letak, kemudian buat
box plotnya
d. Kesimpulan apa yang bisa dinyatakan dari data tersebut ,
berdasarkan a, b, c.
e. Berapa persenkah jarak dari mobil tersebut yang kurang dari 15
mil/gallon, antara 15 dan 18 mil/gallon, dan lebih dari 18 mil/gallon.
2. Suatu penelitian dilakukan untuk mengetahui waktu respon sirkuit yang
digunakan pada kalkulator elektronik. Data yang diperoleh sebagai
berikut :

25 30 33 22 28
22 28 18 25 25
15 22 23 19 24
20 17 31 20 16
23 19 27 15 19

a. Buat box plot dari data tersebut


b. Buat tabel distribusi frekuensi dan histogram
c. Analisis data tersebut dari hasil a dan b
2-11 MODUL 2
3. Ketikan data score toefl dari 100 mahasiswa berikut pada kolom minitab

356 510 345 400 480


423 500 560 456 500
420 460 513 450 400
450 469 426 476 427
458 436 490 475 480
400 400 475 500 368
386 320 518 518 350
520 480 360 346 423
500 479 400 420 446
390 480 436 463 465
475 400 463 460 525
465 500 523 400 468
476 360 500 515 465
475 520 500 375 475
513 348 520 445 525
400 365 500 426 342
476 470 518 450 386
482 473 476 455 346
346 500 482 456 420
400 428 345 468 423

Buat diagram dahan daun, tabel distribusi frekuensi, histogram, lalu beri
kesimpulan

2-12 MODUL 2
3 KENORMALAN DATA

Overview

1. Modul ini memberikan pengenalan singkat tentang karakteristik data


yang berdistribusi normal dan pengujian kenormalan data. Karakteristik
data berdistribusi normal menyatakan gambaran dari data yang
berdistribusi normal ditinjau secara matematis. Karakteristik data belum
bisa digunakan dalam penentuan kenormalan data. Untuk menentukan
kenormalan data, dapat digunakan beberapa uji kenormalan. Modul ini
menyajikan 3 buah uji kenormalan yang dapat digunakan untuk menguji
kenormalan suatu data dengan ukuran statistik yang berbeda – beda
yaitu Statistik Shapiro Wilk W, Statistik Anderson Darling dan
Statistik Kolmogorov Smirnov.

Tujuan

1. Mahasiswa mengenal tentang data berdistribusi normal


2. Mahasiswa dapat menguji kenormalan data

3-1 MODUL 3
3.1 Distribusi normal

Distribusi peluang kontinu yang paling penting adalah distribusi normal. Grafik
dari suatu distribusi normal disebut kurva normal, bentuknya seperti lonceng
pada gambar dibawah ini. Suatu peubah acak X yang distribusinya berbentuk
lonceng, dinamakan peubah acak normal. Persamaan matematika dari
distribusi peluang peubah acak normal kontinu bergantung pada dua
parameter yaitu (rataan) dan (simpangan baku). Dengan demikian
fungsi densitas X dapat dinyatakan oleh :
2
1 1 x
f x e 2
– <X< .
2

Sifat-sifat distribusi normal :

1. f x dx 1

2. f x 0 , x
3. lim f x 0 dan lim f x 0
x x
4. f x f x
5. Nilai maksimum dari f terjadi pada x
6. Titik belok dari f terjadi pada x

3-2 MODUL 3
Kurva setiap distribusi kontinu dibuat sedemikian rupa sehingga luas daerah
dibawah kurva diantara dua koordinat x x1 dan x x 2 sama dengan
peluang peubah acak X antara x x1 dan x x 2 . Hal tersebut dapat
digambarkan sebagai berikut :

x1 x2 x

x2 x2 1 x 2
1 2
P( x1 X x2 ) = n( x ; , ) dx e dx
x1 2 x1

= Luas daerah yang diarsir


Untuk mengatasi kesulitan dalam menghitung integral fungsi densitas maka
dibuat table luas kurva normal sehingga akan memudahkan dalam
penggunaannya.

3.2 Statistik uji kenormalan

Dalam statistika parametrik, distribusi normal mendasari beberapa uji


statistik. Misal statistik t student, Fisher, Khai Square, dll. Sehingga dalam
pengolahan data statistik, biasanya diasumsikan data berasal dari populasi yang
berdistribusi normal. Ada dua cara untuk melihat kenormalan data yaitu
secara visual dan dengan uji statistik. Secara visual dengan menggunakan
histogram, dahan daun, box plot, tetapi cara ini bersifat subyektif. Biasanya
dengan uji statistik, akan lebih obyektif untuk mengatakan data berdistribusi
normal.

3-3 MODUL 3
Ada beberapa statistik uji kenormalan data antara lain :
1. Statistik Shapiro Wilk W
Statistik ini dikembangkan oleh Shapiro dan Wilk tahun 1965. Statistik
ini merupakan rasio antara dua penduga ragam. Statistik ujinya
dinamakan statistik W. Statistik W ini mengukur straightness dari plot
quantil quantilnya. Bila nilai dari W 1, maka data dikatakan normal.

2. Statistik Anderson Darling


Statistik ini dikembangkan oleh Anderson dan Darling tahun 1954.
Statistik Anderson Darling berdasarkan pada fungsi distribusi empirik.
Statistik ujinya dinamakan statistik yang merupakan kuadrat dari selisih
antara luas histogram dengan luas daerah di bawah kurva normal. Bila
nilai P value , maka data berdistribusi normal. Biasanya digunakan
untuk data berukuran besar.

3. Statistik Kolmogorov Smirnov


Statistik ini menggunakan fungsi distribusi kumulatif dan berdasarkan
pada maksimum perbedaan antara dua distribusi, yaitu distribusi normal
dengan distribusi data yang diamati. Biasanya digunakan untuk data
berukuran 30. Bila nilai P value , maka data berdistribusi normal.

3-4 MODUL 3
3.3 Aplikasi dengan minitab

Contoh 1
Langkah-langkah
1. Data adalah data produksi minyak bumi dalam periode waktu 14 bulan
dari 9 lokasi sumur pengeboran. Ketikan data ini pada kolom di minitab

Smr Smr Smr Smr Smr Smr Smr Smr Smr


t
56 59 66 68 70 77 99 144 163
1 507 677 633 503 477 636 402 464 309
2 468 763 661 573 498 672 365 504 463
3 500 738 420 571 466 597 582 501 390
4 498 608 425 534 588 597 351 526 413
5 449 433 451 414 589 521 585 414 393
6 513 460 345 575 547 576 622 471 581
7 558 485 377 635 499 568 685 527 590
8 486 552 455 443 503 485 736 508 486
9 478 605 361 445 495 489 614 560 531
10 426 575 345 448 519 443 234 557 537
11 493 553 531 450 482 426 243 222 553
12 555 548 521 468 545 464 351 502 517
13 542 457 360 501 489 428 414 601 430
14 510 356 442 443 392 455 378 575 531

3-5 MODUL 3
2. Pilih menu stat, kemudian pilih basic statistik, lalu normality test

3. Setelah muncul kotak dialog berikut, Ketik C1 pada isian variable, lalu
klik pilihan tests for normality (asumsi 0.05 )

3-6 MODUL 3
Output masing-masing pilihan sebagai berikut :
Shapiro Wilk
Normal Probability Plot

.999
.99
.95
Probability

.80
.50
.20
.05
.01
.001

200 300 400 500 600 700


produksi
Average: 498.310 W-test for Normality
StDev: 96.5048 R: 0.9938
N: 126 P-Value (approx): > 0.1000

Pada gambar terlihat bahwa nilai statistik W = 0.9938 1, dengan pendekatan


nilai P value > 0.1, maka dapat dikatakan bahwa data berdistribusi normal.

3-7 MODUL 3
Statistik Anderson Darling
Normal Probability Plot

.999
.99
.95
Probability

.80
.50
.20
.05
.01
.001

200 300 400 500 600 700


produksi
Average: 498.310 Anderson-Darling Normality Test
StDev: 96.5048 A-Squared: 0.346
N: 126 P-Value: 0.478

Dengan menggunakan statistik ini diperoleh nilai P value = 0.478, nilai ini
lebih besar dari pada nilai = 0.05.

3-8 MODUL 3
Statistik Kolmogorov smirnov
Normal Probability Plot

.999
.99
.95
Probability

.80
.50
.20
.05
.01
.001

200 300 400 500 600 700


produksi
Average: 498.310 Kolmogorov-Smirnov Normality Test
StDev: 96.5048 D+: 0.036 D-: 0.050 D : 0.050
N: 126 Approximate P-Value > 0.15

Pada gambar terlihat bahwa pendekatan nilai P value > 0.15, nilai ini lebih
besar dari pada nilai = 0.05.
Dari ketiga output di atas, terlihat bahwa untuk ukuran data besar, statistik
Anderson Darling lebih powerfull.

3-9 MODUL 3
Contoh 2
1. Buka software minitab kemudian pilih menu calc , Random Data
kemudian binomial. Pada langkah ini kita akan membangkitkan data yang
berdistribusi binomial. Pada box
yang keluar isilah sesuai isian berikut ini kemudian ok

2. Data yang sudah dipeoleh ini kita anggap sebagai data populasi. Dari data
populasi ini selanjutnya akan kita ambil beberapa sampel berukuran 5, 10
dan 20 untuk selanjutnya akan dibandingkan variansi dari rataan
sampelnya. Dari menu utama pilih calc , Random Data kemudian
sample from column . Isilah box yang keluar seperti isian berikut

3-10 MODUL 3
3. Ulangi langkah 2 sebanyak 5x untuk masing masing ukuran sampel, jadi
akan terdapat 5 sampel berukuran 5, 5 sampel ukuran 10 dan 5 sampel
ukuran 20
4. Dari setiap sampel hitunglah rata ratanya kemudian untuk setiap
ukuran sampel hitunglah rata rata dan variansinya. Anda bisa
menggunakan software lain untuk menghitung rata rata dan variansinya
misalnya microsoft Excel .Mungkin hasil yang keluar ini bisa berbeda
dengan hasil perhitungan anda

no sampel ukuran 5 ukuran 10 Ukuran 20


1 39.6 41.4 40.45
2 42.6 40.9 40.7
3 40 37.7 42.85
4 37 42.8 41.85
5 42 38.8 40.5
rata2 40.24 40.32 41.27
variansi 4.908 4.207 1.10575

Dari hasil diatas terlihat rata rata semua sampel mendekati rata rata
populasi yaitu =np = 40, tetapi untuk ukuran n = 20 variansinya adalah
yang terkecil, ini juga dapat dilihat dari rataan sampel dari no 1 sampai 5
yang hanya berbeda tipis. Ini menunjukkan dengan pengambilan sampel
yang makin besar keakuratan pendugaannya akan semakin tinggi.

5. Pada pembuktian distribusi rataan sampel, langkah – langkahnya


sebenarnya tidak jauh berbeda dengan 4 langkah sebelumnya hanya saja
dalam hal ini diperlukan jumlah pengacakan yang jauh lebih banyak
daripada 4 langkah sebelumnya. Untuk itu akan digunakan progam matlab
untuk membantu meyelesaikan masalah ini.

3-11 MODUL 3
6. Bila dilakukan dengan software matlab, akan keluar tampilan berikut

Pada program tersebut, pada baris ketiga angka 500 menyatakan jumlah
pengacakan Pada baris 4, perintah random (0,1,100,1) menyatakan
perintah pengambilan sampel dari populasi yang memiliki mean 0,
simpangan baku 1, sampel berukuran 100 dari 1 populasi.
Pada baris 6 dan 7 mengandung arti pendefisian variabel Y sebagai sampel
acak pertama yang berukuran 100.
Pada baris 9, mean sampel 1,2,…500 dihitung
Dan pada baris 12, dibuat histogram dari mean sampel hasil perhitungan
pada baris 9

7. Sekarang ubahlah angka 100 pada baris 4 dan 6 dengan angka 5. Jalankan
program ini dengan memilih debug kemudian run and save ( Dalam
langkah ini kita berusaha mengambil sampel acak berukuran 5). Simpanlah
output gambar/ histogram yang keluar dengan file tersendiri. Ulangi
langkah ini dengan mengganti angka 10, 20 dan 30.
8. Dari keempat histogram yang keluar tersebut, analisa apakah keempat
histogram sudah berbentuk kurva normal baku dengan mean 0 dan
simpangan baku 1? apakah ada pengaruh ukuran sampel? jelaskan!

3-12 MODUL 3
Latihan
1. Data seperti contoh no. 1, kemudian dilakukan pengacakan 15 kali dan
diambil sampel ukuran 10, 20, 30. Buat histogram dengan kurva
normalnya dan uji kenormalannya.

2. Bangkitkan data dari komputer, kemudian lakukan pengacakan 20 kali,


dari data berdistribusi normal, poisson dengan rata-rata 2, binomial
dengan p = 0.6 dan n = 15. Buatlah histogramnya.

3-13 MODUL 3
4 TRANSFORMASI DATA

Overview

Modul ini memberikan panduan untuk melakukan tranformasi data baik


untuk satu angkatan data maupun beberapa angkatan data. Transformasi
terhadap satu angkatan data biasanya dilakukan agar asumsi data berdistribusi
normal terpenuhi, sedangkan transformasi untuk beberapa data biasanya
dilakukan agar asumsi ragam sama pada beberapa angkatan data terpenuhi.
Tes kenormalan kemudian juga dilakukan untuk melihat apakah transformasi
yang dilakukan sudah tepat.

Tujuan

1. Dapat melakukan transformasi data dengan menggunakan Tangga


Transformasi Tukey untuk melihat bagaimana bentuk distribusi data
setelah dilakukan transformasi
2. Dapat memilih transformasi yang tepat untuk me-normalkan data

4-1 MODUL 4
4.1 Transformasi untuk satu angkatan data

Dalam ilmu statistik sering kali digunakan asumsi dari bentuk data yang akan
di analisa. Asumsi yang lazim digunakan adalah distribusi Normal. Bentuk data
yang berdistribusi Normal dengan mean dapat digambarkan seperti grafik
berikut

Bila dilihat, data yang berdistribusi Normal akan simetris terhadap dan
sebagaian besar data akan mengelompok di tengah. Dalam kenyataannya
seringkali bentuk data yang diperoleh tidak berbentuk seperti distribusi
normal tetapi berbentuk menjulur ke kanan seperti gambar berikut

Bentuk data yang lainnya adalah menjulur ke kiri yang dapat dilihat pada
gambar berikut :

Agar asumsi bahwa data berdistribusi Normal tetap dipenuhi, maka perlu
dilakukan suatu transformasi terhadap data asli. Transformasi dilakukan untuk
satu angkatan data bila data yang akan ditransformsi hanya satu angkatan data.
4-2 MODUL 4
Untuk memilih fungsi transformasi yang tepat digunakan tangga transformasi
Tukey yang digambarkan sebagai berikut :
1 1
log x x x x2 x3 10 x
x2 x

Kuat sedang lemah lemah sedang kuat

MENJULUR KE KIRI SIMETRIS MENJULUR KE KANAN

Tangga transformasi ini dapat diartikan sebagai berikut :


Transformasi 10 x akan membuat bentuk distribusi data menjadi menjulur
1
kekanan secara kuat, sedangkan transformasi akan membuat bentuk
x2
distribusi data menjadi menjulur kekiri secara kuat. Sebagai contoh bila kita
memiliki data yang menjulur kekanan secara lemah maka kita dapat
transformasi x agar data menjadi Normal, sebaliknya bila data menjulur
kekanan secara sedang maka transformasi x3 agar data menjadi Normal.
Penentuan bahwa suatu data menjulur secara lemah,sedang atau kuat besifat
subyektif sehingga akan lebih baik bila digunakan beberapa transformasi
sekaligus kemudian baru dibandingkan hasilnya. Penentuan apakah hasil
transformasi sudah Normal atau tidak adalah melalui uji kenormalan

4.2 Transformasi untuk beberapa angkatan data


(menyamakan sebaran)

Ketika dimiliki beberapa angkatan data, maka biasanya ingin dilakukan


pembandingan antara angkatan satu dengan angkatan lainnya. Proses
membandingkan ini lebih mudah bila semua angkatan data memiliki
Bentuk distribusi baku
Sebaran data yang sama

4-3 MODUL 4
Bila kedua syarat diatas sudah dipenuhi, maka untuk membandingkan angkatan
angkatan tersebut, cukup dibandingkan masing masing tarafnya ( nilai
Median ) saja. Untuk menyamakan sebaran semua angkatan ( membuat
sebaran hampir sama), digunakan transformasi seperti pada tangga
transformasi Tukey tetapi dengan acuan yang sedikit berbeda. Sebaran masing
masing angkatan diukur dengan dQ = Q3 Q1 yaitu simpangan kuartil.

Penentuan transformasi yang tepat dilakukan dengan prosedur berikut


1. Hitung taraf dari setiap angkatan
2. Hitung sebaran dari setiap angkatan
3. Tentukan Taraf terbesar (TA), Taraf terkecil (TB), Sebaran yang
berseuaian dengan TA (= SA) dan Sebaran yang berseuaian dengan TB
(= SB) dari seluruh angkatan
4. Hitung koefisien arah b yang memiliki rumus
log( S A ) log( S B )
b
log( T A ) log( TB )
Berdasarkan nilai b, pilihlah transformasi yang tepat sesuai dengan tabel
berikut
Nilai b Transformasi yang
Keterangan
(disekitar) dipilih
Makin kecil b > makin besar k
Negatif xk
(k : bulat)
0,5 x
1 Log x
1
1,5
x
1
2 2
x

4-4 MODUL 4
4.3 Aplikasi Minitab
Berikut ini contoh data (tabel data transformasi) yang menjulur ke kanan
yang digambarkan dengan histogram.
Tabel data transformasi
7.2 5.6 9.7 2.9
2.3 14.3 2.6 6.8
1.8 3.0 15.3 1.8
5.9 2.5 8.3 3.4
17.3 3.8 2.4 6.9
2.0 1.7 1.9 8.8
4.8 5.5 3.6 6.5
10.9 3.7 4.9 1.9
3.4 2.9 9.3 3.6
4.4 4.6 3.4 3.4
9.6 4.8 10.4 3.7
7.5 8.3 4.0 2.4
1.7 5.8 3.8 13.7
4.6 2.8 4.9 15.3
3.4 6.3 1.5 1.3
2.1 3.1 4.8 4.9
1.5 7.6 4.4 12.0
3.7 5.5 2.9 2.3
5.3 8.0 6.4 3.2
4.1 3.5 0.5 5.9
9.1 1.7 2.1 3.0
5.7 11.4 8.1 3.7
0.9 6.5 3.6 3.6
1.9 1.7 11.9 2.4
2.3 2.1 5.2 2.9

1. Buat file baru : file transformasi, kemudian simpan data diatas pada
kolom c1
4-5 MODUL 4
2. Buat histogramnya

Histogram menjulur ke kanan

20
Frequency

10

0 10 20

jlrkanan

3. Lakukan tes kenormalan data terhadap data C1


Dari hasil uji Anderson-Darling (lihat modul kenormalan data)
,didapatkan p-value = 0.000 ini berarti secara kuat disimpulkan bahwa
data tidak berdistribusi Normal.
4. Lakukan transformasi x terhadap C1, simpan datanya pada C2. Buat
Histogram berdasarkan data C2, diperoleh

Histogram Transformasi dg akar x

15
Frequency

10

0.5 1.5 2.5 3.5 4.5

akar x

4-6 MODUL 4
5. Lakukan tes kenormalan data terhadap data C2
Dari Dari hasil uji Anderson-Darling,didapatkan p-value = 0.001 ini
berarti disimpulkan bahwa data juga tidak berdistribusi Normal.

6. Lakukan transformasi Log x terhadap C1, simpan datanya pada C3.


Histogram berdasarkan data C3, diperoleh

Histogram Transformasi dg log

15

10
Frequency

0.0 0.5 1.0

log x

7. Lakukan tes kenormalan data terhadap data C3


Dari hasil uji Anderson-Darling,didapatkan p-value = 0.849 ini berarti
secara kuat disimpulkan bahwa data berdistribusi Normal.

Dari kedua transformasi diatas dapat dilihat bahwa data yang sebelumnya
menjulur kekanan secara sedang, dengan transformasi x bentuk data
menjadi menjulur ke kanan secara lemah, sedangkan dengan transformasi Log
x data menjadi Normal. Nantinya yang diolah dengan statistik adalah data Log
x bukan data aslinya.

Sebagai eksperimen lainnya, lakukan tranformasi x2 atau x3 , simpan datanya


pada C4, C5 kemudian buat histogram dan lakukan tes kenormalan maka

4-7 MODUL 4
diperoleh bentuk data akan semakin menjulur kekanan seperti ditunjukkan
dari histogram berikut.

Histogram of hasil transformasi x2

35

30

25
Frequency

20

15

10

0 100 200 300

transf x

Histogram of transformasi x3

80

70

60
Frequency

50

40

30

20

10

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

transf x

4-8 MODUL 4
Latihan
Periksa distribusi data berikut, bila belum simetris, lakukan transformasi yang
tepat seperti pada langkah – langkah praktikum diatas

605 507 633 477


575 468 661 498
553 500 420 466
548 498 425 588
457 449 451 589
356 513 345 547
445 558 377 499
448 486 455 503
450 478 361 495
468 426 345 519
501 493 531 482
443 555 521 545
489 542 360 489
443 510 442 392
426 677 503 636
464 763 573 672
428 738 571 597
455 608 534 597
552 433 414 521
443 460 575 576
485 485 635 568

4-9 MODUL 4
5 UJI HIPOTESIS STATISTIK DAN
PROPORSI

Overview

Modul ini memberikan panduan untuk melakukan uji hipotesis terhadap nilai
tengah dan proporsi. Uji hipotesis terhadap nilai tengah meliputi uji terhadap
terhadap satu nilai tengah maupun perbandingan antara dua nilai tengah,
sedangkan uji proporsi meliputi uji satu proporsi dan perbandingan dua
proporsi. Semua uji hipotesis yang dilakukan berdasarkan beberapa asumsi
yaitu ragam diketahui maupun ragam tidak diketahui.

Tujuan

1. Mahasiswa memahami tentang uji hipotesis statistik


2. Mahasiswa memahami tentang uji satu nilai tengah dengan diketahui
atau tidak dan dapat menerapkannya
3. Mahasiswa memahami tentang uji selisih nilai tengah dari dua sampel
dengan diketahui atau tidak dan dapat menerapkannya
4. Mahasiswa memahami tentang uji proporsi satu dan dua proporsi

5-1 MODUL 5
5.1 Hipotesis statistik

Hipotesis statistik merupakan hal sangat penting dalam statistika inferensia.


Hipotesis statistik yaitu suatu anggapan atau pernyataan yang mungkin benar
atau tidak mengenai satu populasi atau lebih. Suatu hipotesis dianggap benar
atau salah, tidak bias diketahui dengan pasti kecuali dilakukan pemeriksaan
terhadap seluruh populasi. Tetapi hal tersebut tidak efisien. Untuk mengatasi
hal tersebut dilakukan pengambilan sampel secara acak.

Dalam uji hipotesis sering digunakan istilah menerima atau menolak hipotesis
yang dirumuskan, artinya jika diterima maka hipotesis yang dirumuskan benar
dan jika ditolak maka berlaku sebaliknya. Dari hal tersebut, dapat dikatakan
bahwa perumusan suatu hipotesis sering dipengaruhi oleh bentuk peluang
dari kesimpulan yang salah. Hipotesis yang dirumuskan dengan harapan akan
ditolek disebut hipotesi nol. Penolakan terhadap hipotesis nol tersebut akan
mengakibatkan pada penerimaan terhadap suatu hipotesis lain yang disebut
hipotesis alternatif.

Prosedur pengambilan kesimpulan kadang kadang dapat membawa pada


kesimpulan yang salah. Dalam pengujian hipotesis statistik, ada dua jenis
kesalahan yaitu:
a. Kesalahan jenis pertama (galat jenis I)
Yaitu penolakan hipotesis nol, padahal hipotesis nol benar. Peluang galat
jenis I disebut taraf nyata yang dinotasikan dengan . Biasanya taraf nyata
disebut dengan ukuran wilayah kritis.

b. Kesalahan jenis kedua (galat jenis II)


Yaitu penerimaan hipotesis nol, padahal hipotesis nol salah. Peluang galat
jenis II dinotasikan dengan . Nilai dari tidak mungkin dihitung, kecuali
bila hipotesis alternatifnya lebih spesifik.

Sifat dari pengujian hipotesis nol melawan hipotesis alternatif ada dua yaitu :
Hipotesis alternatif yang bersifat dua arah
H0 : = 0
H1 : 0
Pada hipotesis jenis ini, wilayah kritisnya terbagi menjadi dua bagian, yang
letaknya pada masing masing ekor dari sebaran statistik ujinya.

5-2 MODUL 5
Hipotesi alternatif yang bersifat satu arah
a) H0 : 0 atau b) H0 : 0
H1 : > 0 H1 : < 0

Wilayah kritis untuk a) terletak seluruhnya di ekor sebelah kanan dari


sebaran statistik ujinya. Sedangkan untuk b) sebaliknya.

Dalam menentukan keputusan akhir untuk menerima atau menolak H0 ,


didasarkan pada wilayah kritis dengan p value yang mendukung keberartian
suatu uji dalam bentuk peluang. P value adalah taraf keberartian terkecil,
sehingga nilai suatu uji statistik yang diamati masih berarti.Bila p value ,
maka H0 ditolak.

Prosedur pengujian hipotesis dapat mengikuti langkah langkah berikut :


1. Merancang hipotesis nol dan hipotesis alternatif
2. Menguji kenormalan
3. Memilih taraf keberartian
4. Menguji kesamaan ragam
5. Menentukan dan menghitung nilai statistik uji yang sesuai
6. Menentukan daerah kritis dan membuat keputusan apakah menerima
atau menolak H0 (di mana pengambilan keputusan dapat didasarkan pada
tiga hal yaitu nilai kristis dari statistik uji, selang kepercayaan, atau
p value)
7. Membuat kesimpulan akhir mengenai sampel yang diambil

5.1.1 Pengujian hipotesis untuk satu nilai tengah

X1, X2, …, Xn merupakan peubah acak yang menyebar secara normal dengan
nilai tengah tidak diketahui. Perumusan hipotesinya sebagai berikut :
H0 : = 0 atau H0 : 0 atau H0 : 0
H1 : 0 H 1 : > 0 H1 : < 0
Pengujian hipotesis terhadap nilai tengah ada dua asumsi :
1. Ragam diketahui
Uji hipotesis untuk rata rata x, di mana hipotesis nol menyebar normal
dengan nilai tengah 0 dan simpangan baku rata rata populasi / n,
statistik ujinya adalah :
5-3 MODUL 5
x 0
Z
n

Kriteria penolakan terhadap hipotesis nol ditampilkan dalam tabel berikut


:
NO Hipotesis Alternatif Kriteria penolakan
H0 ditolak pada saat Z Z /2 atau Z
1 H1 : 0
Z1 /2
2 H1 : > 0 H0 ditolak pada saat Z Z1
3 H1 : < 0 H0 ditolak pada saat Z Z

2. Ragam tidak diketahui


Bila ragam tidak diketahui, maka statistik ujinya adalah t student, di mana
ragam populasi diduga oleh ragam sampel. Statistik ujinya didefinisikan
sebagai berikut
x 0
t
s
n

Adapun kriteria penolakan terhadap hipotesis nol dijelaskan pada tabel


berikut
NO Hipotesis Alternatif Kriteria penolakan
1 H1 : 0 H0 ditolak saat t t /2, n 1 atau t t1 /2, n 1
2 H1 : > 0 H0 ditolak pada saat t t1 , n 1
3 H1 : < 0 H0 ditolak pada saat t t , n 1

5.1.2 Pengujian hipotesis untuk selisih dua nilai tengah

X1, X2, …, Xn dan Y1, Y2, …, Yn merupakan dua peubah acak yang saling
bebas dan menyebar secara normal dengan nilai tengah x dan y, simpangan
baku x dan y. Perumusan hipotesinya sebagai berikut :
H0 : x y = 0 atau H0 : x y 0 atau H0 : x y 0
H1 : x y 0 H 1 : x y > 0 H 1 : x y < 0

5-4 MODUL 5
Di mana 0 adalah suatu konstanta bernilai positif atau nol yang menunjukkan
selisih antara dua nilai tengah yang tidak diketahui.seperti pada pengujian
hipotesis untuk satu nilai tengah, ada dua asumsi yaitu :
1. Ragam diketahui
Statistik uji didefinisikan sebagai berikut
x y 0
Z
2 2
x y
nx ny

Kriteria penolakan terhadap hipotesis nol adalah :

NO Hipotesis Alternatif Kriteria penolakan


H0 ditolak pada saat Z Z /2 atau Z
1 H1 : x y 0
Z1 /2
2 H1 : x y > 0 H0 ditolak pada saat Z Z1
3 H1 : x y < 0 H0 ditolak pada saat Z Z

2. Ragam tidak diketahui


Bila ragam tidak diketahui, maka sebelum dilakukan pengujian hipotesis
terlebih dahulu dilakukan pengujian terhadap ragam. Pengujian tersebut
dilakukan untuk menduga apakah ragam kedua sampel sama atau tidak.
Hipotesisnya adalah sebagai berikut : H0 : x = y H1 : x y
2
S maks
Sedangkan statistik ujinya adalah statistik uji Fisher yaitu F .
2
S min
Bila didapatkan bahwa F F( , (nx 1, ny 1)), maka H0 ditolak, artinya
ragam kedua sampel tidak sama. Sehingga derajat bebas yang akan
digunakan dalam statistik ujinya adalah

5-5 MODUL 5
2
S x2 S y2
nx ny
v
2 2
S x2 S y2
nx ny

nx 1 ny 1
Statistik uji pengujian hipotesis terhadap selisih antara dua nilai tengah
untuk ragam berbeda adalah
x y 0
t
2 2
Sx S y
nx ny
Sedangkan untuk ragam sama, dalam statistik ujinya menggunakan ragam
gabungan, yaitu :

2 n x 1 S x2 n y 1 S y2
S gab
nx n y 2
dimana statistik ujinya adalah
x y 0
t .
1 1
S gab
nx ny

Kriteria penolakan terhadap hipotesis nol adalah :

NO Hipotesis Alternatif Kriteria penolakan


H0 ditolak pada saat t t /2, m atau t
1 H1 : x y 0
t1 /2, m
2 H1 : x y > 0 H0 ditolak pada saat t t1 ,m
3 H1 : x y < 0 H0 ditolak pada saat t t ,m

5-6 MODUL 5
5.1.3 Aplikasi dengan minitab

Teknologi telekomunikasi di Indonesia berkembang sangat pesat, mulai dari


teknologi berbasis AMPS, GSM, dan CDMA. Kehadiran produk
telekomunikasi berbasis CDMA, merupakan alternatif bagi pengguna jasa
telekomunikasi untuk memilih yang kualitasnya terbaik dan termurah. Saat ini
banyak operator selular menggunakan teknologi berbasis CDMA, antara lain
Bakrie Telecom dengan produknya esia, Telkom dengan flexi, dan Mobile-8
dengan fren. Suatu penelitian dilakukan untuk mengetahui rata-rata pengguna
produk esia, flexi, dan fren dari 15 kecamatan di kota Bandung. Berikut adalah
datanya :

NO Fren Flexi Esia


1 55 60 37
2 42 33 60
3 45 39 35
4 71 61 61
5 83 40 31
6 47 94 56
7 75 71 65
8 48 61 78
9 60 77 59
10 69 64 27
11 85 65 30
12 54 70 45
13 31 80 38
14 25 61 25
15 30 50 35

Langkah-langkah pengolahan dengan menggunakan minitab 15 :


1. Simpan data tersebut pada worksheet minitab
2. Kemudian uji kenormalan data, bila data sudah normal, maka dilakukan
uji dua ragam (ragam sama atau berbeda) dengan cara pilih menu stat,
lalu basic statistics, kemudian dua ragam, maka akan muncul kotak
dialog seperti di bawah kemudian ketikkan kolom data pada isian sampel,
klik option atau storage bila perlu, lalu OK

5-7 MODUL 5
3. Hasil yang diperoleh sebagai berikut :

Dari hasil yang diperoleh di atas, dapat diketahui bahwa ragam kedua
sampel sama, karena Pvalue = 0.582 > 0.05
5-8 MODUL 5
4. Pengujian hipotesis, dilakukan dengan cara pilih stat, basic statistics,
kemudian pilih 2-sample t, kemudian isi kotak dialog

5. Hasil yang diperoleh adalah sebagai berikut :

Two-sample T for Fren vs Flexi


N Mean StDev SE Mean
Fren 15 54.7 19.0 4.9
Flexi 15 61.7 16.3 4.2

Difference = mu (Fren) - mu (Flexi)


Estimate for difference: -7.07
95% CI for difference: (-20.31, 6.18)
T-Test of difference = 0 (vs not =):
T-Value =-1.09 P-Value = 0.284 DF = 28
Both use Pooled StDev = 17.7062

5-9 MODUL 5
Boxplot of Fren, Flexi
100

90

80

70
Data

60

50

40

30

20
Fren Flexi

Untuk menolak atau menerima Ho dapat dilihat dari 3 hal yaitu :


- Karena selang kepercayaan untuk selisih nilai tengah adalah
20.31, 6.18 , sehingga nol termasuk di selang tersebut, maka Ho
diterima
- Pvalue = 0.284 > 0.05, maka Ho diterima
- Nilai kritis (t hitung = -1.09 > t tabel) maka Ho diterima

Karena Ho diterima, maka dapat disimpulkan bahwa rata-rata jumlah


pengguna produk fren dan flexi di 15 kecamatan kota Bandung sama. Hal
itu dimungkinkan dua produk tersebut masing-masing mempunyai
kelebihan dan kekurangan, sehingga konsumen akan memilih produk yang
sesuai dengan kebutuhannya.

6. Untuk latihan, lakukan langkah dan analisis yang sama untuk fren vs esia,
flexi vs esia.

5-10 MODUL 5
5.2 Uji proporsi

Proporsi menyatakan perbandingan “banyaknya sukses” terhadap total


pengamatan. Bila x menyatakan banyaknya sukses dari n ulangan, maka nilai
x
proporsi p dihitung dengan rumus : p .Uji proporsi dapat dilakukan
n
terhadap satu nilai proporsi atau perbandingan beberapa nilai proporsi.
Asumsi yang digunakan adalah proporsi berdistribusi binomial.

5.2.1 Uji terhadap satu nilai proporsi

Hipotesis yang digunakan untuk uji satu nilai proporsi dengan taraf antara
lain berbentuk :
a. H 0 : p p0
H1 : p p0
Wilayah kritik: x a dimana a adalah bilangan bulat terbesar yang bersifat
a
PX a b x; n; p0
x 0

b x; n; p0 : Distribusi Binomial dengan parameter n dan p0


n : banyaknya eksperimen/ulangan
p0 : peluang “sukses”

b. H 0 : p p0
H1 : p p0
Wilayah kritik x a dimana a adalah bilangan bulat terkecil yang bersifat
n
PX a b x; n; p0
x a
b x; n; p0 : binomial dengan parameter n dan p0
n : banyaknya eksperimen/ulangan
p0 : peluang “sukses”

5-11 MODUL 5
c. H 0 : p p0
H1 : p p0
Wilayah kritik x a atau x a dimana a adalah bilangan bulat terkecil
untuk x a atau bilangan bulat terbesar untuk x a yang bersifat
a n
PX a b x; n; p0 atau P X a b x; n; p0
x 0 2 x a 2
b x; n; p0 : binomial dengan parameter n dan p0
n : banyaknya eksperimen/ulangan
p0 : peluang “sukses”

Bila dari hasil perhitungan, nilai berada diwilayah kritik, maka tolak H0.

5.2.2 Aplikasi dengan Minitab

Contoh
Dimiliki suatu pernyataan bahwa 70% rumah yang ada di kota A sudah
terpasang AC. Dari 15 yang rumah yang diamati, ternyata hanya 8 rumah yang
telah terpasang AC. Benarkah pernyataan tersebut ?

Langkah – langkah
1. Karena yang ingin disimpulkan adalah proporsi rumah terpasang AC =
70% atau tidak, maka uji hipotesis yang dipilih adalah
H 0 : p 0,7
H 1 : p 0,7
Taraf = 5% = 0,05

5-12 MODUL 5
2. Pilih menu Basis Statistic , 1 Proportion

3. Isilah kotak dialog dengan isian berikut

5-13 MODUL 5
Number of event = 8, menyatakan banyaknya kejadian sukses
Number of trial = 15, menyatakan banyaknya sampel yang diambil
Hypothesized proportion =0,7 menyatakan nilai dari H0

4. Klik option untuk menentukan tingkat signifikan ( ) dan jenis hipotesis


yang akan dipilih

5. Hasilnya adalah sebagai berikut :

Test and CI for One Proportion

Test of p = 0.7 vs p not = 0.7

Exact
Sample X N Sample p 95% CI P-Value
1 8 15 0.533333 (0.265861, 0.787333) 0.258

Karena nilai P-value=0.258 >0.05, maka H0 tidak ditolak. Data tidak


cukup kuat untuk menolak pernyataan bahwa 70% rumah terpasang AC.

5-14 MODUL 5
5.2.3 Pendekatan normal baku untuk uji terhadap satu nilai
proporsi

Pada pengujian satu nilai proporsi, ada situasi dimana tabel binomial sulit
untuk digunakan, misalkan untuk nilai n yang sangat besar(kecuali dengan
bantuan komputer). Salah satu pendekatan yang bisa digunakan adalah dengan
melakukan transformasi ke bentuk normal baku. Parameter dan 2
ditaksir
dengan rumus : np0 dan 2
npq .
Statistik uji yang digunakan adalah
x np0
z
np0 q0
n : banyaknya eksperimen/ulangan
p0 : peluang “sukses” / proporsi
Z berdistribusi normal baku dengan 0 dan 2
1 . Wilayah kritiknya
menjadi
z Z bila uji hipotesisnya H1 : p p0
z Z1 bila uji hipotesisnya H1 : p p0
z Z atau z Z1 bila uji hipotesisnya H1 : p p0
2 2

5.2.4 Aplikasi dengan Minitab


Contoh
Obat untuk ketegangan syaraf selama ini memiliki kefektifan 60%. Sebuah
obat baru diuji terhadap 100 pasien, 70 orang sembuh sehingga tingkat
keefektifannya 70%. Apakah obat baru tersebut bisa dikatakan lebih efektif
dari obat lama?

5-15 MODUL 5
Langkah – langkah
1. Karena yang ingin disimpulkan adalah tingkat keefektifan obat baru > 60%
atau tidak, maka uji hipotesis yang dipilih adalah
H 0 : p 0,6
H 1 : p 0,6
Taraf = 5% = 0,05
2. Langkah – langkah yang dilakukan untuk uji hipotesis ini mirip dengan uji
hipotesis tanpa menggunakan pendekatan normal. Perbedaannya adalah
ketika memilih kotak option kita memilih check list “use test and interval
test based on normal distribution” seperti berikut ini

5-16 MODUL 5
3. Hasilnya adalah sebagai berikut :

Test and CI for One Proportion

Test of p = 0.6 vs p > 0.6

95% Lower
Sample X N Sample p Bound Z-Value P-Value
1 70 100 0.700000 0.624623 2.04 0.021

Using the normal approximation.

Berarti nilai z masuk dalam wilayah kritik karena P-value= 0,021 < 0,05.
Jadi dapat disimpulkan bahwa tingkat keefektifan obat baru lebih tinggi
dari obat lama.

5.2.5 Pengujian perbandingan dua proporsi

Pengujian terhadap proporsi tidak hanya bisa dilakukan terhadap satu nilai
proporsi. Bila kita sedang meneliti dua buah proporsi, maka kedua proporsi
tersebut dapat diperbandingkan yaitu berdasarkan sebaran selisih
proporsinya. Selisih proporsi ini kemudian ditransformasi kebentuk normal
baku dengan rumus z yaitu :
pˆ 1 pˆ 2
z
pˆ qˆ 1 1
n1 n2
Dimana
x1 x2 x1 x 2
pˆ 1 pˆ 2 pˆ qˆ 1 pˆ
n1 n2 n1 n2
x1 : Banyaknya sukses kategori 1
x2 : Banyaknya sukses kategori 2
n1 : Banyaknya ulangan/sampel kategori 1
n2 : Banyaknya ulangan/sampel kategori 2

5-17 MODUL 5
Hipotesisnya
H 0 : p1 p2

Wilayah kritiknya sama seperti pendekatan normal baku untuk pengujian


terhadap satu nilai proporsi yaitu :
z Z bila uji hipotesisnya H1 : p p0
z Z bila uji hipotesisnya H1 : p p0
z Z atau z Z bila uji hipotesisnya H1 : p p0
2 2

5.2.6 Aplikasi dengan Minitab

Contoh
Suatu penelitian dilakukan untuk melihat apakah proporsi lulusan smu
kotamadya Bandung(p1) yang akan melanjutkan ke PT(Perguruan Tinggi) lebih
tinggi daripada proporsi lulusan smu kabupaten Bandung(p2) yang akan
melanjutkan ke PT dengan taraf 2,5%. Dari sampel acak yang diambil,
diperoleh hasil bahwa dari 200 lulusan asal kotamadya, 120 orang akan
melanjutkan ke PT. Sedangkan dari 500 lulusan asal kabupaten, 240 orang
akan melanjutkan ke PT.

5-18 MODUL 5
Langkah – langkah
1. Karena yang ingin disimpulkan proporsi lulusan smu kotamadya
Bandung(p1) yang akan melanjutkan ke PT(Perguruan Tinggi) lebih tinggi
daripada proporsi lulusan smu kabupaten Bandung(p2), maka uji hipotesis
yang dipilih adalah
H 0 : p1 p2 atau H 0 : p1 p 2 0
H 1 : p1 p 2 atau H 0 : p1 p 2 0
Taraf = 5% = 0,025  selang kepercayaan = 97,5 %
2. Pilih menu Basis Statistic , 2 Proportion

5-19 MODUL 5
3. Isilah kotak dialog dengan isian berikut

Number of event menyatakan banyaknya kejadian sukses (siswa yang


melanjutkan ke PT). First : kodya, Second : kabupaten
Number of trial , menyatakan banyaknya sampel yang diambil

4. Klik option untuk menentukan tingkat signifikan ( ) dan jenis hipotesis


yang akan dipilih

5-20 MODUL 5
5. Hasilnya adalah sebagai berikut :

Test and CI for Two Proportions

Sample X N Sample p
1 120 200 0.600000
2 240 500 0.480000

Difference = p (1) - p (2)


Estimate for difference: 0.12
97.5% lower bound for difference: 0.0392076
Test for difference = 0 (vs > 0): Z = 2.91 P-Value = 0.002

Fisher's exact test: P-Value = 0.003

Karena nilai P-value =0.002 <0.025, maka H0 tidak ditolak. Proporsi


lulusan siswa SMA kodya yang melanjutkan ke PT lebih tinggi daripada
lulusan siswa SMA kabupaten

Latihan
1. Suatu penelitian diadakan untuk mengetahui apakah rata-rata banyaknya
panggilan tiap 2 jam yang diterima oleh swicthboard pada dua wartel
sama atau tidak. Berikut adalah rata-rata banyaknya panggilan dari dua
wartel tiap 2 jam selama 15 hari
H 1 2 3 4 5 6 7 8
W1 20 10 12 6 12 8 22 13
W2 10 10 23 6 8 6 15 12
W1 10 8 9 15 20 15 10 10
W2 11 5 10 18 8 6 12 12

a. Buatlah hipotesisnya
b. Uji dan buat kesimpulannya

5-21 MODUL 5
1. Suatu sampel acak berukuran 20 diambil dari nilai UTS matakuliah
Statistika dari mahasiswa 01. 02, dan 03 Penelitian tersebut dimaksudkan
untuk membandingkan kemampuan akademik antara mahasiswa kelas 01.
02, dan 03, berdasarkan uji selisih nilai tengah antara dua sampel. Adapun
datanya sebagai berikut :

NO Nilai UTS 01 Nilai UTS 02 Nilai UTS 03


1 43 92 63
2 75 47 83
3 43 56 44
4 78 74 37
5 60 79 34
6 76 28 53
7 60 71 53
8 63 68 60
9 60 69 42
10 53 80 36
11 60 63 37
12 25 86 50
13 50 65 72
14 40 99 52
15 50 59 65
16 65 65 73
17 70 78 58
18 65 66 81
19 75 66 15
20 5 96 63

a. Pengujian selisih nilai tengah antara nilai UTS mahasiswa 01 dengan 02


Misal X adalah peubah acak yang menyatakan nilai UTS mahasiswa 01
Misal Y adalah peubah acak yang menyatakan nilai UTS mahasiswa 02

b. Pengujian selisih nilai tengah antara nilai UTS mahasiswa 02 dengan 03


Misal X adalah peubah acak yang menyatakan nilai UTS mahasiswa 02
Misal Y adalah peubah acak yang menyatakan nilai UTS mahasiswa 03

5-22 MODUL 5
3. Lakukan uji proporsi pada data-data berikut, yaitu :
2) Data miskonsepsi siswa dengan model konstruktivis terhadap suatu
mata pelajaran

NO PRA TEST POST TEST JENIS


1 8 15 P
2 7 15 P
3 10 21 L
4 10 15 P
5 11 21 L
6 12 25 L
7 16 21 P
8 15 22 P
9 17 10 P
10 17 21 L
11 16 23 P
12 17 25 L
13 18 25 P
14 18 12 L
15 18 20 L
16 19 25 L
17 20 26 L
18 19 20 L
19 23 27 P
20 20 26 P
21 18 27 L
22 21 20 P
23 22 25 P
24 22 25 P
25 20 26 L
26 18 27 L
27 21 28 P
28 19 29 L
29 23 29 L
30 21 29 P
31 25 29 P
32 25 29 P
33 23 29 L
34 26 30 P
35 25 30 L

5-23 MODUL 5
6 ANALISIS VARIANSI

Overview

Analisis variansi ini merupakan alternatif lain bagi pengujian nilai tengah selain
menggunakan uji-t. Salah satu perbedaan utama antara analisis variansi
dengan uji-t adalah kemampuan uji untuk membandingkan beberapa angkatan
data secara serempak. Pada analisis variansi yang lebih kompleks (banyak
faktor), nilai tengah bisa berasal dari beberapa faktor. Modul ini memberikan
penjelasan mengenai analisis satu faktor saja.

Tujuan

1. Mahasiswa memahami tentang konsep analisis variansi dan asumsi-


asumsinya
2. Mahasiswa dapat membuat tabel analisis variansi untuk
membandingkan nilai tengah beberapa angkatan data secara
serempak
3. Mahasiswa dapat membuat kesimpulan yang tepat terkait dengan uji
hipotesis yang dibuat

6-1 MODUL 6
6.1 Asumsi-asumsi pada analisis variansi

Pada modul IV, telah dibahas masalah kenormalan data. Hal tersebut
merupakan landasan yang penting pada tahap pengujian hipotesis dan analisis
variansi. Hal mendasar pada analisis variansi adalah membandingkan lebih dari
dua populasi berdasarkan pada lebih dari dua buah angkatan data. Asumsi-
asumsi yang diperlukan pada analisis variansi adalah :
1. Setiap angkatan data berasal dari populasi yang berdistribusi normal.
2. Setiap populasi memiliki variansi yang sama.
3. data yang satu dengan yang lainnya merupakan pengamatan yang saling
bebas.

Dalam prakteknya asumsi-asumsi tersebut tidak dituntut terlalu ketat, yaitu :


1. Mengenai kenormalan data, bila distribusinya cukup dekat ke normal,
maka asumsi tersebut sudah dipenuhi
2. Mengenai kesamaan variansi, bila nilai variansi terbesar < 3 x variansi
terkecil, maka hal tersebut tidak sudah cukup
3. Mengenai kebebasan antar pengamatan, dapat dilakukan dengan metode
pengambilan sampel secara acak.

6.2 Uji Kesamaan Ragam


Hipotesis kesamaan ragam :
2 2 2
H0 : 1 = 2 = .... = n

H1 : ragam-ragam tersebut tidak semuanya sama


Ada dua kasus pada uji bartlett :
a. Ukuran sampel sama
1
n1 1 n2 1 nk 1 N k
S12 S 22 .......... S k2
b
S g2

6-2 MODUL 6
k
( ni 1) S i2
S g2 adalah ragam gabungan yaitu S g2 i 1
N k

S i2 adalah ragam masing-masing sampel

Bila b bk ( ; n) , maka H0 ditolak pada taraf nyata


b. Ukuran sampel tidak sama
Pada kasus ini, bila b bk ( ; n1 , n2 , ..., nk ) , maka H0 ditolak pada taraf
nyata . Dalam hal ini,
n1 bk ( ; n1 ) n 2 bk ( ; n1 ) ... n k bk ( ; n1 )
bk ( ; n1 , n 2 , ..., n k )
N

6.3 Tabel analisis variansi

Berdasarkan asumsi-asumsi di atas, maka terdapat hubungan bahwa variansi


hasil penggabungan dari semua angkatan data terdiri atas rata-rata variansi
setiap angkatan dan variansi daris semua rata-rata angkatan. Misalkan akan
dibandingkan m buah angkatan data, maka hubungan tersebut dapat
dinyatakan sebagai :
m
N 1 S2 N m ni 1 S i2 m 1 V
i 1
JKT JKD JKA
di mana
JKT = Jumlah Kuadrat Total
JKD = Jumlah Kuadrat Dalam angkatan
JKA = Jumlah Kuadrat Antar angkatan
m 2
1
V Xi X
m 1i 1
ni = banyaknya data dalam angkatan ke-i
V = variansi dari semua rata-rata angkatan

6-3 MODUL 6
N = Total data penggabungan semua angkatan
S2 = variansi gabungan
S i2 = variansi angkatan ke-i
X i = rata-rata angkatan ke-i
X = rata-rata gabungan
N – 1 = derajat kebebasan total
N – m = derajat kebebasan dalam angkatan
m – 1 = derajat kebebasan antar angkatan

Misal diketahui data setiap angkatan sebagai berikut :


Angkatan ke-1 Angkatan ke-2 ......... Angkatan ke-m
X11 X21 ......... Xm1
X12 X22 ........ Xm2
: : :
X1n1 X2n2 ........ Xmnm

Untuk menghitung JKT, JKD, dan JKA digunakan rumusan sebagai berikut :
2
ni

2
X ij
m ni m j 1
JKD X ij
i 1 j 1 i 1 ni

2
ni
X ij 2
m m ni
j 1
JKA X ij
i 1 ni i 1 j 1

2 2
m ni m ni
JKT X ij X ij
i 1 j 1 i 1 j 1

6-4 MODUL 6
Untuk membandingkan m populasi berdasarkan m buah angkatan data, dan
berdasarkan asumsi-asumsi analisis variansi, maka hipotesis nol dan hipotesis
alternatifnya didefinisikan sebagai berikut :
H0 : 1 = 2 = ..... = m
H1 : paling sedikit ada satu pasangan (i, j) sehingga i ≠ j
Sedangkan statistik uji yang digunakan adalah statistik Fisher yang didefinisikan
JKA
m 1 RKA
sebagai F . Kemudian nilai F hasil perhitungan
JKD RKD
N m
debandingkan dengan nilai F dari tabel, yaitu F , (m-1), (N-m). Bila Fhit
F , (m-1), (N-m), maka H0 ditolak, sehingga paling sedikit ada satu pasangan
(i, j) sehingga i ≠ j.

Tabel analisis variansi dapat ditampilkan sebagai berikut :


Sumber Jumlah Kuadrat Derajat Rata-rata Fhit
Variansi bebas Kuadrat
Antar JKA m–1 RKA RKA/RKD
angkatan
Dalam JKD N–m RKD
angkatan
Total JKT = JKA + N – 1
JKD

6.4 Aplikasi dengan minitab


Teknologi telekomunikasi di Indonesia berkembang sangat pesat, mulai dari
teknologi berbasis AMPS, GSM, dan CDMA. Kehadiran produk
telekomunikasi berbasis CDMA, merupakan alternatif bagi pengguna jasa
telekomunikasi untuk memilih yang kualitasnya terbaik dan termurah. Saat ini
banyak operator selular menggunakan teknologi berbasis CDMA, antara lain
Bakrie Telecom dengan produknya esia, Telkom dengan flexi, dan Mobile-8
dengan fren. Suatu penelitian dilakukan untuk mengetahui rata-rata pengguna
produk esia, flexi, dan fren dari 15 kecamatan di kota Bandung.

6-5 MODUL 6
Berikut adalah datanya :

NO Fren Flexi Esia


1 55 60 37
2 42 33 60
3 45 39 35
4 71 61 61
5 83 40 31
6 47 94 56
7 75 71 65
8 48 61 78
9 60 77 59
10 69 64 27
11 85 65 30
12 54 70 45
13 31 80 38
14 25 61 25
15 30 50 35

Langkah-langkah pengolahan dengan menggunakan minitab 15 :


1. Simpan data tersebut pada worksheet minitab
2. Kemudian uji kenormalan data, bila data sudah normal, maka dilakukan
uji kesamaan ragam dengan cara pilih menu stat, lalu ANOVA,
kemudian test for equal variances, maka akan muncul kotak dialog
seperti di bawah kemudian ketikkan kolom data pada isian response dan
kolom subcript pada factor, klik option atau storage bila perlu, lalu OK
(catatan kolom harus di stack dulu, pada menu data)

6-6 MODUL 6
3. Hasil yang diperoleh sebagai berikut :

Dari hasil yang diperoleh di atas, dapat diketahui bahwa ragam ketiga
sampel sama, karena Pvalue = 0.811 > 0.05
6-7 MODUL 6
4. Pengujian hipotesis, dilakukan dengan cara pilih Stat, ANOVA,
kemudian pilih 2-sample t, kemudian isi kotak dialog

5. Hasil yang diperoleh adalah sebagai berikut :

Test for Equal Variances: C4 versus C5


One-way ANOVA: Fren, Flexi, Esia

Source DF SS MS F P
Factor 2 1996 998 3.35 0.045
Error 42 12520 298
Total 44 14516

S = 17.27 R-Sq = 13.75% R-Sq(adj) = 9.64%

6-8 MODUL 6
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev ----+---------+---------+---------+-----
Fren 15 54.67 18.98 (--------*--------)
Flexi 15 61.73 16.33 (--------*--------)
Esia 15 45.47 16.35 (--------*--------)
----+---------+---------+---------+-----
40 50 60 70
Pooled StDev = 17.27

Boxplot of Fren, Flexi, Esia


100

90

80

70
Data

60

50

40

30

20
Fren Flexi Esia

Untuk menolak atau menerima Ho dapat dilihat dari 2 hal yaitu :


- Pvalue = 0.045 < 0.05, maka Ho ditolak
- Nilai kritis (F hitung = 3.35 > F tabel) maka Ho ditolak

Karena Ho ditolak, maka dapat disimpulkan bahwa rata-rata jumlah


pengguna produk fren, flexi dan esia di 15 kecamatan kota Bandung
berbeda. Hal itu dimungkinkan satu atau dua dari tiga produk tersebut
6-9 MODUL 6
ada yang mempunyai kelebihan, sehingga konsumen akan cenderung
memilih produk tersebut.

Latihan
1. Berikut adalah data pengunjung dari lima warnet dalam waktu 1 minggu.

Warnet/hr 1 2 3 4 5 6 7
A 10 20 25 8 35 20 20
B 18 15 10 26 25 30 30
C 12 25 30 35 9 10 10
D 15 15 20 10 25 20 25
E 20 10 8 9 35 35 15

Lakukan pengujian apakah rata-rata pengunjung dari lima warnet dalam


waktu satu minggu sama atau tidak, dengan taraf nyata 0.05 dan 0.01.

2. Berikut adalah data penjualan dari lima merk Laptop yang dijual di BEC
dari 8 pusat penjualan selama satu bulan.

Merk/ Toko I II III IV V


Accer 6 10 8 12 5
Toshiba 4 3 9 10 2
Compac 15 10 8 12 10
IBM 5 3 6 8 2
HP 4 3 6 10 3
Dengan menggunakan analisis ragam dan taraf nyata 0.05, uji apakah rata-
rata penjualan dari kelima merk laptop di BEC sama, dengan
menggunakan hipotesis seperti pada dasar teori di atas.

6-10 MODUL 6
3. Berikut adalah data nilai toefl tiga jurusan yaitu TE, IF, dan TI angkatan
2006
ST TI IF
426.667 450.000 453.333
520.000 506.667 480.000
216.667 456.667 550.000
290.000 576.667 460.000
410.000 360.000 403.333
400.000 500.000 380.000
370.000 430.000 443.333
490.000 413.333 216.667
343.333 386.667 450.000
390.000 363.333 453.333
373.333 433.333 216.667
430.000 543.333 463.333
456.667 350.000 430.000
580.000 436.667 363.333
410.000 386.667 430.000
436.667 350.000 216.667
423.333 416.667 473.333
413.333 410.000 403.333
396.667 386.667 406.667
430.000 366.667 413.333
410.000 406.667 446.667
430.000 543.333 416.667
510.000 426.667 416.667
216.667 363.333 443.333
420.000 383.333 540.000
420.000 380.000 473.333
483.333 413.333 413.333
370.000 383.333 520.000
433.333 216.667 510.000
476.667 420.000 420.000

Lakukan analisis ragam dengan taraf nyata 0.05 pada data tersebut.
Kemudian uji apakah rata-rata nilai toefl mahasiswa dari tiga juruan sama
ataukah berbeda.
6-11 MODUL 6
7 REGRESI LINIER DAN NON-LINIER
SEDERHANA

Overview

Dalam sebuah penelitian, sering kita memiliki data yang berpasangan (X,Y).
Data tersebut bisa jadi diperoleh dari sebuah percobaan terhadap peubah X
sedangkan respon yang terjadi dicatat sebagai peubah Y. Hal menarik yang
bisa disimpulkan dari data yang berpasangan adalah tingkat keeratan
hubungan antara X dan Y serta bentuk hubungan fungsionalnya. Modul ini
memberikan panduan langkah – langkah kepada mahasiswa dalam
menentukan hubungan antara dua peubah X,Y yang paling tepat, langkah –
langkah pengujian koefisien regresi beserta penentuan tingkat keeratannya.

Tujuan

1. Mahasiswa dapat membuat model regresi linier maupun non-linier


sederhana dari data berpasangan (X,Y).
2. Mahasiswa dapat memahami keterkaitan antara model linier dan model
non-linier.
3. Mahasiswa dapat menentukan model regresi yang terbaik berdasarkan
pengujian terhadap koefisien regresi dan nilai R2

7-1 MODUL 7
7.1 Regresi

Suatu permasalahan penelitian biasanya dapat dijelaskan oleh dua atau lebih
variabel yang saling berhubungan satu sama lain. Variabel-variabel yang saling
berhubungan tersebut membentuk suatu persamaan matematis yang dapat
digunakan untuk menentukan nilai sebuah variabel yang bergantung pada nilai
variabel yang lain. Dalam statistika, hubungan fungsional antara variabel tak
bebas ( dinotasikan Y ) dengan variabel bebas ( dinotasikan X ) disebut
regresi antara Y dan X. Persamaan regresi yang akan dibahas pada bab ini
persamaan linier sederhana, persamaan non-linier yang dibangkitkan dari
persamaan linier yaitu eksponensial dan geometrik.

7.1.1 Model untuk regresi linier sederhana


Bentuk umum :
y x
y : variabel takbebas
x : variabel bebas
: error yang terjadi pada eksperimen
Nilai selalu berubah ubah pada setiap x jadi sulit untuk ditebak, model ini
kemudian diduga oleh ŷ a b x dengan metode kuadrat terkecil yaitu
meminimumkan jumlah kuadrat error ( yi ŷ 2 ). Dari metode kuadrat
terkecil didapatkan nilai untuk a dan b
x y
xy
n
a y b x dan b 2
2 x
x
n
Untuk melihat seberapa baik model regresi yang diperoleh, dapat dilihat
melalui nilai koefisien korelasi determinasi R2 yang memiliki nilai 0 sampai 1
dan memiliki rumus
2
2 JKR yˆ y
R 2
JKT y y

7-2 MODUL 7
Selain menggunakan R2, untuk mengetahui kelayakan suatu model regresi yang
telah diperoleh yang digunakan menduga hubungan antara variabel X dengan
variabel Y, dilakukan dengan pengujian terhadap koefisien-koefisien regresi
yaitu :

1. Pengujian koefisien regresi secara serentak


Hipotesis :
- H0 : a = b = 0
- H1 : paling tidak terdapat satu koefisien tidak sama dengan nol
Tabel analisis ragam untuk uji koefisien regresi secara serentak
Sumber Derajat Jumlah Kuadrat Kuadrat Fhitung
keragaman bebas Tengah
Regresi p bt X tY n Y 2 JK reg KT reg
p KT galat
Galat n-p-1 Sisa JK galat
n p 1
Total n-1 t
Y Y nY 2

Statistik uji untuk penolakan H0 adalah : Fhit F p, n p 1

2. Pengujian koefisien regresi secara individu


Hipotesis :
- H0 : bp = 0
- H1 : bp ≠ 0
bp
Statistik uji yang digunakan : t hit
Se b p

Kriteria penolakan H0 adalah t hit tn p 1


Arti penolakan terhadap H0 adalah variabel bebas berpengaruh nyata
terhadap variabel tak bebas Y (untuk H0 : b1 = 0), sehingga model regresi
linier dikatakan layak.

7-3 MODUL 7
7.1.2 Model regresi non linier

7.1.2.1 Model eksponensial


x
Bentuk umum regresi model eksponensial adalah y . Model

tersebut diduga dengan ŷ ab x .Nilai a dan b diperoleh dengan cara


langkah langkah berikut :
- Dengan melogaritmakan persamaan y ab x , diperoleh
log y log a x log b c dx

- Model tersebut berubah menjadi model linier, sehingga nilai c dan d


didapatkan dari rumusan model linier yaitu
x log y
x log y
c log y d x dan d n
2
x
x2
n
c d
dimana a 10 dan b 10

7.1.2.2 Model geometrik (power )

Regresi model geometrik mempunyai bentuk umum y x .


b
Pendugaan model tersebut adalah y ax .Nilai a dan b diperoleh dengan
cara sebagai berikut :
- Dengan melogaritmakan persamaany axb , diperoleh
log y log a b log x c b log x

7-4 MODUL 7
- Nilai c dan d bisa didapatkan dari rumusan model linier yaitu

log x log y
log x log y
c log y b log x dan b n
2
log x
(log x) 2
n
dimana a 10 c

7.1.3 Aplikasi dengan minitab

Regresi Linier
Berikut adalah data produksi pulsa tingkat nasional (106)

Tahun Pulsa
1998 35451
1999 37221
2000 40905
2001 45875
2002 50260
2003 56852
2004 59981
2005 67230
2006 70020

a. Gambarkan diagram pencar


b. Tentukan persamaan regresinya
c. Hitung korelasinya
d. berapakah produksi pulsa pada tahun 2007

Langkah-langkah :
1. Ketik data tersebut pada kolom C1(X) dan C2(Y)

2. Membuat diagram pencar dengan cara: pilih menu graph, lalu pilih
scatter plot, klik with regression. Setelah muncul kotak dialog, ketik
kolom yang sesuai untuk variabel Y dan X, dan atur skala, dan lain-lain,
kemudian OK

7-5 MODUL 7
Outputnya sebagai berikut :

Scatterplot of Pulsa vs Tahun

70000

60000
Pulsa

50000

40000

30000
0 1 2 3 4 5 6 7 8 9
Tahun

7-6 MODUL 7
3. Pilih menu stat, kemudian basic statistics, lalu correlation. Setelah
muncul kotak dialog berikut, isi kotak variabel dengan kolom tempat X
dan Y, kalau ingin menyimpan matriknya klik store matrix, bila tidak,
langsung klik OK

Hasilnya adalah Correlation of X and Y = 0.994, Pvalue = 0.00


Karena korelasi antara X dan Y nilainya mendekati 1, maka antara tahun
dengan produksi pulsa terdapat hubungan linier, sehingga dapat dianalisis
dengan regresi linier.

7-7 MODUL 7
4. Pilih menu stat, kemudian regression, lalu regression. Setelah muncul
kotak dialog, pada kotak respon ketik kolom tempat Y, dan predictor
dengan kolom tempat X, kemudian OK

Hasil yang diperoleh adalah :

Regression Analysis: Pulsa versus Tahun


The regression equation is
Pulsa = 28413 + 4624 Tahun

Predictor Coef SE Coef T P


Constant 28413 1066 26.66 0.000
Tahun 4623.9 189.4 24.41 0.000

S = 1467.20 R-Sq = 98.8% R-Sq(adj) = 98.7%

7-8 MODUL 7
Analysis of Variance
Source DF SS MS F P
Regression 1 1282808577 1282808577 595.91 0.000
Residual Error 7 15068810 2152687
Total 8 1297877388

Unusual Observations
Obs Tahun Pulsa Fit SE Fit Residual St Resid
1 1.00 35451 33037 902 2414 2.09R

R denotes an observation with a large standardized residual.

Dari hasil yang diperoleh tersebut, dapat diketahui bahwa tiap tahun
peningkatan produksi pulsa linier. Hal tersebut dapat dilihat dari uji
koefisien regresi, semua koefisien, nilai P value nya nol (P value yang
dihitung dari T). Dari segi kelayakan model regresi dapat dilihat dari nilai
R2 = 98.8% dan pada analisis variansi, nilai P value juga nol. Sehingga
dengan menggunakan model regresi di atas, dapat diprediksi produksi
pulsa tingkat nasional pada tahun 2007 adalah 74653 (106).

7-9 MODUL 7
Regresi Non Linier

Berikut ini merupakan contoh dari regresi non linear, diketahui bahwa data
penjualan suatu produk dari mulai diproduksi sampai produk tersebut
berumur 24 bulan (2 tahun).

Keuntungan
Bulan ke-
(dalam ribuan rupiah)
1 150
2 270
3 480
4 750
5 1350
6 2310
7 3625
8 5390
9 9950
10 15510
11 26500
12 40350
13 77510
14 111950
15 165300
16 311600
17 627480
18 804250
19 1540980
20 2314250
21 3923250
22 6010500
23 12334230
24 15975210

Dari data diatas, kita akan mencoba memprediksi keuntungan perusahaan


saat produksi berlangsung selama 3 tahun (36 bulan).
7-10 MODUL 7
Seperti yang telah diketahui sebelumnya, kita dapat membuat diagram pencar
(scater plot) dengan mintab, yaitu :

Plot bulan vs keuntungan


18000000

16000000

14000000

12000000
keuntungan

10000000

8000000

6000000

4000000

2000000

0 5 10 15 20 25
bulan

Jelas bahwa regresi linear kurang baik untuk diterapkan. Melihat bentuk
diagram pencar diatas kita akan mencoba mendekatinya dengan fungsi non
x b
linear yaitu y ab atau y ax . Untuk menentukan persamaan regresi
yang terbaik antara dua model tersebut dapat dilihat dari nilai R2.

7-11 MODUL 7
Langkah – langkah dengan Minitab

1. Pilih stat, kemudian Regression dan Fitted Line Plot

2. Isi kotak dialog dan optionpnya seperti berikut,

7-12 MODUL 7
Untuk model geometrik y axb isi seperti ini

Untuk model eksponensial y ab x isi seperti ini

7-13 MODUL 7
3. Hasilnya adalah sebagai berikut
Untuk model geometrik y axb

The regression equation is


ylog = 0.798 + 3.98 xlog

Predictor Coef StDev T P


Constant 0.7983 0.3558 2.24 0.035
xlog 3.9751 0.3381 11.76 0.000

S = 0.5848 R-Sq = 86.3% R-Sq(adj) = 85.6%

Untuk model eksponensial y ab x

The regression equation is


ylog = 2.01 + 0.218 x

Predictor Coef StDev T P


Constant 2.01111 0.01549 129.83 0.000
x 0.218240 0.001084 201.31 0.000

S = 0.03676 R-Sq = 99.9% R-Sq(adj) = 99.9%

4. Kedua model, berdasarkan uji T cukup layak digunakan, tetapi


berdasarkan nilai R2 masing – masing model, maka diperoleh
kesimpulan bahwa model eksponensial lebih baik daripada model
geometric.
Jadi persamaan regresi nonlinier yang terbaik adalah
log y 2.01 0.218x
x x
Atau bila dituliskan dalam y ab menjadi y 102,33 1,652
5. Bila dihitung keuntungan pada akhir tahun ke-3 (bulan ke 36) maka
diperoleh hasil
y 102,33 1,652 36 7.22.10117 ribu.
7-14 MODUL 7
Latihan
1. Berikut adalah pengaruh temperatur pada proses deodorizing terhadap
warna suatu produk :
Temperatur (X) Warna (Y)
460 0.3
450 0.3
440 0.4
430 0.4
420 0.6
410 0.5
450 0.5
440 0.6
430 0.6
420 0.6
410 0.7
400 0.6
420 0.6
410 0.6
400 0.6
a. tentukan model regresi linier Y = a + b X
b. Hitung korelasi antara Y dan X
2. Seorang distributor ingin mengetahui hubungan antara biaya pemasangan
iklan per minggu dengan hasil penjualannya, datanya sebagai berikut :
Biaya iklan ($) Penjualan ($)
40 385
20 400
25 395
20 365
30 475
50 440
40 490
20 420
50 560
40 525
25 480
50 510
7-15 MODUL 7
a. Buat diagram pencar
b. Tentukan persamaan garis regresi yang terbaik untuk meramalkan
penjualan mingguan berdasarkan biaya iklan

3. Berikut adalah data tentang pengaruh antara nilai ujian pertama dengan
nilai ujian kedua :
Nilai ujian pertama (X) Nilai ujian kedua (Y)
4.1 2.1
2.2 1.5
2.7 1.7
6.0 2.5
8.5 3.0
4.1 2.1
9.0 3.2
8.0 2.8
7.5 2.5
8.5 3.0
9.3 2.8
9.5 3.0
7.4 1.7

a. Gambarkan diagram pencar


b. Tentukan persamaan regresi linier dan non-liniernya
c. Hitung korelasinya dan tentukan regresi yang terbaik
d. berapakah nilai ujian kedua, jika nilai ujian pertama 6.4

7-16 MODUL 7
DAFTAR PUSTAKA

1. Devore J. L., 1991, Probability and Statistics for Engineering in The


Sciences, third edition, Pacific Grove California.

2. Erickson, B. H., dan Nosanchuk, T. A., 1993, Memahami Data,


Terjemahan : R. K. Sembiring, LP3ES, Jakarta.

3. Djauhari, M., Catatan Kuliah, ITB, Bandung.

4. Minitab Inc, 1994, MINITAB Reference Manual 10 for Windows ,


Minitab Inc, New York.

5. Walpole, R. E., 1997, Pengantar Statistika, Edisi ke-3, Penerbit PT


Gramedia Pustaka Utama, Jakarta.

6. Hines William M. W., and Montgomery D. C., 1990, Probability and


Statistics in Engineering and Management Science, third edition, Jhon
Wiley & Sons, New York.

Anda mungkin juga menyukai