i MODUL 1
DAFTAR ISI
v MODUL 1
1 PENGENALAN MINITAB 15, DATA, DAN
TEKNIK PENGAMBILAN SAMPEL
Overview
Tujuan
1-1 MODUL 1
1.1 Menu-menu pada Minitab 15
1-2 MODUL 1
- Open project : menampilkan data yang telah disimpan pada file kita.
Di bawah open project, terdapat save projects, save projects as,
project description.
1-3 MODUL 1
- Query database :
1-4 MODUL 1
2. Edit
Sub-sub menu pada menu edit adalah :
1-5 MODUL 1
3. Data
Menu data berisi perintah-perintah menampilkan data. Sub-sub menu
yang terdapat pada menu data yaitu :
1-7 MODUL 1
5. Menu Stat
Sub-sub menu pada menu stat adalah :
- Fit interceps : mendefault intersep pada persamaan regresi
- Basic statistics : a) descriptiv statistics : menampilkan ukuran-ukuran
statistics, seperti mean, median, trimean, standart deviasi, kuartil,
maksimum dan minimum, b) uji hipotesis 1 sampel, 2 sampel , c)
correlation, d) covariance, e) normallity test
- Regression : mencari persamaan regresi serta analisisnya, baik
regresi linier maupun non linier untuk kuantitatif maupun kualitatif
- Anova : menganalisis perbedaan lebih dari dua populasi berdasarkan
nilai ragam
- DOE : membuat desain rancangan percobaan faktorial
- Control charts : membuat bagan-bagan kendali
- Quality tools : mengalisis data untuk pengendalian kualitas
- Reliability/survival : membuat plot untuk analisis kehandalan sistem
- Multivariate : menganalisis data banyak peubah
- Time series : menganalisis data deret waktu untuk peramalan
- Tables : membuat tabel kontingensi dan analisis korespondensi
- Nonparametrik : menganalisis data kualitatif tanpa asumsi distribusi
tertentu
- EDA (Eksploratory Data Analysis) : memahami dan mengalisis data
melalui diagram dahan daun, box plot, garis resisten, dll
- Power and sample size : digunakan untuk menghitung power
(peluang kita akan menolak H0 ketika ia salah), ukuran sampel,
perbedaan minimum (ditampilkan sebagai nilai proporsi alternatif)
pada uji satu proporsi.
1-8 MODUL 1
Tampilan menu stat adalah sebagai berikut :
6. Menu Graph
Pada menu graph berisi sub-sub menu seperti pada tampilan di bawah
yang digunakan untuk membuat grafik-grafik seperti histogram, diagram
lingkaran, plot, countur, plot untuk data time series, box plot, diagram
dahan daun. Untuk grafik-grafik tertentu dapat ditampilkan dalam dua
dimensi maupun tiga dimensi.
1-9 MODUL 1
7. Menu Editor
Berikut adalah sub-sub menu editor pada worksheet :
- Next column : memindahkan kursor ke kolom berikutnya
- Go to active cell : memindahkan kursor ke sell yang aktif
- Format column : memformat kolom dalam numerik, tanggal, text.
- Column : mengatur ukuran-ukuran kolom
- Formulas : menampilkan formula-formula ke kolom dan menghitung
formula secara otomatis.
- Worksheet : mengedit sel yang sedang aktif dan merubah arah
inputan
- Define custom list : mengurutkan data
- Clipboard setting : merubah setting untuk data hilang
1-10 MODUL 1
Adapun tampilan menu editor adalah :
1-11 MODUL 1
8. Tools
Adapun sub-submenu pada menu tools adalah
- Microsoft Calculator : Menampilkan menu calculator microsoft
- Notepad : Menampilkan notepad
- Windows Explorer : Menampilkan menu windows explorer
- Toolbars : Untuk men-setting tool – tool yang ingin ditampilkan atau
tidak
- Status Bar : Status bar terletak dibagian bawah layar dan
menampilkan pesan yang menjelaskan item menu dan toolbars yang
saat ini sedang aktif.
- Customize : Digunakan untuk mengedit/menambah/menampilkan
shortcut perintah (command), Toolbars, tool dan lain-lain pada
Minitab
- Options : Digunakan untuk merubah dan menyimpan settingan
standar untuk berbagai macam operasi
- Manage Profiles :Digunakan untuk membuat, menghapus,
mengaktifkan atau menonaktifkan satu atau beberapa profil termasuk
mengubah urutan nya.
- File Security :digunakan untuk melindungi file proyek dari pihak lain
1-12 MODUL 1
Tampilan menu tools adalah
9. Menu Windows
Sub-sub menu pada menu windows digunakan untuk mengatur tampilan
dari windows minitab dan menyimpan data, session, grafik yang telah
dibuat untuk sementara, yaitu :
1-13 MODUL 1
10. Menu Help
Menu ini digunakan untuk membantu user, apabila terdapat kesulitan
waktu menggunakan minitab, baik masalah teori, maupun commandnya.
1-14 MODUL 1
umum yang diperoleh oleh dari penelitian peneliti sendiri. Sedangkan data
sekunder merupakan data yang diambil dari penelitian orang lain pada suatu
publikasi.
Berkaitan dengan pengambilan data, terdapat dua istilah yaitu populasi dan
sampel. Populasi adalah seluruh objek yang diamati. Sedangkan sampel adalah
objek yang diamati adalah sebagian dari populasi. Diharapkan pengambilan
sampel yang dilakukan dapat mewakili populasi. Beberapa hal yang mendasari
pengambilan sampel adalah :
1. Waktu
Bila waktu untuk penelitian terbatas, maka pengambilan sampel dapat
dipilih sebagai alternatif pengambilan data.
2. Biaya
Untuk penelitian mengenai suatu komponen yang harganya mahal, bila
pengambilan populasi dilakukan, maka biaya yang dikeluarkan akan besar.
Sehingga untuk biaya yang terbatas, perlu dilakukan pengambilan sampel.
4. Ketelitian
Hal ini berhubungan dengan waktu dan biaya yang terbatas. Misal biaya
dan waktu penelitian terbatas, maka jumlah tenaga yang membantu
penelitian akan menjadi pertimbangan, sehingga hasilnya pengolahannya
berpengaruh pada tingkat ketelitian.
a. Skala Nominal
Data yang termasuk dalam kelompok ini memiliki ciri bahwa data tidak
memiliki tingkatan. Satu – satunya operator matematika yang berlaku
adalah persamaan dan pertidaksamaan.
Contohnya adalah data tentang jenis kelamin, agama, jenis penyakit dan
sebagainya.
b. Skala Ordinal
Sudah ada tingkatan pada data yang masuk kelompok ini, hanya saja
belum ada ketentuan jarak yang sama antar tingkatan,serta ada hubungan
lebih dari.
Contohnya adalah data tentang golongan kepegawaian, kepangkatan, nilai
huruf, peserta kontes kecantikan, jenis komputer dan sebagainya.
c. Skala Interval
Selain sudah memiliki tingkatan seperti data pada skala ordinal, data yang
masuk dalam kelompok ini juga memiliki sifat bahwa jarak antar tingkatan
adalah sama. Hal ini diperiksa melalui selisih antar tingkatan selalu tetap
Sebagai contoh data suhu yang diukur dalam Celcius, selisih antara suhu
30 dan 29 akan sama dengan selisih suhu 10 dan 11 atau dengan yang
lainnya. Ciri lain dari data ini adalah nilai 0 belum memiliki arti sebenarnya
( tidak ada).
Contohnya adalah suhu 0 derajat bukan berarti tidak ada suhu, tahun 0
bukan berarti tidak ada tahun.
d. Skala Rasio
Data yang memiliki skala ini memiliki tingkatan yang paling tinggi. Semua
sifat pada skala interval juga ada pada data skala rasio ini. Tambahan sifat
untuk jenis data ini adalah nilai 0 sudah memiliki arti yang sebenarnya
( tidak ada ).
Contoh adalah data tentang berat, tinggi, harga, volume dan sebagainya.
1-16 MODUL 1
Dengan mengetahui jenis data yang akan diolah, maka kita dapat menentukan
analisis yang tepat untuk data tersebut. Sebagai contoh data yang memiliki
skala Nominal hanya dapat disajikan dalam bentuk pie chart, bar chart dan
tidak dapat ditentukan ukuran ukuran statistik seperti mean, standard
deviation dan sebagainya. Data yang berskala Ordinal selain dapat dianalisa
seperti nominal juga dapat dianalisa lebih lanjut tetapi sebelumnya harus
ditransformasi ke bentuk numerik. Tetapi, kadang untuk pengolahan lebih
lanjut, data berskala ordinal dan nominal dapat diolah dengan menggunakan
statistika nonparametrik. Sedangkan data yang berskala interval atau Rasio
dapat dilakukan analisa yang lebih lengkap secara langsung. Analisa yang dapat
dilakukan pada data dengan kedua skala terakhir ini relatif sama.
1. Acak sederhana
Pada metode ini, pertama kita tentukan populasi yang akan diambil
sampelnya. Misalkan jumlah populasi = 200, maka untuk setiap unit
populasi tersebut diberikan nomor dari 1 sampai 200. Bila diinginkan
jumlah sampel sama dengan 10, dengan menggunakan tabel random
(lampiran A) dapat ditentukan 10 angka yang akan menentukan nomor
unit populasi yang akan diambil.
Misalkan dipilih baris 5 kolom 4,5 dan 6 sebagai titik awal, dan dipilih arah
ke kanan (boleh ke atas,kiri atau bawah) maka nomor sampel secara
random yang diperoleh adalah
532, 115, 916, 239, 505, 956, 250, 961, 207, 868
Karena jumlah populasi = 200, maka angka – angka yang melebihi 200
akan dihilangkan digit ratusannya. Sehingga nomor sampel randomnya
menjadi
32, 115, 16, 39, 05, 56, 50, 61, 07, 68
Banyaknya digit bilangan random sebagai titik awal tergantung dari
banyaknya digit maksimal populasi.
1-17 MODUL 1
2. Random Berstrata ( berlapis )
Dalam metode ini, langkah pertama adalah populasi dikelompokkan
dalam beberapa kelompok agar lebih homogen, kemudian dari masing
masing kelompok diambil sampel berukuran tertentu ( secara
proporsional ) secara acak seperti pada metode pertama.
3. Sistematik
Dalam metode ini pertama tama populasi diberi nomor dari 1 sampai
N. Kemudian secara acak ditentukan sebuah nomor antara 1 sampai N
(misal k) dan dibuat suatu barisan aritmatika dengan suku awal k dengan
pertambahan tertentu sampai didapat n data. Bila suatu suku bernilai
lebih dari N maka suku tersebut harus dikurangi N atau kelipatannya.
Nilai penambahan adalah bilangan bulat sedemikian hingga nilainya dekat
N
dengan dengan N : ukuran populasi dan n : ukuran sampel.
n
Contoh
Sebuah populasi berukuran 100 dan akan diambil sampel berukuran 15.
Misalkan bilangan acak pertama dipilih 70 agar merata maka
pertambahannya bisa dipilih sekitar 7. Hasil selengkapnya bisa dilihat pada
tabel berikut :
No Barisan Sampel yg terpilih
1 70 70
2 77 77
3 84 84
4 91 91
5 98 98
6 105 5
7 112 12
8 119 19
9 126 26
10 133 33
11 140 40
12 147 47
13 154 54
14 161 61
15 168 68
1-18 MODUL 1
4. Bergerombol ( cluster )
Pada metode ini teknik yang digunakan mirip dengan metode acak
sederhana hanya saja disini yang menjadi unit sampelnya adalah berupa
cluster cluster yang mana masing masing cluster berisi elemen
elemen yang yang lebih kecil. Yang menjadi pedoman untuk
menentukan cluster adalah bahwa cluster cluster tersebut memiliki
karakteristik yang hampir sama.
Contoh
Sebuah populasi berukuran 1000 tetapi dapat dikelompokan dalam
kluster kluster yang berukuran 10, jadi total klusternya adalah 100.
Misalkan dari 100 cluster tersebut akan diteliti sebanyak 6 cluster
maka dengan metode acak sederhana dapat ditentukan 6 kluster yang
terpilih. Unit unit sampel yang diteliti adalah keseluruhan unit
populasi atau sebagian unit yang terletak didalam 6 kluster terpilih
tersebut.
A. Acak sederhana
Pada metode ini, pertama kita tentukan populasi yang akan diambil
sampelnya. Misalkan jumlah populasi = 200, maka untuk setiap unit
populasi tersebut diberikan nomor dari 1 sampai 200. Bila diinginkan
jumlah sampel sama dengan 20, dengan menggunakan tabel random dapat
ditentukan 20 angka yang akan menentukan nomor unit populasi yang
akan diambil.
1-19 MODUL 1
Adapun langkah-langkahnya adalah :
1. Pilih calc, make patterned Data kemudian Simple Set o Numbers
2. Isilah tabel yang keluar sesuai tabel berikut
4. Isilah tabel yang keluar sesuai tabel berikut ( proses ini merupakan
pengambilan sampel berukuran 20 secara acak ). Dalam langkah ini
kemungkinan setiap orang akan mendapatkan hasil yang berbeda.
1-20 MODUL 1
5. Hasil yang keluar diatas merupakan nomor nomor unit populasi yang
akan diambil sebagai sampel (pada kolom sampel) yaitu :
Sampel
72
10
102
156
64
169
2
15
147
164
126
117
121
48
176
110
114
199
79
135
1-21 MODUL 1
1. Buat nomor 1 sampai 60 untuk mahasiswa Teknik Telekomunikasi, 1
sampai 50 untuk Teknik Informatika dan 1 sampai 40 untuk Teknik
Industri.
2. Hitung jumlah sampel untuk masing – masing jurusan.
Teknik Telekomunikasi
60
n1 x 20 8
60 50 40
Teknik Informatika
50
n2 x 20 6
60 50 40
Teknik Industri
40
n3 x 20 6
60 50 40
C. Sistematis
Misalkan dimiliki populasi sebanyak 200 dan akan diambil sampel sebanyak 30,
maka langkah – langkahnya adalah sebagai berikut
1-22 MODUL 1
4. Ambil 30 nomor sampel yang pertama, hasilnya adalah
1-23 MODUL 1
D. Bergerombol
Misalkan akan diteliti kualitas suatu minuman mineral botol yang dikemas
dalam kotak. Jumlah kotak keseluruhan adalah 100 kotak dimana masing –
masing kotak berisi 10 botol dan sampel yang diinginkan adalah 50 botol.
Alternatif yang dapat dilakukan antara lain dari 100 kotak diambil 5 kotak
secara acak kemudian semua botol dalam kotak tersebut diteliti. Alternatif
lain yang dapat dipilih dari 100 kotak tersebut dipilih 10 kotak acak kemudian
dari 10 kotak tersebut dipilih 5 botol secara acak. Misalkan alternatif kedua
yang dipilih :
1. Beri nomor 1 sampai 100 semua kotak yang dimiliki.
2. Buat patterned data pada file baru sebanyak 100 seperti pada langkah
sebelumnya kemudian simpan dalam kolom yang tertentu(C1)
3. Ambil 10 sampel secara acak berdasarkan kolom C1 simpan pada C2.
4. Beri nomor 1 sampai 10 pada seluruh botol untuk 10 kotak yang terpilih.
5. Buat patterned data pada file baru sebanyak 10 seperti pada langkah
sebelumnya kemudian simpan dalam kolom C3
6. Ambil 5 sampel secara acak berdasarkan kolom C3 simpan pada C4,
ulangi sampai 10X dan simpan dalam kolom yang berbeda.
7. Semua nomor sampel yang terpilih pada masing – masing kotak
merupakan unit sampel yang akan diteliti.
Latihan
1. Tentukan sampel berukuran 30 dari populasi dengan ukuan 300
2. Tentukan sampel berukuran 30 yang diambil dari populasi yang
dikelompokkan dalam 4 kelompok dengan ukuran 25,50,75 dan 100
3. Tentukan sampel berukuran 20 yang diambil dari populasi berukuran
200 dengan metode sistematik
4. Suatu populasi berukuran 500 dan dikelompokkan dalam 25 kluster.
Bila nomor populasi 1 20 masuk dalam kluster 1, nomor populasi
21 40 masuk dalam kluster 2 dst. Bila dari 25 kluster tersebut
diambil 5 secara acak, tentukan nomor nomor populasi mana yang
akan masuk dalam sampel !
1-24 MODUL 1
2 STATISTIKA DESKRIPTIF
Overview
Modul ini memberikan panduan secara singkat tentang teknik penyajian dan
analisis data secara deskriptif. Pada tahap awal, mahasiswa dikenalkan serta
diajarkan menampilkan pada beberapa ukuran statistik seperti ukuran
pemusatan, ukuran penyebaran dan ukuran letak dengan menggunakan
software minitab. Ukuran – ukuran ini adalah ukuran – ukuran sering yang
digunakan dalam penyajian data secara deskriptif. Pada tahap selanjutnya
mahasiswa akan diajarkan cara menyajikan data dalam bentuk tabel frekuensi
dan juga dalam graph seperti : histogram, box plot dan diagram dahan daun
beserta analisa hasilnya
Tujuan
2-1 MODUL 2
2.1 Ukuran Pemusatan
1
median Xn Xn .
2 1
2 2
Modus yaitu nilai yang paling sering muncul dalam suatu gugus data
2-2 MODUL 2
Variansi adalah nilai tengah dari kuadrat penyimpangan antara xi terhadap
x . Variansi merupakan ukuran penyebaran yang sering digunakan dalam
statistika inferensia. Variansi dinotasikan S2 untuk sampel dan 2 untuk
populasi. Variansi memiliki rumusan sebagai berikut :
2
xi x
S2 , di mana n banyaknya sampel
n 1
2
xi
2
, di mana N banyayknya populasi
N
Simpangan baku merupakan akar dari variansi.
Kuartil menyatakan nilai nilai yang membagi gugus data menjadi empat bagian
yang sama besar. Q1 menyatakan kuartil 1 yang memiliki sifat bahwa ¼ data
terletak di bawah Q1. Q2 sama dengan median. Sedangkan Q3 memiliki sifat
bahwa ¾ data terletak di bawah Q3. Untuk ukuran letak yang lainnya adalh
desil, persentil dll.
Distribusi frekuensi yaitu penyajian data dalam bentuk tabel. Di mana pada
tabel tersebut menampilkan ciri ciri penting sejumlah data yang diperoleh
dengan cara mengelompokkan data menjadi beberapa kelas, kemudian dari
masing masing kelas dihitung banyaknya pengamatan yang masuk.
Langkah-langkah membuat tabel frekuensi :
1. Menentukan banyaknya kelas dengan kaidah Sturges yaitu N 2 k 1 ,
dimana k 1 3.3 log N . Banyaknya kelas sebaiknya antara 5 sampai 15.
2. Menentukan interval kelas (KI)
range
KI
k
KI sebaiknya kelipatan 5.
3. Untuk komposisi kelas, perhatikan bahwa kelas tidak tumpang tindih.
4. Bila tabel distribusi frekuensi, nantinya digunakan untuk membuat
histogram atau poligon, maka komposisinya diubah ke bentuk batas kelas
(batas bawah kikurangi setengah dan batas atas di tambah setengah)
2-3 MODUL 2
Bila data disajikan sebagai data kelompok, maka ukuran pemusatan,
penyebaran dan letak dapat dihitung dengan menggunakan rumusan sebagai
berikut :
- Ukuran pemusatan
n
f i xi
i 1
Mean : x
n
fi
i 1
xi = titik tengan kelas, f i = frekuensi kelas
1 f f sm
2 t
Median : ~
x Bb p
fm
Bb = batas bawah kelas median f t = frekuensi total
f m = frekuensi kelas median p = interval kelas
f sm = frekuensi kumulatif sebelum median
a
Modus : xˆ Bb p
a b
a f m f am b fm f bm
f m = frekuensi kelas modus
f am = frekuensi sebelum kelas modus
f bm = frekuensi sesudah kelas modus
- Ukuran penyebaran
2
n 2 n
n f i ci f i ci
i 1 i 1
S2 p2
n n 1
2-4 MODUL 2
- Ukuran letak
Kuarti ( Qi , Q2 , Q3 )
i f f sp
4 t
Qi Bb p , i 1, 2, 3
fp
f p = frekuensi pada kelas kuartil ke-i
f sp = frekuensi sebelum kuarti
2-5 MODUL 2
Diagram dahan daun adalah salah satu teknik penyajian data yang
menggunakan data asli secara langsung. Pada dasarnya dalam diagram
dahan daun, penyajian data terbagi atas dua kolom yaitu dahan dan daun,
dimana dahan berisi data dengan satuan yang lebih besar dari pada kolom
daun.
Dari ketiga bentuk penyajian data di atas, dapat dilihat bentuk distribusi data,
apakah simetri, menjulur ke kiri atau ke kanan. Sedangkan untuk memeriksa
x ~ x
kemencengan digunakan metode Pearson yaitu . Jika 0 , data
S
menceng ke kiri dan 0 , data menceng ke kanan.
2-6 MODUL 2
Langkah-langkah menggunakan software minitab 15 adalah :
1. Ketikkan atau copy data tersebut pada worksheet minitab
2. Pilih menu stat, kemudian basic statistics, lalu klik summary graphics
2-7 MODUL 2
3. Pada kotak dialog, isi kolom tempat data pada variables, lalu klik OK
2-8 MODUL 2
2-9 MODUL 2
Dari keempat kota (Bandung, Sukabumi, garut, dan tasik) rata-rata penjualan
voucher telepon tiap bulannya adalah kota tasik yaitu 63.5 dengan variansi
terkecil 26,091. Untuk kota Bandung dan Garut penjualan voucher tiap
bulannya hampir merata, kota sukabumi penjualan terbanyak pada bulan-bulan
terakhir, sedangkan untuk kota tasik penjualan terbanyak pada bulan-bulan
pertama. (Lakukan pengolahan data penjualan voucher di kota Bogor dan
analisis)
2-10 MODUL 2
Latihan
1. Jarak (mil) yang ditempuh oleh suatu tipe kendaraan per gallon bahan
baker adalah:
15.7 16.2 18.2 16.3 17.9 18.1 16.8
17.6 18.1 16.7 16.7 16.0 17.4 17.0
18.6 17.1 14.1 17.5 17.0 17.6 15.6
16.0 17.7 16.1 18.6 15.2 17.1 19.5
17.0 16.9 16.9 16.7 17.3 16.3 17.3
17.0 15.6 15.6 17.9 16.0 17.7 18.2
14.7 17.1 15.2 17.0 17.8 16.1 18.2
16.5 17.7 18.8 14.6 16.5 16.6 15.6
14.9 17.5 16.1 18.5 15.8 16.9 17.3
17.1 15.9 17.1 17.1 16.4 15.6 16.3
25 30 33 22 28
22 28 18 25 25
15 22 23 19 24
20 17 31 20 16
23 19 27 15 19
Buat diagram dahan daun, tabel distribusi frekuensi, histogram, lalu beri
kesimpulan
2-12 MODUL 2
3 KENORMALAN DATA
Overview
Tujuan
3-1 MODUL 3
3.1 Distribusi normal
Distribusi peluang kontinu yang paling penting adalah distribusi normal. Grafik
dari suatu distribusi normal disebut kurva normal, bentuknya seperti lonceng
pada gambar dibawah ini. Suatu peubah acak X yang distribusinya berbentuk
lonceng, dinamakan peubah acak normal. Persamaan matematika dari
distribusi peluang peubah acak normal kontinu bergantung pada dua
parameter yaitu (rataan) dan (simpangan baku). Dengan demikian
fungsi densitas X dapat dinyatakan oleh :
2
1 1 x
f x e 2
– <X< .
2
1. f x dx 1
2. f x 0 , x
3. lim f x 0 dan lim f x 0
x x
4. f x f x
5. Nilai maksimum dari f terjadi pada x
6. Titik belok dari f terjadi pada x
3-2 MODUL 3
Kurva setiap distribusi kontinu dibuat sedemikian rupa sehingga luas daerah
dibawah kurva diantara dua koordinat x x1 dan x x 2 sama dengan
peluang peubah acak X antara x x1 dan x x 2 . Hal tersebut dapat
digambarkan sebagai berikut :
x1 x2 x
x2 x2 1 x 2
1 2
P( x1 X x2 ) = n( x ; , ) dx e dx
x1 2 x1
3-3 MODUL 3
Ada beberapa statistik uji kenormalan data antara lain :
1. Statistik Shapiro Wilk W
Statistik ini dikembangkan oleh Shapiro dan Wilk tahun 1965. Statistik
ini merupakan rasio antara dua penduga ragam. Statistik ujinya
dinamakan statistik W. Statistik W ini mengukur straightness dari plot
quantil quantilnya. Bila nilai dari W 1, maka data dikatakan normal.
3-4 MODUL 3
3.3 Aplikasi dengan minitab
Contoh 1
Langkah-langkah
1. Data adalah data produksi minyak bumi dalam periode waktu 14 bulan
dari 9 lokasi sumur pengeboran. Ketikan data ini pada kolom di minitab
3-5 MODUL 3
2. Pilih menu stat, kemudian pilih basic statistik, lalu normality test
3. Setelah muncul kotak dialog berikut, Ketik C1 pada isian variable, lalu
klik pilihan tests for normality (asumsi 0.05 )
3-6 MODUL 3
Output masing-masing pilihan sebagai berikut :
Shapiro Wilk
Normal Probability Plot
.999
.99
.95
Probability
.80
.50
.20
.05
.01
.001
3-7 MODUL 3
Statistik Anderson Darling
Normal Probability Plot
.999
.99
.95
Probability
.80
.50
.20
.05
.01
.001
Dengan menggunakan statistik ini diperoleh nilai P value = 0.478, nilai ini
lebih besar dari pada nilai = 0.05.
3-8 MODUL 3
Statistik Kolmogorov smirnov
Normal Probability Plot
.999
.99
.95
Probability
.80
.50
.20
.05
.01
.001
Pada gambar terlihat bahwa pendekatan nilai P value > 0.15, nilai ini lebih
besar dari pada nilai = 0.05.
Dari ketiga output di atas, terlihat bahwa untuk ukuran data besar, statistik
Anderson Darling lebih powerfull.
3-9 MODUL 3
Contoh 2
1. Buka software minitab kemudian pilih menu calc , Random Data
kemudian binomial. Pada langkah ini kita akan membangkitkan data yang
berdistribusi binomial. Pada box
yang keluar isilah sesuai isian berikut ini kemudian ok
2. Data yang sudah dipeoleh ini kita anggap sebagai data populasi. Dari data
populasi ini selanjutnya akan kita ambil beberapa sampel berukuran 5, 10
dan 20 untuk selanjutnya akan dibandingkan variansi dari rataan
sampelnya. Dari menu utama pilih calc , Random Data kemudian
sample from column . Isilah box yang keluar seperti isian berikut
3-10 MODUL 3
3. Ulangi langkah 2 sebanyak 5x untuk masing masing ukuran sampel, jadi
akan terdapat 5 sampel berukuran 5, 5 sampel ukuran 10 dan 5 sampel
ukuran 20
4. Dari setiap sampel hitunglah rata ratanya kemudian untuk setiap
ukuran sampel hitunglah rata rata dan variansinya. Anda bisa
menggunakan software lain untuk menghitung rata rata dan variansinya
misalnya microsoft Excel .Mungkin hasil yang keluar ini bisa berbeda
dengan hasil perhitungan anda
Dari hasil diatas terlihat rata rata semua sampel mendekati rata rata
populasi yaitu =np = 40, tetapi untuk ukuran n = 20 variansinya adalah
yang terkecil, ini juga dapat dilihat dari rataan sampel dari no 1 sampai 5
yang hanya berbeda tipis. Ini menunjukkan dengan pengambilan sampel
yang makin besar keakuratan pendugaannya akan semakin tinggi.
3-11 MODUL 3
6. Bila dilakukan dengan software matlab, akan keluar tampilan berikut
Pada program tersebut, pada baris ketiga angka 500 menyatakan jumlah
pengacakan Pada baris 4, perintah random (0,1,100,1) menyatakan
perintah pengambilan sampel dari populasi yang memiliki mean 0,
simpangan baku 1, sampel berukuran 100 dari 1 populasi.
Pada baris 6 dan 7 mengandung arti pendefisian variabel Y sebagai sampel
acak pertama yang berukuran 100.
Pada baris 9, mean sampel 1,2,…500 dihitung
Dan pada baris 12, dibuat histogram dari mean sampel hasil perhitungan
pada baris 9
7. Sekarang ubahlah angka 100 pada baris 4 dan 6 dengan angka 5. Jalankan
program ini dengan memilih debug kemudian run and save ( Dalam
langkah ini kita berusaha mengambil sampel acak berukuran 5). Simpanlah
output gambar/ histogram yang keluar dengan file tersendiri. Ulangi
langkah ini dengan mengganti angka 10, 20 dan 30.
8. Dari keempat histogram yang keluar tersebut, analisa apakah keempat
histogram sudah berbentuk kurva normal baku dengan mean 0 dan
simpangan baku 1? apakah ada pengaruh ukuran sampel? jelaskan!
3-12 MODUL 3
Latihan
1. Data seperti contoh no. 1, kemudian dilakukan pengacakan 15 kali dan
diambil sampel ukuran 10, 20, 30. Buat histogram dengan kurva
normalnya dan uji kenormalannya.
3-13 MODUL 3
4 TRANSFORMASI DATA
Overview
Tujuan
4-1 MODUL 4
4.1 Transformasi untuk satu angkatan data
Dalam ilmu statistik sering kali digunakan asumsi dari bentuk data yang akan
di analisa. Asumsi yang lazim digunakan adalah distribusi Normal. Bentuk data
yang berdistribusi Normal dengan mean dapat digambarkan seperti grafik
berikut
Bila dilihat, data yang berdistribusi Normal akan simetris terhadap dan
sebagaian besar data akan mengelompok di tengah. Dalam kenyataannya
seringkali bentuk data yang diperoleh tidak berbentuk seperti distribusi
normal tetapi berbentuk menjulur ke kanan seperti gambar berikut
Bentuk data yang lainnya adalah menjulur ke kiri yang dapat dilihat pada
gambar berikut :
Agar asumsi bahwa data berdistribusi Normal tetap dipenuhi, maka perlu
dilakukan suatu transformasi terhadap data asli. Transformasi dilakukan untuk
satu angkatan data bila data yang akan ditransformsi hanya satu angkatan data.
4-2 MODUL 4
Untuk memilih fungsi transformasi yang tepat digunakan tangga transformasi
Tukey yang digambarkan sebagai berikut :
1 1
log x x x x2 x3 10 x
x2 x
4-3 MODUL 4
Bila kedua syarat diatas sudah dipenuhi, maka untuk membandingkan angkatan
angkatan tersebut, cukup dibandingkan masing masing tarafnya ( nilai
Median ) saja. Untuk menyamakan sebaran semua angkatan ( membuat
sebaran hampir sama), digunakan transformasi seperti pada tangga
transformasi Tukey tetapi dengan acuan yang sedikit berbeda. Sebaran masing
masing angkatan diukur dengan dQ = Q3 Q1 yaitu simpangan kuartil.
4-4 MODUL 4
4.3 Aplikasi Minitab
Berikut ini contoh data (tabel data transformasi) yang menjulur ke kanan
yang digambarkan dengan histogram.
Tabel data transformasi
7.2 5.6 9.7 2.9
2.3 14.3 2.6 6.8
1.8 3.0 15.3 1.8
5.9 2.5 8.3 3.4
17.3 3.8 2.4 6.9
2.0 1.7 1.9 8.8
4.8 5.5 3.6 6.5
10.9 3.7 4.9 1.9
3.4 2.9 9.3 3.6
4.4 4.6 3.4 3.4
9.6 4.8 10.4 3.7
7.5 8.3 4.0 2.4
1.7 5.8 3.8 13.7
4.6 2.8 4.9 15.3
3.4 6.3 1.5 1.3
2.1 3.1 4.8 4.9
1.5 7.6 4.4 12.0
3.7 5.5 2.9 2.3
5.3 8.0 6.4 3.2
4.1 3.5 0.5 5.9
9.1 1.7 2.1 3.0
5.7 11.4 8.1 3.7
0.9 6.5 3.6 3.6
1.9 1.7 11.9 2.4
2.3 2.1 5.2 2.9
1. Buat file baru : file transformasi, kemudian simpan data diatas pada
kolom c1
4-5 MODUL 4
2. Buat histogramnya
20
Frequency
10
0 10 20
jlrkanan
15
Frequency
10
akar x
4-6 MODUL 4
5. Lakukan tes kenormalan data terhadap data C2
Dari Dari hasil uji Anderson-Darling,didapatkan p-value = 0.001 ini
berarti disimpulkan bahwa data juga tidak berdistribusi Normal.
15
10
Frequency
log x
Dari kedua transformasi diatas dapat dilihat bahwa data yang sebelumnya
menjulur kekanan secara sedang, dengan transformasi x bentuk data
menjadi menjulur ke kanan secara lemah, sedangkan dengan transformasi Log
x data menjadi Normal. Nantinya yang diolah dengan statistik adalah data Log
x bukan data aslinya.
4-7 MODUL 4
diperoleh bentuk data akan semakin menjulur kekanan seperti ditunjukkan
dari histogram berikut.
35
30
25
Frequency
20
15
10
transf x
Histogram of transformasi x3
80
70
60
Frequency
50
40
30
20
10
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
transf x
4-8 MODUL 4
Latihan
Periksa distribusi data berikut, bila belum simetris, lakukan transformasi yang
tepat seperti pada langkah – langkah praktikum diatas
4-9 MODUL 4
5 UJI HIPOTESIS STATISTIK DAN
PROPORSI
Overview
Modul ini memberikan panduan untuk melakukan uji hipotesis terhadap nilai
tengah dan proporsi. Uji hipotesis terhadap nilai tengah meliputi uji terhadap
terhadap satu nilai tengah maupun perbandingan antara dua nilai tengah,
sedangkan uji proporsi meliputi uji satu proporsi dan perbandingan dua
proporsi. Semua uji hipotesis yang dilakukan berdasarkan beberapa asumsi
yaitu ragam diketahui maupun ragam tidak diketahui.
Tujuan
5-1 MODUL 5
5.1 Hipotesis statistik
Dalam uji hipotesis sering digunakan istilah menerima atau menolak hipotesis
yang dirumuskan, artinya jika diterima maka hipotesis yang dirumuskan benar
dan jika ditolak maka berlaku sebaliknya. Dari hal tersebut, dapat dikatakan
bahwa perumusan suatu hipotesis sering dipengaruhi oleh bentuk peluang
dari kesimpulan yang salah. Hipotesis yang dirumuskan dengan harapan akan
ditolek disebut hipotesi nol. Penolakan terhadap hipotesis nol tersebut akan
mengakibatkan pada penerimaan terhadap suatu hipotesis lain yang disebut
hipotesis alternatif.
Sifat dari pengujian hipotesis nol melawan hipotesis alternatif ada dua yaitu :
Hipotesis alternatif yang bersifat dua arah
H0 : = 0
H1 : 0
Pada hipotesis jenis ini, wilayah kritisnya terbagi menjadi dua bagian, yang
letaknya pada masing masing ekor dari sebaran statistik ujinya.
5-2 MODUL 5
Hipotesi alternatif yang bersifat satu arah
a) H0 : 0 atau b) H0 : 0
H1 : > 0 H1 : < 0
X1, X2, …, Xn merupakan peubah acak yang menyebar secara normal dengan
nilai tengah tidak diketahui. Perumusan hipotesinya sebagai berikut :
H0 : = 0 atau H0 : 0 atau H0 : 0
H1 : 0 H 1 : > 0 H1 : < 0
Pengujian hipotesis terhadap nilai tengah ada dua asumsi :
1. Ragam diketahui
Uji hipotesis untuk rata rata x, di mana hipotesis nol menyebar normal
dengan nilai tengah 0 dan simpangan baku rata rata populasi / n,
statistik ujinya adalah :
5-3 MODUL 5
x 0
Z
n
X1, X2, …, Xn dan Y1, Y2, …, Yn merupakan dua peubah acak yang saling
bebas dan menyebar secara normal dengan nilai tengah x dan y, simpangan
baku x dan y. Perumusan hipotesinya sebagai berikut :
H0 : x y = 0 atau H0 : x y 0 atau H0 : x y 0
H1 : x y 0 H 1 : x y > 0 H 1 : x y < 0
5-4 MODUL 5
Di mana 0 adalah suatu konstanta bernilai positif atau nol yang menunjukkan
selisih antara dua nilai tengah yang tidak diketahui.seperti pada pengujian
hipotesis untuk satu nilai tengah, ada dua asumsi yaitu :
1. Ragam diketahui
Statistik uji didefinisikan sebagai berikut
x y 0
Z
2 2
x y
nx ny
5-5 MODUL 5
2
S x2 S y2
nx ny
v
2 2
S x2 S y2
nx ny
nx 1 ny 1
Statistik uji pengujian hipotesis terhadap selisih antara dua nilai tengah
untuk ragam berbeda adalah
x y 0
t
2 2
Sx S y
nx ny
Sedangkan untuk ragam sama, dalam statistik ujinya menggunakan ragam
gabungan, yaitu :
2 n x 1 S x2 n y 1 S y2
S gab
nx n y 2
dimana statistik ujinya adalah
x y 0
t .
1 1
S gab
nx ny
5-6 MODUL 5
5.1.3 Aplikasi dengan minitab
5-7 MODUL 5
3. Hasil yang diperoleh sebagai berikut :
Dari hasil yang diperoleh di atas, dapat diketahui bahwa ragam kedua
sampel sama, karena Pvalue = 0.582 > 0.05
5-8 MODUL 5
4. Pengujian hipotesis, dilakukan dengan cara pilih stat, basic statistics,
kemudian pilih 2-sample t, kemudian isi kotak dialog
5-9 MODUL 5
Boxplot of Fren, Flexi
100
90
80
70
Data
60
50
40
30
20
Fren Flexi
6. Untuk latihan, lakukan langkah dan analisis yang sama untuk fren vs esia,
flexi vs esia.
5-10 MODUL 5
5.2 Uji proporsi
Hipotesis yang digunakan untuk uji satu nilai proporsi dengan taraf antara
lain berbentuk :
a. H 0 : p p0
H1 : p p0
Wilayah kritik: x a dimana a adalah bilangan bulat terbesar yang bersifat
a
PX a b x; n; p0
x 0
b. H 0 : p p0
H1 : p p0
Wilayah kritik x a dimana a adalah bilangan bulat terkecil yang bersifat
n
PX a b x; n; p0
x a
b x; n; p0 : binomial dengan parameter n dan p0
n : banyaknya eksperimen/ulangan
p0 : peluang “sukses”
5-11 MODUL 5
c. H 0 : p p0
H1 : p p0
Wilayah kritik x a atau x a dimana a adalah bilangan bulat terkecil
untuk x a atau bilangan bulat terbesar untuk x a yang bersifat
a n
PX a b x; n; p0 atau P X a b x; n; p0
x 0 2 x a 2
b x; n; p0 : binomial dengan parameter n dan p0
n : banyaknya eksperimen/ulangan
p0 : peluang “sukses”
Bila dari hasil perhitungan, nilai berada diwilayah kritik, maka tolak H0.
Contoh
Dimiliki suatu pernyataan bahwa 70% rumah yang ada di kota A sudah
terpasang AC. Dari 15 yang rumah yang diamati, ternyata hanya 8 rumah yang
telah terpasang AC. Benarkah pernyataan tersebut ?
Langkah – langkah
1. Karena yang ingin disimpulkan adalah proporsi rumah terpasang AC =
70% atau tidak, maka uji hipotesis yang dipilih adalah
H 0 : p 0,7
H 1 : p 0,7
Taraf = 5% = 0,05
5-12 MODUL 5
2. Pilih menu Basis Statistic , 1 Proportion
5-13 MODUL 5
Number of event = 8, menyatakan banyaknya kejadian sukses
Number of trial = 15, menyatakan banyaknya sampel yang diambil
Hypothesized proportion =0,7 menyatakan nilai dari H0
Exact
Sample X N Sample p 95% CI P-Value
1 8 15 0.533333 (0.265861, 0.787333) 0.258
5-14 MODUL 5
5.2.3 Pendekatan normal baku untuk uji terhadap satu nilai
proporsi
Pada pengujian satu nilai proporsi, ada situasi dimana tabel binomial sulit
untuk digunakan, misalkan untuk nilai n yang sangat besar(kecuali dengan
bantuan komputer). Salah satu pendekatan yang bisa digunakan adalah dengan
melakukan transformasi ke bentuk normal baku. Parameter dan 2
ditaksir
dengan rumus : np0 dan 2
npq .
Statistik uji yang digunakan adalah
x np0
z
np0 q0
n : banyaknya eksperimen/ulangan
p0 : peluang “sukses” / proporsi
Z berdistribusi normal baku dengan 0 dan 2
1 . Wilayah kritiknya
menjadi
z Z bila uji hipotesisnya H1 : p p0
z Z1 bila uji hipotesisnya H1 : p p0
z Z atau z Z1 bila uji hipotesisnya H1 : p p0
2 2
5-15 MODUL 5
Langkah – langkah
1. Karena yang ingin disimpulkan adalah tingkat keefektifan obat baru > 60%
atau tidak, maka uji hipotesis yang dipilih adalah
H 0 : p 0,6
H 1 : p 0,6
Taraf = 5% = 0,05
2. Langkah – langkah yang dilakukan untuk uji hipotesis ini mirip dengan uji
hipotesis tanpa menggunakan pendekatan normal. Perbedaannya adalah
ketika memilih kotak option kita memilih check list “use test and interval
test based on normal distribution” seperti berikut ini
5-16 MODUL 5
3. Hasilnya adalah sebagai berikut :
95% Lower
Sample X N Sample p Bound Z-Value P-Value
1 70 100 0.700000 0.624623 2.04 0.021
Berarti nilai z masuk dalam wilayah kritik karena P-value= 0,021 < 0,05.
Jadi dapat disimpulkan bahwa tingkat keefektifan obat baru lebih tinggi
dari obat lama.
Pengujian terhadap proporsi tidak hanya bisa dilakukan terhadap satu nilai
proporsi. Bila kita sedang meneliti dua buah proporsi, maka kedua proporsi
tersebut dapat diperbandingkan yaitu berdasarkan sebaran selisih
proporsinya. Selisih proporsi ini kemudian ditransformasi kebentuk normal
baku dengan rumus z yaitu :
pˆ 1 pˆ 2
z
pˆ qˆ 1 1
n1 n2
Dimana
x1 x2 x1 x 2
pˆ 1 pˆ 2 pˆ qˆ 1 pˆ
n1 n2 n1 n2
x1 : Banyaknya sukses kategori 1
x2 : Banyaknya sukses kategori 2
n1 : Banyaknya ulangan/sampel kategori 1
n2 : Banyaknya ulangan/sampel kategori 2
5-17 MODUL 5
Hipotesisnya
H 0 : p1 p2
Contoh
Suatu penelitian dilakukan untuk melihat apakah proporsi lulusan smu
kotamadya Bandung(p1) yang akan melanjutkan ke PT(Perguruan Tinggi) lebih
tinggi daripada proporsi lulusan smu kabupaten Bandung(p2) yang akan
melanjutkan ke PT dengan taraf 2,5%. Dari sampel acak yang diambil,
diperoleh hasil bahwa dari 200 lulusan asal kotamadya, 120 orang akan
melanjutkan ke PT. Sedangkan dari 500 lulusan asal kabupaten, 240 orang
akan melanjutkan ke PT.
5-18 MODUL 5
Langkah – langkah
1. Karena yang ingin disimpulkan proporsi lulusan smu kotamadya
Bandung(p1) yang akan melanjutkan ke PT(Perguruan Tinggi) lebih tinggi
daripada proporsi lulusan smu kabupaten Bandung(p2), maka uji hipotesis
yang dipilih adalah
H 0 : p1 p2 atau H 0 : p1 p 2 0
H 1 : p1 p 2 atau H 0 : p1 p 2 0
Taraf = 5% = 0,025 selang kepercayaan = 97,5 %
2. Pilih menu Basis Statistic , 2 Proportion
5-19 MODUL 5
3. Isilah kotak dialog dengan isian berikut
5-20 MODUL 5
5. Hasilnya adalah sebagai berikut :
Sample X N Sample p
1 120 200 0.600000
2 240 500 0.480000
Latihan
1. Suatu penelitian diadakan untuk mengetahui apakah rata-rata banyaknya
panggilan tiap 2 jam yang diterima oleh swicthboard pada dua wartel
sama atau tidak. Berikut adalah rata-rata banyaknya panggilan dari dua
wartel tiap 2 jam selama 15 hari
H 1 2 3 4 5 6 7 8
W1 20 10 12 6 12 8 22 13
W2 10 10 23 6 8 6 15 12
W1 10 8 9 15 20 15 10 10
W2 11 5 10 18 8 6 12 12
a. Buatlah hipotesisnya
b. Uji dan buat kesimpulannya
5-21 MODUL 5
1. Suatu sampel acak berukuran 20 diambil dari nilai UTS matakuliah
Statistika dari mahasiswa 01. 02, dan 03 Penelitian tersebut dimaksudkan
untuk membandingkan kemampuan akademik antara mahasiswa kelas 01.
02, dan 03, berdasarkan uji selisih nilai tengah antara dua sampel. Adapun
datanya sebagai berikut :
5-22 MODUL 5
3. Lakukan uji proporsi pada data-data berikut, yaitu :
2) Data miskonsepsi siswa dengan model konstruktivis terhadap suatu
mata pelajaran
5-23 MODUL 5
6 ANALISIS VARIANSI
Overview
Analisis variansi ini merupakan alternatif lain bagi pengujian nilai tengah selain
menggunakan uji-t. Salah satu perbedaan utama antara analisis variansi
dengan uji-t adalah kemampuan uji untuk membandingkan beberapa angkatan
data secara serempak. Pada analisis variansi yang lebih kompleks (banyak
faktor), nilai tengah bisa berasal dari beberapa faktor. Modul ini memberikan
penjelasan mengenai analisis satu faktor saja.
Tujuan
6-1 MODUL 6
6.1 Asumsi-asumsi pada analisis variansi
Pada modul IV, telah dibahas masalah kenormalan data. Hal tersebut
merupakan landasan yang penting pada tahap pengujian hipotesis dan analisis
variansi. Hal mendasar pada analisis variansi adalah membandingkan lebih dari
dua populasi berdasarkan pada lebih dari dua buah angkatan data. Asumsi-
asumsi yang diperlukan pada analisis variansi adalah :
1. Setiap angkatan data berasal dari populasi yang berdistribusi normal.
2. Setiap populasi memiliki variansi yang sama.
3. data yang satu dengan yang lainnya merupakan pengamatan yang saling
bebas.
6-2 MODUL 6
k
( ni 1) S i2
S g2 adalah ragam gabungan yaitu S g2 i 1
N k
6-3 MODUL 6
N = Total data penggabungan semua angkatan
S2 = variansi gabungan
S i2 = variansi angkatan ke-i
X i = rata-rata angkatan ke-i
X = rata-rata gabungan
N – 1 = derajat kebebasan total
N – m = derajat kebebasan dalam angkatan
m – 1 = derajat kebebasan antar angkatan
Untuk menghitung JKT, JKD, dan JKA digunakan rumusan sebagai berikut :
2
ni
2
X ij
m ni m j 1
JKD X ij
i 1 j 1 i 1 ni
2
ni
X ij 2
m m ni
j 1
JKA X ij
i 1 ni i 1 j 1
2 2
m ni m ni
JKT X ij X ij
i 1 j 1 i 1 j 1
6-4 MODUL 6
Untuk membandingkan m populasi berdasarkan m buah angkatan data, dan
berdasarkan asumsi-asumsi analisis variansi, maka hipotesis nol dan hipotesis
alternatifnya didefinisikan sebagai berikut :
H0 : 1 = 2 = ..... = m
H1 : paling sedikit ada satu pasangan (i, j) sehingga i ≠ j
Sedangkan statistik uji yang digunakan adalah statistik Fisher yang didefinisikan
JKA
m 1 RKA
sebagai F . Kemudian nilai F hasil perhitungan
JKD RKD
N m
debandingkan dengan nilai F dari tabel, yaitu F , (m-1), (N-m). Bila Fhit
F , (m-1), (N-m), maka H0 ditolak, sehingga paling sedikit ada satu pasangan
(i, j) sehingga i ≠ j.
6-5 MODUL 6
Berikut adalah datanya :
6-6 MODUL 6
3. Hasil yang diperoleh sebagai berikut :
Dari hasil yang diperoleh di atas, dapat diketahui bahwa ragam ketiga
sampel sama, karena Pvalue = 0.811 > 0.05
6-7 MODUL 6
4. Pengujian hipotesis, dilakukan dengan cara pilih Stat, ANOVA,
kemudian pilih 2-sample t, kemudian isi kotak dialog
Source DF SS MS F P
Factor 2 1996 998 3.35 0.045
Error 42 12520 298
Total 44 14516
6-8 MODUL 6
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev ----+---------+---------+---------+-----
Fren 15 54.67 18.98 (--------*--------)
Flexi 15 61.73 16.33 (--------*--------)
Esia 15 45.47 16.35 (--------*--------)
----+---------+---------+---------+-----
40 50 60 70
Pooled StDev = 17.27
90
80
70
Data
60
50
40
30
20
Fren Flexi Esia
Latihan
1. Berikut adalah data pengunjung dari lima warnet dalam waktu 1 minggu.
Warnet/hr 1 2 3 4 5 6 7
A 10 20 25 8 35 20 20
B 18 15 10 26 25 30 30
C 12 25 30 35 9 10 10
D 15 15 20 10 25 20 25
E 20 10 8 9 35 35 15
2. Berikut adalah data penjualan dari lima merk Laptop yang dijual di BEC
dari 8 pusat penjualan selama satu bulan.
6-10 MODUL 6
3. Berikut adalah data nilai toefl tiga jurusan yaitu TE, IF, dan TI angkatan
2006
ST TI IF
426.667 450.000 453.333
520.000 506.667 480.000
216.667 456.667 550.000
290.000 576.667 460.000
410.000 360.000 403.333
400.000 500.000 380.000
370.000 430.000 443.333
490.000 413.333 216.667
343.333 386.667 450.000
390.000 363.333 453.333
373.333 433.333 216.667
430.000 543.333 463.333
456.667 350.000 430.000
580.000 436.667 363.333
410.000 386.667 430.000
436.667 350.000 216.667
423.333 416.667 473.333
413.333 410.000 403.333
396.667 386.667 406.667
430.000 366.667 413.333
410.000 406.667 446.667
430.000 543.333 416.667
510.000 426.667 416.667
216.667 363.333 443.333
420.000 383.333 540.000
420.000 380.000 473.333
483.333 413.333 413.333
370.000 383.333 520.000
433.333 216.667 510.000
476.667 420.000 420.000
Lakukan analisis ragam dengan taraf nyata 0.05 pada data tersebut.
Kemudian uji apakah rata-rata nilai toefl mahasiswa dari tiga juruan sama
ataukah berbeda.
6-11 MODUL 6
7 REGRESI LINIER DAN NON-LINIER
SEDERHANA
Overview
Dalam sebuah penelitian, sering kita memiliki data yang berpasangan (X,Y).
Data tersebut bisa jadi diperoleh dari sebuah percobaan terhadap peubah X
sedangkan respon yang terjadi dicatat sebagai peubah Y. Hal menarik yang
bisa disimpulkan dari data yang berpasangan adalah tingkat keeratan
hubungan antara X dan Y serta bentuk hubungan fungsionalnya. Modul ini
memberikan panduan langkah – langkah kepada mahasiswa dalam
menentukan hubungan antara dua peubah X,Y yang paling tepat, langkah –
langkah pengujian koefisien regresi beserta penentuan tingkat keeratannya.
Tujuan
7-1 MODUL 7
7.1 Regresi
Suatu permasalahan penelitian biasanya dapat dijelaskan oleh dua atau lebih
variabel yang saling berhubungan satu sama lain. Variabel-variabel yang saling
berhubungan tersebut membentuk suatu persamaan matematis yang dapat
digunakan untuk menentukan nilai sebuah variabel yang bergantung pada nilai
variabel yang lain. Dalam statistika, hubungan fungsional antara variabel tak
bebas ( dinotasikan Y ) dengan variabel bebas ( dinotasikan X ) disebut
regresi antara Y dan X. Persamaan regresi yang akan dibahas pada bab ini
persamaan linier sederhana, persamaan non-linier yang dibangkitkan dari
persamaan linier yaitu eksponensial dan geometrik.
7-2 MODUL 7
Selain menggunakan R2, untuk mengetahui kelayakan suatu model regresi yang
telah diperoleh yang digunakan menduga hubungan antara variabel X dengan
variabel Y, dilakukan dengan pengujian terhadap koefisien-koefisien regresi
yaitu :
7-3 MODUL 7
7.1.2 Model regresi non linier
7-4 MODUL 7
- Nilai c dan d bisa didapatkan dari rumusan model linier yaitu
log x log y
log x log y
c log y b log x dan b n
2
log x
(log x) 2
n
dimana a 10 c
Regresi Linier
Berikut adalah data produksi pulsa tingkat nasional (106)
Tahun Pulsa
1998 35451
1999 37221
2000 40905
2001 45875
2002 50260
2003 56852
2004 59981
2005 67230
2006 70020
Langkah-langkah :
1. Ketik data tersebut pada kolom C1(X) dan C2(Y)
2. Membuat diagram pencar dengan cara: pilih menu graph, lalu pilih
scatter plot, klik with regression. Setelah muncul kotak dialog, ketik
kolom yang sesuai untuk variabel Y dan X, dan atur skala, dan lain-lain,
kemudian OK
7-5 MODUL 7
Outputnya sebagai berikut :
70000
60000
Pulsa
50000
40000
30000
0 1 2 3 4 5 6 7 8 9
Tahun
7-6 MODUL 7
3. Pilih menu stat, kemudian basic statistics, lalu correlation. Setelah
muncul kotak dialog berikut, isi kotak variabel dengan kolom tempat X
dan Y, kalau ingin menyimpan matriknya klik store matrix, bila tidak,
langsung klik OK
7-7 MODUL 7
4. Pilih menu stat, kemudian regression, lalu regression. Setelah muncul
kotak dialog, pada kotak respon ketik kolom tempat Y, dan predictor
dengan kolom tempat X, kemudian OK
7-8 MODUL 7
Analysis of Variance
Source DF SS MS F P
Regression 1 1282808577 1282808577 595.91 0.000
Residual Error 7 15068810 2152687
Total 8 1297877388
Unusual Observations
Obs Tahun Pulsa Fit SE Fit Residual St Resid
1 1.00 35451 33037 902 2414 2.09R
Dari hasil yang diperoleh tersebut, dapat diketahui bahwa tiap tahun
peningkatan produksi pulsa linier. Hal tersebut dapat dilihat dari uji
koefisien regresi, semua koefisien, nilai P value nya nol (P value yang
dihitung dari T). Dari segi kelayakan model regresi dapat dilihat dari nilai
R2 = 98.8% dan pada analisis variansi, nilai P value juga nol. Sehingga
dengan menggunakan model regresi di atas, dapat diprediksi produksi
pulsa tingkat nasional pada tahun 2007 adalah 74653 (106).
7-9 MODUL 7
Regresi Non Linier
Berikut ini merupakan contoh dari regresi non linear, diketahui bahwa data
penjualan suatu produk dari mulai diproduksi sampai produk tersebut
berumur 24 bulan (2 tahun).
Keuntungan
Bulan ke-
(dalam ribuan rupiah)
1 150
2 270
3 480
4 750
5 1350
6 2310
7 3625
8 5390
9 9950
10 15510
11 26500
12 40350
13 77510
14 111950
15 165300
16 311600
17 627480
18 804250
19 1540980
20 2314250
21 3923250
22 6010500
23 12334230
24 15975210
16000000
14000000
12000000
keuntungan
10000000
8000000
6000000
4000000
2000000
0 5 10 15 20 25
bulan
Jelas bahwa regresi linear kurang baik untuk diterapkan. Melihat bentuk
diagram pencar diatas kita akan mencoba mendekatinya dengan fungsi non
x b
linear yaitu y ab atau y ax . Untuk menentukan persamaan regresi
yang terbaik antara dua model tersebut dapat dilihat dari nilai R2.
7-11 MODUL 7
Langkah – langkah dengan Minitab
7-12 MODUL 7
Untuk model geometrik y axb isi seperti ini
7-13 MODUL 7
3. Hasilnya adalah sebagai berikut
Untuk model geometrik y axb
3. Berikut adalah data tentang pengaruh antara nilai ujian pertama dengan
nilai ujian kedua :
Nilai ujian pertama (X) Nilai ujian kedua (Y)
4.1 2.1
2.2 1.5
2.7 1.7
6.0 2.5
8.5 3.0
4.1 2.1
9.0 3.2
8.0 2.8
7.5 2.5
8.5 3.0
9.3 2.8
9.5 3.0
7.4 1.7
7-16 MODUL 7
DAFTAR PUSTAKA