Modul Praktikum Satistika Industri Unla

MODUL PRAKTIKUM SATISTIKA INDUSTRI
UNIVERSITAS LANGLANGBUANA
MODUL 1
DAFTAR ISI
KATA PENGANTAR
iii
DAFTAR ISI
iv
1
PENGENALAN MINITAB 15, DATA, DAN
TEKNIK PENGAMBILAN SAMPEL 1-1
1.1 Menu-menu pada Minitab 15 1-2
1.2. Mengenal Data 1-16
1.2.1 Populasi dan sampel 1-16
1.2.2 Skala pengukuran
1-17
1.3 Metode Sampling 1-19
1.4 Aplikasi dengan minitab
1-21
2
STATISTIKA DESKRIPTIF
2-1
2.1 Ukuran Pemusatan
2-2
2.2 Ukuran Penyebaran
2-2
2.5 Penyajian dalam Bentuk Grafik
2-5
2.6 Aplikasi dengan minitab 2-6
3
KENORMALAN DATA 3-1
3.1 Distribusi normal 3-2
3.2 Statistik uji kenormalan 3-3
3.3 Aplikasi dengan minitab 3-4
4
TRANSFORMASI DATA
4-1
4.1 Transformasi untuk satu angkatan data
4-2
4.2 Transformasi untuk beberapa angkatan data
(menyamakan sebaran)4-4
4.3 Aplikasi Minitab 4-5
5
UJI HIPOTESIS STATISTIK DAN PROPORSI
5-1
5.1 Hipotesis statistik 5-2
5.1.1 Pengujian hipotesis untuk satu nilai tengah
5-3
MODUL 1
ii
5.1.2 Pengujian hipotesis untuk selisih dua nilai

tengah
5-5
5.1.3
Aplikasi dengan minitab
5-7
5.2 Uji proporsi 5-13
5.2.1 Uji terhadap satu nilai proporsi
5-13
5.2.2
Aplikasi dengan Minitab5-15
5.2.3 Pendekatan normal baku untuk uji terhadap
satu nilai proporsi5-18
5.2.4
5.2.5 Pengujian perbandingan dua proporsi 5-21
5.2.6
6
ANALISIS VARIANSI 6-1
6.1 Asumsi-asumsi pada analisis variansi
6-2
6.2 Uji Kesamaan Ragam
6-2
6.3 Tabel analisis variansi 6-3
7
REGRESI LINIER DAN NON-LINIER
SEDERHANA
7-1
7.1 Regresi
7-2
7.1.1
Model untuk regresi linier sederhana
7-2
7.1.2 Model regresi non linier
7-4
7.1.2.1 Model eksponensial 7-4
7.1.2.2 Model geometrik (power ) 7-5
DAFTAR PUSTAKA 19
MODUL 1
iii
1 PENGENALAN MINITAB 15, DATA,

DAN TEKNIK PENGAMBILAN SAMPEL
Overview
Modul ini memberikan pengenalan singkat tentang software

Minitab 15 kepada mahasiswa. Pengenalan tentang menu
diberikan diawal, sehingga diharapkan mahasiswa memiliki
gambaran umum tentang penggunaan software ini. Setelah
dapat menjalankan software ini, mahasiswa akan dikenalkan
pada beberapa jenis data berdasarkan skala pengukurannya.
Pada tahap akhir, mahasiswa akan diajarkan tentang
pengambilan sampel dari populasi dengan menggunakan
beberapa teknik sampling
Tujuan
1. Mahasiswa mendapatkan gambaran singkat tentang

software Minitab
2. Mahasiswa dapat membedakan data berdasarkan skala
pengukurannnya
MODUL 1
3. Mahasiswa dapat melakukan pengambilan data sampel

berdasarkan data populasi dengan menggunakan
beberapa metode sampling
1.1
Menu-menu pada Minitab 15
Pada software minitab, tampilannya ada 2, yaitu windows

worksheet dan windows session. Worksheet merupakan
tempat untuk mengetikkan data dan menampilkan hasil
pengolahan data. Sedangkan session merupakan tempat
untuk menampilkan semua perintah-perintah (commandcommand) yang telah kita lakukan dalam bentuk program
dan hasil dari pengolahan data yang tidak dapat ditampilkan
pada worksheet. Adapun tampilan minitab sebagai berikut :
MODUL 1
Adapun menu-menu pada minitab 15 yaitu :

1. File
Pada menu file terdapat sub-sub menu antara lain :
- New : menampilkan worksheet baru
- Open project : menampilkan data yang telah disimpan
pada file kita. Di bawah open project, terdapat save
projects, save projects as, project description.
MODUL 1
Open worksheet : menampilkan data yang telah

disimpan dan disediakan software minitab. Di bawah
sub menu ini, terdapat save worksheet, save
worksheet as.
MODUL 1
Query database :
Open graph : membuka grafik yang telah disimpan

Other file : membuka data dari file lain
Print session window : mencetak tampilan pada
session.
- Print setup : mencetak dengan pengaturan tampilan
pada worksheet dan session.
- Exit : Keluar dari minitab
Adapun tampilan dari menu file sebagai berikut :
-
MODUL 1
2. Edit
Sub-sub menu pada menu edit adalah :
MODUL 1
undo : kembali ke pekerjaan ke- n-1 (bila kita diposisi

n)
redo : kembali ke pekerjaan ke- n+1 (bila kita diposisi
n)
Clear cells : membersihkan data pada sel-sel
worksheet
Delete cells : menghapus sel-sel
Copy cells : menyalin data pada sel
Cut cells : memotong sel (menyalin dan menghapus)
Worksheet link : memindahkan data yang telah disalin
baik dari sel, atau file minitab atau word, excel, dan
lain-lain.
Select all cells : memilih atau menyorot semua data
pada sel-sel untuk pengolahan
Edit last dialog : mengedit dialog terakhir
Command line editor : digunakan untuk mengeksekusi
perintah secara cepat atau mengekseksekusi ulang
MODUL 1
atau mengedit perintah yang digunakan pada sesi

sebelumnya.
3. Data
Menu data berisi perintah-perintah menampilkan data.
Sub-sub menu yang terdapat pada menu data yaitu :
Subset worksheet : menampilkan sebagian worksheet

Split worksheet : membagi worksheet menjadi
beberapa worksheet
Merge
worksheet : menggabungkan
beberapa
worksheet
Sort : mengurutkan data (mengurutkan suatu kolom
berdasarkan kolom lainnya )
Rank : merangking data (membuat rangking suatu
kolom)
Delete rows : menghapus baris
MODUL 1
Erase variabels : menghapus variabel-variabel

Copy columns : mengkopi kolom
Stack/unstack : menggabung data pada kolom yang
berbeda menjadi satu kolom/ memisahkan data pada
satu kolom menjadi beberapa kolom berdasarkan
kriteria tertentu
Code : mengkonversi data (numerik ke numerik,
numerik ke teks dsb)
Change data type : merubah tipe data
Extract from Date/Time : ekstrak data numerik ke text
atau sebaliknya
Concatenate : menggabung dua atau lebih kolom yang
berisi data text menjadi satu kolom, syarat penjang
kolom sama.
Display data : menampilkan data
4. Calc (calculation)
Pada menu calc terdapat sub-sub menu :
- Calculator
:
untuk
melakukan
perhitungan
(penjumlahan,
perkalian,
pembagian,
sinus,
maksimum, eksponen, dan lain-lain)
- Column statistics : menghitung ukuran-ukuran statistik
dari suatu kolom
- Row statistics : menghitung ukuran-ukuran statistik
dari suatu baris
- Standardize : menormalisasikan data
- Make patterned data : membuat suatu kolom(data)
dengan pola tertentu
- Make mesh data : Membuat sebuah fungsi dua dimensi
seperti permukaan berdasarkan pasangan nilai x dan y
- Make indicator variables : membuat variabel dummy
untuk data kualitatif
MODUL 1
Set base : menetapkan titik awal untuk pembangkitan

data acak. Bila kita tidak mengeset titik tersebut,
maka titik tersebut akan ditentukan oleh minitab.
- Random data : membangkitkan data acak dari
berbagai distribusi
- Probability distributions : menghitung peluang dan
distribusi kumulatif peluang dan inversnya dari
berbagai distribusi peluang.
- Matrices : merupakan sub menu untuk menghitung
matriks dan operasi-operasinya
Adapun tampilan menu calc adalah
-
5. Menu Stat
Sub-sub menu pada menu stat adalah :
- Fit interceps : mendefault intersep pada persamaan
regresi
- Basic statistics : a) descriptiv statistics : menampilkan
ukuran-ukuran statistics, seperti mean, median,
trimean, standart deviasi, kuartil, maksimum dan
MODUL 1
10
minimum, b) uji hipotesis 1 sampel, 2 sampel , c)

correlation, d) covariance, e) normallity test
- Regression : mencari persamaan regresi serta
analisisnya, baik regresi linier maupun non linier untuk
kuantitatif maupun kualitatif
- Anova : menganalisis perbedaan lebih dari dua
populasi berdasarkan nilai ragam
- DOE : membuat desain rancangan percobaan faktorial
- Control charts : membuat bagan-bagan kendali
- Quality tools : mengalisis data untuk pengendalian
kualitas
- Reliability/survival : membuat plot untuk analisis
kehandalan sistem
- Multivariate : menganalisis data banyak peubah
- Time series : menganalisis data deret waktu untuk
peramalan
- Tables : membuat tabel kontingensi dan analisis
korespondensi
- Nonparametrik : menganalisis data kualitatif tanpa
asumsi distribusi tertentu
- EDA (Eksploratory Data Analysis) : memahami dan
mengalisis data melalui diagram dahan daun, box plot,
garis resisten, dll
- Power and sample size : digunakan untuk menghitung
power (peluang kita akan menolak H0 ketika ia salah),
ukuran sampel, perbedaan minimum (ditampilkan
sebagai nilai proporsi alternatif) pada uji satu proporsi.
Tampilan menu stat adalah sebagai berikut :
MODUL 1
11
6. Menu Graph
Pada menu graph berisi sub-sub menu seperti pada
tampilan di bawah yang digunakan untuk membuat grafikgrafik seperti histogram, diagram lingkaran, plot, countur,
plot untuk data time series, box plot, diagram dahan daun.
Untuk grafik-grafik tertentu dapat ditampilkan dalam dua
dimensi maupun tiga dimensi.
MODUL 1
12
7. Menu Editor
Berikut adalah sub-sub menu editor pada worksheet :
- Next column : memindahkan kursor ke kolom
berikutnya
- Go to active cell : memindahkan kursor ke sell yang
aktif
- Format column : memformat kolom dalam numerik,
tanggal, text.
- Column : mengatur ukuran-ukuran kolom
MODUL 1
13
Formulas : menampilkan formula-formula ke kolom dan

menghitung formula secara otomatis.
- Worksheet : mengedit sel yang sedang aktif dan
merubah arah inputan
- Define custom list : mengurutkan data
- Clipboard setting : merubah setting untuk data hilang
Adapun tampilan menu editor adalah :
-
Berikut adalah sub-sub menu pada menu editor session :

- Next command : memindahkan kursor ke command
berikutnya
- Previous command : memindahkan kursor ke
command sebelumnya
- Enable command language : menampilkan bahasa
pemrograman yang dieksekusi , MTB >
MODUL 1
14
Output editable : mengeset tampilan output hanya

dapat di baca
Find : mencari kata tertentu dalam lingkup session
Replace : mencari kata tertentu dan menggantinya
dengan kata lain dalam lingkup session
Apply Font : command font untuk memberlakukan
pemilihan font untuk I/O, title, command.
8. Tools
Adapun sub-submenu pada menu tools adalah
- Microsoft Calculator : Menampilkan menu calculator
microsoft
- Notepad : Menampilkan notepad
- Windows Explorer : Menampilkan menu windows
explorer
- Toolbars : Untuk men-setting tool tool yang ingin
ditampilkan atau tidak
- Status Bar : Status bar terletak dibagian bawah layar
dan menampilkan pesan yang menjelaskan item menu
dan toolbars yang saat ini sedang aktif.
MODUL 1
15
Customize
:
Digunakan
untuk
mengedit/menambah/menampilkan shortcut perintah
(command), Toolbars, tool dan lain-lain pada Minitab
Options : Digunakan untuk merubah dan menyimpan
settingan standar untuk berbagai macam operasi
Manage
Profiles
:Digunakan
untuk
membuat,
menghapus, mengaktifkan atau menonaktifkan satu
atau beberapa profil termasuk mengubah urutan nya.
File Security :digunakan untuk melindungi file proyek
dari pihak lain
Tampilan menu tools adalah
9. Menu Windows
Sub-sub menu pada menu windows digunakan untuk
mengatur tampilan dari windows minitab dan menyimpan
data, session, grafik yang telah dibuat untuk sementara,
yaitu :
MODUL 1
16
10. Menu Help

Menu ini digunakan untuk membantu user, apabila
terdapat kesulitan waktu menggunakan minitab, baik
masalah teori, maupun commandnya.
MODUL 1
17
1.2. Mengenal Data

1.2.1 Populasi dan sampel
Persoalan-persoalan yang muncul dalam berbagai bidang,
hampir seratus persen berhubungan dengan data. Data dalam
bidang statistika merupakan keterangan atau informasi
mengenai suatu kejadian, biasanya dinyatakan dengan angka.
Diharapkan nantinya data dapat memberikan informasi lebih
banyak bagi yang bersangkutan. Sebelum membahas tentang
data, terlebih dahulu akan dibahas sekilas tentang statistika,
populasi, dan sampel. Statistika yaitu suatu ilmu yang
mempelajari tentang data, meliputi teknik pengambilan data,
pengolahan dan penyajiannya, kemudian analisis dan
kesimpulan serta pengambilan keputusan dari kesimpulan
yang diperoleh lewat analisis. Sedangkan data itu sendiri
MODUL 1
18
merupakan keterangan yang menggambarkan kondisi saat

itu.
Berdasarkan sumbernya data dibedakan menjadi dua, yaitu 1)
data primer dan 2) data sekunder. Data primer adalah
keteranngan atau informasi secara umum yang diperoleh oleh
dari penelitian peneliti sendiri. Sedangkan data sekunder
merupakan data yang diambil dari penelitian orang lain pada
suatu publikasi.
Berkaitan dengan pengambilan data, terdapat dua istilah
yaitu populasi dan sampel. Populasi adalah seluruh objek
yang diamati. Sedangkan sampel adalah objek yang diamati
adalah sebagian dari populasi. Diharapkan pengambilan
sampel yang dilakukan dapat mewakili populasi. Beberapa hal
yang mendasari pengambilan sampel adalah :
1. Waktu
Bila waktu untuk penelitian terbatas, maka pengambilan
sampel dapat dipilih sebagai alternatif pengambilan data.
2. Biaya
Untuk penelitian mengenai suatu komponen yang
harganya mahal, bila pengambilan populasi dilakukan,
maka biaya yang dikeluarkan akan besar. Sehingga untuk
biaya yang terbatas, perlu dilakukan pengambilan sampel.
3. Populasi tidak pasti
Salah satu contoh populasi tidak pasti adalah, bila
penelitian kita tentang orang berpenyakit flu burung,
maka kita akan kesulitan menentukan populasinya, karena
tanpa pemeriksaan akan sulit ditentukan seseorang kena
flu burung atau tidak. Sehingga pengambilan sampel perlu
dilakukan yaitu pasien flu burung pada suatu rumah sakit.
MODUL 1
19
4. Ketelitian
Hal ini berhubungan dengan waktu dan biaya yang
terbatas. Misal biaya dan waktu penelitian terbatas, maka
jumlah tenaga yang membantu penelitian akan menjadi
pertimbangan,
sehingga
hasilnya
pengolahannya
berpengaruh pada tingkat ketelitian.
1.2.2 Skala pengukuran
Skala pengukuran merupakan bagian yang paling mendekati
pengukuran data baik secara diskret maupun kontinu. Skala
ini sangat penting, karena berkaitan dengan pemilihan teknik
analisis statistika yang sangat bergantung pada sifat data
dan skala pengukuran yang digunakan. Ditinjau berdasarkan
skala pengukurannya, data dapat dibedakan menjadi
beberapa kelompok, yaitu ( dari yang terendah sampai yang
tertinggi ) :
a. Skala Nominal
Data yang termasuk dalam kelompok ini memiliki ciri
bahwa data tidak memiliki tingkatan. Satu satunya
operator matematika yang berlaku adalah persamaan dan
pertidaksamaan.
Contohnya adalah data tentang jenis kelamin, agama,
jenis penyakit dan sebagainya.
b. Skala Ordinal
Sudah ada tingkatan pada data yang masuk kelompok ini,
hanya saja belum ada ketentuan jarak yang sama antar
tingkatan,serta ada hubungan lebih dari.
Contohnya adalah data tentang golongan kepegawaian,
kepangkatan, nilai huruf, peserta kontes kecantikan, jenis
komputer dan sebagainya.
MODUL 1
20
c. Skala Interval
Selain sudah memiliki tingkatan seperti data pada skala
ordinal, data yang masuk dalam kelompok ini juga
memiliki sifat bahwa jarak antar tingkatan adalah sama.
Hal ini diperiksa melalui selisih antar tingkatan selalu
tetap Sebagai contoh data suhu yang diukur dalam
Celcius, selisih antara suhu 30 dan 29 akan sama dengan
selisih suhu 10 dan 11 atau dengan yang lainnya. Ciri lain
dari data ini adalah nilai 0 belum memiliki arti sebenarnya
( tidak ada).
Contohnya adalah suhu 0 derajat bukan berarti tidak ada
suhu, tahun 0 bukan berarti tidak ada tahun.
d. Skala Rasio
Data yang memiliki skala ini memiliki tingkatan yang
paling tinggi. Semua sifat pada skala interval juga ada
pada data skala rasio ini. Tambahan sifat untuk jenis data
ini adalah nilai 0 sudah memiliki arti yang sebenarnya (
tidak ada ).
Contoh adalah data tentang berat, tinggi, harga, volume
dan sebagainya.
Dengan mengetahui jenis data yang akan diolah, maka kita
dapat menentukan analisis yang tepat untuk data tersebut.
Sebagai contoh data yang memiliki skala Nominal hanya
dapat disajikan dalam bentuk pie chart, bar chart dan tidak
dapat ditentukan ukuran ukuran statistik seperti mean,
standard deviation
dan sebagainya. Data yang berskala
Ordinal selain dapat dianalisa seperti nominal juga dapat
dianalisa lebih lanjut tetapi sebelumnya harus ditransformasi
ke bentuk numerik. Tetapi, kadang untuk pengolahan lebih
lanjut, data berskala ordinal dan nominal dapat diolah dengan
MODUL 1
21
menggunakan statistika nonparametrik. Sedangkan data yang

berskala interval atau Rasio dapat dilakukan analisa yang
lebih lengkap secara langsung. Analisa yang dapat dilakukan
pada data dengan kedua skala terakhir ini relatif sama.
1.3 Metode Sampling

Ditinjau dari pengambilan sampelnya, ada beberapa metode
sampling (metode pengambilan sampel ) yaitu :
1. Acak sederhana
Pada metode ini, pertama kita tentukan populasi yang
akan diambil sampelnya. Misalkan jumlah populasi = 200,
maka untuk setiap unit populasi tersebut diberikan nomor
dari 1 sampai 200. Bila diinginkan jumlah sampel sama
dengan 10, dengan menggunakan tabel random (lampiran
A) dapat ditentukan 10 angka yang akan menentukan
nomor unit populasi yang akan diambil.
Misalkan dipilih baris 5 kolom 4,5 dan 6 sebagai titik awal,
dan dipilih arah ke kanan (boleh ke atas,kiri atau bawah)
maka nomor sampel secara random yang diperoleh adalah
532, 115, 916, 239, 505, 956, 250, 961, 207, 868
Karena jumlah populasi = 200, maka angka angka yang
melebihi 200 akan dihilangkan digit ratusannya. Sehingga
nomor sampel randomnya menjadi
32, 115, 16, 39, 05, 56, 50, 61, 07, 68
Banyaknya digit bilangan random sebagai titik awal
tergantung dari banyaknya digit maksimal populasi.
2. Random Berstrata ( berlapis )
MODUL 1
22
Dalam metode ini, langkah pertama adalah populasi

dikelompokkan dalam beberapa kelompok agar lebih
homogen, kemudian dari masing masing kelompok
diambil sampel berukuran tertentu ( secara proporsional )
secara acak seperti pada metode pertama.
3. Sistematik
Dalam metode ini pertama tama populasi diberi nomor
dari 1 sampai N. Kemudian secara acak ditentukan sebuah
nomor antara 1 sampai N (misal k) dan dibuat suatu
barisan aritmatika dengan suku awal k dengan
pertambahan tertentu sampai didapat n data. Bila suatu
suku bernilai lebih dari N maka suku tersebut harus
dikurangi N atau kelipatannya. Nilai penambahan adalah
bilangan bulat sedemikian hingga nilainya dekat dengan
N
dengan N : ukuran populasi dan n : ukuran sampel.
n
Contoh
Sebuah populasi berukuran 100 dan akan diambil sampel
berukuran 15. Misalkan bilangan acak pertama dipilih 70
agar merata maka pertambahannya bisa dipilih sekitar 7.
Hasil selengkapnya bisa dilihat pada tabel berikut :
N
o
1
2
3
MODUL 1
Baris
an
70
77
84
Sampel yg
terpilih
70
77
84
23
4
5
6
7
8
9
10
11
12
13
14
15
4.
91
98
105
112
119
126
133
140
147
154
161
168
91
98
5
12
19
26
33
40
47
54
61
68
Bergerombol ( cluster )
Pada metode ini teknik yang digunakan mirip dengan
metode acak sederhana hanya saja disini yang menjadi
unit sampelnya adalah berupa cluster cluster yang
mana masing masing cluster berisi elemen elemen
yang yang lebih kecil. Yang menjadi pedoman untuk
menentukan cluster adalah bahwa cluster cluster
tersebut memiliki karakteristik yang hampir sama.
Contoh
Sebuah populasi berukuran 1000 tetapi dapat
dikelompokan dalam kluster kluster yang berukuran
10, jadi total klusternya adalah 100. Misalkan dari 100
cluster tersebut akan diteliti sebanyak 6 cluster maka
dengan metode acak sederhana dapat ditentukan 6
kluster yang terpilih. Unit unit sampel yang diteliti
adalah keseluruhan unit populasi atau sebagian unit
yang terletak didalam 6 kluster terpilih tersebut.
MODUL 1
24

Menentukan sampel dengan beberapa metode sampling
A. Acak sederhana
Pada metode ini, pertama kita tentukan populasi yang
akan diambil sampelnya. Misalkan jumlah populasi = 200,
maka untuk setiap unit populasi tersebut diberikan nomor
dari 1 sampai 200. Bila diinginkan jumlah sampel sama
dengan 20, dengan menggunakan tabel random dapat
ditentukan 20 angka yang akan menentukan nomor unit
populasi yang akan diambil. Adapun langkah-langkahnya
adalah :
1. Pilih calc, make patterned Data kemudian Simple Set
o Numbers
2. Isilah tabel yang keluar sesuai tabel berikut
Pada langkah ini merupakan proses pemberian nomor

populasi
MODUL 1
25
3. Pilih calc,Random
Columns
Data
kemudian
Sample
From
4. Isilah tabel yang keluar sesuai tabel berikut ( proses ini

merupakan pengambilan sampel berukuran 20 secara
acak ). Dalam langkah ini kemungkinan setiap orang akan
mendapatkan hasil yang berbeda.
5. Hasil yang keluar diatas merupakan nomor nomor unit

populasi yang akan diambil sebagai sampel (pada kolom
sampel) yaitu :
Samp
el
72
10
102
156
64
169
MODUL 1
26
2
15
147
164
126
117
121
48
176
110
114
199
79
135
B. Random Berstrata (berlapis)

Misalkan dimiliki data populasi yang terdiri atas 60
mahasiswa jurusan Teknik Telekomunikasi, 50 mahasiswa
Teknik Informatika dan 40 mahasiswa Teknik Industri. Bila
ingin diambil sampel sebanyak 20 mahasiswa secara
sistematis maka dilakukan dengan langkah langkah
berikut .
1. Buat nomor 1 sampai 60 untuk mahasiswa Teknik
Telekomunikasi, 1 sampai 50 untuk Teknik Informatika dan
1 sampai 40 untuk Teknik Industri.
2. Hitung jumlah sampel untuk masing masing jurusan.
Teknik Telekomunikasi
MODUL 1
27
n1
60
x 20 8
60 50 40
Teknik Informatika
n2
50
x 20 6
60 50 40
Teknik Industri
n3
40
x 20 6
60 50 40
3. Buat patterned data sebanyak 60,50 dan 40 seperti pada

langkah sebelumnya kemudian simpan(Store samples
in) dalam kolom yang terpisah(C3,C4 dan C5).
4. Lakukan pengambilan secara acak untuk masing masing
jurusan(patterned data) seperti pada pengambilan sampel
acak sederhana dengan ketentuan 8 berasal dari jurusan
Teknik Telekomunikasi(C3), 6 dari jurusan Informatika(C4)
dan 6 orang dari jurusan Teknik Industri(C5).
C. Sistematis
Misalkan dimiliki populasi sebanyak 200 dan akan diambil
sampel sebanyak 30, maka langkah langkahnya adalah
sebagai berikut
1. Tentukan salah satu nilai sebagai titik awal misalkan 50.
2. Nilai pertambahan
200
7
30
3. Buat patterned data pada file baru dengan nilai

pertambahan (in step of) = 7, nilai awal(From first
value) = 50 dan nilai akhir (To last value) = 260.
MODUL 1
28
4. Ambil 30 nomor sampel yang pertama, hasilnya adalah

N
o
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
MODUL 1
Baris
an
50
57
64
71
78
85
92
99
106
113
120
127
134
141
148
155
162
169
176
183
190
197
204
211
218
225
232
239
Sampel yg
terpilih
50
57
64
71
78
85
92
99
106
113
120
127
134
141
148
155
162
169
176
183
190
197
04
11
18
25
32
39
29
29
30
246
253
46
53
D. Bergerombol
Misalkan akan diteliti kualitas suatu minuman mineral botol
yang dikemas dalam kotak. Jumlah kotak keseluruhan adalah
100 kotak dimana masing masing kotak berisi 10 botol dan
sampel yang diinginkan adalah 50 botol. Alternatif yang dapat
dilakukan antara lain dari 100 kotak diambil 5 kotak secara
acak kemudian semua botol dalam kotak tersebut diteliti.
Alternatif lain yang dapat dipilih dari 100 kotak tersebut
dipilih 10 kotak acak kemudian dari 10 kotak tersebut dipilih 5
botol secara acak. Misalkan alternatif kedua yang dipilih :
1. Beri nomor 1 sampai 100 semua kotak yang dimiliki.
2. Buat patterned data pada file baru sebanyak 100 seperti
pada langkah sebelumnya kemudian simpan dalam kolom
yang tertentu(C1)
3. Ambil 10 sampel secara acak berdasarkan kolom C1
simpan pada C2.
4. Beri nomor 1 sampai 10 pada seluruh botol untuk 10 kotak
yang terpilih.
5. Buat patterned data pada file baru sebanyak 10 seperti
pada langkah sebelumnya kemudian simpan dalam kolom
C3
6. Ambil 5 sampel secara acak berdasarkan kolom C3 simpan
pada C4, ulangi sampai 10X dan simpan dalam kolom
yang berbeda.
7. Semua nomor sampel yang terpilih pada masing masing
kotak merupakan unit sampel yang akan diteliti.
Latihan
MODUL 1
30
1.
2.
3.
4.
Tentukan sampel berukuran 30 dari populasi dengan

ukuan 300
Tentukan sampel berukuran 30 yang diambil dari
populasi yang dikelompokkan dalam 4 kelompok dengan
ukuran 25,50,75 dan 100
Tentukan sampel berukuran 20 yang diambil dari
populasi berukuran 200 dengan metode sistematik
Suatu populasi berukuran 500 dan dikelompokkan dalam
25 kluster. Bila nomor populasi 1 20 masuk dalam
kluster 1, nomor populasi 21 40 masuk dalam kluster
2 dst. Bila dari 25 kluster tersebut diambil 5 secara acak,
tentukan nomor nomor populasi mana yang akan
masuk dalam sampel !
MODUL 1
31
2 STATISTIKA DESKRIPTIF
Overview
Modul ini memberikan panduan secara singkat tentang teknik

penyajian dan analisis data secara deskriptif. Pada tahap
awal, mahasiswa dikenalkan serta diajarkan menampilkan
pada beberapa ukuran statistik seperti ukuran pemusatan,
ukuran penyebaran dan ukuran letak dengan menggunakan
software minitab. Ukuran ukuran ini adalah ukuran ukuran
sering yang digunakan dalam penyajian data secara
deskriptif. Pada tahap selanjutnya mahasiswa akan diajarkan
cara menyajikan data dalam bentuk tabel frekuensi dan juga
dalam graph seperti : histogram, box plot dan diagram dahan
daun beserta analisa hasilnya
Tujuan
1. Mahasiswa dapat menentukan beberapa ukuran

pemusatan dan penyebaran data
2. Mahasiswa dapat membuat tabel distribusi frekuensi
3. Mahasiswa dapat menyajikan data dalam bentuk
histogram, box plot dan diagram dahan daun
MODUL 2
2.1 Ukuran Pemusatan

Terdapat beberapa ukuran pemusatan dalam statistika
deskriptif antara lain mean, median, dan modus.
Mean adalah ratarata dari data dan dinotasikan dengan
x atau , di mana x menyatakan ratarata sampel dan
menyatakan ratarata populasi. Secara umum mean
memiliki rumusan sebagai berikut :
xi
, n banyaknya sampel
n
xi
, N banyaknya populasi
N
x
Median adalah nilai yang membagi suatu gugus data yang

telah terurut menjadi 2 bagian yang sama. Median
memiliki sifat bahwa di bawah nilai median terdapat 50%
data. Cara menentukan median sebagai berikut : Misal X 1,
X2, , Xn adalah data yang sudah terurut dari kecil ke
besar, maka untuk n ganjil median X n
dan untuk n
2
X n X n 1 .
2
2
2
Modus yaitu nilai yang paling sering muncul dalam suatu

gugus data
genap median
Dalam penggunaannya, mean lebih sering digunakan dari

pada ukuran pemusatan lainnya karena keakuratannya dalam
menentukan nilai tengah suatu gugus data, walaupun ada
MODUL 2
beberapa kasus yang membuat nilai tengah menjadi kurang

tangguh, misalkan ada nilai yang dianggap ekstrim.
2.2 Ukuran Penyebaran

Beberapa ukuran penyebaran antara lain :
Range atau jangkauan yaitu menyatakan selisih antara
nilai maksimum dengan nilai minimum.
Variansi adalah nilai tengah dari kuadrat penyimpangan
antara xi terhadap x . Variansi merupakan ukuran
penyebaran yang sering digunakan dalam statistika
inferensia. Variansi dinotasikan S2 untuk sampel dan 2
untuk populasi. Variansi memiliki rumusan sebagai berikut
:
S2
xi x 2
n 1
xi 2
N
, di mana n banyaknya sampel

, di mana N banyayknya populasi
Simpangan baku merupakan akar dari variansi.
2.3 Ukuran Letak

Kuartil menyatakan nilainilai yang membagi gugus data
menjadi empat bagian yang sama besar. Q1 menyatakan
kuartil 1 yang memiliki sifat bahwa data terletak di bawah
Q1. Q2 sama dengan median. Sedangkan Q3 memiliki sifat
bahwa data terletak di bawah Q3. Untuk ukuran letak yang
lainnya adalh desil, persentil dll.
2.4 Distribusi Frekuensi
MODUL 2
Distribusi frekuensi yaitu penyajian data dalam bentuk tabel.

Di mana pada tabel tersebut menampilkan ciriciri penting
sejumlah data yang diperoleh dengan cara mengelompokkan
data menjadi beberapa kelas, kemudian dari masingmasing
kelas dihitung banyaknya pengamatan yang masuk.
Langkah-langkah membuat tabel frekuensi :
1. Menentukan banyaknya kelas dengan kaidah Sturges yaitu
N 2 k 1 , dimana k 1 3.3 log N . Banyaknya kelas
sebaiknya antara 5 sampai 15.
2. Menentukan interval kelas (KI)
range
KI
k
KI sebaiknya kelipatan 5.
3. Untuk komposisi kelas, perhatikan bahwa kelas tidak
tumpang tindih.
4. Bila tabel distribusi frekuensi, nantinya digunakan untuk
membuat histogram atau poligon, maka komposisinya
diubah ke bentuk batas kelas (batas bawah kikurangi
setengah dan batas atas di tambah setengah)
Bila data disajikan sebagai data kelompok, maka ukuran
pemusatan, penyebaran dan letak dapat dihitung dengan
menggunakan rumusan sebagai berikut :
- Ukuran pemusatan
n
f i xi
i 1
Mean : x
n
fi
i 1
xi = titik tengan kelas, f i = frekuensi kelas
MODUL 2
1 f f
t
sm
Median : ~
x Bb 2
fm
Bb = batas bawah kelas median
ft =
frekuensi
total
p = interval kelas
f m = frekuensi kelas median
f sm = frekuensi kumulatif sebelum median
Modus : x Bb
a
p
ab
a f m f am
b f m f bm
f m = frekuensi kelas modus
f am = frekuensi sebelum kelas modus
f bm = frekuensi sesudah kelas modus
-
Ukuran penyebaran
S
i 1
f i ci 2
f i ci
i 1
n n 1
Ukuran letak
Kuarti ( Qi , Q2 , Q3 )
Qi Bb
4i f t f sp
fp
p , i 1, 2, 3
f p = frekuensi pada kelas kuartil ke-i

f sp = frekuensi sebelum kuarti
MODUL 2
Pada tabel distribusi frekuensi, dapat juga diberikan

coding untuk mempermudah perhitungan statistik. Coding
dilakukan dengan cara membagi kelas menjadi dua yaitu
kelas yang ditengah-tengah diberi kode nol, sedangkan dua
kelas di bawah dan di atasnya diberi kode negatif dan positif.
2.5 Penyajian dalam Bentuk Grafik
Histogram dibuat berdasarkan tabel distribusi frekuensi.

Bila datanya memiliki skala interval atau rasio, maka
histogram dapat digunakan untuk menyajikan data.
Box plot merupakan bentuk penyajian data yang hanya

menggunakan beberapa statistik yang disebut ringkasan
lima angka yaitu nilai minimum, Q1, median, Q3, nilai
maksimum. Pada box plot dapat juga ditentukan adanya
pencilan atau tidak. Pencilan yaitu suatu nilai pada data
yang apabila dibandingkan dengan nilai data yang lain
tidak konsisten. Pencilan dibedakan menjadi pencilan jauh
(dalam) dan pencilan jauh sekali (luar). Untuk menentukan
pencilan digunakan rumusan sebagai berikut :
Pagar dalam (p)
p1 Q1 1.5 Q3 Q1
Pagar luar (P)
P1 Q1 2 Q3 Q1
p 2 Q3 1.5 Q3 Q1
P2 Q3 2 Q3 Q1
Pencilan dikatagorikan sebagai pencilan jauh bila letaknya

data di antara pagar dalam dan pagar luar. Sedangkan
pencilan jauh sekali, bila data di luar pagar luar.
MODUL 2
Diagram dahan daun adalah salah satu teknik penyajian

data yang menggunakan data asli secara langsung. Pada
dasarnya dalam diagram dahan daun, penyajian data
terbagi atas dua kolom yaitu dahan dan daun, dimana
dahan berisi data dengan satuan yang lebih besar dari
pada kolom daun.
Dari ketiga bentuk penyajian data di atas, dapat dilihat

bentuk distribusi data, apakah simetri, menjulur ke kiri atau
ke kanan. Sedangkan untuk memeriksa kemencengan
digunakan metode Pearson yaitu
x~
x
. Jika 0 , data
S
menceng ke kiri dan 0 , data menceng ke kanan.

Data adalah data penjualan voucher telepon di lima kota
provinsi Jawa barat :
Bula
n
1
2
3
4
5
6
7
8
9
10
11
Bandu
ng
42
45
51
61
69
76
78
78
72
62
51
MODUL 2
Sukabu
mi
8
14
25
43
54
64
71
69
58
47
29
Gar
ut
32
33
41
52
62
72
77
75
68
58
47
Tasi
k
56
60
58
62
63
68
69
71
69
67
61
Bog
or
51
58
57
67
81
88
94
93
85
74
61
7
12
44
16
35
58
55
Langkah-langkah menggunakan software minitab 15 adalah :

1. Ketikkan atau copy data tersebut pada worksheet minitab
2. Pilih menu stat, kemudian basic statistics, lalu klik
summary graphics
3. Pada kotak dialog, isi kolom tempat data pada variables,

lalu klik OK
MODUL 2
4. Hasil yang diperoleh adalah sebagai berikut :
MODUL 2
MODUL 2
10
MODUL 2
11
Dari keempat kota (Bandung, Sukabumi, garut, dan tasik)

rata-rata penjualan voucher telepon tiap bulannya adalah
kota tasik yaitu 63.5 dengan variansi terkecil 26,091. Untuk
kota Bandung dan Garut penjualan voucher tiap bulannya
hampir merata, kota sukabumi penjualan terbanyak pada
bulan-bulan terakhir, sedangkan untuk kota tasik penjualan
terbanyak pada bulan-bulan pertama. (Lakukan pengolahan
data penjualan voucher di kota Bogor dan analisis)
MODUL 2
12
Latihan
1. Jarak (mil) yang ditempuh
gallon bahan baker adalah:
15. 16. 18. 16. 17.
7
2
2
3
9
17. 18. 16. 16. 16.
6
1
7
7
0
18. 17. 14. 17. 17.
6
1
1
5
0
16. 17. 16. 18. 15.
0
7
1
6
2
17. 16. 16. 16. 17.
0
9
9
7
3
17. 15. 15. 17. 16.
0
6
6
9
0
14. 17. 15. 17. 17.
7
1
2
0
8
16. 17. 18. 14. 16.
5
7
8
6
5
14. 17. 16. 18. 15.
9
5
1
5
8
17. 15. 17. 17. 16.
1
9
1
1
4
oleh suatu tipe kendaraan per

18.
1
17.
4
17.
6
17.
1
16.
3
17.
7
16.
1
16.
6
16.
9
15.
6
16.
8
17.
0
15.
6
19.
5
17.
3
18.
2
18.
2
15.
6
17.
3
16.
3
a. Buatlah diagram dahan daun

b. Buat tabel distribusi frekuensi dan histogramnya
c. Hitung ukuran pemusatan, penyebaran, dan letak,
kemudian buat box plotnya
d. Kesimpulan apa yang bisa dinyatakan dari data
tersebut , berdasarkan a, b, c.
MODUL 2
13
e. Berapa persenkah jarak dari mobil tersebut yang

kurang dari 15 mil/gallon, antara 15 dan 18 mil/gallon,
dan lebih dari 18 mil/gallon.
2. Suatu penelitian dilakukan untuk mengetahui waktu
respon sirkuit yang digunakan pada kalkulator elektronik.
Data yang diperoleh sebagai berikut :
2
5
2
2
1
5
2
0
2
3
3
0
2
8
2
2
1
7
1
9
3
3
1
8
2
3
3
1
2
7
2
2
2
5
1
9
2
0
1
5
2
8
2
5
2
4
1
6
1
9
a. Buat box plot dari data tersebut

b. Buat tabel distribusi frekuensi dan histogram
c. Analisis data tersebut dari hasil a dan b
3. Ketikan data score toefl dari 100 mahasiswa berikut pada
kolom minitab
35
6
42
3
42
0
45
0
MODUL 2
51
0
50
0
46
0
46
9
34
5
56
0
51
3
42
6
40
0
45
6
45
0
47
6
48
0
50
0
40
0
42
7
14
45
8
40
0
38
6
52
0
50
0
39
0
47
5
46
5
47
6
47
5
51
3
40
0
47
6
48
2
34
6
40
0
MODUL 2
43
6
40
0
32
0
48
0
47
9
48
0
40
0
50
0
36
0
52
0
34
8
36
5
47
0
47
3
50
0
42
8
49
0
47
5
51
8
36
0
40
0
43
6
46
3
52
3
50
0
50
0
52
0
50
0
51
8
47
6
48
2
34
5
47
5
50
0
51
8
34
6
42
0
46
3
46
0
40
0
51
5
37
5
44
5
42
6
45
0
45
5
45
6
46
8
48
0
36
8
35
0
42
3
44
6
46
5
52
5
46
8
46
5
47
5
52
5
34
2
38
6
34
6
42
0
42
3
15
Buat diagram dahan daun, tabel distribusi frekuensi,

histogram, lalu beri kesimpulan
KENORMALAN DATA
Overview
1. Modul ini memberikan pengenalan singkat tentang

karakteristik data yang berdistribusi normal dan
pengujian kenormalan data. Karakteristik data
berdistribusi normal menyatakan gambaran dari data
yang berdistribusi normal ditinjau secara matematis.
Karakteristik data belum bisa digunakan dalam
penentuan kenormalan data. Untuk menentukan
kenormalan data, dapat digunakan beberapa uji
kenormalan. Modul ini menyajikan 3 buah uji kenormalan
yang dapat digunakan untuk menguji kenormalan suatu
data dengan ukuran statistik yang berbeda beda yaitu
Statistik ShapiroWilk W, Statistik AndersonDarling dan
Statistik KolmogorovSmirnov.
MODUL 2
16
Tujuan
1. Mahasiswa mengenal tentang data berdistribusi normal

2. Mahasiswa dapat menguji kenormalan data
3.1 Distribusi normal

Distribusi peluang kontinu yang paling penting adalah
distribusi normal. Grafik dari suatu distribusi normal disebut
kurva normal, bentuknya seperti lonceng pada gambar
dibawah ini.
Suatu peubah acak X yang distribusinya
berbentuk lonceng, dinamakan peubah acak normal.
Persamaan matematika dari distribusi peluang peubah acak
normal kontinu bergantung pada dua parameter yaitu
(rataan) dan (simpangan baku). Dengan demikian fungsi
densitas X dapat dinyatakan oleh :
x 2
1
1
f x
e 2
< X < .
2
MODUL 2
17
Sifat-sifat distribusi normal :

1.
x dx
2. f x 0 , x
lim f x 0 dan lim f
3. x
x 0
4. f x f x
5. Nilai maksimum dari f terjadi pada x
6. Titik belok dari f terjadi pada x
Kurva setiap distribusi kontinu dibuat sedemikian rupa
sehingga luas daerah dibawah kurva diantara dua koordinat
x x1 dan x x 2 sama dengan peluang peubah acak X
antara x x1 dan
sebagai berikut :
x x 2 . Hal tersebut dapat digambarkan
x1
MODUL 2
x2
x
18
P ( x1 X x 2 ) =
x2
n( x ; , ) dx
x1
x2
2 x1
x 2
1
2
dx
= Luas daerah yang diarsir

Untuk mengatasi kesulitan dalam menghitung integral fungsi
densitas maka dibuat table luas kurva normal sehingga akan
memudahkan dalam penggunaannya.
3.2 Statistik uji kenormalan

Dalam statistika parametrik, distribusi normal mendasari
beberapa uji statistik. Misal statistik tstudent, Fisher, Khai
Square, dll. Sehingga dalam pengolahan data statistik,
biasanya diasumsikan data berasal dari populasi yang
berdistribusi normal. Ada dua cara untuk melihat kenormalan
data yaitu secara visual dan dengan uji statistik. Secara visual
dengan menggunakan histogram, dahan daun, box plot,
tetapi cara ini bersifat subyektif. Biasanya dengan uji statistik,
akan lebih obyektif untuk mengatakan data berdistribusi
normal.
Ada beberapa statistik uji kenormalan data antara lain :
2. Statistik ShapiroWilk W
Statistik ini dikembangkan oleh Shapiro dan Wilk tahun
1965. Statistik ini merupakan rasio antara dua penduga
ragam. Statistik ujinya dinamakan statistik W. Statistik W
ini mengukur straightness dari plot quantilquantilnya.
Bila nilai dari W 1, maka data dikatakan normal.
3. Statistik AndersonDarling
MODUL 2
19
Statistik ini dikembangkan oleh Anderson dan Darling

tahun 1954. Statistik AndersonDarling berdasarkan pada
fungsi distribusi empirik. Statistik ujinya dinamakan
statistik yang merupakan kuadrat dari selisih antara luas
histogram dengan luas daerah di bawah kurva normal.
Bila nilai Pvalue , maka data berdistribusi normal.
Biasanya digunakan untuk data berukuran besar.
4. Statistik KolmogorovSmirnov
Statistik ini menggunakan fungsi distribusi kumulatif dan
berdasarkan pada maksimum perbedaan antara dua
distribusi, yaitu distribusi normal dengan distribusi data
yang diamati. Biasanya digunakan untuk data berukuran
30. Bila nilai Pvalue , maka data berdistribusi
normal.

Contoh 1
Langkah-langkah
1. Data adalah data produksi minyak bumi dalam periode
waktu 14 bulan dari 9 lokasi sumur pengeboran. Ketikan
data ini pada kolom di minitab
MODUL 2
Sm
Sm
Sm
Sm
Sm
56
59
66
68
70
50
67
63
50
47
63
Smr
77
Sm
Sm
14
16
40
4
46
3
30
Sm
r
99
20
46
76
66
57
49
67
36
50
46
8
50
3
73
1
42
3
57
8
46
2
59
5
58
4
50
3
39
0
49
8
60
0
42
1
53
6
58
7
59
2
35
1
52
0
41
8
44
8
43
5
45
4
41
8
58
7
52
1
58
6
41
3
39
9
51
3
46
1
34
4
57
9
54
1
57
5
62
4
47
3
58
3
55
0
48
5
37
5
63
7
49
6
56
2
68
1
52
1
59
8
48
5
55
7
45
5
44
9
50
8
48
5
73
7
50
0
48
6
47
2
60
5
36
3
44
3
49
5
48
6
61
8
56
6
53
8
42
5
57
1
34
5
44
5
51
9
44
4
23
0
55
1
53
0
1
6
49
5
55
5
53
8
45
9
48
3
42
4
24
7
22
7
55
1
1
3
55
3
54
1
52
0
46
2
54
6
46
3
35
2
50
3
51
2
1
5
54
8
45
1
36
8
50
5
48
4
42
1
41
2
60
7
43
3
1
2
51
7
35
0
44
1
44
9
39
8
45
4
37
1
57
0
53
2
3
4
5
6
7
8
9
MODUL 2
21
2. Pilih menu stat, kemudian pilih basic statistik, lalu

normality test
3. Setelah muncul kotak dialog berikut, Ketik C1 pada isian

variable, lalu klik pilihan tests for normality (asumsi
0.05 )
Output masing-masing pilihan sebagai berikut :

ShapiroWilk
MODUL 2
22
Normal Probability Plot
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
200
300
400
500
600
700
produksi
Average: 498.310
StDev: 96.5048
N: 126
W-test for Normality

R:
0.9938
P-Value (approx): > 0.1000
Pada gambar terlihat bahwa nilai statistik W = 0.9938 1,

dengan pendekatan nilai Pvalue
> 0.1, maka dapat
dikatakan bahwa data berdistribusi normal.
Statistik AndersonDarling
MODUL 2
23
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
200
300
400
500
600
700
produksi
Average: 498.310
StDev: 96.5048
N: 126
Anderson-Darling Normality Test

A-Squared: 0.346
P-Value: 0.478
Dengan menggunakan statistik ini diperoleh nilai Pvalue =

0.478, nilai ini lebih besar dari pada nilai = 0.05.
MODUL 2
24
Statistik Kolmogorovsmirnov
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
200
300
400
500
600
700
produksi
Average: 498.310
StDev: 96.5048
N: 126
Kolmogorov-Smirnov Normality Test

D+: 0.036 D-: 0.050 D : 0.050
Approximate P-Value > 0.15
Pada gambar terlihat bahwa pendekatan nilai Pvalue > 0.15,

nilai ini lebih besar dari pada nilai = 0.05.
Dari ketiga output di atas, terlihat bahwa untuk ukuran data
besar, statistik AndersonDarling lebih powerfull.
Contoh 2
1. Buka software minitab kemudian pilih menu calc ,
Random Data kemudian binomial. Pada langkah ini kita
akan membangkitkan data yang berdistribusi binomial.
Pada box
yang keluar isilah sesuai isian berikut ini kemudian ok
MODUL 2
25
2. Data yang sudah dipeoleh ini kita anggap sebagai data

populasi. Dari data populasi ini selanjutnya akan kita ambil
beberapa sampel berukuran 5, 10 dan 20 untuk
selanjutnya akan dibandingkan variansi dari rataan
sampelnya. Dari menu utama pilih calc , Random Data
kemudian sample from column . Isilah box yang keluar
seperti isian berikut
MODUL 2
26
3. Ulangi langkah 2 sebanyak 5x untuk masing masing

ukuran sampel, jadi akan terdapat 5 sampel berukuran 5,
5 sampel ukuran 10 dan 5 sampel ukuran 20
4. Dari setiap sampel hitunglah rata ratanya kemudian
untuk setiap ukuran sampel hitunglah rata rata dan
variansinya. Anda bisa menggunakan software lain untuk
menghitung
ratarata
dan
variansinya
misalnya
microsoft Excel .Mungkin hasil yang keluar ini bisa
berbeda dengan hasil perhitungan anda
no
sampel ukuran 5ukuran 10 Ukuran 20
1
39.6
41.4
40.45
2
42.6
40.9
40.7
3
40
37.7
42.85
4
37
42.8
41.85
5
42
38.8
40.5
rata2
40.24
40.32
41.27
variansi 4.908
4.207
1.10575
Dari hasil diatas terlihat rata rata semua sampel
mendekati rata rata populasi yaitu =np = 40, tetapi
untuk ukuran n = 20 variansinya adalah yang terkecil, ini
juga dapat dilihat dari rataan sampel dari no 1 sampai 5
yang hanya berbeda tipis. Ini menunjukkan dengan
pengambilan sampel yang makin besar keakuratan
pendugaannya akan semakin tinggi.
5. Pada pembuktian distribusi rataan sampel, langkah
langkahnya sebenarnya tidak jauh berbeda dengan 4
langkah sebelumnya hanya saja dalam hal ini diperlukan
MODUL 2
27
jumlah pengacakan yang jauh lebih banyak daripada 4

langkah sebelumnya. Untuk itu akan digunakan progam
matlab untuk membantu meyelesaikan masalah ini.
6. Bila dilakukan dengan
tampilan berikut
software matlab,
akan keluar
Pada program tersebut, pada baris ketiga angka 500

menyatakan jumlah pengacakan Pada baris 4, perintah
random (0,1,100,1) menyatakan perintah pengambilan
sampel dari populasi yang memiliki mean 0, simpangan
baku 1, sampel berukuran 100 dari 1 populasi.
Pada baris 6 dan 7 mengandung arti pendefisian variabel
Y sebagai sampel acak pertama yang berukuran 100.
Pada baris 9, mean sampel 1,2,500 dihitung
Dan pada baris 12, dibuat histogram dari mean sampel
hasil perhitungan pada baris 9
MODUL 2
28
7. Sekarang ubahlah angka 100 pada baris 4 dan 6 dengan

angka 5. Jalankan program ini dengan memilih debug
kemudian run and save ( Dalam langkah ini kita
berusaha mengambil sampel acak berukuran 5).
Simpanlah output gambar/ histogram yang keluar dengan
file tersendiri. Ulangi langkah ini dengan mengganti angka
10, 20 dan 30.
8. Dari keempat histogram yang keluar tersebut, analisa
apakah keempat histogram sudah berbentuk kurva normal
baku dengan mean 0 dan simpangan baku 1? apakah ada
pengaruh ukuran sampel? jelaskan!
1.1
Going with Raw Sample Data
We could simply plot the raw, sample data in a histogram like this one:
MODUL 2
29
This histogram does show us the shape of the sample data and it is a good starting
point. We can see that this distribution is skewed to the right and probably non-normal.
However, this graph only tells us about the data from this specific example. You cant
make any inferences about the larger population.
What can be done to increase the usefulness of these data? First, identify the
distribution that your data follow. Once you do that, you can learn things about the
populationand you can create some cool-looking graphs!
MODUL 2
30
1.2
How to Identify the Distribution of Your Data
To identify the distribution, well go to Stat > Quality Tools > Individual Distribution
Identification in Minitab. This handy tool allows you to easily compare how well your
data fit 16 different distributions. It produces a lot of output both in the Session window
and graphs, but don't be intimidated. Before we walk through the output, there are 3
measures you need to know.
Anderson-Darling statistic (AD): Lower AD values indicate a better fit. Its generally
valid to compare AD values between distributions and go with the lowest.
P-value: You want a high p-value. A low p-value (e.g., < 0.05) indicates that the data
dont follow that distribution. For some 3-parameter distributions, the p-value is
impossible to calculate and is represented by asterisks.
LRT P: For 3-parameter distributions only, a low value indicates that adding the third
parameter is a significant improvement over the 2-Parameter version. A higher value
suggests that you may want to stick with the 2-Parameter version.
So, for my data, Ill fill out the main dialog like this:
MODUL 2
31
Lets dive into the output. Well start with the Goodness of Fit Test table below.
MODUL 2
32
The very first line shows our data are definitely not normally distributed, because the pvalue for Normal is less than 0.005!
We'll skip the two transformations (Box-Cox and Johnson) because we want to identify
the native distribution rather than transform it.
A good place to start is to skim through the AD values and look for the lowest. The
lowest AD is for 3-Parameter Weibull. However, the AD values for 3-Parameter
Lognormal, Largest Extreme Value, and 3-Parameter Gamma are all close. For the 3Parameter Weibull, the LRT P is significant (0.000), which means that the third
parameter significantly improves the fit. The LRT P is not significant for the other 3Parameter candidate distributions.
Given the lower AD value and the significant LRT P value, we can pick the 3-Parameter
Weibull distribution as the best fit for our data. We identified this distribution by looking
at the table in the Session window, but Minitab also creates a series of graphs that
provide most of the same information along with probability plots. You can see 3-
MODUL 2
33
Parameter Weibull in the graph below. The data points follow a fairly straight line, which
indicates a fit.
Now we know what the distribution isbut what are the distribution's parameter values?
For those, look at the next table down in the Minitab Session window output:
MODUL 2
34
1.3
How Does Identifying the Distribution of Data Help with

Analysis?
All right. Now we know that the body fat percentage data follow a 3-Parameter Weibull
distribution with a shape of 1.85718, a scale of 14.07043, and a threshold of 16.06038.
At this point you may be wondering, "How does that help us?" The answer: with this
information about the distribution, we can go beyond the raw sample data and make
statistical inferences about the larger population.
MODUL 2
35
Latihan
1. Data seperti contoh no. 1,
kemudian dilakukan
pengacakan 15 kali dan diambil sampel ukuran 10, 20, 30.
Buat histogram dengan kurva normalnya dan uji
kenormalannya.
2. Bangkitkan data dari komputer, kemudian lakukan
pengacakan 20 kali, dari data berdistribusi normal,
poisson dengan rata-rata 2, binomial dengan p = 0.6 dan
n = 15. Buatlah histogramnya.
MODUL 3
MODUL 3
TRANSFORMASI DATA
Overview
Modul ini memberikan panduan untuk melakukan tranformasi

data baik untuk satu angkatan data maupun beberapa
angkatan data. Transformasi terhadap satu angkatan data
biasanya dilakukan agar asumsi data berdistribusi normal
terpenuhi, sedangkan transformasi untuk beberapa data
biasanya dilakukan agar asumsi ragam sama pada beberapa
angkatan data terpenuhi. Tes kenormalan kemudian juga
dilakukan untuk melihat apakah transformasi yang dilakukan
sudah tepat.
Tujuan
1. Dapat melakukan transformasi data dengan menggunakan

Tangga Transformasi Tukey untuk melihat bagaimana
bentuk distribusi data setelah dilakukan transformasi
2. Dapat memilih transformasi yang tepat untuk meMODUL 4
normalkan data
4.1 Transformasi untuk satu angkatan data

Dalam ilmu statistik sering kali digunakan asumsi dari bentuk
data yang akan di analisa. Asumsi yang lazim digunakan
adalah distribusi Normal. Bentuk data yang berdistribusi
Normal dengan mean dapat digambarkan seperti grafik
berikut
Bila dilihat, data yang berdistribusi Normal akan simetris

terhadap dan sebagaian besar data akan mengelompok di
tengah. Dalam kenyataannya seringkali bentuk data yang
diperoleh tidak berbentuk seperti distribusi normal tetapi
berbentuk menjulur ke kanan seperti gambar berikut
Bentuk data yang lainnya adalah menjulur ke kiri yang

dapat dilihat pada gambar berikut :
MODUL 4

Agar asumsi bahwa data berdistribusi Normal tetap dipenuhi,
maka perlu dilakukan suatu transformasi terhadap data asli.
Transformasi dilakukan untuk satu angkatan data bila data
yang akan ditransformsi hanya satu angkatan data. Untuk
memilih fungsi transformasi yang tepat digunakan tangga
transformasi Tukey yang digambarkan sebagai berikut :
1
x2
1
x
Kuat
log x
sedang
lemah
x2
x3
10 x
lemah
sedang
kuat
MENJULUR KE KIRI
SIMETRIS MENJULUR KE KANAN
Tangga transformasi ini dapat diartikan sebagai berikut :
Transformasi 10 x akan membuat bentuk distribusi data
menjadi
menjulur kekanan
secara kuat,
sedangkan
transformasi
1
x2
akan membuat bentuk distribusi data
menjadi menjulur kekiri secara kuat. Sebagai contoh bila kita

memiliki data yang menjulur kekanan secara lemah maka kita
dapat transformasi
x agar data menjadi Normal, sebaliknya
bila data menjulur kekanan secara sedang maka transformasi
x3 agar data menjadi Normal. Penentuan bahwa suatu data
menjulur secara lemah,sedang atau kuat besifat subyektif
MODUL 4
sehingga akan lebih baik bila digunakan beberapa

transformasi sekaligus
kemudian baru dibandingkan
hasilnya. Penentuan apakah hasil transformasi sudah Normal
atau tidak adalah melalui uji kenormalan
4.2 Transformasi untuk beberapa angkatan data

(menyamakan sebaran)
Ketika dimiliki beberapa angkatan data, maka biasanya ingin
dilakukan pembandingan antara angkatan satu dengan
angkatan lainnya. Proses membandingkan ini lebih mudah
bila semua angkatan data memiliki
Bentuk distribusi baku
Sebaran data yang sama
Bila kedua syarat diatas sudah dipenuhi, maka untuk
membandingkan angkatan angkatan tersebut, cukup
dibandingkan masing masing tarafnya ( nilai Median ) saja.
Untuk menyamakan sebaran semua angkatan ( membuat
sebaran hampir sama), digunakan transformasi seperti pada
tangga transformasi Tukey tetapi dengan acuan yang sedikit
berbeda. Sebaran masing masing angkatan diukur dengan
dQ = Q3 Q1 yaitu simpangan kuartil.
Penentuan transformasi yang tepat dilakukan dengan
prosedur berikut
1.
Hitung taraf dari setiap angkatan
2.
Hitung sebaran dari setiap angkatan
3.
Tentukan Taraf terbesar (TA), Taraf terkecil (TB), Sebaran
yang berseuaian dengan TA (= SA) dan Sebaran yang
berseuaian dengan TB (= SB) dari seluruh angkatan
4.
Hitung koefisien arah b yang memiliki rumus
MODUL 4
log( S A ) log( S B )
log( T A ) log( TB )
Berdasarkan nilai b, pilihlah transformasi yang tepat sesuai

dengan tabel berikut
Nilai
b Transformasi
Keterangan
(disekitar)
yang dipilih
Makin kecil b > makin besar
Negatif
xk
k
(k : bulat)
0,5
x
1
Log x
1,5
4.3
1
x
1
x
Aplikasi Minitab
Berikut ini contoh data (tabel data transformasi) yang

menjulur ke kanan yang digambarkan dengan histogram.
Tabel data transformasi
7.2
2.3
1.8
5.9
17.3
2.0
4.8
10.9
MODUL 4
5.6
14.3
3.0
2.5
3.8
1.7
5.5
3.7
9.7
2.6
15.3
8.3
2.4
1.9
3.6
4.9
2.9
6.8
1.8
3.4
6.9
8.8
6.5
1.9
5
3.4
4.4
9.6
7.5
1.7
4.6
3.4
2.1
1.5
3.7
5.3
4.1
9.1
5.7
0.9
1.9
2.3
1.
2.
2.9
4.6
4.8
8.3
5.8
2.8
6.3
3.1
7.6
5.5
8.0
3.5
1.7
11.4
6.5
1.7
2.1
9.3
3.4
10.4
4.0
3.8
4.9
1.5
4.8
4.4
2.9
6.4
0.5
2.1
8.1
3.6
11.9
5.2
3.6
3.4
3.7
2.4
13.7
15.3
1.3
4.9
12.0
2.3
3.2
5.9
3.0
3.7
3.6
2.4
2.9
Buat file baru : file transformasi, kemudian simpan data

diatas pada kolom c1
Buat histogramnya
MODUL 4
Histogram menjulur ke kanan
F re q u e n cy
20
10
0
0
10
20
jlrkanan
3.
4.
Lakukan tes kenormalan data terhadap data C1

Dari hasil uji Anderson-Darling (lihat modul kenormalan
data) ,didapatkan p-value = 0.000 ini berarti secara
kuat disimpulkan bahwa data tidak berdistribusi Normal.
Lakukan transformasi x terhadap C1, simpan datanya
pada C2. Buat
Histogram berdasarkan data C2,
diperoleh
MODUL 4
Histogram Transformasi dg akar x
Frequency
15
10
0
0.5
1.5
2.5
3.5
4.5
akar x
5.

Dari Dari hasil uji Anderson-Darling,didapatkan p-value
= 0.001 ini berarti disimpulkan bahwa data juga tidak
berdistribusi Normal.
6.
Lakukan transformasi Log x terhadap C1, simpan

datanya pada C3. Histogram berdasarkan data C3,
diperoleh
MODUL 4
Histogram Transformasi dg log
Frequency
15
10
0
0.0
0.5
1.0
log x
7.

Dari hasil uji Anderson-Darling,didapatkan p-value =
0.849 ini berarti secara kuat disimpulkan bahwa data
berdistribusi Normal.
Dari kedua transformasi diatas dapat dilihat bahwa data yang

sebelumnya menjulur kekanan secara sedang, dengan
transformasi
x bentuk data menjadi menjulur ke kanan
secara lemah, sedangkan dengan transformasi Log x data
menjadi Normal. Nantinya yang diolah dengan statistik adalah
data Log x bukan data aslinya.
Sebagai eksperimen lainnya, lakukan tranformasi x2 atau x3 ,
simpan datanya pada C4, C5 kemudian buat histogram dan
lakukan tes kenormalan maka diperoleh bentuk data akan
MODUL 4
semakin menjulur kekanan seperti ditunjukkan dari histogram

berikut.
Histogram of hasil transformasi x2
35
30
Frequency
25
20
15
10
5
0
0
100
200
300
transf x
MODUL 4
10
Histogram of transformasi x3
80
70
Frequency
60
50
40
30
20
10
0
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
transf x
Latihan
Periksa distribusi data berikut, bila belum simetris, lakukan
transformasi yang tepat seperti pada langkah langkah
praktikum diatas
60
5
57
5
55
3
54
8
45
7
50
7
46
8
50
0
49
8
44
9
MODUL 4
63
3
66
1
42
0
42
5
45
1
47
7
49
8
46
6
58
8
58
9
11
35
6
44
5
44
8
45
0
46
8
50
1
44
3
48
9
44
3
42
6
46
4
42
8
45
5
55
2
44
3
48
5
51
3
55
8
48
6
47
8
42
6
49
3
55
5
54
2
51
0
67
7
76
3
73
8
60
8
43
3
46
0
48
5
MODUL 4
34
5
37
7
45
5
36
1
34
5
53
1
52
1
36
0
44
2
50
3
57
3
57
1
53
4
41
4
57
5
63
5
54
7
49
9
50
3
49
5
51
9
48
2
54
5
48
9
39
2
63
6
67
2
59
7
59
7
52
1
57
6
56
8
12
MODUL 4
13
UJI HIPOTESIS STATISTIK DAN

PROPORSI
Overview
Modul ini memberikan panduan untuk melakukan uji hipotesis

terhadap nilai tengah dan proporsi. Uji hipotesis terhadap
nilai tengah meliputi uji terhadap terhadap satu nilai tengah
maupun perbandingan antara dua nilai tengah, sedangkan uji
proporsi meliputi uji satu proporsi dan perbandingan dua
proporsi. Semua uji hipotesis yang dilakukan berdasarkan
beberapa asumsi yaitu ragam diketahui maupun ragam tidak
diketahui.
Tujuan
1. Mahasiswa memahami tentang uji hipotesis statistik

2. Mahasiswa memahami tentang uji satu nilai tengah
dengan diketahui atau tidak dan dapat menerapkannya
3. Mahasiswa memahami tentang uji selisih nilai tengah dari
dua sampel dengan diketahui atau tidak dan dapat
menerapkannya
4. Mahasiswa memahami tentang uji proporsi satu dan dua
proporsi
MODUL 5
5.1 Hipotesis statistik

Hipotesis statistik merupakan hal sangat penting dalam
statistika inferensia. Hipotesis statistik yaitu suatu anggapan
atau pernyataan yang mungkin benar atau tidak mengenai
satu populasi atau lebih. Suatu hipotesis dianggap benar atau
salah, tidak bias diketahui dengan pasti kecuali dilakukan
pemeriksaan terhadap seluruh populasi. Tetapi hal tersebut
tidak efisien. Untuk mengatasi hal tersebut dilakukan
pengambilan sampel secara acak.
Dalam uji hipotesis sering digunakan istilah menerima atau
menolak hipotesis yang dirumuskan, artinya jika diterima
maka hipotesis yang dirumuskan benar dan jika ditolak maka
berlaku sebaliknya. Dari hal tersebut, dapat dikatakan bahwa
perumusan suatu hipotesis sering dipengaruhi oleh bentuk
peluang dari kesimpulan yang salah. Hipotesis yang
dirumuskan dengan harapan akan ditolek disebut hipotesi nol.
Penolakan
terhadap
hipotesis
nol
tersebut
akan
mengakibatkan pada penerimaan terhadap suatu hipotesis
lain yang disebut hipotesis alternatif.
Prosedur pengambilan kesimpulan kadangkadang dapat
membawa pada kesimpulan yang salah. Dalam pengujian
hipotesis statistik, ada dua jenis kesalahan yaitu:
a. Kesalahan jenis pertama (galat jenis I)
Yaitu penolakan hipotesis nol, padahal hipotesis nol benar.
Peluang galat jenis I disebut taraf nyata yang dinotasikan
dengan . Biasanya taraf nyata disebut dengan ukuran
wilayah kritis.
MODUL 5
b. Kesalahan jenis kedua (galat jenis II)

Yaitu penerimaan hipotesis nol, padahal hipotesis nol
salah. Peluang galat jenis II dinotasikan dengan . Nilai
dari tidak mungkin dihitung, kecuali bila hipotesis
alternatifnya lebih spesifik.
Sifat dari pengujian hipotesis nol melawan hipotesis alternatif
ada dua yaitu :
Hipotesis alternatif yang bersifat dua arah
H0 : = 0
H1 : 0
Pada hipotesis jenis ini, wilayah kritisnya terbagi menjadi
dua bagian, yang letaknya pada masingmasing ekor dari
sebaran statistik ujinya.
Hipotesi alternatif yang bersifat satu arah
a) H0 : 0
atau
b) H0 : 0
H1 : > 0
H1 : < 0
Wilayah kritis untuk a) terletak seluruhnya di ekor sebelah
kanan dari sebaran statistik ujinya. Sedangkan untuk b)
sebaliknya.
Dalam menentukan keputusan akhir untuk menerima atau
menolak H0 , didasarkan pada wilayah kritis dengan pvalue
yang mendukung keberartian suatu uji dalam bentuk peluang.
Pvalue adalah taraf keberartian terkecil, sehingga nilai suatu
uji statistik yang diamati masih berarti.Bila pvalue , maka
H0 ditolak.
Prosedur
pengujian
langkahlangkah berikut :
MODUL 5
hipotesis
dapat
mengikuti
1.
2.
3.
4.
5.
6.
Merancang hipotesis nol dan hipotesis alternatif

Menguji kenormalan
Memilih taraf keberartian
Menguji kesamaan ragam
Menentukan dan menghitung nilai statistik uji yang sesuai
Menentukan daerah kritis dan membuat keputusan
apakah menerima atau menolak H0 (di mana pengambilan
keputusan dapat didasarkan pada tiga hal yaitu nilai
kristis dari statistik uji, selang kepercayaan, atau pvalue)
7. Membuat kesimpulan akhir mengenai sampel yang
diambil
5.1.1 Pengujian hipotesis untuk satu nilai tengah
X1, X2, , Xn merupakan peubah acak yang menyebar secara
normal dengan nilai tengah tidak diketahui. Perumusan
hipotesinya sebagai berikut :
H0 : = 0
atau H0 : 0
atau H0 : 0
H1 : 0
H1 : > 0
H1 : < 0
Pengujian hipotesis terhadap nilai tengah ada dua asumsi :
1. Ragam diketahui
Uji hipotesis untuk ratarata x, di mana hipotesis nol
menyebar normal dengan nilai tengah 0 dan simpangan
baku ratarata populasi /n, statistik ujinya adalah :
x 0
Kriteria penolakan terhadap hipotesis nol ditampilkan

dalam tabel berikut :
NO
Hipotesis
Kriteria penolakan
MODUL 5
Alternatif
1
H1 : 0
2
3
H1 : > 0
H1 : < 0
H0 ditolak pada saat Z Z/2 atau

Z Z1/2
H0 ditolak pada saat Z Z1
H0 ditolak pada saat Z Z
2. Ragam tidak diketahui

Bila ragam tidak diketahui, maka statistik ujinya adalah
tstudent, di mana ragam populasi diduga oleh ragam
sampel. Statistik ujinya didefinisikan sebagai berikut
x 0
s
n
Adapun kriteria penolakan terhadap hipotesis nol

dijelaskan pada tabel berikut
Hipotesis
NO
Kriteria penolakan
Alternatif
H0 ditolak saat t t/2, n1 atau t
1
H1 : 0
t1/2, n1
2
H1 : > 0
H0 ditolak pada saat t t1, n1
3
H1 : < 0
H0 ditolak pada saat t t, n1
5.1.2 Pengujian hipotesis untuk selisih dua nilai

tengah
X1, X2, , Xn dan Y1, Y2, , Yn merupakan dua peubah acak
yang saling bebas dan menyebar secara normal dengan nilai
MODUL 5
tengah x dan y, simpangan baku x dan y. Perumusan

hipotesinya sebagai berikut :
H0 : x y = 0
atau H0 : x y 0atau H0 : x y
0
H1 : x y 0
H1 : x y > 0
H1 :
x y < 0
Di mana 0 adalah suatu konstanta bernilai positif atau nol
yang menunjukkan selisih antara dua nilai tengah yang tidak
diketahui.seperti pada pengujian hipotesis untuk satu nilai
tengah, ada dua asumsi yaitu :
1. Ragam diketahui
Statistik uji didefinisikan sebagai berikut
x y 0
2
2x y
nx n y
Kriteria penolakan terhadap hipotesis nol adalah :

NO
Hipotesis
Alternatif
H1 : x y 0
2
3
H1 : x y > 0
H1 : x y < 0
Kriteria penolakan
H0 ditolak pada saat Z Z/2 atau
Z Z1/2
H0 ditolak pada saat Z Z1
H0 ditolak pada saat Z Z
2. Ragam tidak diketahui

Bila ragam tidak diketahui, maka sebelum dilakukan
pengujian hipotesis terlebih dahulu dilakukan pengujian
terhadap ragam. Pengujian tersebut dilakukan untuk
menduga apakah ragam kedua sampel sama atau tidak.
MODUL 5
Hipotesisnya adalah sebagai berikut : H0 : x = y

H1 :
x y
Sedangkan statistik ujinya adalah statistik uji Fisher yaitu
2
S maks
2
S min
Bila didapatkan bahwa F F(, (nx1, ny1)), maka H0 ditolak,

artinya ragam kedua sampel tidak sama. Sehingga derajat
bebas yang akan digunakan dalam statistik ujinya adalah
2
S 2 S y2
x
n
ny
x
v
S x2
ny
nx 1
ny 1
Statistik uji pengujian hipotesis terhadap selisih antara
dua nilai tengah untuk ragam berbeda adalah
x y 0
t
2
S x2 S y
nx n y
nx
S y2
Sedangkan untuk ragam sama, dalam statistik ujinya

menggunakan ragam gabungan, yaitu :
2
S gab
n x 1 S x2 n y
1 S y2
nx n y 2
dimana statistik ujinya adalah
MODUL 5
x y 0
S gab
1
1 .
nx n y
Kriteria penolakan terhadap hipotesis nol adalah :
NO
Hipotesis
Alternatif
H1 : x y 0
H1 : x y > 0
H0 ditolak pada saat t t1, m
H1 : x y < 0
H0 ditolak pada saat t t, m
Kriteria penolakan
H0 ditolak pada saat t t/2, m
atau t t1/2, m
5.1.3 Aplikasi dengan minitab

Teknologi telekomunikasi di Indonesia berkembang sangat
pesat, mulai dari teknologi berbasis AMPS, GSM, dan CDMA.
Kehadiran produk telekomunikasi berbasis CDMA, merupakan
alternatif bagi pengguna jasa telekomunikasi untuk memilih
yang kualitasnya terbaik dan termurah. Saat ini banyak
operator selular menggunakan teknologi berbasis CDMA,
antara lain Bakrie Telecom dengan produknya esia, Telkom
dengan flexi, dan Mobile-8 dengan fren. Suatu penelitian
dilakukan untuk mengetahui rata-rata pengguna produk esia,
MODUL 5
flexi, dan fren dari 15 kecamatan di kota Bandung. Berikut

adalah datanya :
NO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Fre
n
55
42
45
71
83
47
75
48
60
69
85
54
31
25
30
Fle
xi
60
33
39
61
40
94
71
61
77
64
65
70
80
61
50
Esi
a
37
60
35
61
31
56
65
78
59
27
30
45
38
25
35
Langkah-langkah pengolahan dengan menggunakan

minitab 15 :
1. Simpan data tersebut pada worksheet minitab
2. Kemudian uji kenormalan data, bila data sudah normal,
maka dilakukan uji dua ragam (ragam sama atau berbeda)
dengan cara pilih menu stat, lalu basic statistics,
kemudian dua ragam, maka akan muncul kotak dialog
seperti di bawah kemudian ketikkan kolom data pada isian
sampel, klik option atau storage bila perlu, lalu OK
MODUL 5
3. Hasil yang diperoleh sebagai berikut :
MODUL 5
10
Dari hasil yang diperoleh di atas, dapat diketahui

bahwa ragam kedua sampel sama, karena Pvalue =
0.582 > 0.05
4. Pengujian hipotesis, dilakukan dengan cara pilih stat,
basic statistics, kemudian pilih 2-sample t, kemudian
isi kotak dialog
MODUL 5
11
MODUL 5
12
Two-sample T for Fren vs Flexi

N Mean StDev SE Mean
Fren 15 54.7 19.0
4.9
Flexi 15 61.7 16.3
4.2
Difference = mu (Fren) - mu (Flexi)
Estimate for difference: -7.07
95% CI for difference: (-20.31, 6.18)
T-Test of difference = 0 (vs not =):
T-Value =-1.09 P-Value = 0.284 DF = 28
Both use Pooled StDev = 17.7062
Boxplot of Fren, Flexi

100
90
80
Data
70
60
50
40
30
20
Fren
Flexi
Untuk menolak atau menerima Ho dapat dilihat dari 3 hal

yaitu :
- Karena selang kepercayaan untuk selisih nilai tengah
adalah 20.31, 6.18 , sehingga nol termasuk di
selang tersebut, maka Ho diterima
MODUL 5
13
Pvalue = 0.284 > 0.05, maka Ho diterima

Nilai kritis (t hitung = -1.09 > t tabel) maka Ho
diterima
Karena Ho diterima, maka dapat disimpulkan bahwa ratarata jumlah pengguna produk fren dan flexi di 15
kecamatan kota Bandung sama. Hal itu dimungkinkan dua
produk tersebut masing-masing mempunyai kelebihan dan
kekurangan, sehingga konsumen akan memilih produk
yang sesuai dengan kebutuhannya.
6. Untuk latihan, lakukan langkah dan analisis yang sama
untuk fren vs esia, flexi vs esia.
5.2 Uji proporsi
Proporsi menyatakan perbandingan banyaknya sukses
terhadap total pengamatan. Bila x menyatakan banyaknya
sukses dari n ulangan, maka nilai proporsi p dihitung dengan
rumus : p
x
.Uji proporsi dapat dilakukan terhadap satu
n
nilai proporsi atau perbandingan beberapa nilai proporsi.

Asumsi yang digunakan adalah proporsi berdistribusi
binomial.
5.2.1 Uji terhadap satu nilai proporsi
Hipotesis yang digunakan untuk uji satu nilai proporsi dengan
taraf antara lain berbentuk :
a. H 0 : p p 0
MODUL 5
14
H 1 : p p0
Wilayah kritik: x a
terbesar yang bersifat
P X a
dimana
adalah
bilangan
bulat
b x; n; p0
x 0
b x; n; p0 : Distribusi Binomial dengan parameter n dan p0

n : banyaknya eksperimen/ulangan
p0 : peluang sukses
b.
H 0 : p p0
H 1 : p p0
Wilayah kritik
yang bersifat
x a dimana a adalah bilangan bulat terkecil
P X a
b x; n; p0
x a
b x; n; p 0 : binomial dengan parameter n dan p0

p0 : peluang sukses
c.
H 0 : p p0
H1 : p p0
Wilayah kritik x a atau x a dimana a adalah bilangan

bulat terkecil untuk x a atau bilangan bulat terbesar untuk
x a yang bersifat
MODUL 5
15
P X a
P X a
b x; n; p0
x 0
b x; n; p0
xa
atau
b x; n; p 0 : binomial dengan parameter n dan p0

p0 : peluang sukses
Bila dari hasil perhitungan, nilai berada diwilayah kritik, maka
tolak H0.
5.2.2 Aplikasi dengan Minitab

Contoh
Dimiliki suatu pernyataan bahwa 70% rumah yang ada di kota
A sudah terpasang AC. Dari 15 yang rumah yang diamati,
ternyata hanya 8 rumah yang telah terpasang AC. Benarkah
pernyataan tersebut ?
Langkah langkah
1. Karena yang ingin disimpulkan adalah proporsi rumah
terpasang AC = 70% atau tidak, maka uji hipotesis yang
dipilih adalah
H 0 : p 0,7
H 1 : p 0,7
Taraf = 5% = 0,05
MODUL 5
16
2. Pilih menu Basis Statistic , 1 Proportion
3. Isilah kotak dialog dengan isian berikut
MODUL 5
17
Number of event = 8, menyatakan banyaknya kejadian

sukses
Number of trial = 15, menyatakan banyaknya sampel
yang diambil
Hypothesized proportion =0,7 menyatakan nilai dari H0
4. Klik option untuk menentukan tingkat signifikan () dan
jenis hipotesis yang akan dipilih
MODUL 5
18
5. Hasilnya adalah sebagai berikut :
Test and CI for One Proportion

Test of p = 0.7 vs p not = 0.7
Sample
1
X
8
N
15
Sample p
0.533333
95% CI
(0.265861, 0.787333)
Exact
P-Value
0.258
Karena nilai P-value=0.258 >0.05, maka H0 tidak ditolak.

Data tidak cukup kuat untuk menolak pernyataan bahwa
70% rumah terpasang AC.
5.2.3 Pendekatan normal baku untuk uji terhadap satu
nilai proporsi
Pada pengujian satu nilai proporsi, ada situasi dimana tabel
binomial sulit untuk digunakan, misalkan untuk nilai n yang
sangat besar(kecuali dengan bantuan komputer). Salah satu
pendekatan yang bisa digunakan adalah dengan melakukan
transformasi ke bentuk normal baku. Parameter dan 2
ditaksir dengan rumus : np 0 dan 2 npq .
Statistik uji yang digunakan adalah
x np0
np0 q0
p0 : peluang sukses / proporsi
MODUL 5
19
Z berdistribusi normal baku dengan 0 dan

2 1.
Wilayah kritiknya menjadi
z Z
bila uji hipotesisnya H 1 : p p 0
z Z1
z Z

atau
z Z1
bila
uji
hipotesisnya
H 1 : p p0

Contoh
Obat untuk ketegangan syaraf selama ini memiliki kefektifan
60%. Sebuah obat baru diuji terhadap 100 pasien, 70 orang
sembuh sehingga tingkat keefektifannya 70%. Apakah obat
baru tersebut bisa dikatakan lebih efektif dari obat lama?
Langkah langkah
1. Karena yang ingin disimpulkan adalah tingkat keefektifan
obat baru > 60% atau tidak, maka uji hipotesis yang
dipilih adalah
H 0 : p 0,6
H 1 : p 0,6
Taraf = 5% = 0,05
2. Langkah langkah yang dilakukan untuk uji hipotesis ini
mirip
dengan
uji
hipotesis
tanpa
menggunakan
pendekatan normal. Perbedaannya adalah ketika memilih
kotak option kita memilih check list use test and interval
test based on normal distribution seperti berikut ini
MODUL 5
20
MODUL 5
21
Test and CI for One Proportion

Test of p = 0.6 vs p > 0.6
95% Lower
Sample
1
X
70
N
100
Sample p
0.700000
Bound
0.624623
Z-Value
2.04
P-Value
0.021
Using the normal approximation.
Berarti nilai z masuk dalam wilayah kritik karena P-value=

0,021 < 0,05.
Jadi dapat disimpulkan bahwa tingkat keefektifan obat
baru lebih tinggi dari obat lama.
5.2.5 Pengujian perbandingan dua proporsi

Pengujian terhadap proporsi tidak hanya bisa dilakukan
terhadap satu nilai proporsi. Bila kita sedang meneliti dua
buah proporsi, maka kedua proporsi tersebut dapat
diperbandingkan
yaitu
berdasarkan
sebaran
selisih
proporsinya. Selisih proporsi ini kemudian ditransformasi
kebentuk normal baku dengan rumus z yaitu :
p 1 p 2
p q 1 1
n1 n2
Dimana
p 1
x1
n1
MODUL 5
p 2
x2
n2
x1 x 2
n1 n2
q 1 p
22
x1
x2
n1
n2
Banyaknya sukses kategori 1
Banyaknya sukses kategori 2
Banyaknya ulangan/sampel kategori 1
Banyaknya ulangan/sampel kategori 2
Hipotesisnya
H 0 : p1 p 2
Wilayah kritiknya sama seperti pendekatan normal baku

untuk pengujian terhadap satu nilai proporsi yaitu :
z Z bila uji hipotesisnya H 1 : p p 0
z Z bila uji hipotesisnya H 1 : p p0
z Z
atau
z Z

Contoh
Suatu penelitian dilakukan untuk melihat apakah proporsi
lulusan smu kotamadya Bandung(p1) yang akan melanjutkan
ke PT(Perguruan Tinggi) lebih tinggi daripada proporsi lulusan
smu kabupaten Bandung(p2) yang akan melanjutkan ke PT
dengan taraf 2,5%. Dari sampel acak yang diambil, diperoleh
hasil bahwa dari 200 lulusan asal kotamadya, 120 orang akan
melanjutkan ke PT. Sedangkan dari 500 lulusan asal
kabupaten, 240 orang akan melanjutkan ke PT.
Langkah langkah
1. Karena yang ingin disimpulkan proporsi lulusan smu
kotamadya
MODUL 5
Bandung(p1)
yang
akan
melanjutkan
ke
23
PT(Perguruan Tinggi) lebih tinggi daripada proporsi lulusan

smu kabupaten Bandung(p2), maka uji hipotesis yang
dipilih adalah
H 0 : p1 p 2 atau H 0 : p1 p 2 0
H 1 : p1 p 2 atau H 0 : p1 p 2 0
Taraf = 5% = 0,025 selang kepercayaan = 97,5 %
2. Pilih menu Basis Statistic , 2 Proportion
3. Isilah kotak dialog dengan isian berikut
MODUL 5
24
Number of event menyatakan banyaknya kejadian sukses

(siswa yang melanjutkan ke PT). First : kodya, Second :
kabupaten
Number of trial , menyatakan banyaknya sampel yang
diambil
4. Klik option untuk menentukan tingkat signifikan () dan
jenis hipotesis yang akan dipilih
MODUL 5
25
Test and CI for Two Proportions

Sample
1
2
X
120
240
N
200
500
Sample p
0.600000
0.480000
Difference = p (1) - p (2)

Estimate for difference: 0.12
97.5% lower bound for difference:
Test for difference = 0 (vs > 0):
0.0392076
Z = 2.91 P-Value = 0.002
Fisher's exact test: P-Value = 0.003
Karena nilai P-value =0.002 <0.025, maka H 0 tidak ditolak.

Proporsi lulusan siswa SMA kodya yang melanjutkan ke PT
lebih tinggi daripada lulusan siswa SMA kabupaten
Latihan
MODUL 5
26
1. Suatu penelitian diadakan untuk mengetahui apakah ratarata banyaknya panggilan tiap 2 jam yang diterima oleh
swicthboard pada dua wartel sama atau tidak. Berikut
adalah rata-rata banyaknya panggilan dari dua wartel tiap
2 jam selama 15 hari
H
1
2
3
4
5
6
7
8
W1
20 10 12 6
12 8
22 13
W2
10 10 23 6
8
6
15 12
W1
10 8
9
15 20 15 10 10
W2
11 5
10 18 8
6
12 12
a. Buatlah hipotesisnya
b. Uji dan buat kesimpulannya
1. Suatu sampel acak berukuran 20 diambil dari nilai UTS
matakuliah Statistika dari mahasiswa 01. 02, dan 03
Penelitian tersebut dimaksudkan untuk membandingkan
kemampuan akademik antara mahasiswa kelas 01. 02,
dan 03, berdasarkan uji selisih nilai tengah antara dua
sampel. Adapun datanya sebagai berikut :
NO
1
2
3
4
5
6
7
8
9
10
MODUL 5
Nilai UTS
01
43
75
43
78
60
76
60
63
60
53
Nilai UTS
02
92
47
56
74
79
28
71
68
69
80
Nilai UTS
03
63
83
44
37
34
53
53
60
42
36
27
11
12
13
14
15
16
17
18
19
20
60
25
50
40
50
65
70
65
75
5
63
86
65
99
59
65
78
66
66
96
37
50
72
52
65
73
58
81
15
63
a. Pengujian selisih nilai tengah antara nilai UTS mahasiswa

01 dengan 02
Misal X adalah peubah acak yang menyatakan nilai UTS
mahasiswa 01
Misal Y adalah peubah acak yang menyatakan nilai UTS
mahasiswa 02
b. Pengujian selisih nilai tengah antara nilai UTS mahasiswa
02 dengan 03
Misal X adalah peubah acak yang menyatakan nilai UTS
mahasiswa 02
Misal Y adalah peubah acak yang menyatakan nilai UTS
mahasiswa 03
3. Lakukan uji proporsi pada data-data berikut, yaitu :
2) Data miskonsepsi siswa dengan model konstruktivis
terhadap suatu mata pelajaran
NO
1
2
MODUL 5
PRA
TEST
8
7
POST
TEST
15
15
JENI
S
P
P
28
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
MODUL 5
10
10
11
12
16
15
17
17
16
17
18
18
18
19
20
19
23
20
18
21
22
22
20
18
21
19
23
21
25
25
23
26
25
21
15
21
25
21
22
10
21
23
25
25
12
20
25
26
20
27
26
27
20
25
25
26
27
28
29
29
29
29
29
29
30
30
L
P
L
L
P
P
P
L
P
L
P
L
L
L
L
L
P
P
L
P
P
P
L
L
P
L
L
P
P
P
L
P
L
29
MODUL 5
30
ANALISIS VARIANSI
Overview
Analisis variansi ini merupakan alternatif lain bagi pengujian

nilai tengah selain menggunakan uji-t. Salah satu perbedaan
utama antara analisis variansi dengan uji-t adalah
kemampuan uji untuk membandingkan beberapa angkatan
data secara serempak. Pada analisis variansi yang lebih
kompleks (banyak faktor), nilai tengah bisa berasal dari
beberapa faktor. Modul ini memberikan penjelasan mengenai
analisis satu faktor saja.
Tujuan
1. Mahasiswa memahami tentang konsep analisis

variansi dan asumsi-asumsinya
2. Mahasiswa dapat membuat tabel analisis variansi
untuk membandingkan nilai tengah beberapa
angkatan data secara serempak
3. Mahasiswa dapat membuat kesimpulan yang tepat
terkait dengan uji hipotesis yang dibuat
MODUL 6
6.1
Asumsi-asumsi pada analisis variansi
Pada modul IV, telah dibahas masalah kenormalan data. Hal

tersebut merupakan landasan yang penting pada tahap
pengujian hipotesis dan analisis variansi. Hal mendasar pada
analisis variansi adalah membandingkan lebih dari dua
populasi berdasarkan pada lebih dari dua buah angkatan
data. Asumsi-asumsi yang diperlukan pada analisis variansi
adalah :
1. Setiap angkatan data berasal dari populasi yang
berdistribusi normal.
2. Setiap populasi memiliki variansi yang sama.
3. data yang satu dengan yang lainnya merupakan
pengamatan yang saling bebas.
Dalam prakteknya asumsi-asumsi tersebut tidak dituntut
terlalu ketat, yaitu :
1. Mengenai kenormalan data, bila distribusinya cukup dekat
ke normal, maka asumsi tersebut sudah dipenuhi
2. Mengenai kesamaan variansi, bila nilai variansi terbesar <
3 x variansi terkecil, maka hal tersebut tidak sudah cukup
3. Mengenai kebebasan antar pengamatan, dapat dilakukan
dengan metode pengambilan sampel secara acak.
6.2
Uji Kesamaan Ragam
Hipotesis kesamaan ragam :

H0 : 21 = 22 = .... = 2n
H1 : ragam-ragam tersebut tidak semuanya sama
MODUL 6
Ada dua kasus pada uji bartlett :

a. Ukuran sampel sama
2 n11
1
2 n 21
..........
2
2 nk 1
k
N k
S g2
k
S g2
adalah ragam gabungan yaitu
S g2
(ni 1) S i2
i 1
N k
S i2 adalah ragam masing-masing sampel

Bila b bk ( ; n) , maka H0 ditolak pada taraf nyata
b. Ukuran sampel tidak sama
Pada kasus ini, bila b bk ( ; n1 , n 2 , ..., n k ) , maka H0
ditolak pada taraf nyata . Dalam hal ini,
bk ( ; n1 , n 2 , ..., n k )
6.3
n1 bk ( ; n1 ) n2 bk ( ; n1 ) ... nk bk ( ; n
N
Tabel analisis variansi
Berdasarkan asumsi-asumsi di atas, maka terdapat hubungan

bahwa variansi hasil penggabungan dari semua angkatan
data terdiri atas rata-rata variansi setiap angkatan dan
variansi daris semua rata-rata angkatan. Misalkan akan
MODUL 6
dibandingkan m buah angkatan data,

tersebut dapat dinyatakan sebagai :
m
N 1 S 2 N m ni
i 1
JKT
maka
hubungan
1 S i2 m 1 V
JKD
JKA
di mana
JKT = Jumlah Kuadrat Total
JKD = Jumlah Kuadrat Dalam angkatan
JKA = Jumlah Kuadrat Antar angkatan
1 m
Xi X
m 1 i 1
ni = banyaknya data dalam angkatan ke-i
V = variansi dari semua rata-rata angkatan
N = Total data penggabungan semua angkatan
S2 = variansi gabungan
S i2 = variansi angkatan ke-i
V
X i = rata-rata angkatan ke-i

X = rata-rata gabungan
N 1 = derajat kebebasan total
N m = derajat kebebasan dalam angkatan
m 1 = derajat kebebasan antar angkatan
Misal diketahui data setiap

Angkatan
Angkatan
ke-1
ke-2
X11
X21
X12
X22
:
X1n1
:
X2n2
MODUL 6
angkatan sebagai berikut :

...... Angkatan
...
ke-m
...... Xm1
...
...... Xm2
..
:
...... Xmnm
4
..
Untuk menghitung JKT, JKD, dan JKA digunakan rumusan
sebagai berikut :

JKD
ni
i 1
j 1
X ij
X ij
j 1
i 1
ni

JKA
i 1
X ij
j 1
JKT
ni
ni
i 1
j 1
X ij
ni
ni
ni
X ij
i 1 j 1
ni
i 1 j 1
X ij
Untuk membandingkan m populasi berdasarkan m buah

angkatan data, dan berdasarkan asumsi-asumsi analisis
variansi, maka hipotesis nol dan hipotesis alternatifnya
didefinisikan sebagai berikut :
H0 : 1 = 2 = ..... = m
H1 : paling sedikit ada satu pasangan (i, j) sehingga i
j
Sedangkan statistik uji yang digunakan adalah statistik Fisher
yang didefinisikan sebagai
JKA
m 1 RKA . Kemudian
JKD
RKD
N m
nilai F hasil perhitungan debandingkan dengan nilai F dari

MODUL 6
tabel, yaitu F, (m-1), (N-m). Bila Fhit

F , (m-1), (N-m), maka
H0 ditolak, sehingga paling sedikit ada satu pasangan
(i, j)
sehingga i j.
Tabel analisis
Sumber
Variansi
Antar
angkatan
Dalam
angkatan
Total
6.4
variansi dapat
Jumlah
Kuadrat
JKA
ditampilkan sebagai berikut :

Derajat
Rata-rata
Fhit
bebas
Kuadrat
m1
RKA
RKA/RKD
JKD
Nm
JKT = JKA +
JKD
N1
RKD
Aplikasi dengan minitab
Teknologi telekomunikasi di Indonesia berkembang sangat

pesat, mulai dari teknologi berbasis AMPS, GSM, dan CDMA.
Kehadiran produk telekomunikasi berbasis CDMA, merupakan
alternatif bagi pengguna jasa telekomunikasi untuk memilih
yang kualitasnya terbaik dan termurah. Saat ini banyak
operator selular menggunakan teknologi berbasis CDMA,
antara lain Bakrie Telecom dengan produknya esia, Telkom
dengan flexi, dan Mobile-8 dengan fren. Suatu penelitian
dilakukan untuk mengetahui rata-rata pengguna produk esia,
flexi, dan fren dari 15 kecamatan di kota Bandung. Berikut
adalah datanya :
NO
1
2
Fre
n
55
42
MODUL 6
Fle
xi
60
33
Esi
a
37
60
6
3
4
5
6
7
8
9
10
11
12
13
14
15
45
71
83
47
75
48
60
69
85
54
31
25
30
39
61
40
94
71
61
77
64
65
70
80
61
50
35
61
31
56
65
78
59
27
30
45
38
25
35
Langkah-langkah pengolahan dengan menggunakan

minitab 15 :
1. Simpan data tersebut pada worksheet minitab
2. Kemudian uji kenormalan data, bila data sudah normal,
maka dilakukan uji kesamaan ragam dengan cara pilih
menu stat, lalu ANOVA, kemudian test for equal
variances, maka akan muncul kotak dialog seperti di
bawah kemudian ketikkan kolom data pada isian response
dan kolom subcript pada factor, klik option atau storage
bila perlu, lalu OK (catatan kolom harus di stack dulu,
pada menu data)
MODUL 6
3. Hasil yang diperoleh sebagai berikut :
MODUL 6
Dari hasil yang diperoleh di atas, dapat diketahui

bahwa ragam ketiga sampel sama, karena Pvalue =
0.811 > 0.05
4. Pengujian hipotesis, dilakukan dengan cara pilih Stat,
ANOVA, kemudian pilih 2-sample t, kemudian isi kotak
dialog
MODUL 6
Test for Equal Variances: C4 versus

C5
One-way ANOVA: Fren, Flexi, Esia
Source DF
SS MS
F
P
Factor 2 1996 998 3.35 0.045
Error 42 12520 298
Total 44 14516
S = 17.27
9.64%
MODUL 6
R-Sq = 13.75%
R-Sq(adj) =
10
Individual 95% CIs For Mean Based on

Pooled StDev
Level
N
Mean StDev ----+---------+--------+---------+----Fren 15 54.67 18.98
(--------*--------)
Flexi 15 61.73 16.33
(--------*--------)
Esia 15 45.47 16.35 (--------*--------)
----+---------+---------+---------+----40
50
60
70
Pooled StDev = 17.27
Boxplot of Fren, Flexi, Esia
100
90
80
Data
70
60
50
40
30
20
Fren
Flexi
Esia
Untuk menolak atau menerima Ho dapat dilihat dari 2 hal

yaitu :
- Pvalue = 0.045 < 0.05, maka Ho ditolak
- Nilai kritis (F hitung = 3.35 > F tabel) maka Ho ditolak
MODUL 6
11
Karena Ho ditolak, maka dapat disimpulkan bahwa ratarata jumlah pengguna produk fren, flexi dan esia di 15
kecamatan kota Bandung berbeda. Hal itu dimungkinkan
satu atau dua dari tiga
produk tersebut ada yang
mempunyai
kelebihan,
sehingga
konsumen
akan
cenderung memilih produk tersebut.
Latihan
1. Berikut adalah data pengunjung dari lima warnet dalam
waktu 1 minggu.
Warnet/
hr
A
B
C
D
E
1
0
1
8
1
2
1
5
2
0
2
0
1
5
2
5
1
5
1
0
2
5
1
0
3
0
2
0
8
3
5
2
5
9
2
0
3
0
1
0
2
0
3
5
2
0
3
0
1
0
2
5
1
5
2
6
3
5
1
0
9
2
5
3
5
Lakukan pengujian apakah rata-rata pengunjung dari lima

warnet dalam waktu satu minggu sama atau tidak,
dengan taraf nyata 0.05 dan 0.01.
MODUL 6
12
2. Berikut adalah data penjualan dari lima merk Laptop yang

dijual di BEC dari 8 pusat penjualan selama satu bulan.
Merk/
Toko
Accer
II
1
0
3
II
I
8
IV
1 5
2
Toshiba
4
9 1 2
0
Compac
1 1 8 1 1
5 0
2 0
IBM
5 3 6 8 2
HP
4 3 6 1 3
0
Dengan menggunakan analisis ragam dan taraf nyata
0.05, uji apakah rata-rata penjualan dari kelima merk
laptop di BEC sama, dengan menggunakan hipotesis
seperti pada dasar teori di atas.
3. Berikut adalah data nilai toefl tiga jurusan yaitu TE, IF, dan
TI angkatan 2006
ST
TI
IF
426.6 450.0 453.3
67
00
33
520.0 506.6 480.0
00
67
00
216.6 456.6 550.0
67
67
00
290.0 576.6 460.0
00
67
00
410.0 360.0 403.3
00
00
33
400.0 500.0 380.0
MODUL 6
13
00
370.0
00
490.0
00
343.3
33
390.0
00
373.3
33
430.0
00
456.6
67
580.0
00
410.0
00
436.6
67
423.3
33
413.3
33
396.6
67
430.0
00
410.0
00
430.0
00
MODUL 6
00
430.0
00
413.3
33
386.6
67
363.3
33
433.3
33
543.3
33
350.0
00
436.6
67
386.6
67
350.0
00
416.6
67
410.0
00
386.6
67
366.6
67
406.6
67
543.3
33
00
443.3
33
216.6
67
450.0
00
453.3
33
216.6
67
463.3
33
430.0
00
363.3
33
430.0
00
216.6
67
473.3
33
403.3
33
406.6
67
413.3
33
446.6
67
416.6
67
14
510.0
00
216.6
67
420.0
00
420.0
00
483.3
33
370.0
00
433.3
33
476.6
67
426.6
67
363.3
33
383.3
33
380.0
00
413.3
33
383.3
33
216.6
67
420.0
00
416.6
67
443.3
33
540.0
00
473.3
33
413.3
33
520.0
00
510.0
00
420.0
00
Lakukan analisis ragam dengan taraf nyata 0.05 pada data

tersebut. Kemudian uji apakah rata-rata nilai toefl
mahasiswa dari tiga juruan sama ataukah berbeda.
MODUL 6
15
7 REGRESI LINIER DAN NON-LINIER

SEDERHANA
Overview
Dalam sebuah penelitian, sering kita memiliki data yang

berpasangan (X,Y). Data tersebut bisa jadi diperoleh dari
sebuah percobaan terhadap peubah X sedangkan respon
yang terjadi dicatat sebagai peubah Y. Hal menarik yang bisa
disimpulkan dari data yang berpasangan adalah tingkat
keeratan hubungan antara X dan Y serta bentuk hubungan
fungsionalnya. Modul ini memberikan panduan langkah
langkah kepada mahasiswa dalam menentukan hubungan
antara dua peubah X,Y yang paling tepat, langkah langkah
pengujian koefisien regresi beserta penentuan tingkat
keeratannya.
Tujuan
1.
2.
Mahasiswa dapat membuat model regresi linier maupun

non-linier sederhana dari data berpasangan (X,Y).
Mahasiswa dapat memahami keterkaitan antara model
linier dan model non-linier.
1
3.
Mahasiswa dapat menentukan model regresi yang terbaik

berdasarkan pengujian terhadap koefisien regresi dan nilai
R2
7.1 Regresi
Suatu permasalahan penelitian biasanya dapat dijelaskan
oleh dua atau lebih variabel yang saling berhubungan satu
sama lain. Variabel-variabel yang saling berhubungan
tersebut membentuk suatu persamaan matematis
yang
dapat digunakan untuk menentukan nilai sebuah variabel
yang bergantung pada nilai variabel yang lain. Dalam
statistika, hubungan fungsional antara variabel tak bebas
( dinotasikan Y ) dengan variabel bebas ( dinotasikan X )
disebut regresi antara Y dan X. Persamaan regresi yang akan
dibahas pada bab ini persamaan linier sederhana, persamaan
non-linier yang dibangkitkan dari persamaan linier yaitu
eksponensial dan geometrik.
7.1.1 Model untuk regresi linier sederhana
Bentuk umum :
y x
y : variabel takbebas
x : variabel bebas
: error yang terjadi pada eksperimen
Nilai selalu berubah ubah pada setiap
x jadi sulit untuk

ditebak, model ini kemudian diduga oleh y a b x dengan
metode kuadrat terkecil yaitu meminimumkan jumlah kuadrat
2
error ( y i y 2 ). Dari metode kuadrat terkecil didapatkan

nilai untuk a dan b
a y b x dan
xy
x y
x2
n
x 2
n
Untuk melihat seberapa baik model regresi yang diperoleh,

dapat dilihat melalui nilai koefisien korelasi determinasi R2
yang memiliki nilai 0 sampai 1 dan memiliki rumus
R
JKR
JKT
y y
2
y y
2
Selain menggunakan R2, untuk mengetahui kelayakan suatu

model regresi yang telah diperoleh yang digunakan menduga
hubungan antara variabel X dengan variabel Y, dilakukan
dengan pengujian terhadap koefisien-koefisien regresi yaitu :
1. Pengujian koefisien regresi secara serentak
Hipotesis :
- H0 : a = b = 0
- H1 : paling tidak terdapat satu koefisien tidak sama
dengan nol
Tabel analisis ragam untuk uji koefisien regresi secara
serentak
Sumber
Deraj
Jumlah Kuadrat
Kuadra Fhitung
keragama at
t
n
bebas
Tengah
Regresi
p
JK reg
KTreg
bt X tY n Y 2
p
KT galat
3
Galat
n-p-1
Total
n-1
Sisa
JK galat
n p 1
Y Y nY
Statistik uji untuk penolakan H0 adalah : Fhit F p , n p 1
2. Pengujian koefisien regresi secara individu

Hipotesis :
- H0 : bp = 0
- H1 : bp 0
Statistik uji yang digunakan : t hit
bp
Se b p
Kriteria penolakan H0 adalah t hit t n p 1

Arti penolakan terhadap H0 adalah variabel bebas
berpengaruh nyata terhadap variabel tak bebas Y (untuk
H0 : b1 = 0), sehingga model regresi linier dikatakan layak.
7.1.2 Model regresi non linier

7.1.2.1 Model eksponensial
Bentuk umum regresi model eksponensial adalah y x .
Model tersebut diduga dengan y ab x .Nilai a dan b diperoleh
dengan cara langkah langkah berikut :
y ab x ,
- Dengan
melogaritmakan
persamaan
diperoleh
log y log a x log b c dx
Model tersebut
berubah menjadi model linier,
sehingga nilai c dan d didapatkan dari rumusan model
linier yaitu
c log y d x
dan
x log y
x log y
x2
dimana a 10
n
x 2
n
dan b 10 d
7.1.2.2 Model geometrik (power )

Regresi model geometrik mempunyai bentuk umum
y x . Pendugaan model tersebut adalah y ax b .Nilai
a dan b diperoleh dengan cara sebagai berikut :
y ax b ,
- Dengan
melogaritmakan
persamaan
diperoleh
log y log a b log x c b log x
Nilai c dan d bisa didapatkan dari rumusan model linier

yaitu
c log y b log x
log x log y
log x log y
(log x) 2
dan
n
log x 2
n
5
dimana a 10 c
7.1.3 Aplikasi dengan minitab
Regresi Linier
Berikut adalah data produksi pulsa tingkat nasional (106)
1.
2.
Tahu
n
199
8
199
9
200
0
200
1
200
2
200
3
200
4
200
5
200
6
Puls
a
3545
1
3722
1
4090
5
4587
5
5026
0
5685
2
5998
1
6723
0
7002
0
a. Gambarkan diagram pencar

b. Tentukan persamaan regresinya
c. Hitung korelasinya
d. berapakah produksi pulsa pada tahun
2007
Langkah-langkah :
Ketik data tersebut pada kolom C1(X) dan
C2(Y)
Membuat diagram pencar dengan cara:
pilih menu graph, lalu pilih scatter plot,
klik with regression. Setelah muncul
kotak dialog, ketik kolom yang sesuai untuk
variabel Y dan X, dan atur skala, dan lainlain, kemudian OK
Outputnya sebagai berikut :
Scatterplot of Pulsa vs Tahun

70000
Pulsa
60000
50000
40000
30000
0
5
Tahun
3. Pilih menu stat, kemudian basic statistics, lalu

correlation. Setelah muncul kotak dialog berikut, isi kotak
variabel dengan kolom tempat X dan Y, kalau ingin
menyimpan matriknya klik store matrix, bila tidak,
langsung klik OK
Hasilnya adalah Correlation of X and Y = 0.994, Pvalue = 0.00

Karena korelasi antara X dan Y nilainya mendekati 1,
maka antara tahun dengan produksi pulsa terdapat
hubungan linier, sehingga dapat dianalisis dengan regresi
linier.
4. Pilih menu stat, kemudian regression, lalu regression.
Setelah muncul kotak dialog, pada kotak respon ketik
kolom tempat Y, dan predictor dengan kolom tempat X,
kemudian OK
Hasil yang diperoleh adalah :
Regression Analysis: Pulsa versus Tahun

The regression equation is
Pulsa = 28413 + 4624 Tahun
Predictor Coef SE Coef
T
P
Constant 28413
1066 26.66 0.000
Tahun
4623.9 189.4 24.41 0.000
S = 1467.20 R-Sq = 98.8% R-Sq(adj) = 98.7%
Analysis of Variance
Source
DF
SS
MS
F
P
Regression
1 1282808577 1282808577 595.91
0.000
Residual Error 7 15068810
2152687
Total
8 1297877388
Unusual Observations
Obs Tahun Pulsa Fit
SE Fit Residual St Resid
1 1.00 35451 33037
902
2414
2.09R
R denotes an observation with a large standardized
residual.
Dari hasil yang diperoleh tersebut, dapat diketahui bahwa
tiap tahun peningkatan produksi pulsa linier. Hal tersebut
dapat dilihat dari uji koefisien regresi, semua koefisien,
nilai P value nya nol (P value yang dihitung dari T). Dari
segi kelayakan model regresi dapat dilihat dari nilai R 2 =
98.8% dan pada analisis variansi, nilai P value juga nol.
Sehingga dengan menggunakan model regresi di atas,
dapat diprediksi produksi pulsa tingkat nasional pada
tahun 2007 adalah 74653 (106).
Regresi Non Linier
Berikut ini merupakan contoh dari regresi non linear, diketahui
bahwa data penjualan suatu produk dari mulai diproduksi
sampai produk tersebut berumur 24 bulan (2 tahun).
Bulan ke-
Keuntungan
(dalam ribuan
10
1
2
3
4
5
6
7
8
9
1
0
1
1
1
2
1
3
1
4
1
5
1
6
1
7
1
8
1
9
2
0
rupiah)
150
270
480
750
1350
2310
3625
5390
9950
15510
26500
40350
77510
111950
165300
311600
627480
804250
1540980
2314250
11
2
1
2
2
2
3
2
4
3923250
6010500
12334230
15975210
Dari data diatas, kita akan mencoba memprediksi

keuntungan perusahaan saat produksi berlangsung selama 3
tahun (36 bulan).
Seperti yang telah diketahui sebelumnya, kita dapat membuat
diagram pencar (scater plot) dengan mintab, yaitu :
12
Plot bulan vs keuntungan

18000000
16000000
14000000
keuntungan
12000000
10000000
8000000
6000000
4000000
2000000
0
0
10
15
20
25
bulan
Jelas bahwa regresi linear kurang baik untuk diterapkan.

Melihat bentuk diagram pencar diatas kita akan mencoba
mendekatinya dengan fungsi non linear yaitu y ab x atau
y ax b . Untuk menentukan persamaan regresi yang terbaik
antara dua model tersebut dapat dilihat dari nilai R2.

Langkah langkah dengan Minitab
1.
Plot
Pilih stat, kemudian Regression dan Fitted Line
13
2.
Isi kotak dialog dan optionnya seperti berikut,
14
Untuk model geometrik y ax b isi seperti ini
Untuk model eksponensial y ab x isi seperti ini
15
3.
Hasilnya adalah sebagai berikut

Untuk model geometrik y ax b
ylog = 0.798 + 3.98 xlog
Predictor
Constant
0.035
xlog
0.000
Coef
StDev
T
0.7983
0.3558
3.9751
0.3381
S = 0.5848
R-Sq = 86.3%
Untuk
model eksponensial y ab x
85.6%
P
2.24
11.76
R-Sq(adj) =

ylog = 2.01 + 0.218 x
Predictor
Constant
0.000
x
0.000
4.
Coef
StDev
T
P
2.01111
0.01549
129.83
0.218240
0.001084
201.31
S = 0.03676
R-Sq = 99.9%
R-Sq(adj) =
99.9%
Kedua model, berdasarkan uji T cukup layak
digunakan, tetapi berdasarkan nilai R2 masing
masing model, maka diperoleh kesimpulan bahwa
16
model eksponensial lebih baik daripada model

geometric.
Jadi persamaan regresi nonlinier yang terbaik adalah
log y 2.01 0.218 x
Atau
bila
dituliskan
y 102,33 1,652
5.
dalam
y ab x
menjadi
Bila dihitung keuntungan pada akhir tahun ke-3 (bulan

ke 36) maka diperoleh hasil
y 102,33 1,652 36 7.22.10117 ribu.
Latihan
1. Berikut adalah pengaruh temperatur pada
deodorizing terhadap warna suatu produk :
Temperatur
Warna
(X)
(Y)
460
0.3
450
0.3
440
0.4
430
0.4
420
0.6
410
0.5
450
0.5
440
0.6
430
0.6
420
0.6
410
0.7
400
0.6
420
0.6
410
0.6
400
0.6
proses
17
a. tentukan model regresi linier Y = a + b X

b. Hitung korelasi antara Y dan X
2. Seorang distributor ingin mengetahui hubungan antara
biaya pemasangan iklan
per minggu dengan hasil
penjualannya, datanya sebagai berikut :
Biaya iklan Penjualan
($)
($)
40
385
20
400
25
395
20
365
30
475
50
440
40
490
20
420
50
560
40
525
25
480
50
510
a. Buat diagram pencar
b. Tentukan persamaan garis regresi yang terbaik untuk
meramalkan penjualan mingguan berdasarkan biaya
iklan
3. Berikut adalah data tentang pengaruh antara nilai ujian
pertama dengan nilai ujian kedua :
Nilai ujian
Nilai ujian
pertama (X)
kedua (Y)
4.1
2.1
2.2
1.5
18
2.7
6.0
8.5
4.1
9.0
8.0
7.5
8.5
9.3
9.5
7.4
1.7
2.5
3.0
2.1
3.2
2.8
2.5
3.0
2.8
3.0
1.7
a. Gambarkan diagram pencar

b. Tentukan persamaan regresi linier dan non-liniernya
c. Hitung korelasinya dan tentukan regresi yang terbaik
d. berapakah nilai ujian kedua, jika nilai ujian pertama 6.4
19
8 ANALISIS KOMPONEN UTAMA

Analisis Komponen Utama
Dalam statistika, analisis komponen utama (principal
component analysis / PCA) adalah teknik yang digunakan
untuk
menyederhanakan
suatu
data,
dengan
cara
mentransformasi linier sehingga terbentuk sistem koordinat
baru dengan varians maksimum. PCA dapat digunakan untuk
mereduksi dimensi suatu data tanpa mengurangi karakteristik
data tersebut secara signifikan.
Analisis komponen utama merupakan suatu tehnik statistik
untuk mengubah dari sebagian besar variabel asli yang
digunakan yang saling berkorelasi satu dengan yang lainnya
menjadi satu set variabel baru yang lebih kecil dan saling
bebas (tidak berkorelasi lagi). Jadi analisis komponen utama
berguna untuk mereduksi data, sehingga lebih mudah untuk
menginterpretasikan
data-data
tersebut (Johnson
&
Wichern, 1982). Analisis komponen utama merupakan
analisis antara dari suatu proses penelitian yang besar atau
suatu awalan dari analisis berikutnya, bukan merupakan
suatu analisis yang langsung berakhir. Misalnya komponen
utama bisa merupakan masukan untuk regresi berganda atau
analisis faktor.
Dilihat secara aljabar linier, komponen utama adalah
kombinasi linier-kombinasi linier tertentu dari p peubah acak
x1,x2,x3,.,xp. Secara geometris kombinasi
linier ini
merupakan sistem koordinat baru yang didapat dari rotasi
sistem semula dengan x1,x2,.,xp sebagai sumbu koordinat.
20
Sumbu baru tersebut merupakan arah dengan variabilitas

maksimum dan memberikan kovariansi yang lebih sederhana.
Menurut Johnson dan Dean, Analisis Komponen Utama
terkonsentrasi pada penjelasan struktur variansi dan
kovariansi melalui suatu kombinasi linear variabel-variabel
asal, dengan tujuan utama melakukan reduksi data dan
membuat interpretasi. Analisis komponen utama lebih baik
digunakan jika variabel-variabel asal saling berkorelasi (1988:
340).
Contoh:
Examination scores for graduate students in Mathematics
N
Diffgeo comple algebr
statistic
o
m
x
a
reals
s
open book
close book
1
36
58
43
36
37
2
62
54
50
46
52
3
31
42
41
40
29
4
76
78
69
66
81
5
46
56
52
56
40
6
12
42
38
38
28
7
39
46
51
54
41
8
30
51
54
52
32
9
22
32
43
28
22
10
9
40
47
30
24
11
32
49
54
37
52
12
40
62
51
40
49
13
64
75
70
66
63
14
36
38
58
62
62
15
24
46
44
55
49
16
50
50
54
52
51
17
42
42
52
38
50
21
18
2
35
32
22
16
19
56
53
42
40
32
20
59
72
70
66
62
21
28
50
50
42
63
22
19
46
49
40
30
23
36
56
56
54
52
24
54
57
59
62
58
25
14
35
38
29
20
Dengan menggunakan program Minitab, dilakukan analisis
data diatas sebagai berikut:
Dari menu pilih menu Stat, kemudian pilih Multivariate, dan
pilih Principal Components. Sebagai input variabel, masukkan
variabel diffgeom,
complex,
algebra,
reals
dan
statistics. Jumlah komponen yang akan dihitung 5, dengan
menggunakan type matriks hubungan Covariance (karena
memiliki skala ukuran yang sama).
Output yang dihasilkan sebagai berikut:
Statistik Deskriptif
Descriptive Statistics: diffgeom, complex, algebra, reals,
statistics
Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3
diffgeom 25 0 36.76 3.74 18.68 2.00 23.00 36.00 52.00
complex 25 0 50.60 2.41 12.07 32.00 42.00 50.00 56.50
algebra 25 0 50.68 1.95 9.77 32.00 43.00 51.00 55.00
reals
25 0 46.04 2.58 12.92 22.00 37.50 42.00 55.50
statistics 25 0 43.80 3.30 16.51 16.00 29.50 49.00 55.00
Variable Maximum
diffgeom 76.00
complex 78.00
algebra 70.00
reals 66.00
statistics 81.00
22
Analisis Komponen Utama

Principal Component Analysis: diffgeom, complex,
algebra, reals, statistics
Eigenanalysis of the Correlation Matrix
Eigenvalue 4.0812 0.3739 0.2166 0.2048 0.1236
Proportion 0.816 0.075 0.043 0.041 0.025
Cumulative 0.816 0.891 0.934 0.975 1.000
Variable PC1 PC2 PC3 PC4 PC5
diffgeom 0.443 0.473 -0.352 -0.615 -0.279
complex 0.437 0.616 0.368 0.424 0.339
algebra 0.462 -0.276 0.210 0.338 -0.743
reals
0.445 -0.470 0.470 -0.476 0.367
statistics 0.449 -0.317 -0.690 0.318 0.347
Dengan scree plot sebagai berikut:
23
Terlihat bahwa hanya komponen PC1 yang memiliki varians

(atau eigenvalue) lebih besar dari 1, yaitu 4,0812. Komponen
pertama ini (PC1) ini dapat menjelaskan 81,6 persen
keragaman data. Skor untuk komponen yang dibentuk bisa
dihitung dengan melihat nilai koefisien untuk masing-masing
variabel. Untuk komponen PC1, skornya bisa dihitung sebagai
berikut:
PC1 = 0,443 diffgeom + 0.437 complex + 0.462 algebra +
0.445 reals + 0.449 statistics
Komponen kedua (PC2) memiliki eigenvalue 0.3739 dan dapat
menjelaskan 7,5 persen keragaman. Bersama dengan
komponen pertama (PC1), keduanya merepresentasikan 89,1
persen dari keragaman total. Skor untuk PC2 dihitung sebagai
berikut:
PC2 = 0,473 diffgeom + 0.616 complex 0.276 algebra
0.470 reals 0.317 statistics
Penentuan jumlah komponen yang akan digunakan sangat
subjektif. Dalam kasus ini, kedua komponen PC1 dan PC2
yang merepresentasikan 89,1 persen keragaman total bisa
dinilai telah cukup menangkap struktur data. Atau bahkan
hanya dengan menggunakan komponen pertama pun telah
cukup menangkap struktur data, jika dilihat dengan kriteria
nilai eigenvalue lebih besar dari 1. Komponen-komponen
lainnya memiliki proporsi keragaman yang kecil bisa dianggap
tidak penting.
Analisis Faktor
Analisis faktor adalah alat analisis statistik yang dipergunakan
untuk mereduksi faktor-faktor yang mempengaruhi suatu
variabel menjadi beberapa set indikator saja, tanpa
kehilangan informasi yang berarti. Sebagai ilustrasi, terdapat
50 indikator yang diidentifikasi mempunyai pengaruh
terhadap keputusan pembelian konsumen. Dengan analisis
faktor, ke-50 indikator tersebut akan dikelompokkan menjadi
24
beberapa sub set indikator yang sejenis. Masing-masing

kelompok sub set tersebut kemudian diberi nama sesuai
dengan indikator yang mengelompok. Pengelompokan
berdasarkan kedekatan korelasi antar masing-masing
indikator dan penentuan banyaknya sub set berdasarkan nilai
eigen values, yang biasanya diambil di atas 1.
Analisis faktor digunakan untuk penelitian awal di mana
faktor-faktor yang mempengaruhi suatu variabel belum
diidentifikasikan secara baik (explanatory research). Konsep
dasar analisis faktor:
1. Bukan mengkaitkan antara dependen variabel dengan
independen variabel, TAPI membuat REDUKSI atau ABSTRAKSI
atau MERINGKAS dari BANYAK variabel menjadi SEDIKIT
variabel.
2. Teknik yang digunakan adalah TEKNIK INTERDEPENSI, yakni
SELURUH set HUBUNGAN yang interdependen diteliti.
Prinsipnya menggunakan KORELASI r = 1 dan r = 0.
Dipergunakan dalam hal mengidentifikasi variabel yang
berKORELASI dan yang tidak/kecil KORELASI-nya.
3. Analisis Faktor menekankan adanya COMMUNALITY=
jumlah varian yang disumbangkan oleh suatu variabel pada
variabel lainnya.
4. Kovariasi antar-variabel yang diuraikan akan memunculkan
COMMON FACTORS (jumlahnya sedikit) dan UNIQUE FACTORS
setiap variabel. (FAKTOR-FAKTOR tidak secara jelas terlihat).
5. Adanya koefisien nilai faktor (factor score coefficient),
sehingga faktor 1 menyerab sebagian besar seluruh variabel,
faktor 2 menyerab sebagian besar sisa varian setelah diambil
untuk faktor 1. Faktor 2 TIDAK berkorelasi dengan faktor 1.
Contoh:
Dengan menggunakan data pada contoh diatas, kita akan
melakukan Analisis Faktor berikut dengan menggunakan
program SPSS 16:
25
Dari menu pilih Analyze Data Reduction Factor..

Pilih kelima variabel sebagai variabel analisis. Klik Descriptive,
pada bagian Correlation Matrix beri tanda cek pada
Coefficient dan KMO and Bartletts test of sphericity. Klik
Continue.
Kemudian klik pada Extraction dan pastikan pilihan Analyze
pada correlation matrix dan pada bagian Display beri tanda
cek pada kedua pilihan. Sebagai kriteria ekstaksi (Extraction)
kita akan menggunakan eigenvalue, yaitu Eigenvalues over:
1. Klik Continue.
Klik Rotation lalu pilih Varimax dan pada Display pilih Rotated
Solution. Klik Continue.
Klik Scores, lalu beri tanda cek Save as Variables dengan
Method: Regression dan Display factor score coefficient
matrix, agar kita bisa melihat nilai variabel/faktor baru yang
terbentuk. Klik Continue.
Berikut output dari SPSS:
Correlation Matrix
diffgeo comple algeb
statistic
m
x
ra reals
s
Diffgeo
m
.806 .754 .733
.758
.806 1.000 .774 .695
.715
.754
.774 1.000 .841
.838
Reals
.733
.695 .841
1.00
0
.785
Statisti
cs
.758
.715 .838 .785
1.000
Comple
x
Correlatio
Algebra
n
1.000
KMO and Bartletts Test

26
Kaiser-Meyer-Olkin Measure of Sampling

Adequacy.
Approx. Chi-Square
Bartletts Test of
Sphericity
Df
.871
102.84
7
10
Sig.
.000
Terlihat bahwa antar kelima variabel tersebut memiliki

korelasi yang kuat satu sama lain. Uji Bartletts Test of
Sphericity juga menunjukkan kelima variabel tersebut saling
berkorelasi.
Communalities
Initial
Extraction
Diffgeom
Complex
Algebra
Reals
Statistics
1.000
1.000
1.000
1.000
1.000
.803
.778
.870
.807
.824
Extraction Method: Principal Component

Analysis.
Extraction Communalities mengestimasi variansi setiap
variabel yang dijelaskan oleh komponen terbentuk. Dari
output
terlihat
semua
variabel
memiliki
Extraction
Communalities yang besar sehingga komponen yang
terbentuk (terekstraksi) sudah cukup mewakili variabelvariabel dengan baik.
Total Variance Explained
Compone
Initial Eigenvalues
Extraction Sums of
nt
Squared Loadings
27
Tota
% of
Cumulativ
% of
Cumulativ
l Variance
e%
Total Variance
e%
1
2
3
4
5
4.08
1
.374
.217
.205
.124
81.623
81.623
7.477
4.331
4.096
2.473
89.100
93.431
97.527
100.000
4.08
1
81.623
81.623
Extraction Method: Principal

Component Analysis.
Terlihat bahwa hanya komponen/faktor pertama yang
memenuhi kriteria eigenvalue lebih besar dari 1. Komponen
pertama memiliki nilai eigenvalue (varians) sebesar 4.081 dan
memiliki proporsi keragaman sebesar 81,623 persen dari
keragaman total. Jadi untuk mereduksi variabel cukup dengan
menggunakan satu komponen/faktor.
28
Dari screeplot juga jelas terlihat hanya komponen pertama

yang memiliki nilai eigenvalue lebih dari 1.
Component Matrixa
Component
1
Diffgeom
Complex
Algebra
Reals
Statistics
.896
.882
.933
.898
.908
Extraction Method: Principal Component Analysis.

a. 1 components extracted.
Rotated Component Matrixa
a. Only one component was extracted. The solution
cannot be rotated.
Hanya satu komponen yang terekstrak, sehingga tidak bisa
dirotasi.
Dari Component Matrix terlihat bahwa semua variabel
berkorelasi kuat dengan komponen pertama.
Component Score Coefficient Matrix
Component
1
Diffgeom
Complex
Algebra
Reals
Statistics
.220
.216
.229
.220
.222
Extraction Method: Principal Component

29
Analysis.
Rotation Method: Varimax with Kaiser
Normalization.
Component Scores.
Dari Component Score Coefficient Matrix, bisa dihitung skor
untuk
setiap case,
yaitu
dengan
mengalikan
nilai
variabel case yang telah distandardisasi dengan koefisien skor
faktornya.
Faktor_1 = 0.220 diffgeomstd + 0.216 complexstd + 0.229
algebrastd + 0.220 realsstd + 0.222 statisticsstd
Seperti halnya dalam Analisis Komponen Utama, penentuan
jumlah faktor juga sangat subjektif. Jika kita tidak puas
dengan hasil diatas yang hanya mengekstrak satu komponen,
maka kita bisa saja membuat kriteria agar terekstrak dua
komponen, yaitu dengan menandai pilihan Extract sesuai
keinginan pada kotak dialog seperti terlihat pada gambar di
bawah ini.
30
***
31
32
33
DAFTAR PUSTAKA
1. Devore J. L., 1991, Probability and Statistics for

Engineering in The Sciences, third edition, Pacific
Grove California.
2. Erickson, B. H., dan Nosanchuk, T. A., 1993, Memahami
Data, Terjemahan : R. K. Sembiring, LP3ES, Jakarta.
3. Djauhari, M., Catatan Kuliah, ITB, Bandung.
4. Minitab Inc, 1994, MINITAB Reference Manual 10 for
Windows , Minitab Inc, New York.
5. Walpole, R. E., 1997, Pengantar Statistika, Edisi ke-3,
Penerbit PT Gramedia Pustaka Utama, Jakarta.
6. Hines William M. W., and Montgomery D. C., 1990,
Probability and Statistics in Engineering and
Management Science, third edition, Jhon Wiley & Sons,
New York.
34

Modul Praktikum Satistika Industri Unla

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Modul Praktikum Satistika Industri Unla

Diunggah oleh

Hak Cipta:

Format Tersedia

MODUL PRAKTIKUM SATISTIKA INDUSTRI

5.1.2 Pengujian hipotesis untuk selisih dua nilai

1 PENGENALAN MINITAB 15, DATA,

Modul ini memberikan pengenalan singkat tentang software

1. Mahasiswa mendapatkan gambaran singkat tentang

3. Mahasiswa dapat melakukan pengambilan data sampel

Menu-menu pada Minitab 15

Pada software minitab, tampilannya ada 2, yaitu windows

Adapun menu-menu pada minitab 15 yaitu :

Open worksheet : menampilkan data yang telah

Open graph : membuka grafik yang telah disimpan

undo : kembali ke pekerjaan ke- n-1 (bila kita diposisi

atau mengedit perintah yang digunakan pada sesi

Subset worksheet : menampilkan sebagian worksheet

Erase variabels : menghapus variabel-variabel

Set base : menetapkan titik awal untuk pembangkitan

minimum, b) uji hipotesis 1 sampel, 2 sampel , c)

Formulas : menampilkan formula-formula ke kolom dan

Berikut adalah sub-sub menu pada menu editor session :

Output editable : mengeset tampilan output hanya

Tampilan menu tools adalah

10. Menu Help

1.2. Mengenal Data

merupakan keterangan yang menggambarkan kondisi saat

menggunakan statistika nonparametrik. Sedangkan data yang

1.3 Metode Sampling

Dalam metode ini, langkah pertama adalah populasi

1.4 Aplikasi dengan minitab

Pada langkah ini merupakan proses pemberian nomor

4. Isilah tabel yang keluar sesuai tabel berikut ( proses ini

5. Hasil yang keluar diatas merupakan nomor nomor unit

B. Random Berstrata (berlapis)

3. Buat patterned data sebanyak 60,50 dan 40 seperti pada

3. Buat patterned data pada file baru dengan nilai

4. Ambil 30 nomor sampel yang pertama, hasilnya adalah

Tentukan sampel berukuran 30 dari populasi dengan

Modul ini memberikan panduan secara singkat tentang teknik

1. Mahasiswa dapat menentukan beberapa ukuran

2.1 Ukuran Pemusatan

Median adalah nilai yang membagi suatu gugus data yang

Modus yaitu nilai yang paling sering muncul dalam suatu

Dalam penggunaannya, mean lebih sering digunakan dari

beberapa kasus yang membuat nilai tengah menjadi kurang

2.2 Ukuran Penyebaran

, di mana n banyaknya sampel

Simpangan baku merupakan akar dari variansi.

2.3 Ukuran Letak

Distribusi frekuensi yaitu penyajian data dalam bentuk tabel.

Bb = batas bawah kelas median

f p = frekuensi pada kelas kuartil ke-i

Pada tabel distribusi frekuensi, dapat juga diberikan

2.5 Penyajian dalam Bentuk Grafik

Histogram dibuat berdasarkan tabel distribusi frekuensi.

Box plot merupakan bentuk penyajian data yang hanya

Pagar luar (P)

Pencilan dikatagorikan sebagai pencilan jauh bila letaknya

Diagram dahan daun adalah salah satu teknik penyajian

Dari ketiga bentuk penyajian data di atas, dapat dilihat

menceng ke kiri dan 0 , data menceng ke kanan.

2.6 Aplikasi dengan minitab

Langkah-langkah menggunakan software minitab 15 adalah :

3. Pada kotak dialog, isi kolom tempat data pada variables,

4. Hasil yang diperoleh adalah sebagai berikut :