UNIVERSITAS LANGLANGBUANA
MODUL 1
DAFTAR ISI
KATA PENGANTAR
iii
DAFTAR ISI
iv
1
PENGENALAN MINITAB 15, DATA, DAN
TEKNIK PENGAMBILAN SAMPEL 1-1
1.1 Menu-menu pada Minitab 15 1-2
1.2. Mengenal Data 1-16
1.2.1 Populasi dan sampel 1-16
1.2.2 Skala pengukuran
1-17
1.3 Metode Sampling 1-19
1.4 Aplikasi dengan minitab
1-21
2
STATISTIKA DESKRIPTIF
2-1
2.1 Ukuran Pemusatan
2-2
2.2 Ukuran Penyebaran
2-2
2.5 Penyajian dalam Bentuk Grafik
2-5
2.6 Aplikasi dengan minitab 2-6
3
KENORMALAN DATA 3-1
3.1 Distribusi normal 3-2
3.2 Statistik uji kenormalan 3-3
3.3 Aplikasi dengan minitab 3-4
4
TRANSFORMASI DATA
4-1
4.1 Transformasi untuk satu angkatan data
4-2
4.2 Transformasi untuk beberapa angkatan data
(menyamakan sebaran)4-4
4.3 Aplikasi Minitab 4-5
5
UJI HIPOTESIS STATISTIK DAN PROPORSI
5-1
5.1 Hipotesis statistik 5-2
5.1.1 Pengujian hipotesis untuk satu nilai tengah
5-3
MODUL 1
ii
MODUL 1
iii
Overview
Tujuan
1.1
MODUL 1
MODUL 1
MODUL 1
Query database :
MODUL 1
2. Edit
Sub-sub menu pada menu edit adalah :
MODUL 1
MODUL 1
MODUL 1
4. Calc (calculation)
Pada menu calc terdapat sub-sub menu :
- Calculator
:
untuk
melakukan
perhitungan
(penjumlahan,
perkalian,
pembagian,
sinus,
maksimum, eksponen, dan lain-lain)
- Column statistics : menghitung ukuran-ukuran statistik
dari suatu kolom
- Row statistics : menghitung ukuran-ukuran statistik
dari suatu baris
- Standardize : menormalisasikan data
- Make patterned data : membuat suatu kolom(data)
dengan pola tertentu
- Make mesh data : Membuat sebuah fungsi dua dimensi
seperti permukaan berdasarkan pasangan nilai x dan y
- Make indicator variables : membuat variabel dummy
untuk data kualitatif
MODUL 1
5. Menu Stat
Sub-sub menu pada menu stat adalah :
- Fit interceps : mendefault intersep pada persamaan
regresi
- Basic statistics : a) descriptiv statistics : menampilkan
ukuran-ukuran statistics, seperti mean, median,
trimean, standart deviasi, kuartil, maksimum dan
MODUL 1
10
MODUL 1
11
6. Menu Graph
Pada menu graph berisi sub-sub menu seperti pada
tampilan di bawah yang digunakan untuk membuat grafikgrafik seperti histogram, diagram lingkaran, plot, countur,
plot untuk data time series, box plot, diagram dahan daun.
Untuk grafik-grafik tertentu dapat ditampilkan dalam dua
dimensi maupun tiga dimensi.
MODUL 1
12
7. Menu Editor
Berikut adalah sub-sub menu editor pada worksheet :
- Next column : memindahkan kursor ke kolom
berikutnya
- Go to active cell : memindahkan kursor ke sell yang
aktif
- Format column : memformat kolom dalam numerik,
tanggal, text.
- Column : mengatur ukuran-ukuran kolom
MODUL 1
13
MODUL 1
14
8. Tools
Adapun sub-submenu pada menu tools adalah
- Microsoft Calculator : Menampilkan menu calculator
microsoft
- Notepad : Menampilkan notepad
- Windows Explorer : Menampilkan menu windows
explorer
- Toolbars : Untuk men-setting tool tool yang ingin
ditampilkan atau tidak
- Status Bar : Status bar terletak dibagian bawah layar
dan menampilkan pesan yang menjelaskan item menu
dan toolbars yang saat ini sedang aktif.
MODUL 1
15
Customize
:
Digunakan
untuk
mengedit/menambah/menampilkan shortcut perintah
(command), Toolbars, tool dan lain-lain pada Minitab
Options : Digunakan untuk merubah dan menyimpan
settingan standar untuk berbagai macam operasi
Manage
Profiles
:Digunakan
untuk
membuat,
menghapus, mengaktifkan atau menonaktifkan satu
atau beberapa profil termasuk mengubah urutan nya.
File Security :digunakan untuk melindungi file proyek
dari pihak lain
9. Menu Windows
Sub-sub menu pada menu windows digunakan untuk
mengatur tampilan dari windows minitab dan menyimpan
data, session, grafik yang telah dibuat untuk sementara,
yaitu :
MODUL 1
16
MODUL 1
17
MODUL 1
18
MODUL 1
19
4. Ketelitian
Hal ini berhubungan dengan waktu dan biaya yang
terbatas. Misal biaya dan waktu penelitian terbatas, maka
jumlah tenaga yang membantu penelitian akan menjadi
pertimbangan,
sehingga
hasilnya
pengolahannya
berpengaruh pada tingkat ketelitian.
1.2.2 Skala pengukuran
Skala pengukuran merupakan bagian yang paling mendekati
pengukuran data baik secara diskret maupun kontinu. Skala
ini sangat penting, karena berkaitan dengan pemilihan teknik
analisis statistika yang sangat bergantung pada sifat data
dan skala pengukuran yang digunakan. Ditinjau berdasarkan
skala pengukurannya, data dapat dibedakan menjadi
beberapa kelompok, yaitu ( dari yang terendah sampai yang
tertinggi ) :
a. Skala Nominal
Data yang termasuk dalam kelompok ini memiliki ciri
bahwa data tidak memiliki tingkatan. Satu satunya
operator matematika yang berlaku adalah persamaan dan
pertidaksamaan.
Contohnya adalah data tentang jenis kelamin, agama,
jenis penyakit dan sebagainya.
b. Skala Ordinal
Sudah ada tingkatan pada data yang masuk kelompok ini,
hanya saja belum ada ketentuan jarak yang sama antar
tingkatan,serta ada hubungan lebih dari.
Contohnya adalah data tentang golongan kepegawaian,
kepangkatan, nilai huruf, peserta kontes kecantikan, jenis
komputer dan sebagainya.
MODUL 1
20
c. Skala Interval
Selain sudah memiliki tingkatan seperti data pada skala
ordinal, data yang masuk dalam kelompok ini juga
memiliki sifat bahwa jarak antar tingkatan adalah sama.
Hal ini diperiksa melalui selisih antar tingkatan selalu
tetap Sebagai contoh data suhu yang diukur dalam
Celcius, selisih antara suhu 30 dan 29 akan sama dengan
selisih suhu 10 dan 11 atau dengan yang lainnya. Ciri lain
dari data ini adalah nilai 0 belum memiliki arti sebenarnya
( tidak ada).
Contohnya adalah suhu 0 derajat bukan berarti tidak ada
suhu, tahun 0 bukan berarti tidak ada tahun.
d. Skala Rasio
Data yang memiliki skala ini memiliki tingkatan yang
paling tinggi. Semua sifat pada skala interval juga ada
pada data skala rasio ini. Tambahan sifat untuk jenis data
ini adalah nilai 0 sudah memiliki arti yang sebenarnya (
tidak ada ).
Contoh adalah data tentang berat, tinggi, harga, volume
dan sebagainya.
Dengan mengetahui jenis data yang akan diolah, maka kita
dapat menentukan analisis yang tepat untuk data tersebut.
Sebagai contoh data yang memiliki skala Nominal hanya
dapat disajikan dalam bentuk pie chart, bar chart dan tidak
dapat ditentukan ukuran ukuran statistik seperti mean,
standard deviation
dan sebagainya. Data yang berskala
Ordinal selain dapat dianalisa seperti nominal juga dapat
dianalisa lebih lanjut tetapi sebelumnya harus ditransformasi
ke bentuk numerik. Tetapi, kadang untuk pengolahan lebih
lanjut, data berskala ordinal dan nominal dapat diolah dengan
MODUL 1
21
MODUL 1
22
N
dengan N : ukuran populasi dan n : ukuran sampel.
n
Contoh
Sebuah populasi berukuran 100 dan akan diambil sampel
berukuran 15. Misalkan bilangan acak pertama dipilih 70
agar merata maka pertambahannya bisa dipilih sekitar 7.
Hasil selengkapnya bisa dilihat pada tabel berikut :
N
o
1
2
3
MODUL 1
Baris
an
70
77
84
Sampel yg
terpilih
70
77
84
23
4
5
6
7
8
9
10
11
12
13
14
15
4.
91
98
105
112
119
126
133
140
147
154
161
168
91
98
5
12
19
26
33
40
47
54
61
68
Bergerombol ( cluster )
Pada metode ini teknik yang digunakan mirip dengan
metode acak sederhana hanya saja disini yang menjadi
unit sampelnya adalah berupa cluster cluster yang
mana masing masing cluster berisi elemen elemen
yang yang lebih kecil. Yang menjadi pedoman untuk
menentukan cluster adalah bahwa cluster cluster
tersebut memiliki karakteristik yang hampir sama.
Contoh
Sebuah populasi berukuran 1000 tetapi dapat
dikelompokan dalam kluster kluster yang berukuran
10, jadi total klusternya adalah 100. Misalkan dari 100
cluster tersebut akan diteliti sebanyak 6 cluster maka
dengan metode acak sederhana dapat ditentukan 6
kluster yang terpilih. Unit unit sampel yang diteliti
adalah keseluruhan unit populasi atau sebagian unit
yang terletak didalam 6 kluster terpilih tersebut.
MODUL 1
24
MODUL 1
25
3. Pilih calc,Random
Columns
Data
kemudian
Sample
From
26
2
15
147
164
126
117
121
48
176
110
114
199
79
135
MODUL 1
27
n1
60
x 20 8
60 50 40
Teknik Informatika
n2
50
x 20 6
60 50 40
Teknik Industri
n3
40
x 20 6
60 50 40
200
7
30
28
Baris
an
50
57
64
71
78
85
92
99
106
113
120
127
134
141
148
155
162
169
176
183
190
197
204
211
218
225
232
239
Sampel yg
terpilih
50
57
64
71
78
85
92
99
106
113
120
127
134
141
148
155
162
169
176
183
190
197
04
11
18
25
32
39
29
29
30
246
253
46
53
D. Bergerombol
Misalkan akan diteliti kualitas suatu minuman mineral botol
yang dikemas dalam kotak. Jumlah kotak keseluruhan adalah
100 kotak dimana masing masing kotak berisi 10 botol dan
sampel yang diinginkan adalah 50 botol. Alternatif yang dapat
dilakukan antara lain dari 100 kotak diambil 5 kotak secara
acak kemudian semua botol dalam kotak tersebut diteliti.
Alternatif lain yang dapat dipilih dari 100 kotak tersebut
dipilih 10 kotak acak kemudian dari 10 kotak tersebut dipilih 5
botol secara acak. Misalkan alternatif kedua yang dipilih :
1. Beri nomor 1 sampai 100 semua kotak yang dimiliki.
2. Buat patterned data pada file baru sebanyak 100 seperti
pada langkah sebelumnya kemudian simpan dalam kolom
yang tertentu(C1)
3. Ambil 10 sampel secara acak berdasarkan kolom C1
simpan pada C2.
4. Beri nomor 1 sampai 10 pada seluruh botol untuk 10 kotak
yang terpilih.
5. Buat patterned data pada file baru sebanyak 10 seperti
pada langkah sebelumnya kemudian simpan dalam kolom
C3
6. Ambil 5 sampel secara acak berdasarkan kolom C3 simpan
pada C4, ulangi sampai 10X dan simpan dalam kolom
yang berbeda.
7. Semua nomor sampel yang terpilih pada masing masing
kotak merupakan unit sampel yang akan diteliti.
Latihan
MODUL 1
30
1.
2.
3.
4.
MODUL 1
31
2 STATISTIKA DESKRIPTIF
Overview
Tujuan
MODUL 2
xi
, n banyaknya sampel
n
xi
, N banyaknya populasi
N
x
X n X n 1 .
2
2
2
genap median
MODUL 2
S2
xi x 2
n 1
xi 2
N
MODUL 2
MODUL 2
1 f f
t
sm
Median : ~
x Bb 2
fm
ft =
frekuensi
total
p = interval kelas
f m = frekuensi kelas median
f sm = frekuensi kumulatif sebelum median
Modus : x Bb
a
p
ab
a f m f am
b f m f bm
f m = frekuensi kelas modus
f am = frekuensi sebelum kelas modus
f bm = frekuensi sesudah kelas modus
-
Ukuran penyebaran
S
i 1
f i ci 2
f i ci
i 1
n n 1
Ukuran letak
Kuarti ( Qi , Q2 , Q3 )
Qi Bb
4i f t f sp
fp
p , i 1, 2, 3
MODUL 2
p1 Q1 1.5 Q3 Q1
P1 Q1 2 Q3 Q1
p 2 Q3 1.5 Q3 Q1
P2 Q3 2 Q3 Q1
MODUL 2
x~
x
. Jika 0 , data
S
Bandu
ng
42
45
51
61
69
76
78
78
72
62
51
MODUL 2
Sukabu
mi
8
14
25
43
54
64
71
69
58
47
29
Gar
ut
32
33
41
52
62
72
77
75
68
58
47
Tasi
k
56
60
58
62
63
68
69
71
69
67
61
Bog
or
51
58
57
67
81
88
94
93
85
74
61
7
12
44
16
35
58
55
MODUL 2
MODUL 2
MODUL 2
10
MODUL 2
11
MODUL 2
12
Latihan
1. Jarak (mil) yang ditempuh
gallon bahan baker adalah:
15. 16. 18. 16. 17.
7
2
2
3
9
17. 18. 16. 16. 16.
6
1
7
7
0
18. 17. 14. 17. 17.
6
1
1
5
0
16. 17. 16. 18. 15.
0
7
1
6
2
17. 16. 16. 16. 17.
0
9
9
7
3
17. 15. 15. 17. 16.
0
6
6
9
0
14. 17. 15. 17. 17.
7
1
2
0
8
16. 17. 18. 14. 16.
5
7
8
6
5
14. 17. 16. 18. 15.
9
5
1
5
8
17. 15. 17. 17. 16.
1
9
1
1
4
16.
8
17.
0
15.
6
19.
5
17.
3
18.
2
18.
2
15.
6
17.
3
16.
3
MODUL 2
13
3
0
2
8
2
2
1
7
1
9
3
3
1
8
2
3
3
1
2
7
2
2
2
5
1
9
2
0
1
5
2
8
2
5
2
4
1
6
1
9
51
0
50
0
46
0
46
9
34
5
56
0
51
3
42
6
40
0
45
6
45
0
47
6
48
0
50
0
40
0
42
7
14
45
8
40
0
38
6
52
0
50
0
39
0
47
5
46
5
47
6
47
5
51
3
40
0
47
6
48
2
34
6
40
0
MODUL 2
43
6
40
0
32
0
48
0
47
9
48
0
40
0
50
0
36
0
52
0
34
8
36
5
47
0
47
3
50
0
42
8
49
0
47
5
51
8
36
0
40
0
43
6
46
3
52
3
50
0
50
0
52
0
50
0
51
8
47
6
48
2
34
5
47
5
50
0
51
8
34
6
42
0
46
3
46
0
40
0
51
5
37
5
44
5
42
6
45
0
45
5
45
6
46
8
48
0
36
8
35
0
42
3
44
6
46
5
52
5
46
8
46
5
47
5
52
5
34
2
38
6
34
6
42
0
42
3
15
KENORMALAN DATA
Overview
MODUL 2
16
Tujuan
1
f x
e 2
< X < .
2
MODUL 2
17
x dx
2. f x 0 , x
lim f x 0 dan lim f
3. x
x 0
4. f x f x
5. Nilai maksimum dari f terjadi pada x
6. Titik belok dari f terjadi pada x
Kurva setiap distribusi kontinu dibuat sedemikian rupa
sehingga luas daerah dibawah kurva diantara dua koordinat
x x1 dan x x 2 sama dengan peluang peubah acak X
antara x x1 dan
sebagai berikut :
x1
MODUL 2
x2
x
18
P ( x1 X x 2 ) =
x2
n( x ; , ) dx
x1
x2
2 x1
x 2
1
2
dx
MODUL 2
19
MODUL 2
Sm
Sm
Sm
Sm
Sm
56
59
66
68
70
50
67
63
50
47
63
Smr
77
Sm
Sm
14
16
40
4
46
3
30
Sm
r
99
20
46
76
66
57
49
67
36
50
46
8
50
3
73
1
42
3
57
8
46
2
59
5
58
4
50
3
39
0
49
8
60
0
42
1
53
6
58
7
59
2
35
1
52
0
41
8
44
8
43
5
45
4
41
8
58
7
52
1
58
6
41
3
39
9
51
3
46
1
34
4
57
9
54
1
57
5
62
4
47
3
58
3
55
0
48
5
37
5
63
7
49
6
56
2
68
1
52
1
59
8
48
5
55
7
45
5
44
9
50
8
48
5
73
7
50
0
48
6
47
2
60
5
36
3
44
3
49
5
48
6
61
8
56
6
53
8
42
5
57
1
34
5
44
5
51
9
44
4
23
0
55
1
53
0
1
6
49
5
55
5
53
8
45
9
48
3
42
4
24
7
22
7
55
1
1
3
55
3
54
1
52
0
46
2
54
6
46
3
35
2
50
3
51
2
1
5
54
8
45
1
36
8
50
5
48
4
42
1
41
2
60
7
43
3
1
2
51
7
35
0
44
1
44
9
39
8
45
4
37
1
57
0
53
2
3
4
5
6
7
8
9
MODUL 2
21
MODUL 2
22
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
200
300
400
500
600
700
produksi
Average: 498.310
StDev: 96.5048
N: 126
MODUL 2
23
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
200
300
400
500
600
700
produksi
Average: 498.310
StDev: 96.5048
N: 126
MODUL 2
24
Statistik Kolmogorovsmirnov
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
200
300
400
500
600
700
produksi
Average: 498.310
StDev: 96.5048
N: 126
MODUL 2
25
MODUL 2
26
27
software matlab,
akan keluar
MODUL 2
28
We could simply plot the raw, sample data in a histogram like this one:
MODUL 2
29
This histogram does show us the shape of the sample data and it is a good starting
point. We can see that this distribution is skewed to the right and probably non-normal.
However, this graph only tells us about the data from this specific example. You cant
make any inferences about the larger population.
What can be done to increase the usefulness of these data? First, identify the
distribution that your data follow. Once you do that, you can learn things about the
populationand you can create some cool-looking graphs!
MODUL 2
30
1.2
To identify the distribution, well go to Stat > Quality Tools > Individual Distribution
Identification in Minitab. This handy tool allows you to easily compare how well your
data fit 16 different distributions. It produces a lot of output both in the Session window
and graphs, but don't be intimidated. Before we walk through the output, there are 3
measures you need to know.
Anderson-Darling statistic (AD): Lower AD values indicate a better fit. Its generally
valid to compare AD values between distributions and go with the lowest.
P-value: You want a high p-value. A low p-value (e.g., < 0.05) indicates that the data
dont follow that distribution. For some 3-parameter distributions, the p-value is
impossible to calculate and is represented by asterisks.
LRT P: For 3-parameter distributions only, a low value indicates that adding the third
parameter is a significant improvement over the 2-Parameter version. A higher value
suggests that you may want to stick with the 2-Parameter version.
So, for my data, Ill fill out the main dialog like this:
MODUL 2
31
Lets dive into the output. Well start with the Goodness of Fit Test table below.
MODUL 2
32
The very first line shows our data are definitely not normally distributed, because the pvalue for Normal is less than 0.005!
We'll skip the two transformations (Box-Cox and Johnson) because we want to identify
the native distribution rather than transform it.
A good place to start is to skim through the AD values and look for the lowest. The
lowest AD is for 3-Parameter Weibull. However, the AD values for 3-Parameter
Lognormal, Largest Extreme Value, and 3-Parameter Gamma are all close. For the 3Parameter Weibull, the LRT P is significant (0.000), which means that the third
parameter significantly improves the fit. The LRT P is not significant for the other 3Parameter candidate distributions.
Given the lower AD value and the significant LRT P value, we can pick the 3-Parameter
Weibull distribution as the best fit for our data. We identified this distribution by looking
at the table in the Session window, but Minitab also creates a series of graphs that
provide most of the same information along with probability plots. You can see 3-
MODUL 2
33
Parameter Weibull in the graph below. The data points follow a fairly straight line, which
indicates a fit.
Now we know what the distribution isbut what are the distribution's parameter values?
For those, look at the next table down in the Minitab Session window output:
MODUL 2
34
1.3
All right. Now we know that the body fat percentage data follow a 3-Parameter Weibull
distribution with a shape of 1.85718, a scale of 14.07043, and a threshold of 16.06038.
At this point you may be wondering, "How does that help us?" The answer: with this
information about the distribution, we can go beyond the raw sample data and make
statistical inferences about the larger population.
MODUL 2
35
Latihan
1. Data seperti contoh no. 1,
kemudian dilakukan
pengacakan 15 kali dan diambil sampel ukuran 10, 20, 30.
Buat histogram dengan kurva normalnya dan uji
kenormalannya.
2. Bangkitkan data dari komputer, kemudian lakukan
pengacakan 20 kali, dari data berdistribusi normal,
poisson dengan rata-rata 2, binomial dengan p = 0.6 dan
n = 15. Buatlah histogramnya.
MODUL 3
MODUL 3
TRANSFORMASI DATA
Overview
Tujuan
normalkan data
MODUL 4
Agar asumsi bahwa data berdistribusi Normal tetap dipenuhi,
maka perlu dilakukan suatu transformasi terhadap data asli.
Transformasi dilakukan untuk satu angkatan data bila data
yang akan ditransformsi hanya satu angkatan data. Untuk
memilih fungsi transformasi yang tepat digunakan tangga
transformasi Tukey yang digambarkan sebagai berikut :
1
x2
1
x
Kuat
log x
sedang
lemah
x2
x3
10 x
lemah
sedang
kuat
MENJULUR KE KIRI
SIMETRIS MENJULUR KE KANAN
Tangga transformasi ini dapat diartikan sebagai berikut :
Transformasi 10 x akan membuat bentuk distribusi data
menjadi
menjulur kekanan
secara kuat,
sedangkan
transformasi
1
x2
MODUL 4
log( S A ) log( S B )
log( T A ) log( TB )
4.3
1
x
1
x
Aplikasi Minitab
5.6
14.3
3.0
2.5
3.8
1.7
5.5
3.7
9.7
2.6
15.3
8.3
2.4
1.9
3.6
4.9
2.9
6.8
1.8
3.4
6.9
8.8
6.5
1.9
5
3.4
4.4
9.6
7.5
1.7
4.6
3.4
2.1
1.5
3.7
5.3
4.1
9.1
5.7
0.9
1.9
2.3
1.
2.
2.9
4.6
4.8
8.3
5.8
2.8
6.3
3.1
7.6
5.5
8.0
3.5
1.7
11.4
6.5
1.7
2.1
9.3
3.4
10.4
4.0
3.8
4.9
1.5
4.8
4.4
2.9
6.4
0.5
2.1
8.1
3.6
11.9
5.2
3.6
3.4
3.7
2.4
13.7
15.3
1.3
4.9
12.0
2.3
3.2
5.9
3.0
3.7
3.6
2.4
2.9
MODUL 4
F re q u e n cy
20
10
0
0
10
20
jlrkanan
3.
4.
MODUL 4
Frequency
15
10
0
0.5
1.5
2.5
3.5
4.5
akar x
5.
6.
MODUL 4
Frequency
15
10
0
0.0
0.5
1.0
log x
7.
Frequency
25
20
15
10
5
0
0
100
200
300
transf x
MODUL 4
10
Histogram of transformasi x3
80
70
Frequency
60
50
40
30
20
10
0
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
transf x
Latihan
Periksa distribusi data berikut, bila belum simetris, lakukan
transformasi yang tepat seperti pada langkah langkah
praktikum diatas
60
5
57
5
55
3
54
8
45
7
50
7
46
8
50
0
49
8
44
9
MODUL 4
63
3
66
1
42
0
42
5
45
1
47
7
49
8
46
6
58
8
58
9
11
35
6
44
5
44
8
45
0
46
8
50
1
44
3
48
9
44
3
42
6
46
4
42
8
45
5
55
2
44
3
48
5
51
3
55
8
48
6
47
8
42
6
49
3
55
5
54
2
51
0
67
7
76
3
73
8
60
8
43
3
46
0
48
5
MODUL 4
34
5
37
7
45
5
36
1
34
5
53
1
52
1
36
0
44
2
50
3
57
3
57
1
53
4
41
4
57
5
63
5
54
7
49
9
50
3
49
5
51
9
48
2
54
5
48
9
39
2
63
6
67
2
59
7
59
7
52
1
57
6
56
8
12
MODUL 4
13
Overview
Tujuan
hipotesis
dapat
mengikuti
1.
2.
3.
4.
5.
6.
x 0
Alternatif
1
H1 : 0
2
3
H1 : > 0
H1 : < 0
x 0
s
n
MODUL 5
x y 0
2
2x y
nx n y
Hipotesis
Alternatif
H1 : x y 0
2
3
H1 : x y > 0
H1 : x y < 0
Kriteria penolakan
H0 ditolak pada saat Z Z/2 atau
Z Z1/2
H0 ditolak pada saat Z Z1
H0 ditolak pada saat Z Z
MODUL 5
2
S maks
2
S min
n
ny
x
v
S x2
ny
nx 1
ny 1
Statistik uji pengujian hipotesis terhadap selisih antara
dua nilai tengah untuk ragam berbeda adalah
x y 0
t
2
S x2 S y
nx n y
nx
S y2
n x 1 S x2 n y
1 S y2
nx n y 2
MODUL 5
x y 0
S gab
1
1 .
nx n y
NO
Hipotesis
Alternatif
H1 : x y 0
H1 : x y > 0
H1 : x y < 0
Kriteria penolakan
H0 ditolak pada saat t t/2, m
atau t t1/2, m
MODUL 5
Fre
n
55
42
45
71
83
47
75
48
60
69
85
54
31
25
30
Fle
xi
60
33
39
61
40
94
71
61
77
64
65
70
80
61
50
Esi
a
37
60
35
61
31
56
65
78
59
27
30
45
38
25
35
MODUL 5
MODUL 5
10
MODUL 5
11
MODUL 5
12
Data
70
60
50
40
30
20
Fren
Flexi
13
Karena Ho diterima, maka dapat disimpulkan bahwa ratarata jumlah pengguna produk fren dan flexi di 15
kecamatan kota Bandung sama. Hal itu dimungkinkan dua
produk tersebut masing-masing mempunyai kelebihan dan
kekurangan, sehingga konsumen akan memilih produk
yang sesuai dengan kebutuhannya.
6. Untuk latihan, lakukan langkah dan analisis yang sama
untuk fren vs esia, flexi vs esia.
5.2 Uji proporsi
Proporsi menyatakan perbandingan banyaknya sukses
terhadap total pengamatan. Bila x menyatakan banyaknya
sukses dari n ulangan, maka nilai proporsi p dihitung dengan
rumus : p
x
.Uji proporsi dapat dilakukan terhadap satu
n
MODUL 5
14
H 1 : p p0
Wilayah kritik: x a
terbesar yang bersifat
P X a
dimana
adalah
bilangan
bulat
b x; n; p0
x 0
H 0 : p p0
H 1 : p p0
Wilayah kritik
yang bersifat
P X a
b x; n; p0
x a
H 0 : p p0
H1 : p p0
MODUL 5
15
P X a
P X a
b x; n; p0
x 0
b x; n; p0
xa
atau
H 0 : p 0,7
H 1 : p 0,7
Taraf = 5% = 0,05
MODUL 5
16
MODUL 5
17
MODUL 5
18
Sample
1
X
8
N
15
Sample p
0.533333
95% CI
(0.265861, 0.787333)
Exact
P-Value
0.258
x np0
np0 q0
n : banyaknya eksperimen/ulangan
p0 : peluang sukses / proporsi
MODUL 5
19
z Z1
z Z
z Z1
bila
uji
hipotesisnya
H 1 : p p0
H 0 : p 0,6
H 1 : p 0,6
Taraf = 5% = 0,05
2. Langkah langkah yang dilakukan untuk uji hipotesis ini
mirip
dengan
uji
hipotesis
tanpa
menggunakan
pendekatan normal. Perbedaannya adalah ketika memilih
kotak option kita memilih check list use test and interval
test based on normal distribution seperti berikut ini
MODUL 5
20
MODUL 5
21
X
70
N
100
Sample p
0.700000
Bound
0.624623
Z-Value
2.04
P-Value
0.021
p 1 p 2
p q 1 1
n1 n2
Dimana
p 1
x1
n1
MODUL 5
p 2
x2
n2
x1 x 2
n1 n2
q 1 p
22
x1
x2
n1
n2
Hipotesisnya
H 0 : p1 p 2
z Z
atau
z Z
Bandung(p1)
yang
akan
melanjutkan
ke
23
H 1 : p1 p 2 atau H 0 : p1 p 2 0
Taraf = 5% = 0,025 selang kepercayaan = 97,5 %
2. Pilih menu Basis Statistic , 2 Proportion
MODUL 5
24
MODUL 5
25
X
120
240
N
200
500
Sample p
0.600000
0.480000
0.0392076
Z = 2.91 P-Value = 0.002
MODUL 5
26
1. Suatu penelitian diadakan untuk mengetahui apakah ratarata banyaknya panggilan tiap 2 jam yang diterima oleh
swicthboard pada dua wartel sama atau tidak. Berikut
adalah rata-rata banyaknya panggilan dari dua wartel tiap
2 jam selama 15 hari
H
1
2
3
4
5
6
7
8
W1
20 10 12 6
12 8
22 13
W2
10 10 23 6
8
6
15 12
W1
10 8
9
15 20 15 10 10
W2
11 5
10 18 8
6
12 12
a. Buatlah hipotesisnya
b. Uji dan buat kesimpulannya
1. Suatu sampel acak berukuran 20 diambil dari nilai UTS
matakuliah Statistika dari mahasiswa 01. 02, dan 03
Penelitian tersebut dimaksudkan untuk membandingkan
kemampuan akademik antara mahasiswa kelas 01. 02,
dan 03, berdasarkan uji selisih nilai tengah antara dua
sampel. Adapun datanya sebagai berikut :
NO
1
2
3
4
5
6
7
8
9
10
MODUL 5
Nilai UTS
01
43
75
43
78
60
76
60
63
60
53
Nilai UTS
02
92
47
56
74
79
28
71
68
69
80
Nilai UTS
03
63
83
44
37
34
53
53
60
42
36
27
11
12
13
14
15
16
17
18
19
20
60
25
50
40
50
65
70
65
75
5
63
86
65
99
59
65
78
66
66
96
37
50
72
52
65
73
58
81
15
63
MODUL 5
PRA
TEST
8
7
POST
TEST
15
15
JENI
S
P
P
28
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
MODUL 5
10
10
11
12
16
15
17
17
16
17
18
18
18
19
20
19
23
20
18
21
22
22
20
18
21
19
23
21
25
25
23
26
25
21
15
21
25
21
22
10
21
23
25
25
12
20
25
26
20
27
26
27
20
25
25
26
27
28
29
29
29
29
29
29
30
30
L
P
L
L
P
P
P
L
P
L
P
L
L
L
L
L
P
P
L
P
P
P
L
L
P
L
L
P
P
P
L
P
L
29
MODUL 5
30
ANALISIS VARIANSI
Overview
Tujuan
MODUL 6
6.1
6.2
2 n11
1
2 n 21
..........
2
2 nk 1
k
N k
S g2
k
S g2
S g2
(ni 1) S i2
i 1
N k
bk ( ; n1 , n 2 , ..., n k )
6.3
n1 bk ( ; n1 ) n2 bk ( ; n1 ) ... nk bk ( ; n
N
N 1 S 2 N m ni
i 1
JKT
maka
hubungan
1 S i2 m 1 V
JKD
JKA
di mana
JKT = Jumlah Kuadrat Total
JKD = Jumlah Kuadrat Dalam angkatan
JKA = Jumlah Kuadrat Antar angkatan
1 m
Xi X
m 1 i 1
ni = banyaknya data dalam angkatan ke-i
V = variansi dari semua rata-rata angkatan
N = Total data penggabungan semua angkatan
S2 = variansi gabungan
S i2 = variansi angkatan ke-i
V
X22
:
X1n1
:
X2n2
MODUL 6
..
Untuk menghitung JKT, JKD, dan JKA digunakan rumusan
sebagai berikut :
JKD
ni
i 1
j 1
X ij
X ij
j 1
i 1
ni
JKA
i 1
X ij
j 1
JKT
ni
ni
i 1
j 1
X ij
ni
ni
ni
X ij
i 1 j 1
ni
i 1 j 1
X ij
JKA
m 1 RKA . Kemudian
JKD
RKD
N m
6.4
variansi dapat
Jumlah
Kuadrat
JKA
JKD
Nm
JKT = JKA +
JKD
N1
RKD
Fre
n
55
42
MODUL 6
Fle
xi
60
33
Esi
a
37
60
6
3
4
5
6
7
8
9
10
11
12
13
14
15
45
71
83
47
75
48
60
69
85
54
31
25
30
39
61
40
94
71
61
77
64
65
70
80
61
50
35
61
31
56
65
78
59
27
30
45
38
25
35
MODUL 6
MODUL 6
MODUL 6
MODUL 6
R-Sq = 13.75%
R-Sq(adj) =
10
Data
70
60
50
40
30
20
Fren
Flexi
Esia
11
Karena Ho ditolak, maka dapat disimpulkan bahwa ratarata jumlah pengguna produk fren, flexi dan esia di 15
kecamatan kota Bandung berbeda. Hal itu dimungkinkan
satu atau dua dari tiga
produk tersebut ada yang
mempunyai
kelebihan,
sehingga
konsumen
akan
cenderung memilih produk tersebut.
Latihan
1. Berikut adalah data pengunjung dari lima warnet dalam
waktu 1 minggu.
Warnet/
hr
A
B
C
D
E
1
0
1
8
1
2
1
5
2
0
2
0
1
5
2
5
1
5
1
0
2
5
1
0
3
0
2
0
8
3
5
2
5
9
2
0
3
0
1
0
2
0
3
5
2
0
3
0
1
0
2
5
1
5
2
6
3
5
1
0
9
2
5
3
5
12
II
1
0
3
II
I
8
IV
1 5
2
Toshiba
4
9 1 2
0
Compac
1 1 8 1 1
5 0
2 0
IBM
5 3 6 8 2
HP
4 3 6 1 3
0
Dengan menggunakan analisis ragam dan taraf nyata
0.05, uji apakah rata-rata penjualan dari kelima merk
laptop di BEC sama, dengan menggunakan hipotesis
seperti pada dasar teori di atas.
3. Berikut adalah data nilai toefl tiga jurusan yaitu TE, IF, dan
TI angkatan 2006
ST
TI
IF
426.6 450.0 453.3
67
00
33
520.0 506.6 480.0
00
67
00
216.6 456.6 550.0
67
67
00
290.0 576.6 460.0
00
67
00
410.0 360.0 403.3
00
00
33
400.0 500.0 380.0
MODUL 6
13
00
370.0
00
490.0
00
343.3
33
390.0
00
373.3
33
430.0
00
456.6
67
580.0
00
410.0
00
436.6
67
423.3
33
413.3
33
396.6
67
430.0
00
410.0
00
430.0
00
MODUL 6
00
430.0
00
413.3
33
386.6
67
363.3
33
433.3
33
543.3
33
350.0
00
436.6
67
386.6
67
350.0
00
416.6
67
410.0
00
386.6
67
366.6
67
406.6
67
543.3
33
00
443.3
33
216.6
67
450.0
00
453.3
33
216.6
67
463.3
33
430.0
00
363.3
33
430.0
00
216.6
67
473.3
33
403.3
33
406.6
67
413.3
33
446.6
67
416.6
67
14
510.0
00
216.6
67
420.0
00
420.0
00
483.3
33
370.0
00
433.3
33
476.6
67
426.6
67
363.3
33
383.3
33
380.0
00
413.3
33
383.3
33
216.6
67
420.0
00
416.6
67
443.3
33
540.0
00
473.3
33
413.3
33
520.0
00
510.0
00
420.0
00
MODUL 6
15
Overview
Tujuan
1.
2.
3.
7.1 Regresi
Suatu permasalahan penelitian biasanya dapat dijelaskan
oleh dua atau lebih variabel yang saling berhubungan satu
sama lain. Variabel-variabel yang saling berhubungan
tersebut membentuk suatu persamaan matematis
yang
dapat digunakan untuk menentukan nilai sebuah variabel
yang bergantung pada nilai variabel yang lain. Dalam
statistika, hubungan fungsional antara variabel tak bebas
( dinotasikan Y ) dengan variabel bebas ( dinotasikan X )
disebut regresi antara Y dan X. Persamaan regresi yang akan
dibahas pada bab ini persamaan linier sederhana, persamaan
non-linier yang dibangkitkan dari persamaan linier yaitu
eksponensial dan geometrik.
7.1.1 Model untuk regresi linier sederhana
Bentuk umum :
y x
y : variabel takbebas
x : variabel bebas
: error yang terjadi pada eksperimen
Nilai selalu berubah ubah pada setiap
a y b x dan
xy
x y
x2
n
x 2
n
JKR
JKT
y y
2
y y
2
KT galat
3
Galat
n-p-1
Total
n-1
Sisa
JK galat
n p 1
Y Y nY
bp
Se b p
Model tersebut
berubah menjadi model linier,
sehingga nilai c dan d didapatkan dari rumusan model
linier yaitu
c log y d x
dan
x log y
x log y
x2
dimana a 10
n
x 2
n
dan b 10 d
log x log y
log x log y
(log x) 2
dan
n
log x 2
n
5
dimana a 10 c
7.1.3 Aplikasi dengan minitab
Regresi Linier
Berikut adalah data produksi pulsa tingkat nasional (106)
1.
2.
Tahu
n
199
8
199
9
200
0
200
1
200
2
200
3
200
4
200
5
200
6
Puls
a
3545
1
3722
1
4090
5
4587
5
5026
0
5685
2
5998
1
6723
0
7002
0
Pulsa
60000
50000
40000
30000
0
5
Tahun
Analysis of Variance
Source
DF
SS
MS
F
P
Regression
1 1282808577 1282808577 595.91
0.000
Residual Error 7 15068810
2152687
Total
8 1297877388
Unusual Observations
Obs Tahun Pulsa Fit
SE Fit Residual St Resid
1 1.00 35451 33037
902
2414
2.09R
R denotes an observation with a large standardized
residual.
Dari hasil yang diperoleh tersebut, dapat diketahui bahwa
tiap tahun peningkatan produksi pulsa linier. Hal tersebut
dapat dilihat dari uji koefisien regresi, semua koefisien,
nilai P value nya nol (P value yang dihitung dari T). Dari
segi kelayakan model regresi dapat dilihat dari nilai R 2 =
98.8% dan pada analisis variansi, nilai P value juga nol.
Sehingga dengan menggunakan model regresi di atas,
dapat diprediksi produksi pulsa tingkat nasional pada
tahun 2007 adalah 74653 (106).
Regresi Non Linier
Berikut ini merupakan contoh dari regresi non linear, diketahui
bahwa data penjualan suatu produk dari mulai diproduksi
sampai produk tersebut berumur 24 bulan (2 tahun).
Bulan ke-
Keuntungan
(dalam ribuan
10
1
2
3
4
5
6
7
8
9
1
0
1
1
1
2
1
3
1
4
1
5
1
6
1
7
1
8
1
9
2
0
rupiah)
150
270
480
750
1350
2310
3625
5390
9950
15510
26500
40350
77510
111950
165300
311600
627480
804250
1540980
2314250
11
2
1
2
2
2
3
2
4
3923250
6010500
12334230
15975210
12
keuntungan
12000000
10000000
8000000
6000000
4000000
2000000
0
0
10
15
20
25
bulan
13
2.
14
15
3.
Coef
StDev
T
0.7983
0.3558
3.9751
0.3381
S = 0.5848
R-Sq = 86.3%
Untuk
model eksponensial y ab x
85.6%
P
2.24
11.76
R-Sq(adj) =
4.
Coef
StDev
T
P
2.01111
0.01549
129.83
0.218240
0.001084
201.31
S = 0.03676
R-Sq = 99.9%
R-Sq(adj) =
99.9%
Kedua model, berdasarkan uji T cukup layak
digunakan, tetapi berdasarkan nilai R2 masing
masing model, maka diperoleh kesimpulan bahwa
16
Atau
bila
dituliskan
y 102,33 1,652
5.
dalam
y ab x
menjadi
Latihan
1. Berikut adalah pengaruh temperatur pada
deodorizing terhadap warna suatu produk :
Temperatur
Warna
(X)
(Y)
460
0.3
450
0.3
440
0.4
430
0.4
420
0.6
410
0.5
450
0.5
440
0.6
430
0.6
420
0.6
410
0.7
400
0.6
420
0.6
410
0.6
400
0.6
proses
17
2.7
6.0
8.5
4.1
9.0
8.0
7.5
8.5
9.3
9.5
7.4
1.7
2.5
3.0
2.1
3.2
2.8
2.5
3.0
2.8
3.0
1.7
19
18
2
35
32
22
16
19
56
53
42
40
32
20
59
72
70
66
62
21
28
50
50
42
63
22
19
46
49
40
30
23
36
56
56
54
52
24
54
57
59
62
58
25
14
35
38
29
20
Dengan menggunakan program Minitab, dilakukan analisis
data diatas sebagai berikut:
Dari menu pilih menu Stat, kemudian pilih Multivariate, dan
pilih Principal Components. Sebagai input variabel, masukkan
variabel diffgeom,
complex,
algebra,
reals
dan
statistics. Jumlah komponen yang akan dihitung 5, dengan
menggunakan type matriks hubungan Covariance (karena
memiliki skala ukuran yang sama).
Output yang dihasilkan sebagai berikut:
Statistik Deskriptif
Descriptive Statistics: diffgeom, complex, algebra, reals,
statistics
Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3
diffgeom 25 0 36.76 3.74 18.68 2.00 23.00 36.00 52.00
complex 25 0 50.60 2.41 12.07 32.00 42.00 50.00 56.50
algebra 25 0 50.68 1.95 9.77 32.00 43.00 51.00 55.00
reals
25 0 46.04 2.58 12.92 22.00 37.50 42.00 55.50
statistics 25 0 43.80 3.30 16.51 16.00 29.50 49.00 55.00
Variable Maximum
diffgeom 76.00
complex 78.00
algebra 70.00
reals 66.00
statistics 81.00
22
23
.758
.715
.754
.838
Reals
.733
.695 .841
1.00
0
.785
Statisti
cs
.758
1.000
Comple
x
Correlatio
Algebra
n
1.000
Df
.871
102.84
7
10
Sig.
.000
1.000
1.000
1.000
1.000
1.000
.803
.778
.870
.807
.824
Tota
% of
Cumulativ
% of
Cumulativ
l Variance
e%
Total Variance
e%
1
2
3
4
5
4.08
1
.374
.217
.205
.124
81.623
81.623
7.477
4.331
4.096
2.473
89.100
93.431
97.527
100.000
4.08
1
81.623
81.623
28
.896
.882
.933
.898
.908
.220
.216
.229
.220
.222
Analysis.
Rotation Method: Varimax with Kaiser
Normalization.
Component Scores.
Dari Component Score Coefficient Matrix, bisa dihitung skor
untuk
setiap case,
yaitu
dengan
mengalikan
nilai
variabel case yang telah distandardisasi dengan koefisien skor
faktornya.
Faktor_1 = 0.220 diffgeomstd + 0.216 complexstd + 0.229
algebrastd + 0.220 realsstd + 0.222 statisticsstd
Seperti halnya dalam Analisis Komponen Utama, penentuan
jumlah faktor juga sangat subjektif. Jika kita tidak puas
dengan hasil diatas yang hanya mengekstrak satu komponen,
maka kita bisa saja membuat kriteria agar terekstrak dua
komponen, yaitu dengan menandai pilihan Extract sesuai
keinginan pada kotak dialog seperti terlihat pada gambar di
bawah ini.
30
***
31
32
33
DAFTAR PUSTAKA
34