I. PENGANTAR STATISTIKA
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
4.
xmax xmin R
b
b
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
a. Jika ujung-ujung bawah adalah bilangan bulat, maka nilai-nilai dari ujung
atas pada interval kelas pertama, kedua dan seterusnya mempunyai selisih 1
dengan nilai ujung bawah berikutnya.
Contoh 2.2:
Perhatikan kembali Contoh 2.1, maka ujung atas intervalnya adalah:
30, 39, 48, ..dan seterusnya.
b. Jika ujung-ujung bawah adalah bilangan 1 desimal, maka nilai ujung-ujung
atas pada interval kelas pertama, kedua dan seterusnya mempunyai seliisih
0,1 dengan nilai ujung bawah berikutnya.
Contoh 2.3:
Misalkan ujung atas interval kelas data adalah:
25,0
31,5
38,0
44,5
dan seterusnya.
Sehingga diperoleh ujung atas intervalnya adalah:
31,4
37,9
44,4
dan seterusnya.
Begitu seterusnya untuk bilangan 2 desimal , 3 desimal dan selanjutnya.
8. Menetukan batas bawah dan batas atas kelas interval
Batas bawah interval dapat dihitung dengan persamaan berikut:
Batas bawah interval ujung bawah - 0.5 (untuk ujung yang berupa bilangan bulat)
Batas bawah interval ujung bawah - 0.05 (untuk ujung yang berupa bilangan 1 desimal)
Batas bawah interval ujung bawah - 0.005 (untuk ujung yang berupa bilangan 2 desimal)
dan seterusnya
sedangkan batas atas dapat dihitung dengan persamaan berikut:
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Batas atas interval ujung atas 0.5 (untuk ujung yang berupa bilangan bulat)
Batas atas interval ujung atas 0.05 (untuk ujung yang berupa bilangan 1 desimal)
Batas atas interval ujung atas 0.005 (untuk ujung yang berupa bilangan 2 desimal)
dan seterusnya
xi
10. Frekuensi
Banyak data dalam setiap interval kelas yang diperoleh dari himpunan data
disesuaikan dengan batas-batas interval kelas.
Adapun macam-macam distribusi frekuensi adalah:
a. Distribusi frekuensi relatif
Distribusi frekuensi relatif dapat dinyatakan dalam bentuk relatif (persentase).
Frekuensi relatif kadang-kadang dinyatakan dalam bentuk perbandingan ataupun desimal.
Contoh 2.4:
Misalkan jumlah seluruh data adalah 125, maka diperoleh:
21 30
12
12
100% 9,6%
125
31 40
10
10
100% 8%
125
Interval
Frekuensi
Frekuensi relatif
1.
21 30
12
9,6%
2.
31 40
10
8%
dan seterusnya
dan seterusnya
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
a. Distribusi Frekuensi Kumulatif kurang dari, adalah distribusi frekuensi yang memuat
jumlah frekuensi yang memiliki nilai kurang dari nilai batas kelas suatu interval tertentu.
b. Distribusi Frekuensi Kumulatif lebih dari, adalah distribusi frekuensi yang memuat jumlah
frekuensi yang memiliki nilai lebih dari nilai batas kelas suatu interval tertentu.
Contoh 2.5:
Berikut ini adalah data 50 mahasiswa dalam perolehan nilai statistik pada Pendidikan
Matematika Universitas T semester II tahun 2010:
70
91
93
82
78
70
71
92
38
56
79
49
48
74
81
95
87
80
80
84
35
83
73
74
43
86
68
92
93
76
81
70
74
97
95
80
53
71
77
63
74
73
68
72
85
57
65
93
83
86
Nyatakan data-data tersebut ke dalam bentuk tabel distribusi frekuensi kurang dari dan lebih
dari!
Penyelesaian:
Tabel 3.2 Tabel distribusi frekuensi kurang dari dan lebih dari
Frekuensi kumulatif ( f k )
No.
Interval
Frekuensi
Nilai
f k Kurang dari
<35
1.
35 43
< 44
2.
44 52
< 53
3.
53 61
< 62
4.
62 70
< 71
15
5.
71 79
13
< 80
28
6.
80 88
13
< 89
41
7.
89 97
< 98
50
Frekuensi kumulatif ( f k )
No.
1.
Interval
35 43
Frekuensi
Nilai
f k Kurang dari
> 35
50
> 44
41
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
2.
44 52
> 53
28
3.
53 61
> 62
15
4.
62 70
> 71
5.
71 79
13
> 80
6.
80 88
13
> 89
7.
89 97
> 98
20
14
15
21
25
27
15
13
12
17
14
16
28
22
21
22
23
25
20
5. Panjang interval
R 18
3,6667
b 5
Dari informasi-informasi yang diperoleh tersebut, maka didapatkan daftar distribusi sebagai
berikut:
Tabel 2.3 Daftar distribusi frekuensi dari Contoh Soal 2.1
No.
Interval Kelas
Frekuensi
1.
10 13
2.
14 17
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
3.
18 21
4.
22 25
5.
26 29
20
22
25
32
18
24
15
30
29
28
30
26
31
23
30
34
27
20
32
34
32
40
33
26
34
45
58
97
68
65
70
98
55
58
53
86
97
64
34
29
30
45
54
66
76
75
88
48
38
44
48
74
43
42
58
55
30
31
51
87
67
68
75
54
65
89
93
94
76
66
69
70
79
37
38
66
87
50
25
36
39
64
60
69
70
71
72
75
80
86
83
82
98
61
73
82
86
44
42
35
38
42
49
44
75
77
79
81
52
28
43
55
83
66
69
70
73
52
39
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
2. Modus dari data baik yang belum maupun yang sudah dikelompokkan
3. Median dari data yang belum maupun yang sudah dikelompokkan
4. Kuartil dari data yang belum maupun yang sudah dikelompokkan
5. Desil dari data yang belum maupun yang sudah dikelompokkan
2.2.1 Rata-rata
Dalam sub bab ini terdapat beberapa macam rata-rata yang akan dijelaskan,
diantaranya adalah:
a. Rata-rata Hitung
Rata-rata hitung sesungguhnya merupakan hasil jumlah semua data dibagi dengan banyak
data. Rata-rata hitung biasa dilambangkan dengan x .
Misalkan suatu kelompok data dapat dinyatakan dalam barisan x1 , x2 ,, xn . Maka ratarata hitung dari data yang belum dikelompokkan (data tunggal) tersebut dapat dinyatakan
dengan persamaan:
n
x
i 1
x1 x 2 x n
.
n
Sedangkan untuk data yang sudah dikelompokkan ke dalam suatu tabel distribusi
frekuensi, rata-rata hitungnya dapat dinyatakan ke dalam persamaan berikut:
f x
f
i
.(2.1)
f i Ci
x x 0 p
f
i
.(2.2)
dimana:
x Rata - rata data
x0 Mid Point (nilai tengah) interval kelas yang dijadikan dasar
xi Mid Point (nilai tengah) kelas ke - i tertentu dan bukan yang dijadikan dasar
f i Frekuensi kelas ke - i
p panjang kelas interval pada kelas dasar
Ci skala (coding) kelas ke - i, Ci
xi x0
p
10
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Penentuan kelas dasar dalam mencari rata-rata hitung dapat dilakukan secara random.
Setiap orang dapat menentukan nilai x0 yang berbeda-beda.
Contoh soal 2.2
Perhatikan kembali Contoh 2.1. Carilah rata-rata hitung data tersebut baik sebelum
maupun sesudah dikelompokkan ke dalam tabel distribusi frekuensi seperti tampak pada
Tabel 2.3.
Penyelesaian:
Diketahui: n 20
n
xi
i 1
20
x
i 1
n
20
10 20 14 15 21 25 27 23 25 20
20
380
19
20
Selanjutnya, perhatikan Tabel 2.3 data-data tersebut dinyatakan ke dalam suatu tabel
distribusi frekuensi. Dari Tabel 2.3 diperoleh beberapa informasi yang dapat disajikan dalam
Tabel 2.4.
Tabel 2.4. Informasi dari data berkelompok Contoh Soal 2.1 (a)
Frekuensi
No.
Interval Kelas
fi
xi
f i xi
1.
10 13
11,5
34,5
2.
14 17
15,5
93
3.
18 21
19,5
78
4.
22 25
23,5
117,5
5.
26 29
27,5
55
20
378
Sehingga jika rata-rata hitung ditentukan dengan menggunakan Persamaan 2.1, maka
diperoleh:
f x
f
i
380
18,9
20
11
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Kemudian, jika rata-rata hitung dicari dengan menggunakan Persmaan (2.2) dan jika
diambil nilai x0 15,5 maka diperlukan pula beberapa informasi seperti yang tampak pada
Tabel 2.5 berikut:
Tabel 2.5. Informasi dari data berkelompok Contoh Soal 2.1(b)
Frekuensi
No.
Interval Kelas
fi
xi
Ci
f i Ci
1.
10 13
11,5
-1
-3
2.
14 17
15,5
3.
18 21
19,5
4.
22 25
23,5
10
5.
26 29
27,5
20
17
f i Ci
x x 0 p
f
i
17
15,5 4
20
15,5 3,4
18,9
b. Rata-rata Ukur
Rata-rata ukur biasa digunakan pada kumpulan data yang mempunyai sifat berurutan
tetap arau hampir tetap. Dengan kata lain, rata-rata ukur dapat digunakan untuk menghitung
rata-rata data yang bersifat kelipatan tetap (hampir tetap.
Misalkan terdapat sekumpulan data yang memenuhi sifat-sifat di atas, yaitu
..(2.3)
dengan n adalah jumlah data. Persamaan (2.3) dapat diturunkan sebagai berikut:
U x1 x 2 x n n
1
log U log x1 x 2 x n n
1
1
log U log x1 x2 xn
n
.(2.4)
12
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Sehingga untuk data yang telah dikelompokkan dapat digunakan persamaan berikut:
log U
f log x
f
i
.(2.5)
Contoh 2.3
Misalkan sekelompok data:
85
75
70
80
90
45
50
65
35
40
Interval
Frekuensi
xi
log xi
f i log xi
35 48
41,5
1,61805
4,85414
49 62
55,5
1,74429
1,74429
63 76
69,5
1,84199
5,52595
77 90
83,5
1,92165
5,76506
10
17,88945
Atau dapat dihitung dengan menggunakan Persamaan (2.4) seperti tampak di bawah ini:
1
log 85.75.70.80.90.45.50.65.35.40
10
1
17,818
10
1,7818
log U
log U
f log x
f
i
17,88945
1,78895
10
13
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Pt P0 1
100
Keterangan:
Pt Data akhir
P0 Data awal
x Rata - rata data
t Selang waktu
Contoh data yang bersifat tumbuh adalah perkembangan modal usaha selama kurun
waktu tertentu atau perkembangan jumlah penduduk suatu daerah dalam kurun waktu
tertentu.
Contoh 2.4
Jumlah penduduk suatu daerah pada tahun 1998 adalah 3,2 juta dan pada tahun 2011
jumlahnya bertambah menjadi 132,5 juta. Berapakah pertambahan rata-rata penduduk setiap
tahunnya?
Penyelesaian:
Pt P0 1
100
14
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
t
x
log Pt log P0 1
100
log P0 log 1
100
log P0 t log 1
100
100
x
8,1222 6,50515 1,6170659
log 1
100
x
1
100 1,331649
x
0,331649
100
x 33,16 34
2.2.2 Modus
Modus adalah besaran yang menyatakan keterpusatan data didasarkan pada frekuensi
paling sering munculnya data. Selanjutnya, data yang mempunyai lebih dari satu nilai modus
disebut data multimodal.
Untuk data yang telah dikelompokkan menjadi tabel distribusi frekuensi, modus dapat
dihitung dengan menggunakan persamaan berikut:
b1
M o b p
b1 b2
Keterangan:
M o Nilai modus
b Batas bawah dimana modus terdapat
p panjang interval
b1 selisih antara frekuensi modus dengan frekuensi sebelumnya
b2 selisih antara frekuensi modus dengan frekuensi sesudahnya
Contoh 2.5
1. Misalkan sekelompok data: 12, 24, 23, 12, 31, 42
Maka modus dari data tersebut adalah 12 (muncul 2 kali).
15
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
2. Lihat kembali data dalam Contoh 2.1. Tampak bahwa frekuensi tertinggi ada pada kelas
kedua. Sehingga diperoleh informasi sebagai berikut:
b 13,5
b1 3
b2 2
3
M o 13,5
15,9
3 2
Hal ini mengandung arti bahwa nilai-nilai data terletak paling banyak di sekitar nilai 15,9.
2.2.3 Median
Median adalah nilai data tengah (sekelompok data dibagi menjadi 2 bagian yang
sama). Ingat bahwa median dicari setelah data diurutkan terlebih dahulu.
Untuk data yang belum dikelompokkan, penghitungan median dapat dilakukan
dengan 2 cara, yaitu:
a. Untuk data ganjil
Contoh 2.6
Misalkan sekelompok data: 8, 12, 5, 3, 16, 7, 2, 3, 8
Data setelah diurutkan: 2, 3, 3, 5, 7, 8, 8, 12, 16
Sehingga diperoleh median data adalah: M e 7
b. Untuk data genap
Contoh 2.7
Misalkan sekelompok data: 8, 12, 5, 3, 16, 7, 2, 3, 8, 17
Data setelah diurutkan: 2, 3, 3, 5, 7, 8, 8, 12, 16, 17
Sehingga diperoleh median data adalah: M e
78
7,5 .
2
M e b p 2
f
Keterangan:
16
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Interval
Frekuensi (f)
31 40
frekuensi kumulatif
(F)
4
41 50
10
51 60
18
61 70
14
32
71 80
26
58
81 90
12
70
91 100
20
90
90
90
45
2
Karena data ke 45 terletak pada kelas ke-5, maka diperoleh informasi berikut:
b 71 0,5 70,5
p 10
F 32
f 26
45 32
M e 70,5 10
75,5
26
2.2.4 Kuartil
Kuartil adalah nilai sekumpulan data yang dibagi 4 bagian yang sama. Oleh sebab itu,
terdapat 3 kuartil, yaitu: K1 , K 2 , K 3 .
Untuk data yang belum dikelompokkan ke dalam tabel distribusi frekuensi, maka
kuartil data dapat dihitung sesuai dengan langkah-langkah berikut:
17
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Ki
i(n 1)
, n banyak data
4
K1
1(7 1)
2 maka, kuartil pertama ( K1 ) terletak pada data ke-2, yaitu: 8
4
K2
2(7 1)
4 maka, kuartil pertama ( K 2 ) terletak pada data ke-4, yaitu: 10
4
K3
3(7 1)
6 maka, kuartil pertama ( K1 ) terletak pada data ke-6, yaitu: 18
4
K1
1(8 1)
2,25
4
3+(0,25(3-3))
3
K2
2(8 1)
4,5
4
5+(0,5(7-5))
6
K3
3(8 1)
6,25
4
8+(0,25(8-8))
8
18
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Sedangkan untuk data yang telah dikelompokkan ke dalam tabel distribusi frekuensi,
kuartil data dapat dihitung dengan menggunakan langkah-langkah berikut:
1. Tentukan letak kuartil dengan persamaan:
Ki
in
, n banyak data
4
Nilai K i b p 4
f
Keterangan:
Contoh 2.10
Perhatikan Tabel 2.7. Tentukan nilai kuartil ketiganya ( K 3 )!
Letak kuartil kedua ( K 3 ):
K3
3 90
67,5 , maka kuartil ketiga terletak pada kelas ke-6
4
b 81 0,5 80,5
p 10
F 58
f 12
3 90
58
88,42
Nilai K 3 80,5 10 4
12
Latihan Soal
Misalkan terdapat sekumpulan data berikut:
10
20
14
15
21
25
27
15
13
12
19
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
17
14
16
28
22
21
22
23
25
20
Carilah modus, median dan ketiga kuartil dari data tersebut baik sebelum maupun sesudah
dikelompokkan ke dalam tabel distribusi frekuensi!
20
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Analisis korelasi adalah metode statistik yang digunakan untuk menentukan kuat
tidaknya (derajat) hubungan linier antara 2 variabel atau lebih. Analisa korelasi sederhana,
meneliti hubungan dan bagaimana eratnya itu, tanpa melihat bentuk hubungan. Jika kenaikan
didalam suatu variabel diikuti dengan kenaikan variabel yang lain, maka dapat dikatakan
bahwa kedua variabel tersebut mempunyai korelasiyang positif. Tetapi jika kenaikan
didalam suatu variabel diikuti penurunan variabel yang lain maka kedua variabel tersebut
mempunyai korelasi negatif. Jika tidak ada perubahan pada suatu variabel ,meskipun variabel
yang lain mengalami perubahan, maka kedua variabel tersebut, tidak mempunyai hubungan
(uncorrelated).
Ilmu ekonomi dan pendidikan banyak mempelajari hubungan antar berbagai variabel.
Dari adanya hubungan tersebut digunakan untuk memprediksi pengaruh satu variabel
terhadap variabel lainnya. Misalnya, hubungan antara jumlah permintaan suatu barang
terhadap besarnya harga yang dapat dinyatakan dengan (f(p)). Fungsi tersebut menunjukkan
fakta yang muncul sebagai akibat atau disebabkan munculnya suatu yang lain. Hal ini
menghadapkan kita pada fakta kausalitas. Dari contoh tersebut dapat dijelaskan bahwa
jumlah barang yang diminta akan berubah sebagai akibat adanya perubahan harga.
Hubungan-hubungan fungsional tersebut menjelaskan ketergantungan variabel terikat
(dependent variable) pada variabel-variabel bebas (independent variable) dalam bentuk yang
spesifik. Hubungan fungsional ini bisa jadi merupakan hubungan yang sederhana antar
variabel. Pada kenyataannya, lebih sering dijumpai hubungan fungsional yang rumit dan sulit
untuk dijelaskan. Alat yang sering digunakan untuk mendekati kejadian tersebut adalah
regresi, baik regresi linear sederhana maupun regresi berganda.
Langkah awal yang harus dilakukan (sebelum menganalisis regresi) adalah mengetahui
bahwa dua variabel yang akan dianalisis memiliki hubungan yang kuat. Hal ini dapat
dilakukan dengan melakukan analisis korelasi. Analisis korelasi adalah sekumpulan teknik
statistika yang dapat digunakan untuk mengukur keeratan hubungan (korelasi) antara dua
variabel. Misalkan suatu perusahaan berpendapat bahwa dengan mendemonstrasikan cara
pemakaian produk akan dapat meningkatkan angka penjualan. Dari contoh tersebut, maka
dapat dikatakan bahwa demonstrasi pemakaian produk disebut variabel bebas, sedangkan
angka penjualan disebut variabel terikat.
21
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Hubungan antara dua variabel jika ditinjau dari segi arahnya dapat dibedakan menjadi 2
jenis, yaitu:
1. Hubungan searah (korelasi positif)
Dua variabel (atau lebih) dikatakan memunyai hubungan searah jika dua variabel (atau
lebih) berjalan secara paralel. Hal ini mengandung makna bahwa hubungan antara dua
variabel (atau lebih) menunjukkan arah yang sama.
Jadi apabila variabel X meningkat (bertambah) maka variabel Y juga mengalami
peningkatan. Sebaliknya, apabila variabel X menurun (berkurang) maka variabel Y juga
menurun.
Contoh 3.1
Berikut ini adalah beberapa contoh hubungan searah antara dua variabel:
1. Kenaikan harga BBM akan diikuti dengan kenaikan harga sembako
2. Naiknya frekuensi pemberian tugas akan menyebabkan naiknya hasil belajar
3. Naiknya kedisiplinan anak didik diikuti dengan meningkatnya hasil belajar anak didik
bersangkutan.
Gambaran umum mengenai korelasi positif di atas dapat dilihat dalam Gambar 3.1
berikut:
(a)
X Y
(b)
22
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Contoh 3.2
Berikut ini adalah beberapa contoh hubungan antara dua variabel yang berlawanan arah:
1. Semakin
meningkatnya
kedisiplinan
dalam
berkendara
akan
diikuti
dengan
Gambaran umum mengenai korelasi positif di atas dapat dilihat dalam Gambar 3.1
berikut:
(a)
X Y
(b)
23
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Jika tanda koefisien korelasi adalah positif (plus) maka korelasi yang terjadi adalah
korelasi positif. Sedangkan jika tanda angka/koefisien korelasi adalah negatif (minus) maka
korelasi antara variabel-variabel yang diselidiki adalah korelasi negatif.
Terdapat beberapa teknik korelasi yang dapat digunakan untuk mencari angka/koefisien
korelasi antar variabel, diantaranya adalah:
1. Teknik korelasi product moment (pearson)
Teknik korelasi product moment digunakan untuk mencari koefisien korelasi untuk data
kontinu, populasinya bersifat homogen atau mendekati homogen dan regresinya adalah
regresi linear.
2. Teknik korelasi tata jenjang (rank spearman)
Teknik korelasi rank spearmann digunakan untuk mencari koefisien korelasi untuk data
ordinal (berjenjang).
3. Teknik korelasi phi
Teknik korelasi phi digunakan untuk mencari koefisien korelasi untuk data diskrit.
4. Teknik korelasi point biserial
Teknik korelasi point biserial digunakan untuk mencari koefisien korelasi untuk data
kontinu dan diskrit.
Dalam bab ini hanya akan dibahas mengenai teknik korelasi product moment. Seperti
yang telah disebutkan sebelumnya bahwa lambang untuk angka korelasi product moment
adalah rxy , yang dapat ditentukan dengan persamaan berikut:
r
xy
n XY X Y
n X 2 X 2 n Y 2 Y 2
..(3.1)
Keterangan:
X Variabel bebas
Y Variabel terikat
n Jumlah data
rxy koefisien korelasi product moment
24
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
Interpretasi
korelasi
0,2 0,4
0,4 0,7
0,7 0,9
0,9 1
Interpretasi dari koefisien korelasi dapat diambil dengan menggunakan Tabel 3.1 sesuai
dengan nilai yang diperoleh dan disesuaikan dengan interval yang ada di dalam tabel.
25
STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
t hit
rxy n 2
1 rxy
26