45.bahan Ajar Statistika Dasar

STATISTIKA DASAR
ZUMROTUS SYADIYAH,S.Si, M.Si
I. PENGANTAR STATISTIKA
1.1 Jenis-jenis Statistik

Secara umum, ilmu statistika dapat terbagi menjadi dua jenis, yaitu:
1. Statistika Deskriptif
2. Statistika Inferensial
Dalam sub bab ini akan dijelaskan mengenai pengertian dari kedua jenis statistika
tersebut.
a. Statistika Deskriptif
Statistika deskriptif dapat disebut juga sebagai statistika deduktif atau statistika
sederhana. Staistika deskriptif adalah statistika yang tingkat pengerjaanya mencakup caracara menghitung, menyusun atau mengatur, mengolah, menyajikan data agar dapat
memberikan gambaran yang ringkas mengenai suatu keadaan, seperti teknik umum mencari
rata-rata, median, modus, kuartil dan lain sebagainya.
b. Statistika Inferensial
Statistika inferensial adalah statistika yang berhubungan dengan analisis data untuk
penarikan kesimpulan dari data. Misalnya, teknik uji hipotesa, analisis varians, teknik
korelasi, regresi dan lain-lain.
1.2 Jenis-jenis Data

Secara garis besar, data-data olahan dibagi menjadi 3 jenis data, yaitu:
1. Data Kuantitatif, yaitu data yang berupa angka-angka. Informasi yang dikandung data
berupa data angka. Contoh: data jumlah penduduk, jumlah pendapatan nasional, dan lain
sebagainya. Data kuantitatif dapat berupa:
a. Data Kontinu adalah data yang angka-angkanya merupakan deretan angka yang
sambung-menyambung atau berkelanjutan.
Contoh: tinggi badan, berat badan, dan lain-lain.
b. Data diskrit adalah data statistik yang tidak berkelanjutan.
Contoh: Jumlah penduduk, Jumlah anak dan lain-lain.
2. Data Kualitatif, yaitu data non-angka. Informasi yang dikandung bukan berupa angka.
Contoh: data jenis kelamin penduduk, tingkat pendidikan dan sebagainya. Data jenis ini harus
diubah terlebih dahulu menjadi data kuantitatif sebelum diolah.
STATISTIKA DASAR
1.3 Jenis-jenis Skala Pengukuran

Skala pengukuran yang dapat digunakan dalam pengolahan data statistik adalah
sebagai berikut:
1. Data Nominal
Data nominal adalah data statistik yang cara menyusunnya atas golongan atau klasifikasi
tertentu.
Contoh: Jumlah mahasiswa dari segi tingkat kelas dan kelamin.
2. Data Ordinal
Data ordinal adalah data statistik yang cara menyusunnya didasarkan pada urutan,
kedudukan dan rangking/tingkatan data.
Contoh: Pandai, kurang pandai dan tidak pandai.
3. Data Interval
Data interval adalah data statistik dimana terdapat jarak yang sama. Dari satu data ke data
yang lain intervalnya sama.
Contoh: Mahasiswa yang mendapat nilai 1 sampai 10, petani yang mempunya hasil panen
antara 2 sampai 15 kwintal, dan sebagainya.
4. Data Rasio
Data rasio adalah data yang tergolong dalam data kontinum tapi mempunyai ciri (syarat)
tertentu.
Contoh: Berat badan Paman 60 Kg, Berat badan Sagung 15 Kg. Dengan demikian, berat
badan Ibu adalah 4 kali berat badan Ani.
1.4 Populasi dan Sampel

Populasi adalah sekumpulan objek yang akan dijadikan sebagai bahan penelitian
dengan ciri mempunyai karakteristik yang sama. Populasi selalu memiliki sifat-sifat yang
serupa. Beberapa macam populasi didasarkan pada jumlah anggotanya adalah sebagai
berikut:
a. Populasi berhingga
Populasi berhingga adalah sekumpulan objek yang akan dijadikan sebagai kajian yang
jumlahnya tertentu.
Contoh: Populasi mahasiswa fakultas ekonomi, jumlah kendaraan bermotor dari merk
tertentu yang beredar di jalan, jumlah siswa kelas III dari suatu Sekolah Dasar, dan lain
sebagainya.
STATISTIKA DASAR
b. Populasi tak berihingga

Populasi tak berhingga adalah sekumpulan objek yang akan diteliti berjumlah tidak
terhingga banyak.
Contoh: Populasi amoeba dalam suatu parit, jumlah pelanggan supermarket, jumlah
partikel di udara, dan lain-lain.
STATISTIKA DASAR
II. STATISTIKA DESKRIPTIF
2.1 Daftar Distribusi Frekuensi

Dafatr distribusi frekuensi adalah penyusunan urutan data ke dalam kelas-kelas
interval, untuk kemudian ditentukan jumlah frekuensinya berdasarkan data yang sesuai
dengan batas-batas interval kelasnya. Tahap penyusunan data menjadi daftar distribusi
frekuensi antara lain adalah:
1. Menghitung jumlah data
2. Mencari data tertinggi dan terendah
3. Menetapkan range
Range ( R) X max X min
4.
Merencanakan jumlah kelas

Jumlah kelas dihitung dengan menggunakan kaedah Sturges:
b 1 3,3 log n , dimana n adalah jumlah data
5. Menentukan panjang kelas

Panjang kelas ditentukan dengan persamaan berikut:
p
xmax xmin R
b
b
6. Menentukan ujung bawah pada kelas interval

Ujung bawah kelas interval ditentukan dengan cara menjumlahkan data terkecil
yang ditetapkan sebagai ujung bawah kelas interval pertama dengan nilai panjang
kelas (p).
Contoh 2.1:
Jumlah kelas: 8
P=9
Data terkecil=22
Maka ujung bawah interval adalah:
22, 31, 40, .dan seterusnya.
7. Menetapkan nilai ujung atas kelas interval
Ujung atas kelas interval dimulai dengan interval kelas pertama sampai dengan
kelas terakhir.
STATISTIKA DASAR
a. Jika ujung-ujung bawah adalah bilangan bulat, maka nilai-nilai dari ujung
atas pada interval kelas pertama, kedua dan seterusnya mempunyai selisih 1
dengan nilai ujung bawah berikutnya.
Contoh 2.2:
Perhatikan kembali Contoh 2.1, maka ujung atas intervalnya adalah:
30, 39, 48, ..dan seterusnya.
b. Jika ujung-ujung bawah adalah bilangan 1 desimal, maka nilai ujung-ujung
atas pada interval kelas pertama, kedua dan seterusnya mempunyai seliisih
0,1 dengan nilai ujung bawah berikutnya.
Contoh 2.3:
Misalkan ujung atas interval kelas data adalah:
25,0
31,5
38,0
44,5
dan seterusnya.
Sehingga diperoleh ujung atas intervalnya adalah:
31,4
37,9
44,4
dan seterusnya.
Begitu seterusnya untuk bilangan 2 desimal , 3 desimal dan selanjutnya.
8. Menetukan batas bawah dan batas atas kelas interval
Batas bawah interval dapat dihitung dengan persamaan berikut:
Batas bawah interval ujung bawah - 0.5 (untuk ujung yang berupa bilangan bulat)
Batas bawah interval ujung bawah - 0.05 (untuk ujung yang berupa bilangan 1 desimal)
Batas bawah interval ujung bawah - 0.005 (untuk ujung yang berupa bilangan 2 desimal)
dan seterusnya
sedangkan batas atas dapat dihitung dengan persamaan berikut:
STATISTIKA DASAR
Batas atas interval ujung atas 0.5 (untuk ujung yang berupa bilangan bulat)
Batas atas interval ujung atas 0.05 (untuk ujung yang berupa bilangan 1 desimal)
Batas atas interval ujung atas 0.005 (untuk ujung yang berupa bilangan 2 desimal)
dan seterusnya
9. Menentukan nilai tengah

Nilai tengah dapat ditentuan sebagai berikut:
xi
ujung bawah ujung atas

2
10. Frekuensi
Banyak data dalam setiap interval kelas yang diperoleh dari himpunan data
disesuaikan dengan batas-batas interval kelas.
Adapun macam-macam distribusi frekuensi adalah:
a. Distribusi frekuensi relatif
Distribusi frekuensi relatif dapat dinyatakan dalam bentuk relatif (persentase).
Frekuensi relatif kadang-kadang dinyatakan dalam bentuk perbandingan ataupun desimal.
Contoh 2.4:
Misalkan jumlah seluruh data adalah 125, maka diperoleh:
21 30
12
12
100% 9,6%
125
31 40
10
10
100% 8%
125
dan seterusnya. Sehingga diperoleh tabel distribusi berikut ini:

Tabel 2.1 Distribusi frekuensi relatif dari Contoh 2.4
No.
Interval
Frekuensi
Frekuensi relatif
1.
21 30
12
9,6%
2.
31 40
10
8%
dan seterusnya
dan seterusnya
b. Distribusi frekuensi kumulatif

Distribusi frekuensi kumulatif adalah distribusi yang berisikan frekuensi kumulatif.
Frekuensi kumulatif adalah frekuensi yang dijumlahkan. Ada dua macam distribusi frekuensi
kumulatif, yaitu distribusi frekuensi kumulatif kurang dari dan lebih dari.
STATISTIKA DASAR
a. Distribusi Frekuensi Kumulatif kurang dari, adalah distribusi frekuensi yang memuat
jumlah frekuensi yang memiliki nilai kurang dari nilai batas kelas suatu interval tertentu.
b. Distribusi Frekuensi Kumulatif lebih dari, adalah distribusi frekuensi yang memuat jumlah
frekuensi yang memiliki nilai lebih dari nilai batas kelas suatu interval tertentu.
Contoh 2.5:
Berikut ini adalah data 50 mahasiswa dalam perolehan nilai statistik pada Pendidikan
Matematika Universitas T semester II tahun 2010:
70
91
93
82
78
70
71
92
38
56
79
49
48
74
81
95
87
80
80
84
35
83
73
74
43
86
68
92
93
76
81
70
74
97
95
80
53
71
77
63
74
73
68
72
85
57
65
93
83
86
Nyatakan data-data tersebut ke dalam bentuk tabel distribusi frekuensi kurang dari dan lebih
dari!
Penyelesaian:
Tabel 3.2 Tabel distribusi frekuensi kurang dari dan lebih dari
Frekuensi kumulatif ( f k )
No.
Interval
Frekuensi
Nilai
f k Kurang dari
<35
1.
35 43
< 44
2.
44 52
< 53
3.
53 61
< 62
4.
62 70
< 71
15
5.
71 79
13
< 80
28
6.
80 88
13
< 89
41
7.
89 97
< 98
50
(a) Tabel distribusi frekuensi kumulatif kurang dari
Frekuensi kumulatif ( f k )
No.
1.
Interval
35 43
Frekuensi
Nilai
f k Kurang dari
> 35
50
> 44
41
STATISTIKA DASAR
2.
44 52
> 53
28
3.
53 61
> 62
15
4.
62 70
> 71
5.
71 79
13
> 80
6.
80 88
13
> 89
7.
89 97
> 98
(b) Tabel distribusi frekuensi kumulatif lebih dari
Contoh Soal 2.1:

Misalkan terdapat sekelompok data berikut ini:
10
20
14
15
21
25
27
15
13
12
17
14
16
28
22
21
22
23
25
20
Kelompokkan data-data tersebut ke dalam suatu distribusi frekuensi!

Penyelesaian:
1. Jumlah data = 20
2. xmax 28 dan xmin 10
3. Range ( R) xmax xmin 28 10 18
4. Jumlah kelas:
b 1 3,3 log n 1 3,3 log 20 1 3,3 1,301 5,29
Pembulatan dilakukan ke bawah sehingga diperoleh:

b 5,29 5
5. Panjang interval
R 18
3,6667
b 5
Pembulatan dilakukan ke atas sehingga diperoleh:

p 3,6667 4
Dari informasi-informasi yang diperoleh tersebut, maka didapatkan daftar distribusi sebagai
berikut:
Tabel 2.3 Daftar distribusi frekuensi dari Contoh Soal 2.1
No.
Interval Kelas
Frekuensi
1.
10 13
2.
14 17
STATISTIKA DASAR
3.
18 21
4.
22 25
5.
26 29
20
Latihan Soal 2.1

1. Misalkan terdapat sekelompok data berikut ini:
20
22
25
32
18
24
15
30
29
28
30
26
31
23
30
34
27
20
32
34
Kelompokkan data-data tersebut ke dalam suatu distribusi frekuensi, distribusi frekuensi

relatif, distribusi frekuensi kumulatif kurang dari dan lebih dari!
2. Misalkan terdapat sekelompok data berikut ini:
25
32
40
33
26
34
45
58
97
68
65
70
98
55
58
53
86
97
64
34
29
30
45
54
66
76
75
88
48
38
44
48
74
43
42
58
55
30
31
51
87
67
68
75
54
65
89
93
94
76
66
69
70
79
37
38
66
87
50
25
36
39
64
60
69
70
71
72
75
80
86
83
82
98
61
73
82
86
44
42
35
38
42
49
44
75
77
79
81
52
28
43
55
83
66
69
70
73
52
39
Kelompokkan data-data tersebut ke dalam suatu tabel distribusi frekuensi, distribusi

frekuensi relatif, distribusi frekuensi kumulatif kurang dari dan lebih dari!
2.2 Ukuran Kepusatan

Ukuran kepusatan suatu kelompok data terdiri atas:
1. Bagaimana tingkat penyimpangan data terhadap rata-rata datanya
2. Bagaimana variasi data yang dimiliki
3. Seberapa besar kemiringan kurvanya terhadap nilai rata-rata
4. Bagaimana ukuran keruncingan kurva (menunjukkan kondisi penyebaran data terhadap
nilai rata-rata)
Terdapat beberapa ukuran kepusatan yang akan dibahas dalam sub bab ini, yaitu:
1. Rata-rata data baik yang belum maupun yang sudah dikelompokkan
STATISTIKA DASAR
2. Modus dari data baik yang belum maupun yang sudah dikelompokkan
3. Median dari data yang belum maupun yang sudah dikelompokkan
4. Kuartil dari data yang belum maupun yang sudah dikelompokkan
5. Desil dari data yang belum maupun yang sudah dikelompokkan
2.2.1 Rata-rata
Dalam sub bab ini terdapat beberapa macam rata-rata yang akan dijelaskan,
diantaranya adalah:
a. Rata-rata Hitung
Rata-rata hitung sesungguhnya merupakan hasil jumlah semua data dibagi dengan banyak
data. Rata-rata hitung biasa dilambangkan dengan x .
Misalkan suatu kelompok data dapat dinyatakan dalam barisan x1 , x2 ,, xn . Maka ratarata hitung dari data yang belum dikelompokkan (data tunggal) tersebut dapat dinyatakan
dengan persamaan:
n
x
i 1
x1 x 2 x n
.
n
Sedangkan untuk data yang sudah dikelompokkan ke dalam suatu tabel distribusi
frekuensi, rata-rata hitungnya dapat dinyatakan ke dalam persamaan berikut:
f x
f
i
.(2.1)
atau dapat juga digunakan persamaan:
f i Ci
x x 0 p
f
i
.(2.2)
dimana:
x Rata - rata data
x0 Mid Point (nilai tengah) interval kelas yang dijadikan dasar
xi Mid Point (nilai tengah) kelas ke - i tertentu dan bukan yang dijadikan dasar
f i Frekuensi kelas ke - i
p panjang kelas interval pada kelas dasar
Ci skala (coding) kelas ke - i, Ci
xi x0
p
10
STATISTIKA DASAR
Penentuan kelas dasar dalam mencari rata-rata hitung dapat dilakukan secara random.
Setiap orang dapat menentukan nilai x0 yang berbeda-beda.
Contoh soal 2.2
Perhatikan kembali Contoh 2.1. Carilah rata-rata hitung data tersebut baik sebelum
maupun sesudah dikelompokkan ke dalam tabel distribusi frekuensi seperti tampak pada
Tabel 2.3.
Penyelesaian:
Diketahui: n 20
n
xi
i 1
20
x
i 1
n
20
10 20 14 15 21 25 27 23 25 20
20
380
19
20
Selanjutnya, perhatikan Tabel 2.3 data-data tersebut dinyatakan ke dalam suatu tabel
distribusi frekuensi. Dari Tabel 2.3 diperoleh beberapa informasi yang dapat disajikan dalam
Tabel 2.4.
Tabel 2.4. Informasi dari data berkelompok Contoh Soal 2.1 (a)
Frekuensi
No.
Interval Kelas
fi
xi
f i xi
1.
10 13
11,5
34,5
2.
14 17
15,5
93
3.
18 21
19,5
78
4.
22 25
23,5
117,5
5.
26 29
27,5
55
20
378
Sehingga jika rata-rata hitung ditentukan dengan menggunakan Persamaan 2.1, maka
diperoleh:
f x
f
i
380
18,9
20
11
STATISTIKA DASAR
Kemudian, jika rata-rata hitung dicari dengan menggunakan Persmaan (2.2) dan jika
diambil nilai x0 15,5 maka diperlukan pula beberapa informasi seperti yang tampak pada
Tabel 2.5 berikut:
Tabel 2.5. Informasi dari data berkelompok Contoh Soal 2.1(b)
Frekuensi
No.
Interval Kelas
fi
xi
Ci
f i Ci
1.
10 13
11,5
-1
-3
2.
14 17
15,5
3.
18 21
19,5
4.
22 25
23,5
10
5.
26 29
27,5
20
17
Sehingga diperoleh rata-rata hitung:
f i Ci
x x 0 p
f
i
17
15,5 4
20
15,5 3,4
18,9
b. Rata-rata Ukur
Rata-rata ukur biasa digunakan pada kumpulan data yang mempunyai sifat berurutan
tetap arau hampir tetap. Dengan kata lain, rata-rata ukur dapat digunakan untuk menghitung
rata-rata data yang bersifat kelipatan tetap (hampir tetap.
Misalkan terdapat sekumpulan data yang memenuhi sifat-sifat di atas, yaitu
x1 , x2 ,, xn . Maka rata-rata ukur dapat dihitung dengan menggunakan persamaan berikut:

U n x1 x2 xn
..(2.3)
dengan n adalah jumlah data. Persamaan (2.3) dapat diturunkan sebagai berikut:
U x1 x 2 x n n
1
log U log x1 x 2 x n n
1
1
log U log x1 x2 xn
n
.(2.4)
12
STATISTIKA DASAR
Sehingga untuk data yang telah dikelompokkan dapat digunakan persamaan berikut:
log U
f log x
f
i
.(2.5)
Contoh 2.3
Misalkan sekelompok data:
85
75
70
80
90
45
50
65
35
40
Data tersebut dapat dinyatakan ke dalam tabel distribusi frekuensi berikut:
Tabel 2.6 Tabel distribusi frekuensi Contoh 2.3

No.
Interval
Frekuensi
xi
log xi
f i log xi
35 48
41,5
1,61805
4,85414
49 62
55,5
1,74429
1,74429
63 76
69,5
1,84199
5,52595
77 90
83,5
1,92165
5,76506
10
17,88945
Cari rata-rata ukurnya!

Penyelesaian:
U 10 85.75.70.80.90.45.50.65.35.40
10 6,5786 1017
60,51
Atau dapat dihitung dengan menggunakan Persamaan (2.4) seperti tampak di bawah ini:
1
log 85.75.70.80.90.45.50.65.35.40
10
1
17,818
10
1,7818
log U
U log 1 1,7818 60,51

Untuk data yang telah dikelompokkan dalam Tabel 2.3 dapat diperleh rata-rata ukur berikut:
log U
f log x
f
i
17,88945
1,78895
10
U log 1,78895 61,5

1
13
STATISTIKA DASAR
c. Rata-rata Untuk Suatu Data Yang Bersifat Tumbuh

Nilai rerata untuk suatu data yang bersifat tumbuh dapat diperoleh dengan menggunakan
persamaan:
Pt P0 1
100
Keterangan:
Pt Data akhir
P0 Data awal
x Rata - rata data
t Selang waktu
Contoh data yang bersifat tumbuh adalah perkembangan modal usaha selama kurun
waktu tertentu atau perkembangan jumlah penduduk suatu daerah dalam kurun waktu
tertentu.
Contoh 2.4
Jumlah penduduk suatu daerah pada tahun 1998 adalah 3,2 juta dan pada tahun 2011
jumlahnya bertambah menjadi 132,5 juta. Berapakah pertambahan rata-rata penduduk setiap
tahunnya?
Penyelesaian:
Pt P0 1
100
14
STATISTIKA DASAR
t

x
log Pt log P0 1
100
log P0 log 1
100
log P0 t log 1
100
log 132500000 log 3200000 13 log 1
100
x
8,1222 6,50515 1,6170659
log 1
100
x
1
100 1,331649
x
0,331649
100
x 33,16 34
Jadi, rata-rata pertambahan penduduk per tahunnya adalah 34 jiwa.
2.2.2 Modus
Modus adalah besaran yang menyatakan keterpusatan data didasarkan pada frekuensi
paling sering munculnya data. Selanjutnya, data yang mempunyai lebih dari satu nilai modus
disebut data multimodal.
Untuk data yang telah dikelompokkan menjadi tabel distribusi frekuensi, modus dapat
dihitung dengan menggunakan persamaan berikut:
b1
M o b p
b1 b2
Keterangan:
M o Nilai modus
b Batas bawah dimana modus terdapat
p panjang interval
b1 selisih antara frekuensi modus dengan frekuensi sebelumnya
b2 selisih antara frekuensi modus dengan frekuensi sesudahnya
Contoh 2.5
1. Misalkan sekelompok data: 12, 24, 23, 12, 31, 42
Maka modus dari data tersebut adalah 12 (muncul 2 kali).
15
STATISTIKA DASAR
2. Lihat kembali data dalam Contoh 2.1. Tampak bahwa frekuensi tertinggi ada pada kelas
kedua. Sehingga diperoleh informasi sebagai berikut:
b 13,5
b1 3
b2 2
3
M o 13,5
15,9
3 2
Hal ini mengandung arti bahwa nilai-nilai data terletak paling banyak di sekitar nilai 15,9.
2.2.3 Median
Median adalah nilai data tengah (sekelompok data dibagi menjadi 2 bagian yang
sama). Ingat bahwa median dicari setelah data diurutkan terlebih dahulu.
Untuk data yang belum dikelompokkan, penghitungan median dapat dilakukan
dengan 2 cara, yaitu:
a. Untuk data ganjil
Contoh 2.6
Misalkan sekelompok data: 8, 12, 5, 3, 16, 7, 2, 3, 8
Data setelah diurutkan: 2, 3, 3, 5, 7, 8, 8, 12, 16
Sehingga diperoleh median data adalah: M e 7
b. Untuk data genap
Contoh 2.7
Misalkan sekelompok data: 8, 12, 5, 3, 16, 7, 2, 3, 8, 17
Data setelah diurutkan: 2, 3, 3, 5, 7, 8, 8, 12, 16, 17
Sehingga diperoleh median data adalah: M e
78
7,5 .
2
Selanjutnya, untuk kumpulan data yang telah dikelompokkan ke dalam distribusi

frekuensi, median data tersebut dapat ditentukan dengan persamaan di bawah ini:
n
M e b p 2
f
Keterangan:
16
STATISTIKA DASAR
b Batas bawah kelas median (dimana median berada)

p panjang kelas kelas median (dimana median berada)
n jumlah data
F frekuensi kumulatif sebelum kelas median
f frekuensi kelas median
Contoh 2.8
Misalkan terdapat sekelompok data yang telah disajikan dalam tabel distribusi frekuensi
berikut ini:
Tabel 2.7. Tabel distribusi frekuensi data Contoh 2.8
No.
Interval
Frekuensi (f)
31 40
frekuensi kumulatif
(F)
4
41 50
10
51 60
18
61 70
14
32
71 80
26
58
81 90
12
70
91 100
20
90
90
Median terletak pada data ke:
90
45
2
Karena data ke 45 terletak pada kelas ke-5, maka diperoleh informasi berikut:
b 71 0,5 70,5
p 10
F 32
f 26
45 32
M e 70,5 10
75,5
26
2.2.4 Kuartil
Kuartil adalah nilai sekumpulan data yang dibagi 4 bagian yang sama. Oleh sebab itu,
terdapat 3 kuartil, yaitu: K1 , K 2 , K 3 .
Untuk data yang belum dikelompokkan ke dalam tabel distribusi frekuensi, maka
kuartil data dapat dihitung sesuai dengan langkah-langkah berikut:
17
STATISTIKA DASAR
1. Urutkan data dari data terkecil ke data terbesar

2. Tentukan letak kuartil dengan persamaan:
Ki
i(n 1)
, n banyak data
4
3. Tentukan nilai kuartil yang diminta tersebut

Contoh 2.9
1. Misalkan diketahui data ganjil sebagai berikut: 12,8, 10, 22, 18, 4, 9
Sehingga diperoleh data setelah diurutkan: 4, 8, 9, 10, 12, 18, 22
Letak kuartil:
K1
1(7 1)
2 maka, kuartil pertama ( K1 ) terletak pada data ke-2, yaitu: 8
4
K2
2(7 1)
4 maka, kuartil pertama ( K 2 ) terletak pada data ke-4, yaitu: 10
4
K3
3(7 1)
6 maka, kuartil pertama ( K1 ) terletak pada data ke-6, yaitu: 18
4
2. Misalkan diketahui data genap: 8, 12, 5, 3, 7, 2, 3, 8

Sehingga data terurut: 2, 3, 3, 5, 7, 8, 8, 12
Letak kuartil:
K1
1(8 1)
2,25
4
Nilai K1 Data ke-2+(0,25(data ke-3 data ke-2))
3+(0,25(3-3))
3
K2
2(8 1)
4,5
4
Nilai K1 Data ke-4+(0,5(data ke-5 data ke-4))
5+(0,5(7-5))
6
K3
3(8 1)
6,25
4
Nilai K 3 Data ke-6+(0,25(data ke-7 data ke-6))
8+(0,25(8-8))
8
18
STATISTIKA DASAR
Sedangkan untuk data yang telah dikelompokkan ke dalam tabel distribusi frekuensi,
kuartil data dapat dihitung dengan menggunakan langkah-langkah berikut:
1. Tentukan letak kuartil dengan persamaan:
Ki
in
, n banyak data
4
2. Menentukan nilai kuartil dengan persamaan berikut:

in
Nilai K i b p 4
f
Keterangan:
b batas bawah kelas kuartil

p panjang interval
n jumlah data
F frekuensi kumulatif sebelum kelas kuartil
f frekuensi kelas kuartil
Contoh 2.10
Perhatikan Tabel 2.7. Tentukan nilai kuartil ketiganya ( K 3 )!
Letak kuartil kedua ( K 3 ):
K3
3 90
67,5 , maka kuartil ketiga terletak pada kelas ke-6
4
Sehingga diperoleh informasi berikut:
b 81 0,5 80,5
p 10
F 58
f 12
3 90
58
88,42
Nilai K 3 80,5 10 4
12
Latihan Soal
Misalkan terdapat sekumpulan data berikut:
10
20
14
15
21
25
27
15
13
12
19
STATISTIKA DASAR
17
14
16
28
22
21
22
23
25
20
Carilah modus, median dan ketiga kuartil dari data tersebut baik sebelum maupun sesudah
dikelompokkan ke dalam tabel distribusi frekuensi!
20
STATISTIKA DASAR
III. ANALISA KORELASI LINEAR SEDERHANA
Analisis korelasi adalah metode statistik yang digunakan untuk menentukan kuat
tidaknya (derajat) hubungan linier antara 2 variabel atau lebih. Analisa korelasi sederhana,
meneliti hubungan dan bagaimana eratnya itu, tanpa melihat bentuk hubungan. Jika kenaikan
didalam suatu variabel diikuti dengan kenaikan variabel yang lain, maka dapat dikatakan
bahwa kedua variabel tersebut mempunyai korelasiyang positif. Tetapi jika kenaikan
didalam suatu variabel diikuti penurunan variabel yang lain maka kedua variabel tersebut
mempunyai korelasi negatif. Jika tidak ada perubahan pada suatu variabel ,meskipun variabel
yang lain mengalami perubahan, maka kedua variabel tersebut, tidak mempunyai hubungan
(uncorrelated).
Ilmu ekonomi dan pendidikan banyak mempelajari hubungan antar berbagai variabel.
Dari adanya hubungan tersebut digunakan untuk memprediksi pengaruh satu variabel
terhadap variabel lainnya. Misalnya, hubungan antara jumlah permintaan suatu barang
terhadap besarnya harga yang dapat dinyatakan dengan (f(p)). Fungsi tersebut menunjukkan
fakta yang muncul sebagai akibat atau disebabkan munculnya suatu yang lain. Hal ini
menghadapkan kita pada fakta kausalitas. Dari contoh tersebut dapat dijelaskan bahwa
jumlah barang yang diminta akan berubah sebagai akibat adanya perubahan harga.
Hubungan-hubungan fungsional tersebut menjelaskan ketergantungan variabel terikat
(dependent variable) pada variabel-variabel bebas (independent variable) dalam bentuk yang
spesifik. Hubungan fungsional ini bisa jadi merupakan hubungan yang sederhana antar
variabel. Pada kenyataannya, lebih sering dijumpai hubungan fungsional yang rumit dan sulit
untuk dijelaskan. Alat yang sering digunakan untuk mendekati kejadian tersebut adalah
regresi, baik regresi linear sederhana maupun regresi berganda.
Langkah awal yang harus dilakukan (sebelum menganalisis regresi) adalah mengetahui
bahwa dua variabel yang akan dianalisis memiliki hubungan yang kuat. Hal ini dapat
dilakukan dengan melakukan analisis korelasi. Analisis korelasi adalah sekumpulan teknik
statistika yang dapat digunakan untuk mengukur keeratan hubungan (korelasi) antara dua
variabel. Misalkan suatu perusahaan berpendapat bahwa dengan mendemonstrasikan cara
pemakaian produk akan dapat meningkatkan angka penjualan. Dari contoh tersebut, maka
dapat dikatakan bahwa demonstrasi pemakaian produk disebut variabel bebas, sedangkan
angka penjualan disebut variabel terikat.
21
STATISTIKA DASAR
Hubungan antara dua variabel jika ditinjau dari segi arahnya dapat dibedakan menjadi 2
jenis, yaitu:
1. Hubungan searah (korelasi positif)
Dua variabel (atau lebih) dikatakan memunyai hubungan searah jika dua variabel (atau
lebih) berjalan secara paralel. Hal ini mengandung makna bahwa hubungan antara dua
variabel (atau lebih) menunjukkan arah yang sama.
Jadi apabila variabel X meningkat (bertambah) maka variabel Y juga mengalami
peningkatan. Sebaliknya, apabila variabel X menurun (berkurang) maka variabel Y juga
menurun.
Contoh 3.1
Berikut ini adalah beberapa contoh hubungan searah antara dua variabel:
1. Kenaikan harga BBM akan diikuti dengan kenaikan harga sembako
2. Naiknya frekuensi pemberian tugas akan menyebabkan naiknya hasil belajar
3. Naiknya kedisiplinan anak didik diikuti dengan meningkatnya hasil belajar anak didik
bersangkutan.
Gambaran umum mengenai korelasi positif di atas dapat dilihat dalam Gambar 3.1
berikut:
(a)
X Y
(b)
Gambar 3.1 Arah Korelasi positif
2. Hubungan berlawanan arah (korelasi negatif)

Dua variabel (atau lebih) dikatakan mempunyai hubungan yang berlawanan arah jika
kedua variabel (atau lebih) tersebut bergerak dengan arah yang berlawanan. Hal ini
mengandung makna bahwa hubungan antara dua variabel (atau lebih) menunjukkan arah
yang berkebalikan.
Jadi, apabila variabel X meningkat (bertambah) maka variabel Y juga mengalami
penurunan. Sebaliknya, apabila variabel X menurun (berkurang) maka variabel Y juga
menigkat.
22
STATISTIKA DASAR
Contoh 3.2
Berikut ini adalah beberapa contoh hubungan antara dua variabel yang berlawanan arah:
1. Semakin
meningkatnya
kedisiplinan
dalam
berkendara
akan
diikuti
dengan
berkurang/menurunnya angka kecelakaan lalu lintas.

2. Semakin menurunnya harga buku pelajaran akan meningkatkan tingkat pengetahuan
siswa.
Gambaran umum mengenai korelasi positif di atas dapat dilihat dalam Gambar 3.1
berikut:
(a)
X Y
(b)
Gambar 3.1 Arah Korelasi positif

Positif atau negatifnya korelasi antara dua variabel dapat juga dilihat dari angka
korelasinya. Angka korelasi (koefisien korelasi) adalah koefisien yang dapat digunakan untuk
melihat besar-kecilnya, tinggi-rendah atau kuat-lemahnya suatu korelasi. Jadi, koefisien
korelasi adalah sebuah angka yang dapat dijadikan petunjuk untuk mengetahui seberapa besar
kekuatan korelasi di antara variabel yang sedang diselidiki korelasinya.
Lambang koefisien korelasi berbeda-beda sesuai dengan teknik korelasi yang
digunakan, yaitu:
rxy koefisien korelasi product moment
koefisien korelasi spearmann

koefisien korelasi phi
rpbi koefisien korelasi point biserial
Besarnya nilai mutlak angka korelasi berada dalam interval 0,1. 0 menandakan
tidak ada korelasi di antara variabel-variabel yang diselidiki dan angka 1 menunjukkan
adanya korelasi yang maksimal. Jika diperoleh angka korelasi yang lebih dari 1 atau kurang
dari -1, maka dalam perhitungan pasti terjadi kesalahan.
23
STATISTIKA DASAR
Jika tanda koefisien korelasi adalah positif (plus) maka korelasi yang terjadi adalah
korelasi positif. Sedangkan jika tanda angka/koefisien korelasi adalah negatif (minus) maka
korelasi antara variabel-variabel yang diselidiki adalah korelasi negatif.
Terdapat beberapa teknik korelasi yang dapat digunakan untuk mencari angka/koefisien
korelasi antar variabel, diantaranya adalah:
1. Teknik korelasi product moment (pearson)
Teknik korelasi product moment digunakan untuk mencari koefisien korelasi untuk data
kontinu, populasinya bersifat homogen atau mendekati homogen dan regresinya adalah
regresi linear.
2. Teknik korelasi tata jenjang (rank spearman)
Teknik korelasi rank spearmann digunakan untuk mencari koefisien korelasi untuk data
ordinal (berjenjang).
3. Teknik korelasi phi
Teknik korelasi phi digunakan untuk mencari koefisien korelasi untuk data diskrit.
4. Teknik korelasi point biserial
Teknik korelasi point biserial digunakan untuk mencari koefisien korelasi untuk data
kontinu dan diskrit.
Dalam bab ini hanya akan dibahas mengenai teknik korelasi product moment. Seperti
yang telah disebutkan sebelumnya bahwa lambang untuk angka korelasi product moment
adalah rxy , yang dapat ditentukan dengan persamaan berikut:
r
xy
n XY X Y
n X 2 X 2 n Y 2 Y 2

..(3.1)
Keterangan:
X Variabel bebas
Y Variabel terikat
n Jumlah data
rxy koefisien korelasi product moment
Koefisien ini dapat diinterpretasi dengan 2 cara, yaitu:

1. Dengan cara kasar menggunakan tabel penentu
Jika koefisien yang diperoleh dari Persmaan (3.1) diinterpretasikan dengan menggunakan
cara kasar (tabel penentu) maka digunakan Tabel 3.1 berikut:
24
STATISTIKA DASAR
Tabel 3.1 Tabel interpretasi koefisien korelasi dengan cara kasar

Nilai koefisien
Interpretasi
korelasi
Antara variabel X dan Y terdapat korelasi yang sangat lemah sehingga

0 0,2
korelasi tersebut dapat diabaikan (dianggap tidak ada korelasi antara

variabel X dan Y)
0,2 0,4
Antara variabel X dan Y terdapat korelasi yang lemah
0,4 0,7
Antara variabel X dan Y terdapat korelasi yang sedang
0,7 0,9
Antara variabel X dan Y terdapat korelasi yang kuat
0,9 1
Antara variabel X dan Y terdapat korelasi yang sangat kuat
Interpretasi dari koefisien korelasi dapat diambil dengan menggunakan Tabel 3.1 sesuai
dengan nilai yang diperoleh dan disesuaikan dengan interval yang ada di dalam tabel.
2. Dengan menggunakan uji-r

Jika interpretasi dilakukan dengan menggunakan uji-r, maka terdapat beberapa langkah
yang harus ditempuh, yakni:
a). Membuat hipotesa nol H 0 dan hipotesa alternatif ( H a )
H a = Terdapat korelasi positif/negatif yang signifikan antara variabel X dan Y
H 0 = Tidak terdapat korelasi positif/negatif yang signifikan antara variabel X dan Y
b). Menguji kebenaran hipotesa

Dengan menggunakan tabel r product moment dengan menggunakan ketentuan sebagai
berikut:
df derajat kebebasan n k
n jumlah data
k banyaknya variabel yang dikorelasi kan
taraf signifikan si 5% atau 1%

dimana kriteria ujinya adalah:
Jika rxy rt maka H 0 ditolak dan H a diterima

Jika rxy rt maka H 0 diterima dan H a ditolak
25
STATISTIKA DASAR
3. Dengan menggunakan uji-t

Seperti pada interpretasi dengan uji-r, dalam interpretasi uji-t juga diperlukan beberapa
langkah berikut:
a). Membuat hipotesa nol H 0 dan hipotesa alternatif ( H a )
H a = Terdapat korelasi positif/negatif yang signifikan antara variabel X dan Y
H 0 = Tidak terdapat korelasi positif/negatif yang signifikan antara variabel X dan Y
b). Menguji kebenaran hipotesa

Dengan menggunakan tabel t dengan menggunakan ketentuan sebagai berikut:
df derajat kebebasan n k
n jumlah data
k banyaknya variabel yang dikorelasi kan
taraf signifikan si 5% atau 1%

Dan t hitung ditentukan dengan persamaan berikut:
t hit
rxy n 2
1 rxy
dimana kriteria ujinya adalah:

Jika t hit t t maka H 0 ditolak dan H a diterima
Jika t hit t t maka H 0 diterima dan H a ditolak
26

45.bahan Ajar Statistika Dasar

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

45.bahan Ajar Statistika Dasar

Diunggah oleh

Hak Cipta:

Format Tersedia

STATISTIKA DASAR

ZUMROTUS SYADIYAH,S.Si, M.Si

1.1 Jenis-jenis Statistik

1.2 Jenis-jenis Data

1.3 Jenis-jenis Skala Pengukuran

1.4 Populasi dan Sampel

b. Populasi tak berihingga

II. STATISTIKA DESKRIPTIF

2.1 Daftar Distribusi Frekuensi

Merencanakan jumlah kelas

5. Menentukan panjang kelas

6. Menentukan ujung bawah pada kelas interval

9. Menentukan nilai tengah

ujung bawah ujung atas

dan seterusnya. Sehingga diperoleh tabel distribusi berikut ini:

b. Distribusi frekuensi kumulatif

(a) Tabel distribusi frekuensi kumulatif kurang dari

(b) Tabel distribusi frekuensi kumulatif lebih dari

Contoh Soal 2.1:

Kelompokkan data-data tersebut ke dalam suatu distribusi frekuensi!

Pembulatan dilakukan ke bawah sehingga diperoleh:

Pembulatan dilakukan ke atas sehingga diperoleh:

Latihan Soal 2.1

Kelompokkan data-data tersebut ke dalam suatu distribusi frekuensi, distribusi frekuensi

Kelompokkan data-data tersebut ke dalam suatu tabel distribusi frekuensi, distribusi

2.2 Ukuran Kepusatan

atau dapat juga digunakan persamaan:

Sehingga diperoleh rata-rata hitung:

x1 , x2 ,, xn . Maka rata-rata ukur dapat dihitung dengan menggunakan persamaan berikut:

Data tersebut dapat dinyatakan ke dalam tabel distribusi frekuensi berikut:

Tabel 2.6 Tabel distribusi frekuensi Contoh 2.3

Cari rata-rata ukurnya!

U log 1 1,7818 60,51

U log 1,78895 61,5

c. Rata-rata Untuk Suatu Data Yang Bersifat Tumbuh

log 132500000 log 3200000 13 log 1

Jadi, rata-rata pertambahan penduduk per tahunnya adalah 34 jiwa.

Selanjutnya, untuk kumpulan data yang telah dikelompokkan ke dalam distribusi

b Batas bawah kelas median (dimana median berada)

Median terletak pada data ke:

1. Urutkan data dari data terkecil ke data terbesar

3. Tentukan nilai kuartil yang diminta tersebut

2. Misalkan diketahui data genap: 8, 12, 5, 3, 7, 2, 3, 8

Nilai K1 Data ke-2+(0,25(data ke-3 data ke-2))

Nilai K1 Data ke-4+(0,5(data ke-5 data ke-4))

Nilai K 3 Data ke-6+(0,25(data ke-7 data ke-6))

2. Menentukan nilai kuartil dengan persamaan berikut:

b batas bawah kelas kuartil

Sehingga diperoleh informasi berikut:

III. ANALISA KORELASI LINEAR SEDERHANA

Gambar 3.1 Arah Korelasi positif

2. Hubungan berlawanan arah (korelasi negatif)

berkurang/menurunnya angka kecelakaan lalu lintas.

Gambar 3.1 Arah Korelasi positif

rxy koefisien korelasi product moment

koefisien korelasi spearmann

Koefisien ini dapat diinterpretasi dengan 2 cara, yaitu:

Tabel 3.1 Tabel interpretasi koefisien korelasi dengan cara kasar

Antara variabel X dan Y terdapat korelasi yang sangat lemah sehingga

korelasi tersebut dapat diabaikan (dianggap tidak ada korelasi antara

Antara variabel X dan Y terdapat korelasi yang lemah

Antara variabel X dan Y terdapat korelasi yang sedang

Antara variabel X dan Y terdapat korelasi yang kuat