BAB I
DATA & PENGANTAR STATISTIKA
A. Pendahuluan
D
ata merupakan koleksi fakta, seperti nilai-
nilai atau hasil-hasil pengukuran. Data
dapat berupa bilangan, kata-kata,
pengukuran, pengamatan atau bahkan hanya deskripsi
mengenai sesuatu. Data dapat berbentuk kualitatif atau
kuantitatif. Data kualitatif merupakan informasi yang bersifat
deskriptif, yakni ’menggambarkan’ sesuatu. Data kuantitatif
merupakan informasi numerik atau bilangan.
Perhatikan diagram mengenai jenis data berikut.
DATA
Kualitatif Kuantitatif
”Sangat menyenangkan”
Diskrit Kontinu
5 3,265...
b. Berjenis kontinu:
i. Berat anjing itu 25,5 kg.
ii. Tinggi anjing itu 56,5 cm.
|2
Statistik Dengan Pendekatan Matematik
B. Level Pengukuran
Level pengurukuran (level of measurement)
menunjukkan hubungan antara nilai-nilai yang dipasangkan
dengan atribut variabel. Variabel mempunyai sejumlah
atribut. Misalkan variabel “Jenis Sekolah” di Indonesia, dan
diasumsikan bahwa ada tiga atribut sekolah, yakni Sekolah
Standar Internasional (SSI), Sekolah Standar Nasional (SSN),
dan Sekolah Rintisan Standar Nasional (SRSN).
Untuk tujuan analisis hasil dari variabel tersebut,
pasangkan nilai-nilai 1, 2, dan 3 dengan atribut variabel.
Level pengukuran menggambarkan hubungan antara tiga
nilai itu. Dalam hal ini, secara sederhana dengan
menggunakan angka-angka tersebut mempersingkat
penulisan atribut yang teksnya lebih panjang.
Pemberian nilai seperti itu tentu tanpa berasumsi
bahwa nilai lebih tinggi bermakna "lebih" mengenai sesuatu
dan nilai lebih kecil berarti "kurang", juga tidak berasumsi
bahwa nilai 2 bermakna bahwa Sekolah Standar Nasional dua
kali Sekolah Standar Internasional. Tanpa berasumsi juga
bahwa Sekolah Standar Internasional menempati posisi
pertama atau memiliki prioritas pertama karena bernilai 1.
Dalam hal ini, hanya digunakan nilai itu sebagai nama lebih
singkat (kategori) untuk atribut (case) dari suatu variabel.
Level pengukuran seperti variabel tersebut adalah
"nominal". Perhatikan diagram berikut ini.
|3
Statistik Dengan Pendekatan Matematik
Nilai-nilai
1 2 3
Hubungan
Gambar 1.2.
Diagram Mengenai Variabel dan Jenisnya
|4
Statistik Dengan Pendekatan Matematik
|5
Statistik Dengan Pendekatan Matematik
C. Pengumpulan Data
Data dapat dikumpulkan melalui banyak cara. Cara
paling sederhana adalah melalui observasi (pengamatan
langsung). Contoh, mengetahui mengenai banyak mobil yang
melintasi suatu jalan tertentu dalam rentang waktu 10 menit.
Secara sederhana kita berdiri saja di suatu titik pada jalan
tersebut dan hitung mobil-mobil yang melintas dalam rentang
waktu yang dimaksud. Artinya kita mengumpulkan data
melalui survei. Beberapa jenis atau cara mengumpulkan data
diuraikan berikut ini.
1. Sensus atau Sampel
Sensus dilakukan sewaktu kita mengumpulkan data
setiap anggota kelompok (populasi keseluruhan). Sampel
dilakukan apabila kita akan mengumpulkan data hanya dalam
|6
Statistik Dengan Pendekatan Matematik
|7
Statistik Dengan Pendekatan Matematik
Tabel 1.1.
Hasil Pengumpulan Data Metode Pembelajaran Oleh Dosen
|9
Statistik Dengan Pendekatan Matematik
D. Analisis Data
Data merupakan nilai-nilai yang diukur atau dicatat
pada sampel.Statistik sampel merupakan karakteristik
numerik dari data sampel seperti rata-rata (mean), proporsi
ataupun varians.Karaktersitik numerik tersebut dapat
digunakan sebagai penaksir atau estimator dari parameter
populasi terkait. Contoh, persentase pemilih dalam suatu
pengumpulan pendapat di Indonesia tentang kepercayaan
mereka bahwa pemerintah akan melakukan yang terbaik
untuk meningkatkan mutu pendidikan.
Ada dua tujuan analisis data, yakni:
1. untuk meneliti pola dan
2. untuk menyediakan jawaban yang jelas terhadap
pertanyaan khusus.
Analisis data adalah penting, tetapi peneliti juga perlu
mengembangkan keterampilan:
| 10
Statistik Dengan Pendekatan Matematik
Sampel
Sampel Populasi
Statistika
Inferensial
Gambar 1.3.
Diagram Peran Statistika Inferensial Dalam Generalisasi
| 11
Statistik Dengan Pendekatan Matematik
Contoh parameter :
1. rata-rata berat badan, µ, dari semua wanita berusia 30
tahun dan
2. persentase pemilih p, yang percaya bahwa pemerintah
akan melakukan yang terbaik guna meningkatkan mutu
pendidikan.
Tujuan pengambilan sampel adalah mempelajari
sebagian dalam rangka memperoleh informasi mengenai
keseluruhan. Sebagai contoh, kepala sekolah akan mengambil
sampel inventaris sekolah untuk memeriksa ketepatan dari
catatan keseluruhannya. Sampel berbeda memberikan nilai
yang berbeda pula. Dengan mengambil banyak sampel
berbeda dan menghitung suatu statistik untuk setiap sampel
(misalnya rata-rata), akan dapat digambar histogram dari
semua rata-rata sampel.
Suatu statistik dari sampel atau dari suatu eksperimen
acak dapat dipandang sebagai variable random dan
histogram merupakan pendekatan terhadap distribusi
probabilitasnya. Istilah distribusi sampel (sampling
distribution) digunakan untuk menggambarkan distribusi
tersebut, yakni bagaimana statistik (dipandang sebagai
variabel acak) bervariasi jika sampel acak secara berulang
diambil dari populasi.
Suatu eksperimen secara acak mengalokasikan
perlakuan pada satuan-satuan atau subyek-subyek percobaan
untuk mengamati respon mereka. Rancangan suatu percobaan
berawal dengan deskripsi dari variabel respon (terikat atau
dependent), faktor-faktor (variabel eksplanasi atau
bebas/independent) dan apa perlakuan khusus yang akan
dilakukan. Eksperimen akan membandingkan perlakuan dari
pada sekedar upaya menilai satu perlakuan secara terisolir.
Misalnya, membandingkan respon dari kelompok perlakuan
dengan kelompok kontrol yang tidak mendapatkan perlakuan.
| 12
Statistik Dengan Pendekatan Matematik
x x x x x x x x x x x x x x
| 13
Statistik Dengan Pendekatan Matematik
x xxxx x x x x x
bias
3. Dalam kasus seperti ilustrasi di bawah ini, estimasi
dibiaskan karena semuanya secara sistematis lebih tinggi
daripada parameter populasi.
peneliti peneliti
mengetahui ingin mengetahui
Gambar 1.4.
Rumusan Distribusi Sampel Pengurang Bias
| 14
Statistik Dengan Pendekatan Matematik
Keterangan:
1. Jika sampel bukan representasi populasi yang diteliti,
statistik sampel akan bias sehingga peneliti tidak dapat
menggunakannya untuk membuat kesimpulan yang valid
mengenai parameter populasi.
2. Untuk meminimalkan bias, sampel harus dipilih secara
acak (random sampling) dari daftar semua individu dalam
population yang sesuai. Daftar seperti ini dinamakan
bingkai penarikan sampel (sampling frame). Hal ini
penting.
3. Untuk sampel acak sederhana (simple random sample),
individu-individu dipilih dalam suatu cara dimana setiap
individu dalam bingkai sampling punya kesempatan yang
sama untuk dipilih.
E. Probabilitas (Peluang)
Dalam dunia nyata, suatu peristiwa tidak dapat
diprediksi dengan ketepatan 100%. Yang terbaik dapat
dilakukan adalah menyatakan mungkin terjadi menggunakan
konsep probabilitas. Kalau kita melempar satu koin (uang
logam), maka ada dua kemungkinan yang terjadi, yakni
muncul angka (A) atau gambar (G). Kita katakan bahwa
probabilitas muncul A adalah ½, begitu pula untuk G. Kalau
kita melempar satu dadu dengan 6 permukaan, masing-
masing bernoktah 1, 2, 3, 4, 5, dan 6, maka probabilitas atau
peluang muncul satu permukaan adalah 1/6.
Secara umum:
Banyak cara peristiwa itu dapat
Probabilitas suatu peristiwa
= terjadi
terjadi
Total banyak kejadian mungkin
1. Eksperimen/Percobaan
Eksperimen merupakan perlakuan atau tindakan
dimana hasilnya tidak pasti.Melambungkan koin, melempar
dadu, mengamati kue yang dipilih orang merupakan contoh
dari eksperimen. Suatu kejadian atau peristiwa merupakan
hasil unik (tunggal) dari suatu eksperimen. Contoh peristiwa
adalah:
a. Mendapatkan muka A sewaktu melempar koin
merupakan peristiwa.
b. Menggelindingkan dadu dan muncul "mata 5"
merupakan suatu kejadian.
c. Menggelindingkan dadu dan muncul "bilangan genap"
(2, 4 atau 6) juga merupakan suatu peristiwa/kejadian.
2. Garis Probabilitas
Probabilitas merupakan peluang bahwa sesuatu akan
terjadi. Probabilitas dapat ditunjukkan pada suatu garis. Kita
dapat mengatakan bahwa probabilitas dari suatu peristiwa
terjadi adalah antara tak mungkin dan pasti. Dengan
perkataan lain kita dapat menggunakan pecahan atau bentuk
desimal untuk menunjukkan probabilitas dari sesuatu yang
terjadi. Ketidakmungkinan sama dengan nol dan yang pasti
| 16
Statistik Dengan Pendekatan Matematik
| 17
Statistik Dengan Pendekatan Matematik
| 18
Statistik Dengan Pendekatan Matematik
Gambar 1.7.
Ilustrasi Permukaan Dadu
Pertanyaan:
Jika kita menggelindingkan satu dadu:
1. Berapa skor terkecil yang mungkin?
2. Berapa skor terbesar yang mungkin?
3. Berapa skor yang hampir dapat dipastikan muncul?
| 19
Statistik Dengan Pendekatan Matematik
Tabel 1.2.
Distribusi Frekuensi Kemunculan Mata Dadu
Pertanyaan
1. Muka mana paling sering muncul? ____
2. Muka mana paling jarang muncul? ____
3. Apakah hasilnya sama jika kita lakukan lagi? Ya / Tidak
| 20
Statistik Dengan Pendekatan Matematik
1
Probabilitas muncul muka 2 =
6
Tabel 1.3.
Mata Dadu dan Probabilitas Munculnya
Skor Probabilitas
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
Total = 1
Gambar 1.8.
Ilustrasi Dua Mata Dadu Dan Jumlahnya
| 21
Statistik Dengan Pendekatan Matematik
Gambar 1.9.
Ilustrasi Jumlah Dua Mata Dadu Bernilai 8
Tabel 1.4.
Distribusi Frekuensi Jumlah Nilai Dua Mata Dadu
| 22
Statistik Dengan Pendekatan Matematik
Tabel 1.5.
Jumlah Skor Dua Mata Dadu Yang Digelindingkan
| 23
Statistik Dengan Pendekatan Matematik
5 4
6 5
7 6
8 5
9 4
10 3
11 2
12 1
Total = 36
Tabel 1.7.
Jumlah Dua Skor Mata Dadu 3 Kelompok
| 24
Statistik Dengan Pendekatan Matematik
Gambar 1. 9.
Diagram Batang Nilai Teoritis Jumlah Dua Mata Dadu
| 25
Statistik Dengan Pendekatan Matematik
1
Probabilitas skor total 2 =
36
Tabel 1.8.
Total Skor dan Probabilitasnya
| 26
Statistik Dengan Pendekatan Matematik
4. Randomisasi
Penggunaan probabilitas (peluang) untuk
mengalokasikan satuan percobaan ke dalam kelompok-
kelompok dinamakan randomisasi (randomization).
Randomisasi adalah prinsip utama dari rancangan statistik
ekperimen. Randomisasi menghasilkan kelompok eksperimen
yang lebih mirip dalam semua pengakuan sebelum perlakuan
diterapkan dari pada penggunaan metode tak acak (non-
random methods). Pada akhir studi apabila perbedaan dalam
variabel akibat antara dua kelompok adalah sangat besar
dibandingkan peluang atribut, maka perbedaan itu dinamakan
signifikan secara statistik (statistically significant).
Keputusan mengenai seberapa besar suatu perbedaan adalah
signifikan (berarti) tergantung pada statitika inferensial yang
menggunakan hukum-hukum probabilitas.
Prinsip lain adalah bahwa eksperimen dengan lebih
banyak subyek lebih banyak mendeteksi perbedaan-
perbedaan daripada sedikit subyek. Pengulangan eksperimen
pada banyak subyek dinamakan replikasi (replication).
Apabila diketahui, sebelum eksperimen dilakukan, bahwa
variabel lain tidak mempengaruhi variabel hasil/akibat
| 27
Statistik Dengan Pendekatan Matematik
Subyek Placebo
Gambar 1.11.
Diagram Analisis Statistik Perbandingan Kelompok
Arah sebab
c. Confounding Effect
Masalah potensial dalam studi observasional adalah
bahwa mungkin terdapat faktor yang berbeda antara
kelompok pembanding dan akan mengakibatkan hasil-hasil
tertentu. Apabila faktor tersebut mempengaruhi hasil
dinamakan pengaruh yang tidak diharapkan (confounding
effect). Peneliti perlu melihat faktor seperti itu sewaktu
menganalisis data, yakinilah bahwa data menyajikan hasil-
hasil yang sesuai.
| 31
Statistik Dengan Pendekatan Matematik
Tabel 1.9
Distribusi Frekuensi Pelamar Pada Suatu Universitas
Siswa Yang
% Yang Diterima
Mendaftar
Pria 8.442 44%
Perempuan 4.321 35%
Tabel 1.10
Distribusi Frekuensi Pelamar Menurut NEM Dan Gender
Pria Perempuan
NEM Pendaftar % Diterima Pendaftar % Diterima
A 825 62 108 82
B 560 63 25 68
C 325 37 593 35
D 417 33 375 35
E 191 28 393 24
F 373 6 341 7
Total 2691 45 1835 30
| 33
Statistik Dengan Pendekatan Matematik
| 34
Statistik Dengan Pendekatan Matematik
| 35
Statistik Dengan Pendekatan Matematik
2 Juta Siswa
Gambar 1.15.
Diagram Konstribusi Statistik Dalam Eksperimen
| 36
Statistik Dengan Pendekatan Matematik
| 37
Statistik Dengan Pendekatan Matematik
750.000 siswa
Randomisasi
Kontrol Perlakuan
200.000siswa
200.000 siswa 350.000siswa
Rasio polio
Rasio polio Rasio polio
28 per 100.000
71 per 100.000 46 per 100.000
Tidak : Ya
Studi deskriptif atau Survei
Tidak : Ya:
Studi analitik atau Observasional eksperimen
| 38
Statistik Dengan Pendekatan Matematik
Tabel 1.11
Data Pelamar Masuk Universitas
Banyak Pelamar
Program Pilihan Utama Laki-Laki Perempuan Total
A 825 108 933
B 560 25 585
C 325 593 918
D 417 375 792
E 191 393 584
F 373 341 714
TOTAL 2691 1835 4526
| 39
Statistik Dengan Pendekatan Matematik
| 41
Statistik Dengan Pendekatan Matematik
Tabel 1.14
Sebarasan Data 20 Restoran
Ukuran
Kepemilikan Total
1 2 3
1 3 4 0 7
2 2 0 1 3
3 4 3 3 10
Total 9 7 4 20
Tabel 1.16
Persentase Kolom Pada Masing-Masing Sel
Ukuran
Kepemilikan Total
1 2 3
1 33,33 57,14 0 35
2 22,22 0 25 15
3 44,44 42,86 75 50
Total 100 100 100 100
| 42
Statistik Dengan Pendekatan Matematik
Tabel 1.17
Persentase Baris Pada Masing-Masing Sel
Ukuran
Kepemilikan Total
1 2 3
1 42,86 57,14 0 100
2 66,67 0 33,33 100
3 40,00 30,00 30,00 100
Total 45 35 20 100
Tabel 1.18
Distribusi Frekuensi Penyebab Kematian Menurut Gender
| 43
Statistik Dengan Pendekatan Matematik
Tabel 1.19
Distribusi Frekuensi Marginal Kematian Menurut Gender
Tabel 1.20
Distribusi Frekuensi Marginal Penyebab Kematian
Frekuensi
Penyebab Frekuensi
Relatif
Kecelakaan Kendaraan Bermotor 594 0,31
Bunuh Diri 434 0,23
Kecelakaan Lainnya 331 0,17
Kanker Menular 136 0,07
Penyakit Lainnya 420 0,22
Total 1915 1,00
| 44
Statistik Dengan Pendekatan Matematik
Laki-Laki Perempuan
Penyebab
Frekuensi % Frekuensi %
Kecelakaan
448 32 146 29
kendaraan bermotor
Bunuh diri 350 25 84 17
Kecelakaan lainnya 257 18 74 15
Kanker 86 6 50 10
Penyakit lainnya 267 19 153 30
Total 1408 100% 507 100%
| 45
Statistik Dengan Pendekatan Matematik
| 46
Statistik Dengan Pendekatan Matematik
Nomor 1 2 3 4 5 6 7 8 9
Frekuensi 8 9 11 7 12 9 15 13 16
| 47
Statistik Dengan Pendekatan Matematik
Tentukanlah:
a. Frekuensi relatif munculnya nomor 7.
b. Frekuensi relatif munculnya nomor bukan prima.
c. Frekuensi relatif munculnya nomor ganjil.
9. Pada pelemparan dua buah dadu ke udara sebanyak satu
kali. Jika peluang munculnya mata dadu berjumlah ganjil
5
adalah , maka tentukanlah peluang munculnya mata
12
dadu berjumlah genap.
10. Suatu lembaga swadaya masyarakat yang bergerak di
bidang kesehatan bekerja sama dengan suatu rumah sakit
untuk mengadakan penelitian terhadap satu jenis
penyakit pada anak usia sekolah di suatu kabupaten.
Hasil penelitian menyatakan 375 dari 1500 anak usia
sekolah yang dijadikan subyek penelitian dinyatakan
pernah mengalami penyakit tersebut. Tentukan peluang
anak usia sekolah tersebut dinyatakan tidak pernah
terkena penyakit itu.
11. Manakah diantara kejadian-kejadian berikut yang
merupakan kejadian saling lepas atau bebas.
a) Munculnya tiga angka atau munculnya dua gambar
pada pelemparan tiga keping mata uang logam.
b) Munculnya kartu As atau kartu berwarna merah pada
pengambilan sebuah kartu dari satu set kartu bridge.
c) Munculnya bola nomor ganjil atau munculnya bola
nomor prima pada pengambilan satu buah bola
bilyard dari masing-masing kantung tertutup berisi
satu set bola bilyard (nine ball).
12. Sekeping mata uang logam dilemparkan ke udara
sebanyak m kali. Kejadian muncul sisi gambar (G)
sebanyak 9 kali dan kejadian muncul sisi angka (A)
sebanyak a kali. Jika m cukup besar, tentukanlah:
9 𝑎
a. +𝑚 b) 9 + 𝑎
𝑚
| 48
Statistik Dengan Pendekatan Matematik
13. Empat (4) kartu diberi label EFGH dan dikocok. Jika
kartu-kartu tersebut diambil satu per satu secara acak
tanpa pengembalian, tentukan peluang bahwa kartu-kartu
yang terambil memenuhi urutan alfabetis!
14. Jika frekuensi harapan munculnya angka pada sisi mata
uang logam dan mata dadu prima pada pelemparan satu
mata uang logam dan satu dadu adalah 56. Tentukan
berapa kali mata uang logam dan dadu dilempar ke
udara?
15. Herdi mempunyai koleksi dasi merah dan kuning, baju
warna hijau, biru, ungu dan cokelat serta celana warna
hitam, putih dan abu-abu. Tentukan banyak pasangan
dasi, baju dan celana yang bisa dipakai Herdi.
16. Di dalam kantung A terdapat 4 buah kartu yang diberi
nomor 1, 3, 5, 6 dan di dalam kantung B terdapat 3 buah
kartu yang diberi nomor 2, 4, 7. Akan diambil masing-
masing sebuah kartu dari setiap kantung. Tentukan
peluang terambilnya kartu berjumlah genap.
17. Dua buah dadu dilempar ke udara sebanyak satu kali.
Berapa peluang mata dadu yang muncul berjumlah 7?
18. Akan dipilih secara acak 2 dari 4 orang pasangan suami
istri. Berapa peluang keduanya merupakan pasangan
suami istri?
19. Akan dipilih secara acak masing-masing satu huruf dari
kata-kata PARALLEL dan LEVEL. Berapa peluang
terambilnya huruf yang sama?
20. E dan F adalah dua kejadian saling lepas. Jika P(E), P(F),
P(E atau F) berturut-turut adalah peluang kejadian E,
kejadian F dan kejadian (E atau F). Tentukan hubungan
P(E) dan P(F).
21. Seorang pesulap mencoba membuka satu pintu dengan 8
kunci dimana hanya satu kunci yang bisa membuka pintu
| 49
Statistik Dengan Pendekatan Matematik
| 50
Statistik Dengan Pendekatan Matematik
| 51
Statistik Dengan Pendekatan Matematik
BAB II
KONSEP DASAR STATISTIK
B
ab ini merupakan pengantar yang memuat
secara singkat mengenai konsep-konsep
dasar statistik sebagai landasan dalam
mempelajari analisis data statistik. Pokok bahasan yang
diuraikan menggambarkan asumsi dasar metode statistik
paling populer dan sudah dilakukan banyak peneliti sebagai
komponen pemahaman umum mengenai "naturalitas
kuantifikasi" dari realitas. Tulisan pada bab ini menunjukkan
perhatian pada aspek fungsional suatu konsep dan disajikan
secara ringkas. Informasi lanjut pada setiap konsep dapat
ditemukan dalam buku-buku ajar statistika.
Dalam bab ini, secara singkat diuraikan mengenai:(1)
variabel; (2) penelitian korelasional dan eksperimental; (3)
variabel terikat dan bebas; (4) skala-skala pengukuran; (5)
relasi antara variabel; (6) keutamaan relasi antara variabel;
(7) dua ciri dasar setiap relasi antara variabel; (8) signifikansi
statistik (nilai-p); (9) penentuan hasil yang benar-benar
signifikan; (10) signifikansi statistik dan analisis yang
dilakukan; (11) kekuatan dan reliabilitas relasi antara
variabel-variabel; (12) relasi lebih kuat antara variabel yang
lebih signifikan; (13) signifikansi relasi antara variabel terikat
terhadap ukuran sampel; (14) contoh rasio; relasi kecil dalam
sampel besar; (16) tidak terdapat relasi sebagai hasil yang
signifikan;(17) mengukur kekuatan relasi antara variabel;
(18) format paling umum dari uji statistik; menghitung taraf
signifikansi statistik; (19) kepentingan distribusi normal; (20)
distribusi normal dalam penalaran statistik (induksi); (21) uji
| 52
Statistik Dengan Pendekatan Matematik
A. Variabel
Dalam kerja-kerja statistik, sangat berguna
membedakan antara dua jenis variabel, yakni kualitatif dan
kuantitatif (atau numerik). Masing-masing dikelompokkan ke
dalam dua jenis, yakni data kualitatif, ordinal atau nominal,
dan data numerik yang diskrit (seringkali adalah bulat) atau
kontinu.
Kata "variabel" digunakan dalam dua pengertian.
Yakni, variabel dapat bermakna sebagai item data yang
dikumpulkan pada tiap satuan (unit) penarikan sampel, dan
berarti pula sebagai "variabel acak". Variabel acak
merupakan variabel dalam pengertian matematika, tetapi
peneliti dapat mengambil nilai-nilai berbeda menurut suatu
sebaran probabilitas.
Kata "variat" kadang-kadang juga digunakan
bermakna sebagai variabel acak. Dalam statistik, digunakan
variabel acak untuk membangun model probabilitas untuk
variabel-variabel data karena, sewakltu data dikumpulkan
pada satuan-satuan pengamatan yang diambil sampelnya
secara acak, nilai-nilai tersebut dicatat untuk variabel-
variabel data dapat dipandang sebagai realisasi dari variabel
acak matematik.
Mengingat bahwa data kualitatif selalu terbatas
banyak nilai-nilai pilihannya, variabel seperti ini juga
digambarkan berbentuk diskrit. Semua data kualitatif adalah
diskrit, sedangkan beberapa data numerik adalah diskrit dan
beberapa kontinu. Untuk analisis statistik, data kualitatif
dapat dikonversi ke dalam data numerik diskrit dengan cara
menghitung nilai-nilai berbeda yang muncul.
| 53
Statistik Dengan Pendekatan Matematik
| 54
Statistik Dengan Pendekatan Matematik
| 55
Statistik Dengan Pendekatan Matematik
D. Skala Pengukuran
Pengukuran terdiri atas aturan pemasangan bilangan
kepada atribut dari objek didasarkan pada aturan-aturan.
Bahasa aljabar tidak mempunyai makna di dalam dan dari
dirinya sendiri. Matematikawan teoritik berhubungan
seluruhnya dalam realita dari bahsa formal dan
memperhatikan struktur serta hubungan dalam bahasa
tersebut. Matematikawan terapan atau ahli statistik, pada sisi
lain, tidak hanya memperhatikan bahasa aljabar, tetapi
hubungan dari simbol-simbol dalam bahasa itu dengan objek
dan peristiwa nyata dalam kehidupan. Perhatian mengenai
makna simbol-simbol matematika (bilangan) merupakan
perhatian mengenai pengukuran.
| 56
Statistik Dengan Pendekatan Matematik
| 57
Statistik Dengan Pendekatan Matematik
Gambar 2.1
Diagram Pemasangan Objek dengan Bilangan
a. Ukuran/Besar Objek
Sifat dari ukuran/besar ada apabila suatu objek yang
mempunyai lebih banyak atribut dari pada objek lain,
diberikan suatu bilangan yang lebih besar berdasarkan suatu
sistem aturan. Hubungan seperti itu haruslah memenuhi
untuk semua objek dalam "dunia nyata". Secara matematika,
sifat adanya ukuran/besar objek digambarkan sebagai berikut:
Sifat ukuran/besar ada apabila untuk semua i,j jika Oi> Oj
maka M(Oi) > M(Oj).
b. Rentang (Interval)
Sifat interval terkait dengan hubungan dari perbedaan-
perbedaan antara objek-objek. Jika suatu sistem pengukuran
memiliki sifat-sifat interval berarti bahwa satuan pengukuran
dari pengukuran bermakna sebagai sesuatu yang sama
menurut skala dari bilangan. Misalnya, satu inci adalah satu
inci, tidak ada masalah pada bagian mana pengukuran
dilakukan.
Secara lebih tepat, perbedaan yang sama antara dua
bilangan mencerminkan perbedaan yang sama dalam "dunia
nyata" antara objek yang dipasangkan dengan bilangan-
bilangan itu. Dalam kaitan pendefinisian sifat interval dalam
notasi matematika, diperlukan empat objek yakni: Oi, Oj, Ok,
dan Ol. Perbedaan antara objek-objek disajikan menggunakan
tanda "-"; dimana Oi-Oj menunjukkan perbedaan aktual pada
"dunia nyata" antara objek i dan objek j, sedangkan M(Oi)-
M(Oj) menunjuk perbedaan antara bilangan-bilangan yang
dipasangkan atau yang merupakan ukuran dari masing-
masing objek tersebut.Sifat dari interval adalah:Untuk semua
i, j, k, ljikaOi-Oj=Ok- Olmaka M(Oi)-M(Oj)=M(Ok)-M(Ol).
| 59
Statistik Dengan Pendekatan Matematik
| 60
Statistik Dengan Pendekatan Matematik
2. Jenis-Jenis Skala
S. S. Stevens (1951, h. 147) mengusulkan empat jenis
skala.Jenis skala yang dimaksud adalah Nominal, Ordinal,
Interval,dan Ratio, dan masing-masing memiliki perbedaan
sifat-sifat dari sistem pengukuran.
a. Skala Nominal
Skala-skala nominal merupakan sistem pengukuran
yang tidak memiliki tiga sifat sebagaimana diuraikan yakni,
besar, interval, dan nol rasional. Skala-skala nominal dibagi
ke dalam dua kelompok, yakni: Penamaan Kembali
(Renaming) dan Kategori (Categorical).
Penamaan kembali skala nominal (Nominal-
Renaming) terjadi apabila tiap objek dalam suatu himpunan
dipasangkan dengan bilangan berbeda, oleh karena itu,
namakan kembali menggunakan suatu bilangan. Contoh
penamaan kembali skala nominal adalah bilangan-bilangan
kode sosial atau bilangan pada bagian punggung pemain
sepak bola. Bilangan kode sosial perlu dinamakan kembali
karena indivisu berbeda dengan nama sama, misalnya
Ahmad, dan karena komputer memerlukan waktu lebih
singkat dan lebih mudah menangani mengenai bilangan
dibandingkan karakter bilangan (alpha-numeric).
| 61
Statistik Dengan Pendekatan Matematik
| 62
Statistik Dengan Pendekatan Matematik
| 63
Statistik Dengan Pendekatan Matematik
empat jenis, yakni: (a) nominal, (b) ordinal, (c) interval, atau
(d) rasio.
Variabel nominal hanya untuk klasifikasi kualitatif.
Jenis variabel ini hanya dapat diukur berdasarkan apakah
item individual secara jelas milik beberapa kategori berbeda,
tetapi kita tidak dapat mengkuantifikasi atau bahkan
mengurutkan peringkat kategori-kategori itu. Contoh, peneliti
dapat mengatakan bahwa dua individu berbeda dalam kaitan
dengan variabel A (misal, keduanya berbeda warna kulit),
tetapi kita tidak dapat menyatakan mana yang "memiliki
kelebihan" kualitas berdasarkan penyajian variabel tersebut.
Contoh khusus variabel nominal adalah gender, suku, warna,
dan jenis kota.
Variabel ordinal memungkinkan bagi peneliti
memeringkat urutan item yang diukur berkaitan dengan mana
berkualitas kurang dan lebih baik (tinggi) yang disajikan
variabel itu. Namun, masih belum membolehkan peneliti
mengatakan "berapa kelebihannya". Contoh khusus variabel
ordinal adalah status sosial-ekonomi dari keluarga. Misal,
peneliti mengetahui bahwa kelas atas adalah lebih tinggi dari
pada kelas menengah tetapi tidak dapat menyatakan 18%
lebih tinggi.
Perbedaan utama skala nominal, ordinal, dan interval
juga dapat dilihat dalam menyajikan suatu variabel ordinal.
Sebagai contoh, peneliti dapat menyatakan bahwa
pengukuran nominal menyediakan sedikit informasi
dibandingkan pengukuran ordinal, tetapi tidak dapat
menyatakan "berapa banyak kekurangannya" atau bagaimana
perbedaan tersebut dibandingkan dengan perbedaan antara
skala ordinal dan interval.
Variabel interval memungkinkan peneliti tidak
hanya memeringkat urutan item yang diukur, tetapi juga
mengkuantifikasi dan membandingkan ukuran perbedaan
| 64
Statistik Dengan Pendekatan Matematik
| 65
Statistik Dengan Pendekatan Matematik
| 66
Statistik Dengan Pendekatan Matematik
| 67
Statistik Dengan Pendekatan Matematik
| 68
Statistik Dengan Pendekatan Matematik
| 69
Statistik Dengan Pendekatan Matematik
| 70
Statistik Dengan Pendekatan Matematik
| 71
Statistik Dengan Pendekatan Matematik
| 72
Statistik Dengan Pendekatan Matematik
| 73
Statistik Dengan Pendekatan Matematik
| 74
Statistik Dengan Pendekatan Matematik
| 75
Statistik Dengan Pendekatan Matematik
| 76
Statistik Dengan Pendekatan Matematik
| 77
Statistik Dengan Pendekatan Matematik
K. Distribusi Normal
Distribusi normal memang penting karena, dalam
banyak kasus, sebaran tersebut paling baik mendekati fungsi
sebagaimana diuraikan secara singkat pada bagian J (uraian
lebih lanjut pada Bab tersendiri dalam buku ini). Kepentingan
distribusi normal dari banyak uji statistik adalah karena
sebaran data adalah mengikuti fungsi normal atau mengikuti
beberapa bentuk yang dapat diturunkan dari distribusi
normal. Secara filosofis, distribusi normal menyajikan satu
dari verifikasi dasar peristiwa empiris yakni, "kebenaran atas
dasar kewajaran umum dari realita," dan kedudukannya dapat
dibandingkan dengan hukum-hukum dasar mengenai ilmu
pengetahuan alam. Bentuk tepat dari distribusi normal (ciri
"kurva lonceng") didefinisikan sebagai suatu fungsi yang
hanya mempunyai dua parameter, yakni: rata-rata dan standar
deviasi.
Sifat khusus distribusi normal adalah bahwa 68% dari
semua observasi berada dalam rentang ±1 standar deviasi dari
rata-rata, dan rentang ±2 standar deviasi memuat 95% dari
| 78
Statistik Dengan Pendekatan Matematik
| 79
Statistik Dengan Pendekatan Matematik
| 80
Statistik Dengan Pendekatan Matematik
| 81
Statistik Dengan Pendekatan Matematik
LATIHAN 2
1. Tuliskan lima (5) contoh variabel penelitian.
2. Tuliskan dua (2) variabel dalam penelitian korelasional.
Jelaskan!
3. Tuliskan dua (2) variabel dalam penelitian
eksperimental. Jelaskan!
4. Tuliskan dua (2) variabel penelitian dimana satu
merupakan variabel bebas dan yang lain adalah variabel
terikat.
5. Tuliskan masing-masing lima (5) variabel nominal,
ordinal, interval dan rasio. Jelaskan!
6. Apa yang dimaksud ”hubungan antar variabel”. Jelaskan!
7. Apa yang dimaksud ”signifikansi statistik”. Jelaskan!
8. Apa yang dimaksud ”fungsi normal”. Jelaskan!
9. Berikut adalah daftar atribut berbeda dan aturan untuk
memasangkan bilangan dengan objek-objek. Coba
klasifikasikan sistem pengukuran berbeda ke dalam satu
dari empat jenis skala.
a. Numor rekening sebagai nama untuk rekening.
b. Keseimbangan rekening sebagai ukuran banyak uang
pada rekening itu.
c. Keseimbangan rekening sebagai ukuran of your
wealth.
d. Bilangan yang diperoleh dari mesin (32, 33, ...)
sebagai ukuran waktu seseorang antri.
| 82
Statistik Dengan Pendekatan Matematik
| 83
Statistik Dengan Pendekatan Matematik
BAB III
MENYARIKAN DAN MENYAJIKAN DATA
B
ab-3 ini memuat sebagian dari uraian pada
Bab-2 dalam rangka mengingatkan kembali
beberapa terminologi dalam statistika.
Beberapa uraian yang diulang antara lain terkait dengan data
serta beberapa ukuran sebaran data.
A. Menyarikan Data
Uraian mengenai penyarian data diawali pengertian
mengenai variabel sebagaimana telah disinggung juga pada
Bab-2. Uraian mengenai variabel sebaiknya berawal dari
pengertian variabel dimana selanjutnya akan dapat dipahami
data variabel serta kedudukan suatu variabel, yakni bebas
atau terikat.
1. Jenis Variabel
Secara umum, variabel merupakan item data yang
dikumpulkan pada setiap satuan penarikan sampel. Dikenal
pula istilah variabel acak yang biasa dinamakan variat. Variat
merupakan pengambilan nilai berbeda sesuai probabilitas
sebaran. Kuantitas-kuantitas seperti gender dan berat badan
misalnya dinamakan variabel, karena nilai yang dimaksud
berubah-ubah dari suatu pengamatan ke pengamatan lain.
Terdapat dua jenis variabel, yakni:
(a) Variabel kualitatif, yakni merupakan pengambilan data
berciri diskrit atau berupa angka atau sering pula
dinamakan variabel kategori. Variabel ini dapat berjenis
ordinal atau nominal. Jenis variabel kualitatif berciri
ordinaldigunakan apabila terdapat urutan dari data yang
diambil. Misalnya hasil-hasil ujian dan status sosial-
| 84
Statistik Dengan Pendekatan Matematik
Contoh statistik:
1. Proporsi perempuan dalam suatu sampel penduduk di
suatu wilayah, misalnya p = 0,2. Statistiknya adalah 0,2
dimana p adalah nama/istilah/konsep atau ukuran
sebaran data.
2. Misalkan ada 10 data : 6, 7, 5, 8, 8, 6, 4, 9, 7, 4. Rata-
ratanya = (4 + 4 + 5 + 6 + 6 + 7 + 7 + 8 + 8 + 9)/10 =
6,4. Artinya ukuran statistik tertentu dari sepuluh data
tersebut adalah 6,4 sedangkan rata-rata adalah suatu
konsep.
3. Rata-rata usia sekolah dalam suatu sampel penduduk di
suatu wilayah juga merupakan statistik.
| 85
Statistik Dengan Pendekatan Matematik
Penghasilan
No Kelompok
Usia (tahun) Tahunan Gender
Subjek Usia
(10 juta)
1 32 3 4,1 P
2 20 2 1,5 L
3 45 4 2,3 P
. . . . .
. . . . .
. . . . .
47 19 1 0,5 P
48 32 3 1,9 P
| 86
Statistik Dengan Pendekatan Matematik
| 87
Statistik Dengan Pendekatan Matematik
Gambar 3.1
Diagram Batang Persentase Penggunaan
Model Pembelajaran Di Suatu Wilayah
1200
Percent
1000
984
50
800
600
400 25
303
200
132
95 87
0 0
F H C D E B A G I
Gambar. 3.2
Diagram Pareto Frekuensi Penggunaan Model Pembelajaran
Gambar 3.3
Diagram Garis Sebaran Data Tahun dan Berat Badan
| 89
Statistik Dengan Pendekatan Matematik
Gambar 3.4
Diagram lingkaran dan bagiannya dalam persen
| 90
Statistik Dengan Pendekatan Matematik
Tabel 3.3
Distribusi Frekuensi Harga Mobil Bekas
Harga Ribu Frekuensi
Frekuensi
Rupiah Frekuensi Kumulatif
Tally Frekuensi kumulatif
(kelas Relatif Kurang
lebih dari
interval) Dari
2000 – 4999 //// / 6 0,16 0 38
5000 – 7999 //// // 7 0,18 6 32
8000 – 10999 //////// // 13 0,34 13 25
11000 – 13999 //// 5 0,13 26 12
14000 – 16999 //// 4 0,11 31 7
17000 – 19999 / 1 0,03 35 3
20000 atau
// 2 0,05 36 2
lebih
38 1,00 38
Gambar 3.5
Histogram Distribusi Frekuensi Harga Mobil Bekas
| 91
Statistik Dengan Pendekatan Matematik
3. Dotplots
Suatu histogram mengelompokkan data hanya ke
dalam beberapa interval.Suatu dotplot mengelompokkan data
sekecil mungkin.Dotplot lebih bermanfaat pada himpunan
data kecil. Dotplot berguna apabila kita akan
membandingkan dua atau lebih himpunan data. Terhadap
| 92
Statistik Dengan Pendekatan Matematik
harga
Gambar 3.6
Dotplot Data Harga Buku Dari Penerbit
4. Boxplots
40000
30000 19
20000
10000
0
N = 38
Frekuensi Penampilan
Gambar 3.7
Boxplot data Harga Buku Dari Penerbit
D. Distribusi Frekuensi
Perhatikan masing-masing satu contoh Tabel
Distribusi Frekuensi Numerik dan Distribusi Frekuensi
Kategori berikut.
Tabel 3.4
Dua Contoh Distribusi Frekuensi
| 93
Statistik Dengan Pendekatan Matematik
10 20 25 30 30 35 40 40 45 50 55 59 65 70 80
10 20 25 30 30 35 40 40 45 50 55 59 65 70 80
15 20 25 30 30 35 40 40 45 50 55 60 65 70 80
15 20 25 30 30 35 40 40 45 50 55 60 65 70 85
15 20 25 30 31 36 40 45 47 50 57 60 65 70 85
15 20 25 30 33 40 40 45 47 50 57 60 65 75 85
15 20 25 30 35 40 40 45 47 55 58 60 65 75 90
15 20 25 30 35 40 40 45 48 55 58 61 65 75 90
18 20 25 30 35 40 40 45 48 55 58 62 65 75 90
20 25 30 30 35 40 40 45 49 55 58 63 70 75 95
Gambar 3.8
Histogram Sebaran Data Dari Tabel 3.5
| 95
Statistik Dengan Pendekatan Matematik
| 96
Statistik Dengan Pendekatan Matematik
| 97
Statistik Dengan Pendekatan Matematik
| 98
Statistik Dengan Pendekatan Matematik
Contoh 2:
Tabel 3.7. Distribusi Frekuensi
b. Simetri
Suatu distribusi dikatakan simetris apabila frekuensi
relatif (atau probabilitas) adalah sama, atau berjarak sama di
sisi lain dari pusat–m. Secara matematik, distribusi X-m
adalah sama seperti distribusi m-X. Rata-rata (mean) dan nilai
tengah (median) dari distribusi simetris adalah sama.
Distribusi simetris yang paling penting adalah
distribusi normal (normal distribution), yang adalah
unimodal dan relatif simetris terhadap modus. Apabila suatu
distribusi adalah unimodal dan simetris, maka rata-rata,
median dan modus semuanya bernilai sama.
Distribusi frekuensi asimetris (tidak simetris) adalah
menceng ke kiri apabila bagian ekor bawah lebih panjang
daripada bagian ekor atas, dan menceng ke kanan sebaliknya,
yaitu ekor atas lebih panjang daripada ekor bawah. Sebaran
| 99
Statistik Dengan Pendekatan Matematik
Contoh 3:
Perhatikan sebaran data : 6, 6.7, 3.8, 7, 5.8, 9.975.Median
={(6+6,7)/2} = 6,35.
| 101
Statistik Dengan Pendekatan Matematik
𝑓𝑚𝑒𝑑𝑖𝑎𝑛 − ∑𝑠𝑎𝑡𝑢
𝑖=1
𝑘𝑒𝑙𝑎𝑠 𝑠𝑒𝑏𝑒𝑙𝑢𝑚 𝑘𝑒𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑛
𝑓𝑖
𝐵𝑏 + 𝑖 ( )
𝑓𝑘𝑒𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑛
Langkah/prosedur perhitungan:
1. Hitung panjang interval kelas median, yaitu sama dengan
10
2. Tentukan kelas interval dari median, yaitu di kelas interval
ke-4
3. Hitung batas bawah kelas median, sama dengan 40,00 –
0,005 = 39,995.
4. Hitung jumlah frekuensi sampai satu kelas sebelum kelas
3
median, yaitu f
i 1
i = 9 + 20 + 26 = 55. Jumlah frekuensi
| 102
Statistik Dengan Pendekatan Matematik
4
f f
i 1
median
Median = Ba – i
f4
= 49,995 – 10{(90-75)/35}
= 49,995 – 10 (15/35)
= 49,995 – (10 x 0,4285)
= 49,995 – 4,285
= 45,71
jumlah bilangan
Re rata
banyak bilangan
Contoh 1:
3 6 11 8 28
7
4 4
Contoh 2:
Rata-rata dari bilangan 11, 11, 4, 10, 11, 7, dan 8 tepat pada
dua angka di belakang koma (per seratus) adalah 8,86.
Catatan:
Notasi rata-rata menggunakan huruf diberi garis di atasnya,
seperti x dan merupakan rata-rata hitung (aritmatika) dari
semua nilai data.Huruf x menyatakan simbol atau notasi
untuk suatu nilai data (kuantitatif) dari suatu variable dan
| 103
Statistik Dengan Pendekatan Matematik
x1 x2 ... xn
xi
tunggal) dituliskan: x 1
.
n n
Contoh 1:
Tabel.3.9
Distribusi frekuensi data usia siswa pada suatu sekolah
No
Usia Siswa x i Frekuensi f i xi . f i
1 18 9 162
2 19 8 152
3 20 2 40
4 21 1 21
Jumlah 20 375
x1 f1 x 2 f 2 ... x k f k
Rata-rata aritmatika adalah x =
n
k
1 k
x i fi
xi f i = i 1
k
f
n i 1
i
i 1
Dengan demikian:
Rata-rata =
(18 x9) (19 x8) (20 x2) (21x1) 375
18,75 Tahun.
20 20
| 104
Statistik Dengan Pendekatan Matematik
Contoh 2 :
menghitung rata-rata menggunakan nilai tengah
Tabel. 3.11
Distribusi frekuensi data tersusun
| 105
Statistik Dengan Pendekatan Matematik
9
f .Nt i i
7075
Mean = i 1
9
47.16667
f
150
i
i 1
Contoh 3 :
Rata-rata dengan dugaan adalah nilai tengah. Misalkan rata-
rata dugaan Md = 44,5
Tabel 3.12
Distribusi frekuensi data tersusun
Rata-rata =
9
fd i i
400
Md 1
9
44,5 44,5 2.666667
f
150
i
1
= 47.16667
| 106
Statistik Dengan Pendekatan Matematik
3. Variabilitas
a. Ukuran Variabilitas
Ukuran variabilitas merupakan statistik yang
menyarikan penyebaran nilai-nilai data. Ukuran penyebaran
tersebut juga dinamakan dispersi. Masing-masing ukuran
dispersi diuraikan berikut ini.
1) Ukuran penyebaran mutlak (absolute dispersion)
dinyatakan menggunakan satuan yang sama dengan
satuan data asli, misalnya orang, tahun, kilogram, meter,
rupiah, dll.
2) Range:
i. Range 10-90 persentil adalah 80 % data
ii. Range interquartil range (Q3 – Q1)
iii. Range semi-interquartil range (deviasi quartil) : ½
(Q3 – Q1)
Range merupakan selisih antara nilai tertinggi dan
terendah: maksimum dikurangi minimum. Range hanya
tergantung pada nilai-nilai ekstrim dalam himpunan data.
Sebagai contoh harga buku, nilai masimumnya adalah 29.500
dan minimum 2.200. Dengan demikian, Range = 29.500 –
2.200 = 27.300.
b. Kuartil
Apabila data disusun berurutan menurut besar
nilainya (data tersebut dirangking/diurutkan), maka kuartil
merupakan 3 bilangan yang membagi (mengelompokkan)
| 107
Statistik Dengan Pendekatan Matematik
1 11 15 19 20 24 28 34 37 47 50 57
Q1 Q2 Q3
17 26 42
Prosedur Perhitungan
1. Urutkan nilai-nilai data dari terkecil ke terbesar.
2. Kuartil kedua, Q2 merupakan median dari seluruh
himpunan data.
3. Jika n genap, maka:
a) kuartil pertama Q1 adalah median dari n/2
pengamatan terkecil dan,
b) kuartil ketiga Q3 merupakan median dari n/2
pengamatan terbesar.
n 1
4. Apabila n ganjil maka Q1 merupakan median dari
2
n 1
pengamatan terkecil, dan Q3 adalah median dari
2
pengamatan yang terbesar.
| 108
Statistik Dengan Pendekatan Matematik
Contoh 1:
Perhatikan 9 harga barang (dalam ribuan): 6.0, 6.7, 3.8,
7.0, 5.8, 9.975, 10.5, 5.99, 20.0. Tentukan Q1, Q3, Q2,
IQR, dan SIQR dari harga barang tersebut.
Penyelesaian:
a. Data diurutkan: 3,8; 5,8; 5,99; 6,0; 6,7; 7,0; 9,975; 10,5;
20,0
b. Q1 = (5,8 + 5,99)/2 = 11,79/2 = 5,895
c. Q2 = Median = 6,7
d. Q3 = (9,975 + 10,5)/2 = 20,475/2 = 10,2375
e. IQR = Q3 – Q1 = 10,2375 – 5,895 = 4,3425
f. SIQR = ½ IQR = ½ × 4,3425 = 2,17125
Contoh 2:
Perhatikan 8 harga barang berikut: 6.0; 6.7; 3.8; 7.0; 5.8;
9.975; 10.5; 5.99. Tentukan Q1 dan Q3 dari harga barang
tersebut.
Penyelesaian:
a. Data diurutkan: 3,8; 5,8; 5,99; 6,0; 6,7; 7,0; 9,975; 10,5
b. Q1 = (5,8 + 5,99)/2 = 11,79/2 = 5,895
c. Q3 = (7,0 + 9,975)/2 = 16,975/2 = 8,487
| 109
Statistik Dengan Pendekatan Matematik
Contoh 2:
Hitung kuartil bawah (Q1) dan kuartil atas (Q3) dari sebaran
frekuensi berikut.
Tabel 3.14
Sebaran Data Tersusun
Kelas
Kategori fi Keterangan
Interval
1 10 – 19 9
2 20 – 29 20
3 30 – 39 26 Kelas Q1
4 40 – 49 35
5 50 – 59 22
6 60 – 69 17 Kelas Q3
7 70 – 79 11
8 80 - 89 6
9 90 - 99 4
150
9
fi 2
1 fi
4
Q1 Bb i 1
f kelas Q1 .
Bb adalah batas bawah kelas Q1;
i adalah panjang interval kelas;
9
f
1
i adalah banyak seluruh pengamatan (atau n); dan
| 110
Statistik Dengan Pendekatan Matematik
| 111
Statistik Dengan Pendekatan Matematik
Gambar 3.11
Dispersi Persentil 90 atau 10% yang Diambil
Tabel 3.15
Sebaran Data Tersusun
Frekuensi
Kelas Frekuensi kumulatif
(fi)
10,00 – 19,99 9 9
20,00 – 29,99 20 29
30,00 – 39,99 26 55
40,00 – 49,99 35 90
| 112
Statistik Dengan Pendekatan Matematik
Contoh-contoh perhitungan:
Persentil (P)
1. P5 = 9,995 + {10 (7,5)}/9 = 9,995 + 8,33 = 18,325
2. P35 = 29,995 + {10 (52,5 – 29)}/26 = 29,995 + 9,04 =
39,035
Desil (D)
1. D2 = 29.995 + {10 (30 – 29)}/26 = 29,995 + 0,38 = 30,375
2. D9 = 69,995 + {10 (135 – 129)}/11 = 69,995 + 5,45 = 75,445
| 113
Statistik Dengan Pendekatan Matematik
Contoh lain:
Misalkan seorang peneliti memiliki data mengenai biaya
konsultasi psikologi per hari dan dibayar oleh sekolah untuk
sebanyak 400 sampel dan ingin diketahui 10% teratas uang
yang didapat per hari. Pertama data tersebut disusun dalam
bentuk matriks seperti berikut. Berdasarkan data, keinginan
tersebut dapat dijawab dengan cara menemukan persentil
yang bersesuaian.
Tabel. 3.16.
Sebaran Data (Matriks) Biaya Konsultasi Psikologi
Interval Biaya (Ribu Rupiah) f cf
1 250 – 500 32 400
Interval Kritis 200 – 249 27 P-368 atau
Nilai ke-360
terjadi di sini
3 160 – 199 48 341
4 130 – 159 72 293
5 100 – 129 92 221
6 80 – 99 51 129
7 60 – 79 35 78
8 40 – 59 43 43
400
| 114
Statistik Dengan Pendekatan Matematik
Selesaian:
Persentil ke-90?
P = 90/100 × 400 adalah posisi ke-360
𝑃−𝑐𝑓
P90 =𝐿+[ (𝑈 − 𝐿)]
𝑓
360−341
= 199,5 + [( ) (249,5 − 199,5)] = 234,5
27
Simpulan peneliti:
Sepuluh persen teratas membayar biaya konsultasi psikologi
antara 234,5 hingga 500 ribu rupiah per hari. Sembilan puluh
persen membayar 234,5 ribu atau kurang per hari.
Gambar 3.12
Posisi Persentil ke-90 Pada Kurva Normal
| 115
Statistik Dengan Pendekatan Matematik
Gambar 3.13
Posisi Dispersi Pada Kurva Normal
Contoh 1:
Apabila seseorang memperoleh skor 95 pada ujian
matematika dan skor tersebut lebih besar atau sama dengan
skor dari 88% siswa yang mengikuti ujian, maka percentile
rank adalah 88. Artinya ia berada pada percentile ke-88.
Contoh 2:
Skor tes yang lebih besar atau sama dengan 75% dari skor
siswa yang mengikuti tes itu dikatakan berada pada persentil
75. Tidak ada persentil ke-100 karena tidak ada skor yang
lebih rendah dari skor itu sendiri. Bahkan skor sempurna
adalah persentil 99 karena 99 persen dari skor siswa yang
mengikuti ujian adalah lebih rendah daripada skor sempurna
itu.
Rumus lain untuk menghitung rank persentil adalah:
𝑐𝑓𝑙 + 0,5𝑓𝑖
𝑃𝑅 = × 100%
𝑁
1. cfl adalah frekuensi kumulatif dari semua skor yang
lebih rendah daripada skor yang akan dihitung PR nya,
2. fi adalah frekuensi skor yang dikaji, dan
3. N adalah banyak peserta tes dalam suatu sampel.
4. Apabila suatu sebaran adalah normal, percentile rank
dapat diinferensi dari skor standar (standard score).
Data tersusun (dikelompokkan)
Rumus untuk menghitung PR data yang
dikelompokkan (tersusun) pada suatu distribusi frekuensi
sama seperti rumus untuk menghitung dispersi persentil.
| 117
Statistik Dengan Pendekatan Matematik
𝒄𝒇𝒃
Kelas Interval f cfb × 𝟏𝟎𝟎
𝒏
1 250 – 500 32 400 100%
2 200 – 249 27 368 92%
3 160 – 199 48 341 85.25%
4 (interval kritis) 130 – 159 72 293 73.25%
5 100 – 129 92 221 55.25%
6 80 – 99 51 129 32.25%
7 60 – 79 35 78 19.50%
8 40 – 59 43 43 10.75%
400
Gambar 3.14.
Porsi Dispersi Persentil Rank 135 pada Kurva Normal
| 118
Statistik Dengan Pendekatan Matematik
xi
70
xi - x xi x
20
65 20
15
45 15
-5
40
-10 5
30
-20 10
20
Jumlah = 70
x x
i 1
i
│}/5. Atau duliskan sebagai: . Atau, simpangan
5
rata-rata = SR (MD) = 70/5 = 14
Simpangan rata-rata data dikelompokkan.
Perhatikan tabel distribusi frekuensi berikut.
| 119
Statistik Dengan Pendekatan Matematik
Titik
Kelas Tengah
Frekuensi
(fi)
fiti ti - x ti x ti x f i
(ti)
10,00 – 19,99 15 9 135 -32,667 32,667 294,003
20,00 – 29,99 25 20 500 -22,667 22,667 453,34
30,00 – 39,99 35 26 910 -12,667 12,667 329,342
40,00 – 49,99 45 35 1575 -2,667 2,667 93,345
50,00 – 59,99 55 22 1210 7,333 7,333 161,326
60,00 – 69,99 65 17 1105 17,333 17,333 294,661
70,00 – 79,99 75 11 825 27,333 27,333 300,663
80,00 – 89,99 85 6 510 37,333 37,333 223,998
90,00 – 99,99 95 4 380 47,333 47,333 189,332
Jumlah 150 7150 207,333 2340,01
nilai xi
rata-rata x
1 1
√𝑛−1 ∑𝑛𝑖=1 𝑑𝑖 2 = √𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 .
| 121
Statistik Dengan Pendekatan Matematik
x x
n
2
i fi
2 i 1
Varians (s ) = , dengan xi adalah data tengah-
n
tengah dari kelas ke- i. Varians = 56133,33/150 = 374,22.
x x
n 2
i fi
i 1
SD = .Simpangan baku (SD) = 374,22 =
n
19,345
c. Sifat-sifat simpangan baku (standar deviasi)
1. Penting dalam berbagai penggunaan dan atau
pengujian secara statistik.
2. Untuk ukuran data kecil, yaitu untuk n < 100, rumus
SD yang digunakan berbeda dengan rumus yang
umum seperti diuraikan.
∑𝑛
𝑖=1(𝑥𝑖 −𝑥̅ )
2
3. Untuk data tak tersusun:𝑠 =√ atau
𝑛−1
2
n
n
n xi xi
2
∑𝑖=1 𝑥𝑖 𝑛 2 − 1 (∑𝑛 𝑥 )2
𝑠=√ 𝑛 𝑖=1 𝑖
atau =
i 1 i 1
𝑛−1 n(n 1)
| 122
Statistik Dengan Pendekatan Matematik
1 (∑ 𝑓𝑖 𝑥𝑖 )2
√ [∑ 𝑓𝑖 𝑥𝑖 2 − ],𝑛 = ∑𝑘𝑖=1 𝑓𝑖
𝑛−1 𝑛
𝑥𝑖 𝑓𝑖 𝑓𝑖 𝑥𝑖 𝑓𝑖 𝑥𝑖 2
18 9 162 2916
19 8 152 2888
20 2 40 800
21 1 21 441
k=4 ∑ 𝑓𝑖 =20 ∑ 𝑓𝑖 𝑥𝑖 =375 ∑ 𝑓𝑖 𝑥𝑖 2 = 7045
1 (375)2 13,75
Dengan demikian, 𝑠 2 = 19 [7054 − ]= =
20 19
0,7237 dan 𝑠 = √0,7237 = 0,8507
5. Simpangan baku dapat pula dihitung selain
menggunakan rata-rata hitung, misalnya menggunakan
nilai modus, median, atau nilai rata-rata lain; hanya saja
SD yang dihitung menggunakan nilai rata-rata hitung
hasilnya adalah paling kecil.
6. Sifat yang paling banyak digunakan dalam penaksiran
dan pengujian hipotesis.
Contoh:
Apabila dari sekumpulan data tentang tinggi badan
diperoleh bahwa rata-rata hitung sama dengan 157 cm dan
SD = 22 (asumsi berdistribusi normal), maka
| 123
Statistik Dengan Pendekatan Matematik
n s
i 1
i i
2
n
i 1
i
penyebaran mutlak
Penyebaran relatif = = koefisien
rata rata
s
varians (V) =
x
d. Bentuk Penyebaran Frekuensi
1. simetris: pencerminan, kiri dan kanan rata-rata
hitung
2. tidak simetris: menceng, keruncingan, lebih runcing
jika dibandingkan dengan bagian lain (yang lain)
3. berbentuk U
4. berbentuk U terbalik
5. berbentuk J
6. berbentuk J terbalik
7. berbentuk merata
e. Kemencengan (Skewness)
1. perhatikan perbedaan antara letak modus dan letak
rata-rata hitung; dan kadang-kadang juga
memperhatikan ukuran penyebaran lainnya (seperti
| 124
Statistik Dengan Pendekatan Matematik
Rangkuman:
A. Statistika Dan Data
1. Statistika: merupakan metode dan aturan tentang
pengumpulan, penyajian pengolahan, analisis,
interpretasi, dan penarikan kesimpulan dari data-data
(statistik); Statistik adalah data yang telah dihitung
menggunakan berbagai ukuran statistika.
2. Statistika Deskriptif : penyajian atau penyusunan
data dan tidak berkenaan dengan penarikan
kesimpulan atau generalisasi. Penyajian data dalam
bentuk tabel, gambar, diagram, dan grafik;
3. Statistika Induktif (Inferensial) : metode dan
aturan penarikan kesimpulan dari data tersusun dan
diolah. Statistika ini juga menyediakan aturan
peramalan (prediksi) dan penaksiran (estimasi)
4. Data: informasi atau keterangan (dapat diukur,
diamati, dan bernilai)
a. Data kualitatif : secara umum bukan
merupakan bilangan (mungkin hanya angka
ordinal atau kategori); Contoh: warna, jenis
kelamin, status perkawinan, dll
b. Data kuantitatif : merupakan bilangan.
Contoh: umur, tinggi/berat badan, nilai, dll
c. Cara mengumpulkan data:
1) Wawancara
2) Kuesinoner
3) Melalui media IT (non cetak)
| 126
Statistik Dengan Pendekatan Matematik
4) Dokumen
5) Media cetak
6) Buku sumber: buku ajar, jurnal, dll
d. Data dikumpulkan dari :
1) sumber internal dan eksternal
2) sumber primer atau sekunder
10 20 30
9,99 19,99
29,99
f i
1 k
n
i 1
fi 1
n i 1
; ∑ sigma, berarti jumlah.
6. Contoh Gambar/Diagram Distribusi FrekuensiPoligon
(poligon frekuensi)
1 n
x i
x1 x 2 ... x n
x xi i 1
n i 1 n n
2.
Simpangan: x i x ; deviasi
n
3. Jumlah simpangan sama dengan nol ( ( xi x) 0
i 1
| 128
Statistik Dengan Pendekatan Matematik
n
4. (x
i 1
i x) 2 disebut jumlah kuadrat terkecil
n m n2 m2 ... nk mk n m i i
x 1 1 i 1
dengan ni
n1 n2 ... nk k
n i 1
i
d i
xM i 1
dimana M merupakan suatu nilai
n
yang diterka sebagai rata-rata hitung dan di = xi – M
atau xi = M + di.
7. Median: nilai di tengah data yang telah diurutkan,
sehingga setengah dari nilai-nilai itu (atau lebih)
sama dengan atau kurang dari nilai median itu dan
setengah lagi (atau lebih) lebih besar atau sama
dengan nilai median itu.
D. Ukuran Dispersi
1. Kuartil, nilai-nilai dari sekumpulan data yang dibagi
ke dalam empat bagian yang sama banyak. Dengan
demikian maka Q1, Q2, dan Q3. Q2 di tengah-tengah,
biasanya dituliskan pula bahwa Q2 = Me (median).
2. Desil: sekumpulan data yang telah diurutkan dan
dibagi menjadi 10 kelas/kelompk data.
3. Persentil: sekumpulan data yang telah diurutkan dan
dibagi menjadi 100 kelas/kelompk data.
| 129
Statistik Dengan Pendekatan Matematik
Latihan:
1. Jenjang pendidikan tertinggi seseorang adalah tipe
variable apa?
a. kontinu
b. numerik diskrit
c. ordinal
d. nominal
2. Banyak terjadi kecelakan pada kendaraan bermotor di
suatu jalan bebas hambatan dalam satu minggu
merupakan tipe variablel apa?
a. kontinu
b. numerik diskrit
c. nominal
d. ordinal
3. Data nominal seringkali dianalisis dalam bentuk:
a. pencacahan
b. rata-rata
c. ranking
4. Apa tipe variabel masing-masing berikut ini?
a. warna rambut
b. banyak televisi di rumah tinggal
c. respon terhadap item pertanyaan : ya, tidak, tidak tau
d. intensitas gempa bumi
e. posisi final dalam suatu pertandingan olahraga,
pertama, kedua, ke- 30, dst.
5. Suatu histogram dibuat untuk himpunan data kontinu.
Mana dari yang berikut merupakan pernyataan yang
benar?
(a) median membagi luas histogram menjadi dua bagian
yang sama
(b) data adalah numerik kontinu
(c) mean (rata-rata) adalah pada kolom paling tinggi.
1. a dan b
| 130
Statistik Dengan Pendekatan Matematik
2. a dan c
3. b dan c
6. Pada suatu histogram, sifat apa dari masing-masing
persegipanjang mewakili frekuensi pengamatan dalam
rentang yang sesuai?
a. tingginya
b. lebarnya
c. luasnya
7. Konsultan pendidikan mencatat uang yang dibelanjakan
oleh 20 guru di suatu toko grosir. Banyak uang tersebut
disusun secara berurut naik sebagai berikut:
6.61 6.90 8.04 9.45 10.26 11.63 12.95 13.67 14.35 14.55
15.01 15.33 16.55 18.22 18.30 19.54 20.58 20.89 21.13 33.80
a.
Gambarkan diagram (plotting) stem and leaf untuk
data tersebut.
b. Tentukan mean (rata-rata) dan median (nilai tengah)
dari banyak uang yang dibelanjakan tersebut?
8. Jika rata-rata berat 20 paket buku yang dikirim ke
sekolah adalah 60 kilogram, tentukan berat total semua
paket buku itu ?
9. Suatu distribusi simetris mempunyai
a. mean (rata-rata) sama dengan nol
b. varians sama dengan nol
c. skewness (kemencengan) sama dengan nol
10. Dalam suatu distribusi simeris, mana yang sama?
a. Rata-rata dan median
b. Rata-rata dan modus
c. Median dan modus
d. Ketiga-tiganya
11. Median dari suatu distribusi merupakan
a. ukuran dispersinya
b. ukuran lokasinya
| 131
Statistik Dengan Pendekatan Matematik
c. pusat sebaran
12. Lebih mudah memperoleh rata-rata suatu himpunan
besar dari data daripada median karena
a. median mempunyai satu rumus untuk n genap dan
satu untuk n ganjil
b. tidak perlu mengurutkan data untuk mendapatkan
rata-rata
c. mean memberikan bobot yang sama untuk semua
pengamatan
13. Kelebihan utama median atas mean adalah bahwa
a. hasilnya adalah selalu satu dari nilai-nilai data
b. median lebih dekat ke modus dari sebaran data
c. tidak begitu sensitif terhadap kesalahan dalam data
d. lebih sensitif terhadap nilai yang penting dalam data
14. Mana yang secara numerik lebih besar, varians atau
standar deviasi?
a. Varians
b. Standar deviasi
c. Dapat salah satunya
15. Waktu dalam menit digunakan oleh siswa untuk
melengkapi latihan dicatat oleh guru, dan variansnya
dihitung. Satuan dari varians itu adalah
a. Bilangan saja
b. Akar kuadrat menit
c. Menit
d. Menit kuadrat
16. Hitung Median (Me), Q1, dan Q3 dari distribusi frekuensi
berikut.
Kelas Nilai Ujian Frekuensi
1 0,00 – 19,99 3
2 20,00 – 39,99 10
3 40,00 – 59,99 20
4 60,00 – 79,99 12
5 80,00 – 99,99 5
Total 50
| 132
Statistik Dengan Pendekatan Matematik
x x {x
n n
2
2 xi x ( x ) 2 }
2
i i
i 1
i 1
n n =
n n
x i
2
x i
n( x ) 2
i 1
2x i 1
n n n
n n
x i
2
x i
2
i 1
2 xx ( x ) 2 i 1
(x ) 2
= n = n
n
1 n
n
n 2
x 2
( xi ) 2
x
xi
2 i
i 1 i
n i 1
=
i 1
i 1 = n
n n
2
18. Hitung varians = s menggunakan turunan dari rumus
x x x x
n 2 n 2
i i
i 1
i 1 (pendekatan matematis)
n n 1
19. Buktikan bahwa :
2
1 n
n
xi
n
2 2
xi x x i
i 1 i 1 n i 1
SD = =
n n
20. Bilangan berikut merupakan persentase pendapatan 110
keluarga di Kota Pontianak yang dibelanjakan untuk
membeli buku.
18 61 2445 4941 2523 6220
2434 4644 2252 2228 3739
2039 4346 4717 3942 4341
4542 3532 5732 2460 5955
1926 5248 3038 5761 3144
5942 5145 2646 4148 4125
| 133
Statistik Dengan Pendekatan Matematik
2942 5434 3247 2847 5456
3653 5652 2443 4754 3124
3653 5652 2443 4754 3124
4148 3825 4635 4830 4532
4442 6329 4230 6269 2433
| 134
Statistik Dengan Pendekatan Matematik
23. Cari persentil ke-75 (atau Q3) serta rank persentil dari
130 dan 145 dari distribusi berikut. Tentukan pula mean
dan mediannya.
Interval f
151 – 160 3
141 – 150 4
131 – 140 6
121 – 130 9
111 – 120 6
101 - 110 4
91 – 110 5
81 – 90 1
| 135
Statistik Dengan Pendekatan Matematik
BAB IV
INFERENSI DATA NOMINAL
S
tatistika inferensial memerlukan teori probabilitas
untuk menarik kesimpulan tentang suatu populasi
dari data sampel. Misalkan menaksir ciri suatu
populasi seperti rata-rata berat badan dari semua mahasiswi
berusia 30 tahun di Indonesia, atau persentase pemilih yang
menyatakan bahwa pemerintah saat ini sedang melaksanakan
program pengawasan terhadap dana BOS (Bantuan
Operasional Sekolah).
Dalam praktek, tidaklah dapat (sukar) memperoleh
data dari setiap anggota populasi. Sebagai gantinya,
didapatkan data dari suatu sampel dan menggunakannya
untuk menarik kesimpulan tentang populasi. Perhatikan
ilustrasi berikut
SAMPEL POPULASI
Statistika
Inferensial
Gambar 4.1
Diagram Penarikan Kesimpulan Tentang Populasi
| 137
Statistik Dengan Pendekatan Matematik
| 138
Statistik Dengan Pendekatan Matematik
Gambar.4.5
Estimasi dengan Bias dan Variabilitas Rendah
Gambar 4.6
Ilustrasi Karakteristik Populasi dari Data Sampel
| 139
Statistik Dengan Pendekatan Matematik
Keterangan diagram:
1. Jika sampel bukan representasi populasi yang diteliti,
statistik sampel akan bias sehingga peneliti tidak dapat
menggunakannya untuk membuat kesimpulan yang valid
mengenai parameter populasi.
2. Untuk meminimalkan bias, sampel harus dipilih secara
acak (random sampling) dari daftar semua individu
dalam population yang sesuai. Daftar seperti ini
dinamakan bingkai penarikan sampel (sampling frame).
Hal ini penting.
3. Untuk sampel acak sederhana (simple random sample),
individu-individu di pilih dalam suatu cara dimana setiap
individu dalam bingkai sampling punya kesempatan
yang sama untuk dipilih.
4. Asumsikan bahwa distribusi suatu variabel adalah secara
kuat digambarkan dengan suatu distribusi menggunakan
satu atau lebih parameter (tidak/belum diketahui).
Dengan demikian upayakan mengestimasi parameter
populasi (population parameter) menggunakan data
sampel.
5. Untuk mempelajari perbedaan antara sampel dan
populasi, parameter yang diperlukan untuk mengestimasi
dinamakan parameter-parameter populasi.
6. Estimasi dari parameter populasi yang diperoleh dari
suatu sampel dinamakan statistik sampel (atau estimasi
sampel).
Pada masalah estimasi, yang diperlukan adalah
mendapatkan estimasi titik dan interval keduanya. Estimasi
titik merupakan tebakan terbaik dari nilai parameter
sesungguhnya, sedangkan estimasi interval memberikan
suatu ukuran akurasi dari estimasi titik itu dengan
menyediakan rentang yang memuat nilai-nilai yang masuk
akal. Apabila variabel yang dikaji adalah kuantitatif, mean
| 140
Statistik Dengan Pendekatan Matematik
Gambar 4.7
Aproksimasi Histogram Distribusi Sampling
| 142
Statistik Dengan Pendekatan Matematik
Dengan demikian,
∑𝑋 1
𝑣𝑎𝑟(𝑋̅) = 𝑣𝑎𝑟 ( ) = 2 𝑣𝑎𝑟 (∑ 𝑋)
𝑛 𝑛
1
= 2 𝑣𝑎𝑟(𝑋1 + ⋯ + 𝑋𝑛 )
𝑛
1 1 𝜎2
= 2 (𝜎 2 + ⋯ + 𝜎 2 ) = 2 𝑛𝜎 2 =
𝑛 𝑛 𝑛
Gambar 4.9
Batas-Batas Kepercayaan 95% untuk μ
Contoh:
Sampel n = 100 mahasiswi berusia 25-29 tahun.
Mean 𝑋 = 165 cm, dan standar deviasi sampel s = 5 cm.
Misalkan SD populasi diketahui tepat sama dengan 5.
Estimasi adalah nilai 5 tersebut. Metode yang hanya
menetapkan estimasi tersebut didasarkan pada distribusi-t,
sebagbai ganti dari distribusi normal. Perbedaan keduanya
adalah kecil apabila ukuran sampel besar. Pelajari
perhitungannya sebagai berikut.
Gambar 4.10
Ilustrasi Interval Kepercayaan Secara Vertikal
Sampel
| 146
Statistik Dengan Pendekatan Matematik
Contoh:
Panjang pensil yang digunakan siswa SD/MI
Pabrik pensil memproduksi pensil-pensil yang panjangnya 15
cm. Panjang sesungguhnya berbeda sedikit-sedikit. Proses
produksi stabil dan SD populasi diketahui yaitu σ = 0,3 cm.
Sampel sebanyak 50 dengan rata-rata = 14,85 cm. Apakah
panjang rata-rata pensil semuanya bukan 15 cm?
Penyelesaian:
Distribution sampling dari mean sampel adalah:
𝜎2
𝑋̅~𝑁 (𝜇, ). Dalam contoh ini, σ = 0,3, n = 50, dan𝑋 =
𝑛
14,85 dan ingin diketahui apakah µ = 15 benar.
Gambar 4.11
Kurva Normal untuk Nilai μ = 15
| 148
Statistik Dengan Pendekatan Matematik
14,85 −15 15,5 −15
= P(Z ≤ 0,3 atau Z ≥ 0,3 )
√50 √50
= P(Z < - 3,5 atau Z > 3,5) < 0,001 (diperoleh dari
tabel).
Gambar 4.12
Kurva Normal Nilai P (Z < -3,5 atau Z > 3,5)
| 149
Statistik Dengan Pendekatan Matematik
| 151
Statistik Dengan Pendekatan Matematik
| 152
Statistik Dengan Pendekatan Matematik
Tabel 4.1
Jenis-Jenis Kesalahan dalam Pengujian Hipotesis
Penjelasan:
1. Taraf signifikansi
= P (kesalahan tipe I yang memberikan H0 benar)
= probabilitas menolak hipotesis nol ketika benar
Probabilitas ini secara konvensional dinamakan "alpha".
2. Kekuatan
= 1 – P (kesalahan tipe II yang memberikan H0 salah)
= probability menolak hipotesis nol ketika salah
Probabilitas menerima hipotesis nol ketika salah (yakni
probabilitas kondisional dari kesalahan tipe II) secara
konvensional dinamakan β ("beta"), sehingga: kekuatan
= 1-β. Studi-studi ideal sebaiknya dirancang sehingga
kekuatan yakni 1-β sekurang-kurangnya 0,8. Hal ini
mensyaratkan suatu rancangan efisien dan ukuran sampel
cukup besar.
Contoh:
Botol-botol minuman ringan (softdrink) berisi 300ml. Suatu
sampel dengan n = 10 botol diukur dan isinya (dalam ml)
masing-masing adalah: 299, 276, 283, 301, 297, 281, 300,
291, 295, 291.
a. Uji hipotesis nol H0 : µ = 300 terhadap hipotesis
alternatif H1: µ≠300.
b. Cari interval kepercayaan 90% untuk µ.
| 153
Statistik Dengan Pendekatan Matematik
Penjelasan:
Untuk data tersebut, asumsikan distribusi sampel adalah
X~N(µ, σ2) tetapi µ dan σ tidak diketahui. Dari data
diperoleh 𝑥̅ = 291,4, s = 8,72, dan n = 10.Untuk menguji
hipotesis nol, pertama asumsikan bahwa H0benar.
Asumsikan µ = 300, sehingga nilai pengamatan dari statistik-
t adalah:
𝑥̅ − 𝜇 291,4 − 300
𝑡= 𝑠 = 8,72 = −3,12
√𝑛 √10
Nilai Tabel
Gambar 4.13
Ilustrasi pada Kurva Normal Nilai Distribusi t
| 154
Statistik Dengan Pendekatan Matematik
Catatan:
1. Pengujian hipotesis distribusi-t memberikan nilai-p lebih
tinggi daripada distribusi normal, sehingga hipotesis nol
berkemungkinan kecil ditolak (bahkan apabila salah).
| 155
Statistik Dengan Pendekatan Matematik
DEVIASI
Tabel 4.2
Perbandingan Nilai t terhadap Sebaran Normal
Statistik N(0,1) t5 t1
Mean (rata-rata) 0 0 0
Varians 1 5/3 inf.
Skewness (kemencengan) 0 0 0
Kurtosis (keruncingan) 3 9 inf.
Contoh 3:
Misalkan dalam 50 kali pelemparan pertama dari satu
koin muncul 20 angka dan 30 gambar. Dapatkah diduga
bahwa koin itu tidak seimbang?
Misalkan X = banyak angka. Asumsikan X ~
Binomial (50,½). Dalam kasus ini, banyak kali muncul angka
yang diharapkan, dengan berasumsi koin seimbang adalah 50
×½ = 25. Nilai-p merupakan probabilitas mendapatkan nilai
harapan 20 atau nilai lebih ekstrim (≤ 20 angka) dalam arah
lain (yakni ≥30 angka), atau nilai-p = P(X≤20 atau X ≥30)
yang membosankan menghitungnya secara langsung.
Oleh karena itu digunakan pendekatan Normal
terhadap sebaran, karena nbesar, yakni jika X ~ Binomial
(n,p) maka kira-kira X ~ Normal (np,npq). Untuk n = 50 dan
𝑋−25
p = ½, np = 25, npq = 12,5 dan 𝑍 = .
√12,5
Nilai-p = P(X≤20 atau X ≥30) dan dengan
menggunakan koreksi kekontinuan,
20,5−25 29,5−25
= P(Z ≤ atau Z ≥ )
√12,5 √12,5
≈P(Z≤- 1,273 atau Z ≥1,273)
= 2 × (1 - 0.898)
≈0.20
Mengingat bahwa nilai-p tersebut secara statistik tidak
signifikan maka disimpulkan data konsisten dengan hipotesis
P (angka) = ½ yakni bahwa koin yang dimakdud mungkin
seimbang.
| 160
Statistik Dengan Pendekatan Matematik
| 161
Statistik Dengan Pendekatan Matematik
Contoh:
Perhitungan nilai-p memerlukan probabilitas sebaran untuk
𝜒2 seperti pada tabelnya. Tabel dimaksud merupakan sebaran
ki-kuadrat(chi-squared) dengan derajat kebebasan (df)1,
ditulis𝜒 21, lihat Tabel 3, yakni
P(Z < - 1.96 atau Z > 1.96) = 0,05
Ekivalen dengan
P(Z2> 1.962)
= P(Z2> 3.84)
= P (𝜒21> 3.84)
= 0.05 dari Table 3 (baris pertama)
Perhatikan ilustrasi visual berikut.
Gambar 4.16.
Ekivalensi Normal terhadap Sebaran Ki-Kuadrat
| 162
Statistik Dengan Pendekatan Matematik
Kategori : A1 A2 ... Ak
Frekuensi Diamati : o1 o2 ... ok
Frekuensi diharapkan : e1 e2 ... ek
| 163
Statistik Dengan Pendekatan Matematik
Gambar 4.17
Sebaran Ki-Kuadrat Dengan df = 5
Komentar
1. Nilai χ2 kecil menunjukkan bahwa data konsisten dengan
H0. Nilai χ2 besar menunjukkan bahwa data tak konsisten
dengan H0 dan apabila nilai-p sangat kecil maka tolak H0.
2. Distribusi sampel χ2 mendekati sebaran ki-kuadrat
apabila tidak satu pun dari nilai harapan yang sangat
kecil (biasanya disyaratkan ei≥5). Apabila masing-
masing eisangat kecil maka dapat dikombinasikan
karegori bersebelahan hingga frekuensi harapan ≥5.
3. Jika terdapat k kategori dan frekuensi harapan semuanya
ditetapkan sebagai H0 (yakni tidak ada parameter yang
perlu diestimasi dari data) maka χ2 mempunyai derajat
kebebasan (k - 1).
4. Jika frekuensi harapan tidak semuanya ditetapkan
sebagai H0dan sebanyak m parameter harus diestimasi
dari data maka χ2 mempunyai derajat kebebasan (k - m -
1).
Contoh: Konsumsi vitamin C terhadap demam
Apakah vitamin C mengurangi demam? Untuk mengujinya,
guru meminta 100 siswa menjawab pertanyaan: apakah
| 165
Statistik Dengan Pendekatan Matematik
Mengkonsumsi Vitamin C?
Mengalami Demam? Ya Tidak Total
Tidak 35 5 40
Ya 35 25 60
Total 70 30 100
Mengkonsumsi Vitamin C
Mengalami Demam? Ya Tidak Total
Tidak 35(28) 5(12) 40
Ya 35(42) 25(18) 60
Total 70 30 100
| 166
Statistik Dengan Pendekatan Matematik
(35−28)2 (5−12)2
Dari Tabel 5.8 dihitung nilai 𝜒 2 = + +
28 12
(35−42)2 (25−18)2
+ = 9,72.Prosedur yang digunakan pada
42 18
contoh tersebut adalah sebagai berikut:
1. Rumuskan hipotesis nol bahwa mengkonsumsi vitamin C
dan mengalami demam secara statistik merupakan
peristiwa saling bebas (independent events), yakni, H0 :
vitamin C dan demam adalah bebas
2. Esimasikan probabilitas pv dari mengkonsumsi vitamin C
(dan karena itu qv = 1 - pv) dan probabilitas pc dari tidak
mengalami demam (dan karenanya qc = 1 - pc).
3. Gunakan H0 untuk menghitung probabilitas masing-
masing sel dalam tabel, yakni untuk vitamin C dan tidak
demam, probilitas = pv × pc karena saling bebas = 70% ×
40%= 0,28. Hitung frekuensi harapan dengan
mengalikan probabilitas tersebut dengan frekuensi total n
= 100, yakni untuk konsumsi vitamin C dan tidak
demam, e = 100×0,28= 28. Untuk contoh ini pv dan pc
diestimasi dari data (tetapi qv dan qc dihitung dari pv dan
pc) sehingga derajat kebebasan = banyak kategori –
banyak parameter yang diestimasi – 1 = 4 - 2 - 1 = 1.
Jadi nilai-p adalah P( χ21> 9.72).
4. Dari baris pertama dalam Table 3, P( χ 21> 9.72) terletak
antara 0.0025 dan 0.001 sehingga nilai-p kurang dari
0.0025 (p<0.0025). perhatikan ilustrasi visual berikut.
Gambar 4.18
Sebaran Ki-Kuadrat
| 167
Statistik Dengan Pendekatan Matematik
4. Kasus Umum
Secara umum, variabel-variabel dua kategori
berkelompok silang seperti tabel berikut.
Tabel 4.9
Matriks Variabel Dua Kategori Kelompok Silang
Variabel B
Variabel A B1 B2 . . . Bc
A1 o11 o12 . . . o1c o1.
A2 o21 . . .
. .
. .
. .
Ar or1 . . . orc or.
o1 oc n
| 168
Statistik Dengan Pendekatan Matematik
Tabel 4.10
Sebaran Frekuensi Konsumsi Vitamin C dan Demam
| 169
Statistik Dengan Pendekatan Matematik
Gambar 4.19
Sebaran Ki-Kuadrat dari Data Dalam Tabel
| 170
Statistik Dengan Pendekatan Matematik
Latihan:
𝝈
̅−
1. Buktikan (gunakan rumus Z) bahwa : 𝑿 ̅+
<𝝁<𝑿
√𝒏
𝝈
√𝒏
Menerima Pembelajaran
Menggunakan Metode Inkuiri?
Pemahaman Konsep Perkalian
Ya Tidak Total
Meningkat?
Tidak 60 10 70
Ya 45 35 80
Total 105 45 150
| 172
Statistik Dengan Pendekatan Matematik
BAB V
PENYAJIAN DATA KONTINU
A. Korelasi
K
orelasi menunjukkan kekuatan asosiasi
(hubungan) linear antara dua variabel
kontinu, misalkan x and y. misalkan (x1, y1),
(x2, y2), ..., (xn, yn) merupakan titik-titik data. Titik-titk data
tersebut dapat disajikan pada diagram pencar (scatter plot)
yang menunjukkan "kumpulan" titik-titik seperti berikut.
Sketsa Kasar
atau
Gambar 5.2
Titik-Titik Mendekati Suatu Garis Lurus
| 173
Statistik Dengan Pendekatan Matematik
Gambar.5.3
Titik Tersebar Menunjukkan Tidak Terdapat Asosiasi
| 174
Statistik Dengan Pendekatan Matematik
3. Koefisien Korelasi
Bandingkan dua bentuk data yang digambarkan
seperti berikut.
1 1
∑𝑛𝑖=0(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅), 𝑠𝑥 = √𝑛−1 ∑𝑛𝑖=0(𝑥𝑖 − 𝑥̅ )2
𝑛−1
merupakan standar deviasi dari nilai-nilai x, dan 𝑠𝑦 =
1
√𝑛−1 ∑𝑛𝑖=0(𝑦𝑖 − 𝑦̅)2 standar deviasi y.
| 175
Statistik Dengan Pendekatan Matematik
Gambar 5.5
Letak Titik-Titik Data dalam Sistem Koordinat Kartesius
Gambar 5.6
Dominasi Letak Titik Pada Sistem Koordinat Kartesius
| 176
Statistik Dengan Pendekatan Matematik
Tabel 5.1
Penyajian Data untuk Perhitungan Korelasi
216 215,3334
𝑠𝑥 = √ = 6,573; 𝑠𝑦 = √ = 6,563; 𝑠𝑥𝑦 =
5 5
195
= 39,0.
5
Dengan demikian,
39,0
𝑟 = 6,572 ×6,563 = 0,904.
| 177
Statistik Dengan Pendekatan Matematik
Tabel 5.2
Interpretasi Nilai-Nilai Korelasi r
Nilai r Interpretasi
r=0 Dua variabel sama sekali tidak dapat saling bertukar
bersama-sama
0<r<1 Dua variabel cenderung naik atau turun bersama-sama
r = 1,0 Korelasi sempurna
-1 < r < 0 Satu variabel naik dan yang lain turun
r = -1,0 Korelasi negatif atau berkebalikan sempurna
Gambar 5.7
Letak Titik-Titik Berkemiringan Positif
Gambar 5.8
Letak Titik-Titik Berkemiringan Negatif
| 178
Statistik Dengan Pendekatan Matematik
Gambar 5.9
Letak Titik-Titik yang Menunjukkan r = 0
Gambar 5.10
Visual Letak Titik-Titik Bukan Asosiasi Non Linear
Gambar 5.11
Letak Titik-Titik dengan Pencilan dan r << 1
| 179
Statistik Dengan Pendekatan Matematik
| 180
Statistik Dengan Pendekatan Matematik
Contoh 1:
Total pengetahuan siswa dan banyak guru keduanya
bertambah dari waktu ke waktu dan berkorelasi positif tetapi
penambahan salah satunya tidak menyebabkan penambahan
yang lain (keduanya dikaitkan dengan total ukuran populasi)
Contoh 2:
Ukuran sepatu siswa pernah dilaporkan berkorelasi positif
dengan skor tes kemampuan matematika. Laporan ini
diilustrasikan seperti gambar berikut.
Skor Matematika
Ukuran Sepatu
Gambar 5.12
Sebaran Titik Data (ukuran sepatu, skor matematika)
Gambar 5.13
Data Dalam Kelompok Masing-Masing Tidak Berasosiasi
| 181
Statistik Dengan Pendekatan Matematik
| 182
Statistik Dengan Pendekatan Matematik
Gambar 5.14
Letak Titik-Titik (xi,yi) pada Sistem Koordinat
∑ 𝑥𝑖 𝑦𝑖 −𝑛𝑥̅ 𝑦̅
𝑟𝑥𝑦 = .
√(∑ 𝑥𝑖 2 −𝑛𝑥̅ 2 )(∑ 𝑦𝑖 2 −𝑛𝑦̅ 2 )
Nomor
Tinggi (cm) Berat (kg)
Mahasiswa
1 167 60
2 164 65
3 170 64
4 163 47
5 152 46
6 160 57
7 170 57
| 183
Statistik Dengan Pendekatan Matematik
8 160 55
9 157 55
10 170 65
11 150 50
12 156 46
13 168 60
14 159 55
15 160 50
16 172 69
17 175 56
18 169 56
19 169 72
20 156 56
Gambar 5.15
Diagram Pencar (Tinggi,Berat) 20 Subyek
7. Memeriksa korelasi
Untuk memeriksa bahwa korelasi sesuai data,
perhatikan tabel berikut.
| 184
Statistik Dengan Pendekatan Matematik
Pertanyaan Uraian
Apakah subyek Korelasi mengasumsikan bahwa setiap faktor acak hanya
independen? mempengaruhi satu subyek, dan tidaklainnya. Asumsi
dapat diabaikan apabila dipilih separoh subyek dari satu
kelompok dan separoh lagi dari kelompok yang lain.
Perbedaan antara kelompok dapat mempengaruhi
separoh subyek dan tidak untuk separoh lainnya.
Apakah X dan Y Perhitungan adalah tak valid apabila X dan Y terjalin.
diukur secara Kita dapat mengabaikan asumís ini apabila kita
independen? mengkorelasikan satu bagi dari skor dengan keseluruhan
skor, yakni satu bagian skor merupakan satu dari
keseluruhan komponen skor.
Apakahnilai X Jika nilai-nilai X dikontrol (misalnya konsentrasi, dosis
diukur atau waktu) maka yang dapat dihitung adalah regresi
(bukandikontrol)? linear regression bukan korelasi.
Apakahkovariasi Analisis korelasi tidak membantu apabila Y bertambah
linear? sementara X berkurang menuju ke suatu titik, dan
kemudian Y menurun sedangkan X meningkat. Dalam
hal ini akan diperoleh nilai r kecil meskipun kedua
variable berhubungan kuat. Koefisien korelasinya hanya
menunjukkan kovariasi linear.
Apakah X dan Y Untuk menerima nilai P dari korelasi standar (Pearson),
berdistribusi nilai-nilai X dan Y masing-masing haruslah diambil dari
Gauss? populasi yang berdistribusi Gauss. Korelasi
nonparamterik Spearman tidak membuat asumsi ini.
| 185
Statistik Dengan Pendekatan Matematik
r
y y y yˆ
2 2
, atau
y y 2
r
y y x x , atau yang
y y x x
2 2
s y2 s y2. x
r
s y2
9. Uji Signifikansi r
a. Pengambilan berulang-ulang dari suatu sampel besar,
korelasi dari sampel seperti itu cenderung
berdistribusi normal dengan standard error
1 2
sr ;
n 1
| 186
Statistik Dengan Pendekatan Matematik
a) kovarians sample, s XY
xy atau
n 1
X i X Yi Y ;
1
s XY
n 1
1 Xi X Yi Y
b) korelasi sample, r
n 1 s X
atau
sY
s XY
c) r atau
s X sY
d) r
xy ;
x y
2 2
| 187
Statistik Dengan Pendekatan Matematik
Tabel 5.4
Sebaran Data Hasil Ujian dan Disiplin Siswa
Disiplin Disiplin
No Hasil Ujian No Hasil Ujian
Siswa Siswa
1 9.0 36 17 9.3 37
2 8.5 34 18 7.3 29
3 6.3 25 19 7.4 29
4 8.0 32 20 7.8 31
5 9.5 38 21 9.2 37
6 7.5 30 22 8.4 33
7 9.1 30 23 7.8 31
8 8.0 36 24 9.9 40
9 6.0 32 25 9.0 36
10 6.0 25 26 8.6 34
11 8.5 24 27 7.9 32
12 8.1 34 28 9.1 42
13 6.6 32 29 9.7 39
14 9.0 26 30 7.5 30
15 7.0 36 31 6.7 27
16 8.7 25 32 8.2 32
| 188
Statistik Dengan Pendekatan Matematik
No x y xy x2 y2 Yˆ Y x Y Yˆ
2
Xˆ X * y X X̂
2
Berdasarkan data dan hasil perhitungan sebagaimana dalam Tabel 6.5, diperoleh:
86,87504
1. β = 35,434992 = 2,45167375796
86,87504
2. β* = 676,875064 = 0,12834723071
86,87504
3. r= = 0,560950566
√35,434992 ×676,875064
| 189
Statistik Dengan Pendekatan Matematik
B. Regresi
Contoh: Pengaruh Bobot Tugas dari Guru terhadap
Perasaan Siswa
Untuk memeriksa pengaruh bobot pemberian tugas oleh
guru terhadap perasaan siswa dilakukan beberapa kali
percobaan. Satu pengukuran yang dilakukan yakni bobot tugas
yang diberikan guru pada level berbeda dari perasaan relatif
siswa.
Hasilnya adalah sebagai berikut:
Perasaan
Gambar 5.16
Diagram Pencar Titik Data Bobot Tugas terhadap Perasaan
| 190
Statistik Dengan Pendekatan Matematik
y = a + bx
nilai bobot tugas
nilai perasaan kemiringan
konstanta
titik potong dengan sumbu-y
Perasaan
Gambar 5.17
Garis Lurus dari Sebaran Titik Data
= ∑[𝑦𝑖 − 𝑎 − 𝑏𝑥𝑛 ]2
𝑖=1
| 192
Statistik Dengan Pendekatan Matematik
∂S
= 2[y1 − (a + bx1 )](−1) + 2[y2 − (a + bx2 )](−1) + ⋯
∂a
+ 2[yn − (a + bxn )](−1)
𝜕𝑆
= 2[𝑦1 − (𝑎 + 𝑏𝑥1 )](−𝑥1 ) + 2[𝑦1 − (𝑎 + 𝑏𝑥2 )](−𝑥2 ) + ⋯
𝜕𝑏
+ 2[𝑦𝑛 − (𝑎 + 𝑏𝑥𝑛 )](−𝑥𝑛 )
𝜕𝑆
= −2 ∑ 𝑦𝑖 + 2 ∑(𝑎 + 𝑏𝑥𝑖 ) = 0
𝜕𝑎
𝜕𝑆
= −2 ∑ 𝑥𝑖 𝑦𝑖 + 2 ∑ 𝑥𝑖 (𝑎 + 𝑏𝑥𝑖 ) = 0
𝜕𝑏
∑ 𝑦𝑖 − 𝑛𝑎 − 𝑏 ∑ 𝑥𝑖 (1)
∑ 𝑥𝑖 𝑦𝑖 − 𝑎 ∑ 𝑥𝑖 − 𝑏 ∑ 𝑥𝑖 2 = 0 (2)
Selanjutnya:
1
𝑠𝑥𝑦 = ∑𝑛𝑖(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) dan 𝑠𝑥 2 =
𝑛−1
1
∑𝑛𝑖(𝑥𝑖 − 𝑥̅ . )2
𝑛−1
| 193
Statistik Dengan Pendekatan Matematik
1
𝑠𝑥𝑦 = 𝑛−1 [∑𝑛𝑖 𝑥𝑖 𝑦𝑖 − (𝑥̅ 𝑦̅)𝑛]dan
𝑛
1
𝑠𝑥 2 = (∑ 𝑥𝑖 2 − 𝑥̅ 2 . 𝑛)
𝑛−1
𝑖
Tabel 5.6
Perhitungan a dan b Menggunakan Metode Kuadrat Terkecil
x y x2 xy
30 7 900 210
35 10 1225 350
40 11 1600 440
45 12 2025 540
50 15 2500 750
55 16 3025 880
255 71 11275 3170
255
𝑥̅ = = 42,5
6
71
𝑦̅ = = 11,833
6
11275 6 × (42,5)2
𝑠𝑥 2 = − = 87,5
5 5
3170 6 × 42,5 × 11,833
𝑠𝑥𝑦 = − = 30,5
5 5
30,5
𝑏̂ = = 0,348
87,5
𝑎̂ = 11,8333 − 0,3486 × 42,5 = −2,981
| 194
Statistik Dengan Pendekatan Matematik
| 195
Statistik Dengan Pendekatan Matematik
Gambar 5.18
Garis Regresi Peramal Horisontal dan Vertikal
𝑥 = 𝑎∗ + 𝑏 ∗ 𝑦
y = a + bx
(xi,yi)
𝑠𝑥𝑦 𝑠𝑥𝑦
Dari Gambar 5.18 diperoleh 𝑏̂ = 𝑠 2 dan 𝑏∗ = 𝑠 2,
𝑥 𝑦
2
̂∗ = (𝑠𝑥𝑦
sehingga 𝑏
)
= 𝑟 2, yakni kuadrat dari koefisien korelasi
𝑠 2𝑠 2
𝑥 𝑦
| 196
Statistik Dengan Pendekatan Matematik
Gambar. 5.19
Diagram Pencar Kecepatan dengan Panjang Langkah
Tabel 5.7
Data untuk Perhitungan a dan b dalam Persamaan Regresi
Panjang
Kecepatan
No Langkah y2 x2 xy
(x)
(y)
1 15,86 3,05 9,3025 251,5396 48,373
2 16,88 3,12 9,7344 284,9344 52,6656
3 17,50 3,17 10,0489 306,25 55,475
4 18,62 3,25 10,5625 346,7044 60,515
5 19,97 3,36 11,2896 398,8009 67,0992
6 21,06 3,46 11,9716 443,5236 72,8676
Jumlah 109,89 19,41 62,9095 2031,7529 356,9954
| 197
Statistik Dengan Pendekatan Matematik
Tabel 5.8
Nilai y Estimasi serta Residual
Kecepatan Panjang
No (𝒚
̂) Residual
(x) Langkah (y)
1 15,86 3,05 3,0202 0,0298
2 16,88 3,12 3,0916 0,0284
3 17,50 3,17 3,135 0,035
4 18,62 3,25 3,2134 0,0366
5 19,97 3,36 3,3079 0,0521
6 21,06 3,46 3,3842 0,0758
Gambar 5.20
Garis Referensi y = 0,05 dari Program SPSS
Coefficientsa
Unstandardized Standardized
Model/Prediktor Coefficients Coefficients t Sig.
B Std. Error Beta
1 (Constant) 1.834 .049 37.271 .000
Kecepatan .077 .003 .998 28.612 .000
a. Dependent Variable: Panjang_Langkah
| 199
Statistik Dengan Pendekatan Matematik
Tabel 5.10
Hasil Perhitungan Koefisien Korelasi dan Determinasi
Model Summary
Adjusted R Std. Error of
Model R R Square
Square the Estimate
1 .998a .995 .994 .01198
a. Predictors: (Constant), Kecepatan
Titik
Jarak
Titik
Gambar 5.21
Ilustrasi Komponen Pencocokan Garis Regresi
D. Analisis Varians
Analisis varians merupakan teknik pengukuran penting
dari suatu regresi serta untuk mengestimasi seberapa besar
variasi dalam Y yang tak dapat diterangkan agar diabaikan
setelah mempertimbangkan X. Keseluruhan (total) variasi
| 201
Statistik Dengan Pendekatan Matematik
2 2
Total variasi = ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅ ) = ∑𝑛𝑖=1[(𝑦𝑖 − 𝑦̂ 𝑖 ) + (𝑦̂ 𝑖 − 𝑦̅ )]
Tabel 5.11
Analisis Varians Regresi dari Program SPSS
ANOVAb
Mean
Model Sum of Squares df Square F Sig.
1 Regression .118 1 .118 818.660 .000a
Residual .001 4 .000
Total .118 5
a. Predictors: (Constant), Kecepatan
b. Dependent Variable: Panjang_Langkah
| 202
Statistik Dengan Pendekatan Matematik
| 203
Statistik Dengan Pendekatan Matematik
Unstandardized Standardized
Model Coefficients Coefficients t Sig.
B Std. Error Beta
1 (Constant) 4.667 .717 6.508 .003
Tahun -.500 .184 -.805 -2.715 .053
a. Dependent Variable: Belanja_Pendidikan
Tabel 5.15
Analisis Varians Persamaan Regresi Luaran SPSS
ANOVAb
Sum of
Model df Mean Square F Sig.
Squares
1 Regression 4.375 1 4.375 7.374 .053a
Residual 2.373 4 .593
Total 6.748 5
a. Predictors: (Constant), Tahun
b. Dependent Variable: Belanja_Pendidikan
| 205
Statistik Dengan Pendekatan Matematik
| 206
Statistik Dengan Pendekatan Matematik
Tabel 5.12
Sebaran Data Ekspor Kayu Lapis Indoensia (Ribu Kubik)
Tahun Kayu Lapis Tahun Kayu Lapis Tahun Kayu Lapis
1954 6902 1964 9103 1974 7483
1955 7228 1965 8639 1975 6428
1956 6829 1966 8248 1976 6348
1957 6833 1967 8734 1977 6369
1958 6421 1968 8971 1978 6709
1959 7260 1969 8165 1979 7053
1960 7686 1970 8221 1980 6131
1961 7882 1971 8181 1981 5649
1962 7568 1972 8630 1982 6237
1963 7804 1973 9746 1983 6895
1984 6643
Gambar 5.20
Diagram Pencar Ekspor Kayu Lapis dalam Tahun
Gambar 5.21
Diagram Garis Mengenai Ekspor Kayu Lapis dalam Tahun
| 207
Statistik Dengan Pendekatan Matematik
| 208
Statistik Dengan Pendekatan Matematik
15000
5000
Pergerakan
Rerata
0
1954
1957
1960
1963
1966
1969
1972
1975
1978
1981
1984
Gambar 5.22
Grafik Pergerakan Rerata dari Data Mentah
Soal Latihan
1
1. Tunjukkan bahwa: 𝑠𝑥𝑦 = 𝑛−1 ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) =
1
[(∑ 𝑥𝑖 𝑦𝑖 ) − 𝑥̅ 𝑦̅. 𝑛].
𝑛−1
1
2. Tunjukkan bahwa: 𝑠𝑥 = √ (∑ 𝑥𝑖 2 − (𝑥̅ )2 . 𝑛)dan 𝑠𝑦 =
𝑛−1
1
√𝑛−1 (∑ 𝑦𝑖 2 − (𝑦̅)2 . 𝑛)
3. Hitung korelasi antara Tinggi (cm) dan Berat (kg) dari 20
mahasiswa seperti data pada tabel berikut. Perhitungan
dilakukan secara manual menggunakan rumus korelasi
melalui tabel yang sesuai.
𝑠𝑥𝑦
4. Koefisien korelasi adalah 𝑟 = 𝑠 sehingga x dan y dapat
𝑥 𝑠𝑦
| 211
Statistik Dengan Pendekatan Matematik
DAFTAR PUSTAKA
| 212
Statistik Dengan Pendekatan Matematik
| 213