Anda di halaman 1dari 213

Statistik Dengan Pendekatan Matematik

BAB I
DATA & PENGANTAR STATISTIKA

A. Pendahuluan

D
ata merupakan koleksi fakta, seperti nilai-
nilai atau hasil-hasil pengukuran. Data
dapat berupa bilangan, kata-kata,
pengukuran, pengamatan atau bahkan hanya deskripsi
mengenai sesuatu. Data dapat berbentuk kualitatif atau
kuantitatif. Data kualitatif merupakan informasi yang bersifat
deskriptif, yakni ’menggambarkan’ sesuatu. Data kuantitatif
merupakan informasi numerik atau bilangan.
Perhatikan diagram mengenai jenis data berikut.

DATA

Kualitatif Kuantitatif

”Sangat menyenangkan”
Diskrit Kontinu
5 3,265...

Gambar 1.1. Diagram Jenis Data


Data kuantitatif dapat juga merupakan data diskrit
atau kontinu. Data diskrit hanya dapat mengambil nilai-nilai
tertentu (seperti bilangan-bilangan bulat). Data kontinu dapat
mengambil sebarang nilai (dalam suatu rentang atau interval).
Data diskrit dibilang (dicacah), sedangkan data kontinu
diukur. Sebagai contoh, data kualitatif adalah warna rambut:
coklat, hitam, putih, dan lain-lain; berambut panjang; dan
|1
Statistik Dengan Pendekatan Matematik

punya banyak enerji. Contoh data kuantitatif diskrit antara


lain adalah: 4 kaki; 2 saudara kandung; sedangkan kuantitatif
kontinu antara lain adalah berat badan 25,5 kg; dan tinggi
badan 56,5 cm.
Data merupakan bentuk jamak dari datum. Akan
tetapi, data sering digunakan sebagai ”kata benda” tunggal.
Oleh karena itu, umumnya kita mengatakan "data itu ada"
bukan "terdapat banyak data".Data dapat bersifat deskriptif
(seperti "tinggi" atau "cepat") atau numerik (bilangan-
bilangan).
Contoh lain dari data diskrit adalah banyak siswa
dalam suatu kelas (tentu tidak ada setengah siswa). Data
kontinu dapat mengambil sebarang nilai (dalam suatu
rentang). Contoh lain dari data kontinu: (a) berat seseorang
merupakan suatu nilai dalam rentang berat, tidak sekedar
berat tertentu yang tetap, (b) waktu dalam suatu perlombaan,
kita bahkan dapat mengukurnya dan bernilai pecahan dari
detik, (c) berat anjing, dan (d) panjang daun.
Agar kita lebih mendalami mengenai kedua jenis data
tersebut, perhatikan penjelasan tambahan berikut ini.
1. Sebagai data kualitatif:
a. Anjing itu berwarna coklat dan hitam.
b. Anjing itu berambut panjang.
c. Anjing itu memiliki banyak tenaga.

2. Sebagai data kuantitatif:


a. Berjenis diskrit
i. Anjing itu memiliki 4 kaki.
ii. Anjing itu mempunyai 2 anak.

b. Berjenis kontinu:
i. Berat anjing itu 25,5 kg.
ii. Tinggi anjing itu 56,5 cm.

|2
Statistik Dengan Pendekatan Matematik

Cukup membantu kita mengingat ”kuantitatif adalah


berkenaan dengan kuantitas”

B. Level Pengukuran
Level pengurukuran (level of measurement)
menunjukkan hubungan antara nilai-nilai yang dipasangkan
dengan atribut variabel. Variabel mempunyai sejumlah
atribut. Misalkan variabel “Jenis Sekolah” di Indonesia, dan
diasumsikan bahwa ada tiga atribut sekolah, yakni Sekolah
Standar Internasional (SSI), Sekolah Standar Nasional (SSN),
dan Sekolah Rintisan Standar Nasional (SRSN).
Untuk tujuan analisis hasil dari variabel tersebut,
pasangkan nilai-nilai 1, 2, dan 3 dengan atribut variabel.
Level pengukuran menggambarkan hubungan antara tiga
nilai itu. Dalam hal ini, secara sederhana dengan
menggunakan angka-angka tersebut mempersingkat
penulisan atribut yang teksnya lebih panjang.
Pemberian nilai seperti itu tentu tanpa berasumsi
bahwa nilai lebih tinggi bermakna "lebih" mengenai sesuatu
dan nilai lebih kecil berarti "kurang", juga tidak berasumsi
bahwa nilai 2 bermakna bahwa Sekolah Standar Nasional dua
kali Sekolah Standar Internasional. Tanpa berasumsi juga
bahwa Sekolah Standar Internasional menempati posisi
pertama atau memiliki prioritas pertama karena bernilai 1.
Dalam hal ini, hanya digunakan nilai itu sebagai nama lebih
singkat (kategori) untuk atribut (case) dari suatu variabel.
Level pengukuran seperti variabel tersebut adalah
"nominal". Perhatikan diagram berikut ini.

|3
Statistik Dengan Pendekatan Matematik

Variabel Jenis Sekolah

Atribut SSI SSN SRSN

Nilai-nilai
1 2 3

Hubungan

Gambar 1.2.
Diagram Mengenai Variabel dan Jenisnya

Level atau peringkat pengukuran memiliki


kepentingan dalam kerja-kerja statistik. Beberapa
kepentingan tersebut adalah: Pertama, mengetahui level
pengukuran membantu memutuskan cara menafsirkan data
dari suatu variabel. Apabila diketahui bahwa suatu ukuran
adalah nominal, maka diketahuilah nilai numerik hanya kode
dan digunakan sebagai pengganti nama variabel yang
panjang. Kedua, mengetahui level pengukuran membantu
memutuskan analisis statistik yang sesuai dengan
pemasangan nilai-nilai tertentu. Jika suatu ukuran adalah
nominal, maka dapat diketahui bahwa tidak akan dihitung
rata-rata nilai-nilai data itu atau tidak akan pernah menguji
perbedaan rata-rata atau melakukan uji-t (t-test) pada data
tersebut.
Secara khusus terdapat empat level pengukuran,
yakni: (a) nominal, (b) ordinal, (c) interval, dan (d) rasio.
Dalam pengukuran nominal, nilai numerik hanya merupakan
"nama" atribut secara unik. Tanpa urutan kasus yang dipakai.
Sebagai contoh, bilangan-bilangan pada kaos yang dipakai
pemain basket merupakan ukuran level nominal. Seorang
pemain bernomor 30 tidaklah lebih ‘sesuatu’ daripada pemain

|4
Statistik Dengan Pendekatan Matematik

bernomor kaos 15, dan tentulah bukan dua kali apapun


terhadap angka 15.Nomor dalam daftar hadir siswa di kelas
juga merupakan contoh pengukuran nominal.
Dalam pengukuran ordinal, atribut dapat disusun
berdasarkan urutan ranking (peringkat). Namun, jarak antara
atribut tidak mempunyai makna apapun. Sebagai contoh,
pada suatu survei diberikan pengkodean mengenai Capaian
Pendidikan, yakni sebagai berikut: 0 = derajat capaian
kurang; 1 = beberapa derajat tercapai; 2 = semua derajat
tercapai; 3 = beberapa pengamatan adalah mahasiswa; 4 =
sarjana; 5= pasca sarjana. Dalam ukuran ini, nilai lebih tinggi
tidak berarti lebih tinggi capaian pendidikan. Akan tetapi
jarak dari 0 hingga 1 tidak sama seperti 3 ke 4. Interval antara
nilai tidak dapat ditafsirkan adalam suatu ukuran ordinal.
Dalam pengukuran interval jarak antara atribut
memiliki makna. Sebagai contoh, ukuran suhu (dalam
Fahrenheit), jarak dari 30-40 sama dengan jarak dari 70-80.
Interval antara nilai-nilai dapat ditafsirkan. Karena itu, masuk
akal menghitung rata-rata dari suatu variabel interval, dan
menjadi tidak masuk akal melakukannya untuk skala-skala
ordinal. Namun, perhatikan bahwa dalam pengukuran
interval, rasio tidak bermakna, misalnya 80 derajat bukan dua
kali panas padasuhu 40 derajat (walaupun nilai atribut adalah
dua kali lebih besar).
Dalam pengukuran rasio selalu terdapat nol mutlak
(absolute zero) yang bermakna. Berarti bahwa kita dapat
mengkonstruksi suatu pecahan bermakna (atau ratio)
menggunakan suatu variabel rasio. Berat merupakan variabel
rasio. Dalam penelitian sosial terapan sebagian besar variabel
yang "dicacah" adalah rasio. Sebagai contoh, banyak
pelanggan dalam enam bulan terakhir. Disebut variabel rasio
karena mungkin saja ada nol pelanggan dan karena bermakna
bahwa "...kita mempunyai dua kali lebih banyak pelanggan

|5
Statistik Dengan Pendekatan Matematik

dalam enam bulan terakhir sebagaimana kita peroleh dalam


enam bulan sebelumnya". Oleh karena itu menjadi penting
mengenal bahwa terdapat suatu hirarki yang berimplikasi
dalam ide mengenai level pengukuran.
Pada level pengukuran lebih rendah, asumsi-asumsi
cenderung kurang berkebatasan dan analisis data cenderung
kurang sensitif. Pada masing-masing hirarki, level yang
sedang digunakan termasuk semua kualitas pada satu
dibawah level itu dan menambahkan level baru tersebut.
Secara umum, diperlukan sekali level pengukuran lebih
tinggi (misalnya, interval atau rasio) dibandingkan level lebih
rendah (nominal atau ordinal).
Data nominal hanya memberi nama atribut dan paling
lemah. Data ordinal dapat mengurutkan atribut. Data-data
interval memberi makna pada jarak, dan data rasio memiliki
nilai nol mutlak. Dengan demikian, keempat jenis data
tersebut adalah hirarkis, dan yang paling tinggi atau kuat
adalah data rasio, diikuti data interval, ordinal dan nominal.

C. Pengumpulan Data
Data dapat dikumpulkan melalui banyak cara. Cara
paling sederhana adalah melalui observasi (pengamatan
langsung). Contoh, mengetahui mengenai banyak mobil yang
melintasi suatu jalan tertentu dalam rentang waktu 10 menit.
Secara sederhana kita berdiri saja di suatu titik pada jalan
tersebut dan hitung mobil-mobil yang melintas dalam rentang
waktu yang dimaksud. Artinya kita mengumpulkan data
melalui survei. Beberapa jenis atau cara mengumpulkan data
diuraikan berikut ini.
1. Sensus atau Sampel
Sensus dilakukan sewaktu kita mengumpulkan data
setiap anggota kelompok (populasi keseluruhan). Sampel
dilakukan apabila kita akan mengumpulkan data hanya dalam

|6
Statistik Dengan Pendekatan Matematik

anggota yang dipilih dari kelompok tersebut. Contoh,


terdapat 120 siswa di suatu sekolah. Kita dapat bertanya
kepada setiap siswa tersebut berapa usia mereka masing-
masing. Kegiatan pengumpulan data seperti ini dinamakan
sensus. Atau, kita hanya memilih siswa yang berada di
sekolah suatu sore. Kegiatan ini dinamakan pengumpulan
data secara sampel. Sensus akurat, tetapi sulit dilakukan.
Sampel tidak begitu akurat, tetapi cukup baik, dan tentu lebih
mudah.
2. Survei
Hasil dari suatu kegiatan survei sering kita ketahui
dari media cetak atau elektronik. Survei merupakan cara
mendapatkan informasi penting yang dapat membantu orang
mengambil keputusan mengenai suatu topik yang menjadi
perhatian. Survei dapat membantu memutuskan perubahan
yang diperlukan, bagaimana membelanjakan uang, produk
apa yang akan dibeli atau dijual, apa saja masalah yang
muncul, dan banyak pertanyaan lain yang kita temui dalam
suatu waktu. Bagian penting dari survei adalah bahwa ia
dapat digunakan untuk menjawab pertanyaan seputar
sebarang topik. Kita dapat melakukan survei kepada orang-
orang menggunakan kuesioner, jajak pendapat, dan lain-lain.
Atau survei mengenai sesuatu, misalnya pencemaran di
sungai, atau mengenai lalu lintas.
Ada empat (4) langkah melakukan survei agar
berhasil, yakni:
i. Langkah pertama: susun pertanyaan;
ii. Langkah kedua: tanyakan pertanyaan-pertanyaan yang
disusun tersebut;
iii. Langkah ketiga: tally (turus) hasilnya; dan
iv. Langkah keempat: sajikan hasilnya.
Misalnya, survei metode pembelajaran yang
digunakan oleh dosen, dan hasilnya disajikan sebagai berikut.

|7
Statistik Dengan Pendekatan Matematik

Tabel 1.1.
Hasil Pengumpulan Data Metode Pembelajaran Oleh Dosen

Metode Pembelajaran Tally Frekuensi


Ceramah ∕∕∕∕ 4
Diskusi ∕∕∕∕ 5
Kerja Kelompok ∕∕∕∕∕ 6
Penemuan ∕ 1
Tanya Jawab ∕∕∕∕ 4

Untuk membantu mendapatkan hasil survei yang baik,


selanjutnya ajukan pertanyaan. Apabila survei dilakukan pada
kelompok kecil, kita dapat menanyakan setiap mahasiswa
(yakni sensus). Jika survei terhadap kelompok besar, kita
mungkin tidak dapat bertanya kepada semua mahasiswa,
maka ajukan pertanyaan kepada sampel dari populasi
mahasiswa (dinamakan penarikan sampel atau sampling).
Apabila dilakukan penarikan sampel, tentu kita perlu berhati-
hati kepada siapa pertanyaan diajukan.
Suatu sampel dikatakan baik apabila setiap mahasiswa
dipilih secara acak. Jika pertanyaan diajukan kepada
mahasiswa yang terlihat ramah, maka kita hanya mengetahui
apa yang dipikirkan mahasiswa ramah itu. Apabila kita ke
kantin dan mengajukan pertanyaan, ”apakah anda senang
metode diskusi”, maka jawaban yang diberikan mungkin bias
dengan mengatakan ’ya’. Perhatikanlah bahwa orang yang
ditanya mengenai motode pembelajaran yang paling banyak
dipilih menjadi tidak akurat karena hanya jenis mahasiswa
tertentu saja yang akan menjawabnya. Dengan demikian hati-
hati agar survei tidak bias. Lakukanlah pemilihan secara
acak.
Contoh, kita ingin mengetahui metode pembelajaran
paling disukai dalam pembelajaran statistika di perguruan
tinggi tertentu, tetapi tidak ada waktu menanyakannya kepada
|8
Statistik Dengan Pendekatan Matematik

semua mahasiswa. Caranya adalah pilih 50 mahasiswa secara


acak, sebagai berikut.
i. kita tunggu di gerbang pintu ke luar kampus dan pilih
mahasiswa selanjutnya setiap waktu;
ii. atau pilih secara acak dari daftar mahasiswa dan ajukan
pertanyaan kepada mereka;
iii. atau kita pilih setiap mahasiswa kelima.
Hasil survei seperti itu lebih dekat kepada harapan
sebagaimana kita bertanya kepada setiap mahasiswa. Apabila
mahasiswa terpilih tidak mau menjawab, catat saja ”tidak
menjawab”.
Setelah survei sampling tersebut lengkap, kita dapat
menggunakan informasi yang dikumpulkan untuk membuat
prediksi respon mahasiswa lainnya dalam populasi. Semakin
banyak mahasiswa yang ditanya, semakin baik hasil yang
diperoleh. Contoh, survei pengumpulan pendapat terhadap
2.000 mahasiswa dan hasilnya sama seperti (dalam 1%)
pengajuan pertanyaan kepada semua mahasiswa.
Pertanyaan dalam kegiatan survei dapat berjenis open-
ended atau closed-ended. Jenis pertanyaan pertama diberikan
apabila seseorang dapat menjawab secara bebas sesuai yang
diinginkan. Sedangkan jenis kedua yakni pertanyaan tertutup
dengan cara meminta seseorang memilih satu dari beberapa
pilihan.
Pertanyaan juga sebaiknya disusun berurutan
sehingga jawaban seseorang tidak mendahului. Salah satu
pedoman yang baik dalam menyusun pertanyaan adalah: (a)
dari yang kurang sensitif ke yang paling sensitif, (b) dari
umum ke yang lebih khusus, dan (c) dari pertanyaan
mengenai fakta ke pertanyaan berkenaan pendapat. Contoh,
mahasiswa tentu akan menjawab ”ya” jika kita bertanya
apakah anda suka penggunaan metode ceramah dalam
pembelajaran? Dan mereka mungkin menjawab ”tidak”

|9
Statistik Dengan Pendekatan Matematik

apabila ditanyakan apakah metode ceramah merupakan


masalah dalam pembelajaran? Sebaiknya ditanyakan
seberapa sering dosen menggunakan metode ceramah dalam
pembelajaran, sebelum kita bertanya mengenai pendapat
mereka mengenai metode ceramah. Atau kita tanyakan secara
umum mengenai metode pembelajaran oleh dosen sebelum
ditanya mengenai metode ceramah. Dan penting dipahami
bahwa pertanyaan yang diajukan bersifat netral sehingga
memungkinkan seseorang menyampaikan pikiran mereka
mengenai pertanyaan itu. Contoh, seberapa penting metode
ceramah bagi anda? Jawabannya mungkin tidak penting,
cukup penting, sangat penting. Untuk pertanyaan tertutup,
kita sediakan jawaban paling biasa, atau terlebih dahulu
dilakukan survei setengah terbuka dengan cara menanyai
orang-orang tertentu guna melengkapi pilihan pada model
pertanyaan tertutup tersebut.

D. Analisis Data
Data merupakan nilai-nilai yang diukur atau dicatat
pada sampel.Statistik sampel merupakan karakteristik
numerik dari data sampel seperti rata-rata (mean), proporsi
ataupun varians.Karaktersitik numerik tersebut dapat
digunakan sebagai penaksir atau estimator dari parameter
populasi terkait. Contoh, persentase pemilih dalam suatu
pengumpulan pendapat di Indonesia tentang kepercayaan
mereka bahwa pemerintah akan melakukan yang terbaik
untuk meningkatkan mutu pendidikan.
Ada dua tujuan analisis data, yakni:
1. untuk meneliti pola dan
2. untuk menyediakan jawaban yang jelas terhadap
pertanyaan khusus.
Analisis data adalah penting, tetapi peneliti juga perlu
mengembangkan keterampilan:

| 10
Statistik Dengan Pendekatan Matematik

a. mendapatkan data reliable dan valid dan


b. menilai mutu data yang dihasilkan oleh yang lain.
Menghasilkan data memang ’mahal’, tetapi suatu
respon seringkali memerlukan data baru untuk menjawab
pertanyaan atau pernyataan khusus. Sebagai alternatif “data
tersedia” dikumpulkan untuk tujuan lain, tetapi mungkin
dapat digunakan untuk membantu menjawab pertanyaan yang
ada. Rancangan-rancangan statistik untuk menghasilkan data
baru tergantung pada salah satu, yakni: penarikan sampel
acak (random sampling) atau eksperimen yang dikontrol
(controlled experimentation).
Dalam praktek, kita tidak dapat memperoleh data dari
setiap anggota populasi. Sebagai gantinya, kita mendapatkan
data dari suatu sampel dan menggunakannya untuk menarik
kesimpulan tentang populasi. Perhatikan diagram berikut.

Sampel
Sampel Populasi
Statistika
Inferensial

Gambar 1.3.
Diagram Peran Statistika Inferensial Dalam Generalisasi

Populasi adalah kumpulan semua subjek atau objek


atau objek perhatian (tidak selalu orang). Sample adalah
himpunan bagian (subset) dari suatu populasi yang digunakan
untuk menarik kesimpulan tentang karakteristik dari populasi
itu.Sedangkan parameter populasi merupakan karakteristik
numerik dari suatu populasi, yaitu suatu kuantitas tetap dan
biasanya tidak diketahui.

| 11
Statistik Dengan Pendekatan Matematik

Contoh parameter :
1. rata-rata berat badan, µ, dari semua wanita berusia 30
tahun dan
2. persentase pemilih p, yang percaya bahwa pemerintah
akan melakukan yang terbaik guna meningkatkan mutu
pendidikan.
Tujuan pengambilan sampel adalah mempelajari
sebagian dalam rangka memperoleh informasi mengenai
keseluruhan. Sebagai contoh, kepala sekolah akan mengambil
sampel inventaris sekolah untuk memeriksa ketepatan dari
catatan keseluruhannya. Sampel berbeda memberikan nilai
yang berbeda pula. Dengan mengambil banyak sampel
berbeda dan menghitung suatu statistik untuk setiap sampel
(misalnya rata-rata), akan dapat digambar histogram dari
semua rata-rata sampel.
Suatu statistik dari sampel atau dari suatu eksperimen
acak dapat dipandang sebagai variable random dan
histogram merupakan pendekatan terhadap distribusi
probabilitasnya. Istilah distribusi sampel (sampling
distribution) digunakan untuk menggambarkan distribusi
tersebut, yakni bagaimana statistik (dipandang sebagai
variabel acak) bervariasi jika sampel acak secara berulang
diambil dari populasi.
Suatu eksperimen secara acak mengalokasikan
perlakuan pada satuan-satuan atau subyek-subyek percobaan
untuk mengamati respon mereka. Rancangan suatu percobaan
berawal dengan deskripsi dari variabel respon (terikat atau
dependent), faktor-faktor (variabel eksplanasi atau
bebas/independent) dan apa perlakuan khusus yang akan
dilakukan. Eksperimen akan membandingkan perlakuan dari
pada sekedar upaya menilai satu perlakuan secara terisolir.
Misalnya, membandingkan respon dari kelompok perlakuan
dengan kelompok kontrol yang tidak mendapatkan perlakuan.

| 12
Statistik Dengan Pendekatan Matematik

Kontrol dari pengaruh-pengaruh faktor dan variabel lain


(placebo effect, pemilihan subyek dan lain-lain) merupakan
tujuan pertama dari rancangan statistik ekperimen.
Rancangan suatu penelitian (studi) adalah bias apabila secara
sistematis menyokong hasil-hasil tertentu (yang diinginkan).
Jika distribusi sampel diketahui maka keampuhan
suatu statistik sampel sebagai penaksir parameter populasi
yang berkorespondensi dapat ditentukan. Secara khusus,
distribusi sampel menentukan nilai harapan dan varians dari
statistik sampel tertentu. Jika nilai yang diharapkan tentang
suatu statistik sama dengan parameter populasi, maka
penaksir adalah tak bias. Apabila varians dari suatu statistik
adalah “kecil” dan juga tak bias maka statistik yang diamati
mungkin cukup dekat ke parameter populasi. Bias merupakan
jarak antara parameter dan nilai harapan dari statistik sampel.
Statistik-statistik sampel dapat dikelompokan seperti
ditunjukan dalam penjelasan berikut.
1. Estimasi dengan bias kecil dikarenakan rata-rata dekat ke
parameter populasi, tetapi memiliki variabilitas tinggi
karena tersebar luas dan nilai sampel tunggal dapat jauh
dari parameter. Perhatikan ilustrasi berikut.
Parameter populasi (biasanya tidak diketahui)
xx Statistik sampel – dari sampel-sampel berbeda

x x x x x x x x x x x x x x

2. Estimasi dengan bias karena nilai yang diharapkan tidak


sama dengan suatu parameter. Estimasi itu juga
mempunyai variabilitas tinggi dikarenakan tersebar luas.
Perhatikan ilustrasi berikut.

| 13
Statistik Dengan Pendekatan Matematik

Rata-rata dari suatu


statistik sampel

x xxxx x x x x x

bias
3. Dalam kasus seperti ilustrasi di bawah ini, estimasi
dibiaskan karena semuanya secara sistematis lebih tinggi
daripada parameter populasi.

4. Statistik sampel mempunyai variabilitas rendah karena


semuanya berdekatan. Perhatikan ilustrasi berikut.Dalam
kasus ini, estimasi mempunyai bias rendah dan variabilitas
rendah

Inferensi mengenai karakteristik populasi didasarkan


data dari sampel.Rancangan eksperimental dimaksudkan
guna mengurangi bias secara serempak dengan cara
menghasilkan suatu distribusi sampel seperti ditunjukan
(secara umum) pada diagram berikut ini:

statistik sampel = parameter populasi + bias + variasi


peluang

peneliti peneliti
mengetahui ingin mengetahui

Gambar 1.4.
Rumusan Distribusi Sampel Pengurang Bias

| 14
Statistik Dengan Pendekatan Matematik

Keterangan:
1. Jika sampel bukan representasi populasi yang diteliti,
statistik sampel akan bias sehingga peneliti tidak dapat
menggunakannya untuk membuat kesimpulan yang valid
mengenai parameter populasi.
2. Untuk meminimalkan bias, sampel harus dipilih secara
acak (random sampling) dari daftar semua individu dalam
population yang sesuai. Daftar seperti ini dinamakan
bingkai penarikan sampel (sampling frame). Hal ini
penting.
3. Untuk sampel acak sederhana (simple random sample),
individu-individu dipilih dalam suatu cara dimana setiap
individu dalam bingkai sampling punya kesempatan yang
sama untuk dipilih.

E. Probabilitas (Peluang)
Dalam dunia nyata, suatu peristiwa tidak dapat
diprediksi dengan ketepatan 100%. Yang terbaik dapat
dilakukan adalah menyatakan mungkin terjadi menggunakan
konsep probabilitas. Kalau kita melempar satu koin (uang
logam), maka ada dua kemungkinan yang terjadi, yakni
muncul angka (A) atau gambar (G). Kita katakan bahwa
probabilitas muncul A adalah ½, begitu pula untuk G. Kalau
kita melempar satu dadu dengan 6 permukaan, masing-
masing bernoktah 1, 2, 3, 4, 5, dan 6, maka probabilitas atau
peluang muncul satu permukaan adalah 1/6.
Secara umum:
Banyak cara peristiwa itu dapat
Probabilitas suatu peristiwa
= terjadi
terjadi
Total banyak kejadian mungkin

Sebagai contoh: ada 5 kelereng dalam kantong, 3


berwarna merah dan 2 biru. Probabilitas bahwa kelereng
berwarna biru terambil dapat dihitung dengan cara sebagai
| 15
Statistik Dengan Pendekatan Matematik

berikut.Banyak cara kelereng biru terambil adalah 2 karena


ada dua kelereng itu di dalam kantong. Total kejadian adalah
5. Jadi probabilitas (peluang) yang terambil adalah kelereng
biru sama dengan 2/5 = 0,4.
Probabilitas muncul suatu peristiwa memang tidak
dapat dipastikan. Probabilitas, yakni yang dapat ditunjukkan
merupakan peluang teoritis. Sebagai pembanding adalah
melakukan eksperimen sebagai cara yang tepat dalam
memahami probabilitas suatu peristiwa. Berikut diuraikan
kegiatan atau ilustrasi mengenai probabilitas.

1. Eksperimen/Percobaan
Eksperimen merupakan perlakuan atau tindakan
dimana hasilnya tidak pasti.Melambungkan koin, melempar
dadu, mengamati kue yang dipilih orang merupakan contoh
dari eksperimen. Suatu kejadian atau peristiwa merupakan
hasil unik (tunggal) dari suatu eksperimen. Contoh peristiwa
adalah:
a. Mendapatkan muka A sewaktu melempar koin
merupakan peristiwa.
b. Menggelindingkan dadu dan muncul "mata 5"
merupakan suatu kejadian.
c. Menggelindingkan dadu dan muncul "bilangan genap"
(2, 4 atau 6) juga merupakan suatu peristiwa/kejadian.

2. Garis Probabilitas
Probabilitas merupakan peluang bahwa sesuatu akan
terjadi. Probabilitas dapat ditunjukkan pada suatu garis. Kita
dapat mengatakan bahwa probabilitas dari suatu peristiwa
terjadi adalah antara tak mungkin dan pasti. Dengan
perkataan lain kita dapat menggunakan pecahan atau bentuk
desimal untuk menunjukkan probabilitas dari sesuatu yang
terjadi. Ketidakmungkinan sama dengan nol dan yang pasti

| 16
Statistik Dengan Pendekatan Matematik

adalah satu. Pecahan garis probabilitas ditunjukkan seperti


berikut ini.

Gamber 1.5. Garis Probabilitas

Kita dapat menunjukkan pada garis probabilitas


peluang sesuatu akan terjadi, misalnya:
a. matahari akan terbit besok.
b. saya tidak mau belajar matematika di sekolah.
c. jika saya melambungkan satu koin maka akan muncul
angka.
d. apabila kita mempunyai pilihan warna: merah, kuning,
biru atau hijau maka kamu akan memilih merah.

Kejadian tersebut masing-masing memiliki nilai


probabilitas. Perhatikan ilustrasi berikut.

Gambar 1.6. Nilai Peristiwa Pada Garis Probabilitas

Dengan demikian dapat disimpulkan bahwa:


a. Probabilitas suatu peristiwa tidak akan kurang dari 0,
karena 0 adalah tak mungkin (yakin bahwa sesuatu tidak
akan terjadi)
b. Probabilitas dari suatu kejadian tidak akan lebih dari 1,
karena 1 adalah pasti bahwa sesuatu akan terjadi.

| 17
Statistik Dengan Pendekatan Matematik

3. Prinsip dalam Perhitungan


Jika terdapat m cara untuk melakukan satu kegiatan,
dan n cara melakukan kegiatan lain, maka ada sebanyak m ×
n cara untuk melakukan keduanya. Contoh: kita memiliki 3
baju dan 4 celana. Artinya ada sebanyak 3 x 4 kelengkapan
pakaian yang berbeda. Contoh lain: ada 6 rasa es krim dan 3
berbentuk kerucut yang berbeda. Artinya terdapat 6 x 3 = 18
es krim berbeda yang dapat dipesan.
Contoh lain lagi adalah apabila kita memiliki lebih
dari dua pilihan sewaktu akan membeli mobil. Misal, ada dua
model mobil, tersedia 5 warna berbeda (satu berwarna
hitam), dan terdapat 3 jenis mesin. Total pilihan adalah 2 x 5
x 3 = 30.
Akan tetapi, probabilitas tidak hanya terjadi pada satu
jenis peristiwa. Dalam hal ini, kita perlu memahami
pengertian peristiwa yang saling bebas dan peristiwa yang
terikat.
a. Peristiwa Bebas atau Terikat (Independent or
Dependent Events)
Prinsip perhitungan probabilitas sebagaimana
diuraikan dapat digunakan apabila semua pilihan adalah
saling bebas satu sama lain. Jika satu pilihan mempengaruhi
pilihan lain (yakni tergantung pilihan lain), maka perkalian
sederhana pada prinsip tersebut tidak benar.

Contoh: kita membeli mobil baru, tetapi penjual mengatakan


"anda tidak dapat memilih warna hitam untuk model
mini bus", karenanya pilihan berubah. Artinya kita hanya
memiliki 27 pilihan. Karena pilihan kita tidak bebas, tetapi
perhitungannya masih sederhana, yakni (5x3) + (4x3) = 27.

| 18
Statistik Dengan Pendekatan Matematik

b. Eksperimen dengan satu Dadu


Umumnya, dadu mempunyai enam permukaan, dan
biasanya dinamakan muka 1, 2, 3, 4, 5, dan 6. Perhatikan
ilustrasi berikut:

Gambar 1.7.
Ilustrasi Permukaan Dadu

Sebelum kita memulai suatu perhitungan, pikirkanlah


apa yang akan terjadi dari kegiatan dan/atau pertanyaan
berikut.

Pertanyaan:
Jika kita menggelindingkan satu dadu:
1. Berapa skor terkecil yang mungkin?
2. Berapa skor terbesar yang mungkin?
3. Berapa skor yang hampir dapat dipastikan muncul?

Dua pertanyaan pertama mudah dijawab, yakni:


1. Skor paling kecil yang mungkin haruslah 1
2. Skor paling besar yang mungkin pastilah 6
3. Skor yang hampir dapat dipastikan muncul adalah ... ???

Apakah semuanya hanya mungkin? Atau beberapa


lebih sering terjadi? Marilah kita lihat mana yang hampir
dapat dipastikan, jawabannya adalah melakukan eksperimen
(percobaan).
Percobaan: lemparkan satu dadu sebanyak 60 kali,
catat skor dalam tabel dengan cara membuattally, seperti
berikut ini.

| 19
Statistik Dengan Pendekatan Matematik

Tabel 1.2.
Distribusi Frekuensi Kemunculan Mata Dadu

Skor Tally Frekuensi


1
.
.
.
6
Total Frekuensi = 60

Tentu saja kita berharap 10 kali muncul dari masing-


masing bilangan. Harapan tersebut merupakan nilai-nilai
teoritis, yang berbeda dengan hasil percobaan. Bagaimana
hasil teoritis tersebut dibandingkan dengan hasil percobaan?
Grafik teoritis dibandingkan dengan yang dari suatu
percobaan mungkin berkemiripan, tetapi tidak sama persis,
karena percobaan tergantung peluang, dan banyak kali kita
melakukannya secara tepat adalah relatif kecil. Apabila kita
melakukan percobaan dalam banyak kali, hasilnya akan
mendekati nilai teoritis. Percobaan yang dilakukan adalah
untuk menjawab pertanyaan berikut.

Pertanyaan
1. Muka mana paling sering muncul? ____
2. Muka mana paling jarang muncul? ____
3. Apakah hasilnya sama jika kita lakukan lagi? Ya / Tidak

Suatu percobaan tentu memberikan hasil. Apabila


dilakukan lagi mungkin hasilnya berbeda. Dengan demikian
penting mengetahui sewaktu hasilnya berkualitas baik, atau
sekedar acak.

| 20
Statistik Dengan Pendekatan Matematik

Contoh 1: Probabilitas dari 2

Kita mengetahui bahwa ada 6 kemungkinan muncul


muka dadu. Dan hanya ada 1 cara mendapatkan 2. Jadi
probabilitas memperoleh 2 adalah:

1
Probabilitas muncul muka 2 =
6

Dengan demikian untuk masing-masing skor


peluangnya adalah sebagai berikut:

Tabel 1.3.
Mata Dadu dan Probabilitas Munculnya

Skor Probabilitas
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
Total = 1

Contoh 2: Penggelindingan dua dadu.

Misalnya, penggelindingan dua dadu dan


menambahkan skor-skor yang muncul. Jika satu dadu muncul
2 dan dadu lain muncul mata dadu 6, maka total nilai adalah
2 + 6 = 8. Perhatikan ilustrasinya berikut ini.

Gambar 1.8.
Ilustrasi Dua Mata Dadu Dan Jumlahnya
| 21
Statistik Dengan Pendekatan Matematik

Selanjutnya bayangkan apabila kedua dadu berbeda


warna, misalnya satu dadu agak gelap dan yang satu lagi
sedikit lebih terang. Terdapat dua kemungkinan, seperti
ilustrasi berikut:

Gambar 1.9.
Ilustrasi Jumlah Dua Mata Dadu Bernilai 8

Perhatikan bahwa 2 + 6 dan 6 + 2 berbeda karena


perbedaan warna kedua dadu. Dan kita pun dapat
memperoleh 8 tetapi bilangannya lain, seperti 3 + 5 = 8 dan 4
+ 4 = 8. Apabila kita menggelindingkan dua dadu dan
tambahkan kedua nilainya maka nilai paling kecil adalah 2,
paling besar 12, sedangkan nilai yang hampir dapat
dipastikan akan diperoleh melalui percobaan.
Misalkan kita menggelindingkan dua dadu bersama-
sama sebanyak 108 kali dan tambahkan kedua nilai masing-
masing setiap kali keduanya digelindingkan. Hasilnya dapat
disajikan seperti pada tabel berikut.

Tabel 1.4.
Distribusi Frekuensi Jumlah Nilai Dua Mata Dadu

Jumlah Dua Nilai Tally Frekuensi


2
3
.
.
.
12
Total Frekuensi = 108

| 22
Statistik Dengan Pendekatan Matematik

Setelah selesai percobaan dilakukan, sajikan hasilnya


dalam bentuk diagram batang. Amati bentuk digaram batang
tersebut atau buat poligon (kurva) yang menghubungkan
tengah-tengah diagram batang itu.
Bentuk kurva atau susunan diagram batang menarik
dikaji. Mengapa bentuknya selalu seperti itu? Penjelasannya
adalah bahwa: (a) hanya ada satu cara memperoleh skor total
2, yakni: (1 + 1) dan (b) terdapat enam cara memperoleh nilai
total 7 yakni : (1 + 6, 2 + 5, 3 + 4, 4 + 3, 5 + 2 and 6 + 1).
Berikut ditunjukkan tabel hasil yang mungkin, dan nilai
totalnya yang sama dengan 7 ditebalkan.

Tabel 1.5.
Jumlah Skor Dua Mata Dadu Yang Digelindingkan

Skor pada Satu Dadu


1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
Skor
pada 3 4 5 6 7 8 9
Dadu 4 5 6 7 8 9 10
Lain
5 6 7 8 9 10 11
6 7 8 9 10 11 12

Perhatikanlah bahwa hanya ada 1 cara memperoleh 2,


ada 2 cara mendapatkan nilai total 3, dan seterusnya. Apabila
diteruskan diperoleh banyak cara, seperti ditunjukkan pada
tabel berikut:
Tabel 1.6.
Total Skor Dan Banyak Cara Memperolehnya

Total Skor Banyak Cara Memperoleh Skor


2 1
3 2
4 3

| 23
Statistik Dengan Pendekatan Matematik

5 4
6 5
7 6
8 5
9 4
10 3
11 2
12 1
Total = 36

Tabel tersebut menunjukkan kesimetrian, yakni:


 2 dan 12 memiliki banyak cara sama masing-masing = 1
 3 dan 11 memiliki banyak cara sama masing-masing = 2
 4 dan 10 memiliki banyak cara sama masing-masing = 3
 5 dan 9 memiliki banyak cara sama masing-masing = 4
 6 dan 8 memiliki banyak cara sama masing-masing = 5

Mengapa penggelindingan sebanyak 108 kali? Hanya


36 penggelindingan memberikan hasil yang baik, 360
penggelindingan tentu sulit, sehingga untuk 108 kali (yakni 3
kelompok masing-masing 36) tampaknya benar-benar baik.
Perhatikan hasilnya yang disajikan pada tabel berikut.

Tabel 1.7.
Jumlah Dua Skor Mata Dadu 3 Kelompok

Total Skor Banyak Cara Memperoleh Skor


2 3
3 6
4 9
5 12
6 15
7 18
8 15
9 12
10 9
11 6
12 3
Total = 108

| 24
Statistik Dengan Pendekatan Matematik

Hasil tersebut merupakan nilai teoritis, berbeda


dengan hasil dari suatu percobaan. Nilai-nilai teoritis tampak
seperti diagram batang berikut:

Gambar 1. 9.
Diagram Batang Nilai Teoritis Jumlah Dua Mata Dadu

Bagaimana hasil teoritis dibandingkan dengan hasil


dari suatu eksperimen? Diagram batang teoritis dengan yang
dari suatu percobaan berkemiripan, tetapi tidak persis sama,
karena dari eksperimen tergantung pada peluang, dan banyak
kali melakukannya relatif tidak begitu sesuai. Jika kita
melakukan percobaan banyak sekali pengulangannya, kita
akan mendapatkan hasil tidak jauh berbeda dengan hasil
perhitungan teoritis. Dan, dengan perkataan lain, kita sudah
menjawab pertanyaan mengenai eksperimen.Total nilai yang
hampir dapat dipastikan muncul adalah 7 karena memiliki
frekuensi tertinggi. Inilah mungkin oleh orang dikatakan
keberuntungan 7.
Probabilitas kemunculan skor total dari
penggelindingan 2 dadu dapat dihitung dengan menggunakan
penjelasan pada penggelindingan satu dadu. Contoh,
probabilitas nilai total 2 dihitung dengan mengetahui bahwa

| 25
Statistik Dengan Pendekatan Matematik

kemungkinan kejadian adalah 36. Dan hanya ada 1 cara


memperoleh skor total 2. Sehingga probabilitas memperoleh
skor total 2 adalah:

1
Probabilitas skor total 2 =
36

Dengan cara yang sama, probabilitas masing-masing


skor total disajikan pada tabel berikut.

Tabel 1.8.
Total Skor dan Probabilitasnya

Total Skor Probabilitas


2 1/36
3 2/36
4 3/36
5 4/36
6 5/36
7 6/36
8 5/36
9 4/36
10 3/36
11 2/36
12 1/36
Total = 1

Catatan untuk setiap eksperimen:


1. Jumlah probabilitas dari semua kejadian yang mungkin
selalu sama dengan 1.
2. Dadu benar-benar merupakan objek padat dan tanda
pada masing-masing permukaan dapat digunakan untuk
mendapatkan bilangan acak. Tentu sangat berguna dalam
permainan mengenai peluang.
3. Dadu yang dimaksud adalah Fair Dice, dalam
matematika diartikan memiliki peluang menggelinding

| 26
Statistik Dengan Pendekatan Matematik

yang sama pada sebarang permukaan, atau berpeluang


sama untuk muncul atau tidak muncul (tampak dari atas).
4. Sebagian besar orang memandang dadu sebagai kubus
kecil.
Semua benda berbentuk platonik (platonic solids)
dapat membentuk dadu yang berpeluang sama untuk muncul
atau tidak. Benda berbentuk platonik sama semua
permukaannya sehingga berpeluang sama untuk muncul.
Dengan menggunakan benda-benda berbentuk platonik, kita
akan memperoleh dadu dengan 4, 6, 8, 12, atau 20
permukaan.

4. Randomisasi
Penggunaan probabilitas (peluang) untuk
mengalokasikan satuan percobaan ke dalam kelompok-
kelompok dinamakan randomisasi (randomization).
Randomisasi adalah prinsip utama dari rancangan statistik
ekperimen. Randomisasi menghasilkan kelompok eksperimen
yang lebih mirip dalam semua pengakuan sebelum perlakuan
diterapkan dari pada penggunaan metode tak acak (non-
random methods). Pada akhir studi apabila perbedaan dalam
variabel akibat antara dua kelompok adalah sangat besar
dibandingkan peluang atribut, maka perbedaan itu dinamakan
signifikan secara statistik (statistically significant).
Keputusan mengenai seberapa besar suatu perbedaan adalah
signifikan (berarti) tergantung pada statitika inferensial yang
menggunakan hukum-hukum probabilitas.
Prinsip lain adalah bahwa eksperimen dengan lebih
banyak subyek lebih banyak mendeteksi perbedaan-
perbedaan daripada sedikit subyek. Pengulangan eksperimen
pada banyak subyek dinamakan replikasi (replication).
Apabila diketahui, sebelum eksperimen dilakukan, bahwa
variabel lain tidak mempengaruhi variabel hasil/akibat

| 27
Statistik Dengan Pendekatan Matematik

(misalnya, usia atau jenis kelamin siswa), maka randomisasi


dapat dilakukan sebagai subset (himpunan bagian) dari satuan
eksperimen yang didefinisikan menggunakan variabel
tersebut. Rancangan tersebut dinamakan Rancangan Blok
(Block Design).
Sebagai contoh, respon terhadap perlakuan untuk
mengenai tipe kesulitan belajar diharapkan tergantung pada
jenis kelamin siswa. Idealnya, banyak pria atau perempuan
yang sama diperlukan/dipersyaratkan dalam kelompok
kontrol atau yang mendapatkan perlakuan dan hal ini dapat
diperoleh malalui randomisasi 50% dari perempuan untuk
kelompok perlakuan, seperti diilustrasikan berikut ini.
50% Laki-Laki
dalam
Perlakuan
Laki- Pemasangan Bandingan
Laki Acak sisa

Subyek Placebo

Perempua Pemasan Perlakuan


n gan Acak
Bandingan
sisa
Placebo

Gambar 1.10. Diagram Rancangan Block Design

Contoh randomisasi: Siswa di laboratorium


Dalam percobaan di laboratorium, 5 siswa menerima
perlakuan yang dipilihkan guru untuk memasukkan
tangannya masing-masing ke dalam lubang dimana di
sebelahnya adalah ruangan dengan 10 siswa lain dan 5 siswa
itu mencari 10 tangan siswa lain untuk disalami. Metode ini
tampak acak tetapi mungkin anak-anak yang melakukannya
perlahan-lahan, lebih santai atau bahkan ogah-ogahan
| 28
Statistik Dengan Pendekatan Matematik

daripada siswa yang menunggu akan disalami. Inilah yang


memberikan hasil bahwa siswa yang diberi perlakuan lebih
perlahan atau ogah-ogahan daripada siswa dalam kelompok
kontrol.
Randomisasi akan memberikan masing-masing siswa
kesempatan yang sama untuk dipilih dalam kelompok
perlakuan. Langkah-langkah dalam randomisasi biasanya
terdiri atas
 pemasangan lebel pada satuan percobaan,
 menggunakan suatu metode untuk memilih lebel secara
acak, misalnya menggunakan tabel bilangan acak atau
komputer (atau kalkulator) yang menghasilkan bilangan-
bilangan acak.
Sebagian besar analisis statistik melibatkan
perbandingan kelompok-kelompok. Idealnya peneliti
mengambil kumpulan subyek atau obyek yang awalnya sama,
bagilah mereka ke dalam kelompok-kelompok, perlakukan
kelompok secara berbeda dan ukur hasilnya (atau responnya).
Perhatikan ilustrasi berikut.

Gambar 1.11.
Diagram Analisis Statistik Perbandingan Kelompok

Apabila peneliti melakukan randomisasi subyek


terhadap kelompok masing-masing dan karena itu intervensi,
studi tersebut diatas dinamakan eksperimen/percobaan
(experiment). Jika subyek-subyek tidak dirandomisasi,
| 29
Statistik Dengan Pendekatan Matematik

penelitian seperti itu dinamakan penelitian observasional


(observational study). Randomisasi diperoleh menggunakan
mata uang logam (coin) atau tabel bilangan acak.
Contoh penelitian (studi) observasional adalah:

a. Pengumpulan Pendapat (Opinion Poll)

Pendukung Guru Pandangan/


pendapat pada
debat tingkat
Kumpulan Pendukung Siswa nasional
Subjek mengenai
program
sekolah
Pendukung Lainnya bertaraf
internasional

Gamber 1.12. Diagram Contoh Pengumpulan Pendapat

Dua "pengukuran" yang dilakukan pada masing-


masing subyek, yakni:
1) Dukungan stakeholder
2) Pandangan/pendapat pada debat tingkat nasional
Dan diukur pada waktu yang sama merupakan contoh
cross-sectional study.

b. Proses pembelajaran dan keberhasilan dalam


kehidupan
Eksperimen dilakukan selama 20 tahun atau lebih
untuk melihat siapa yang berhasil dalam kehidupan. Juga
mengambil sampel dari populasi dan membaginya ke dalam
kelompok berhasil dan belum berhasil serta yang menerima
proses pembelajaran secara sesuai dan tidak begitu
sesuai(yakni cross-sectional study) akan menghasilkan dalam
satu sampel dengan sedikit kasus keberhasilan dalam
kehidupan(yakni, pada setiap waktu tidak terdapat banyak
| 30
Statistik Dengan Pendekatan Matematik

orang dalam populasi yang hidup dan diketahui belum


berhasil karena harapan berhasil orang yang ditemui
tergolong rendah).
Karena itu, rancangan studi berbeda digunakan dalam
suatu kelompok orang yang berkeberhasilan hidup (yakni dari
beberapa sentra dan tempat kerja) dan kelompok belum
berhasil (yakni tetangga mereka) dipilih oleh peneliti dan
ditanyai mengenai pengalaman menerima proses
pembelajaran masa lalu di sekolah atau kampus. Studi
semacam ini dinamakan case-control study. Perhatikan
ilustrasi berikut.

Kasus menerima proses


pembelajaran yang sesuai Pertanyaan
mengenai
proses
Arah studi pembelajaran
Kumpulan
Subyek

Arah sebab

Gambar 1.13. DiagramCase-Control Study

c. Confounding Effect
Masalah potensial dalam studi observasional adalah
bahwa mungkin terdapat faktor yang berbeda antara
kelompok pembanding dan akan mengakibatkan hasil-hasil
tertentu. Apabila faktor tersebut mempengaruhi hasil
dinamakan pengaruh yang tidak diharapkan (confounding
effect). Peneliti perlu melihat faktor seperti itu sewaktu
menganalisis data, yakinilah bahwa data menyajikan hasil-
hasil yang sesuai.

| 31
Statistik Dengan Pendekatan Matematik

Contoh - Gender dan diskriminasidi suatu universitas.


Apakah ada diskriminasi gender untuk masuk di suatu
perguruan tinggi. Perhatikan tabel berikut.

Tabel 1.9
Distribusi Frekuensi Pelamar Pada Suatu Universitas

Siswa Yang
% Yang Diterima
Mendaftar
Pria 8.442 44%
Perempuan 4.321 35%

Penerimaan diputuskan berdasarkan "NEM" (ekivalen


dengan standar fakultas di suatu universitas yang
berakreditasi Unggul). Perhatikan tabel berikut.

Tabel 1.10
Distribusi Frekuensi Pelamar Menurut NEM Dan Gender

Pria Perempuan
NEM Pendaftar % Diterima Pendaftar % Diterima
A 825 62 108 82
B 560 63 25 68
C 325 37 593 35
D 417 33 375 35
E 191 28 393 24
F 373 6 341 7
Total 2691 45 1835 30

Tabel 1.9 tidak meliputi semua "NEM" sehingga tidak


sama banyak seperti pada Tabel 1.10. Penjelasannya adalah
sebagai berikut.
a. Untuk masing-masing "NEM" perempuan lebih baik,
atau sama seperti pria, tetapi tidak semuanya.
b. Untuk kelompok NEM dimana yang diterima banyak
(yakni A dan B) sebagian besar pendaftar adalah pria,
sehingga banyak pria yang diterima.
| 32
Statistik Dengan Pendekatan Matematik

c. Untuk kelompok NEM dimana yang diterima lebih


sedikit (yakni C dan E) pendaftar perempuan lebih
banyak, sehingga lebih sedikit perempuan yang diterima.
d. Dalam contoh ini, "NEM" merupakan faktor yang tidak
diharapkan karena berbeda antara kelompok pembanding
(pria dan perempuan) dan mempengaruhi hasil (yang
diterima)
e. Cara terbaik untuk menyajikan data seperti itu adalah
menunjukkan secara jelas pengaruh dari faktor yang
tidak diharapkan itu (yakni Table 1.10).
f. Hitungan kasar atau % (yakni Tabel 1 atau baris bawah
Tabel 2) tidak perlu digunakan karena ia memberikan
pengaruh yang salah.
g. Bagaimana peneliti mengetahui apakah terdapat faktor
yang tidak diharapkan (menyimpang)?
h. Perhatikan faktor tak diharapkan pada waktu merancang
suatu studi/penelitian dan sewaktu mengumpulkan data
untuk mengukur variabel tersebut.
i. Membolehkan faktor tak diharapkan tersebut dalam
perhitungan apabila membandingkan kelompok-
kelompok.
j. Jika faktor tak diharapkan ada dan diketahui, maka ia
dapat dikontrol untuk salah satu: dalam rancangan
eksperimen dengan pemblokan (blocking) atau dalam
analisis (analisis tidak selalu mungkin).

d. Rancangan Kuesioner (Questionnaire Design)


Seringkali pertanyaan penelitian tidak dapat dijawab
menggunakan data yang dikumpulkan secara rutin (misalnya,
data sensus, survei Biro Pusat Statistik). Dalam situasi seperti
ini, data yang diperlukan mungkin harus didapatkan melalui
kuesioner. Beberapa petunjuk kunci rancangan kuesioner
untuk dicatat adalah:

| 33
Statistik Dengan Pendekatan Matematik

1) Terdapat beberapa jenis informasi yang dapat


dikumpulkan menggunakan kuesioner. Sebagai contoh,
pertanyaan untuk mengukur sikap atau perilaku
seseorang yang dikaitkan dengan topik tertentu seperti
kebiasaan menggunakan evaluasi bentuk pilihan ganda,
akan lebih sensitif (peka) daripada pertanyaan mengenai
suatu atribut, seperti gender atau kebangsaan seseorang.
2) Telaah mengenai tujuan kuesioner, informasi yang
peneliti perlukan dan bagaimana ia berkontribusi
terhadap pertanyaan peneliti.
3) Pertimbangkan pro dan kontra menggunakan kuesioner
untuk penelitian dan yakinilah bahwa ia merupakan
metode paling cocok.
4) Putuskan jenis informasi apa yang akan dicari melalui
kuesioner dan apakah terbuka (dimana responden dapat
membuat jawaban mereka sendiri) atau pertanyaan
tertutup (responden memiliki pilihan dari sebanyak
terbatas jawaban), atau mungkin kombinasi dari dua,
adalah paling sesuai.
5) Daftarkan cakupan pertanyaan yang lebih luas dan
kemudian tuliskan pertanyaan khusus, pertahankan
ingatan populasi responden dan yakinilah bahwa
pertanyaan cukup sederhana sehingga mudah dipahami.
6) Pertanyaan harus mengikuti urutan logis. Kuesioner
harus tampak, atau mudah dibaca dan jelas.
7) Panduan pengujian adalah penting, secara informal
diantara kawan-kawan dan secara formal diantara
responden yang menjadi sampel keduanya.
8) Mendefinisikan sampel populasi dan mempertimbangkan
bagaimana kuesioner akan dilengkapi dan dikembalikan
untuk pengolahan.
9) Tetapkan pengkodean kategori untuk masing-masing
pertanyaan sehingga entri data lebih mudah dibuat.

| 34
Statistik Dengan Pendekatan Matematik

10) Keputusan mengenai analisis yang dilakukan harus


dibuat sewaktu kuesioner dikonstruksi.

e. Prinsip-Prinsip Rancangan Penelitian


Prinsip rancangan penelitian adalah mengikuti atau
sesuai Metode Ilmiah. Metode ilmiah secara umum diawali
pengenalan atas masalah serta ada keinginan untuk
menyelesaikannya. Setelah masalah dikenali, biasanya
seorang peneliti merumuskan masalah tersebut, tentu akan
tampak lebih fokus dibandingkan dengan masalah yang telah
dikenali. Selanjutnya dilakukan pengumpulan data, melalui
pengamatan serta mendapatkan informasi dari berbagai
sumber.
Kemudian peneliti merumuskan hipotesis, melakukan
eksperimen, menarik simpulan atau menguji hipotesis dari
hasil eksperimen. Biasanya peneliti akan sampai kepada
merumuskan teori meskipun masih bersifat hipotetik. Secara
sederhana langkah metode ilmiah digambarkan seperti
diagram berikut ini.

Hipotesis Rancangan Eksperimen

Simpulan Pengumpulan & Analisis Data

Gambar 1.14. Diagram Langkah Metode Ilmiah

f. Prinsip Eksperimen Ilmiah


Rancangan eskperimen merupakan satu kontribusi
utama dari statistika untuk menyelesaikan masalah-masalah.
Contoh: Pemberian Vaksin Polio (Salk). Subyek penelitian
adalah siswa SD kelas 1, 2, dan 3 sebanyak kurang lebih 2

| 35
Statistik Dengan Pendekatan Matematik

juta yang tinggal di daerah beresiko. Bagan eksperimen


digambarkan sebagai berikut.

2 Juta Siswa

1 Juta Tidak Diberi Vaksin 1 Juta Ditawarkan Vaksin


(Kelompok Kontrol)

½ Juta Menolak ½ Juta Divaksinasi


(Kelompok Perlakuan)

Gambar 1.15.
Diagram Konstribusi Statistik Dalam Eksperimen

Pertanyaan atau pemikiran mengenai penelitian


eksperimentaldari diagram di atas yang diajukan peneliti
secara umum adalah sebagai berikut.
1) Mengapa tidak memvaksinasi setiap siswa? Pertanyaan ini
terkait kajian mengenai efektif tidaknya vaksin. Tentu saja
peneliti tidak dapat mengatakan vaksin adalah efektif
karena tidak ada dasar untuk pembanding (tingkat
pertumbuhan polio bervariasi dari tahun ke tahun sehingga
perbandingan dengan masa lalu tak berguna).
2) Mengapa tidak menggunakan kelompok menolak
pemberian vaksin sebagai kontrol? Hal ini penting
mengingat bahwa orang tua berpenghasilan besar
sepertinya menolak, tetapi resiko polio yang dipikirkan
lebih tinggi terjadi dalam kelompok berpenghasilan besar
sehingga studi tersebut akan bias terhadap dukungan
vaksinasi.
3) Untuk menghindari bias peneliti memerlukan kelompok
perlakuan dan kontrol yang berkemungkinan sama
(kecuali untuk perlakuan).

| 36
Statistik Dengan Pendekatan Matematik

4) Apabila kelompok-kelompok berbeda dalam beberapa


faktor yang dapat mempengaruhi hasil (atau respon) maka
pengaruh perlakuan mungkin tidak diharapkan karena
faktor itu.
5) Untuk menjamin bahwa kelompok perlakuan dan kontrol
dapat dibandingkan, peserta didik ditempatkan ke dalam
kelompok-kelompok secara randomisasi (ekivalen dengan
melempar satu koin), sehingga masing-masing siswa
memiliki peluang yang sama dari yang ditempatkan ke
kelompok lain.
6) Untuk meningkatkan keterbandingan kelompok kontrol
juga diberikan injeksi placebo. Placebo adalah bahan
netral yang menyerupai perlakuan sesungguhnya. Dalam
kasus ini placebo adalah suntikan (injeksi) solusi garam.
7) Orang tua dan anak-anak tidak diberitahukan mereka
berada di kelompok mana sehingga tidak tahu jika anak-
anak diinjeksi vaksin atau placebo (yakni dirahasiakan).
Hasilnya terdapat juga penolakan dalam kelompok
kontrol.
8) Dokter yang sedang mendiagnosa polio tidak
diberitahukan apakah siswa diberikan vaksin atau placebo,
sehingga kepada mereka juga dirahasiakan. Karena itu
situasi ini memiliki kerahasiaan ganda.
9) Kelompok-kelompok berbeda ukuran tetapi hasilnya dapat
dibandingkan menggunakan perhitungan rasio kasus polio
setiap 100.000 anak. Yakni, jika 95 kasus ditemukan dalam
95
250.000 anak, rasio = 250.000 × 100.000 = 38 per 100.000
`Perhatikan diagram eksperimen pemberian vaksin
berikut ini.

| 37
Statistik Dengan Pendekatan Matematik

750.000 siswa

Randomisasi

Kontrol Perlakuan

Placebo Penolaka Penolakan Pemberian vaksin


n

200.000siswa
200.000 siswa 350.000siswa
Rasio polio
Rasio polio Rasio polio
28 per 100.000
71 per 100.000 46 per 100.000

Gambar 1.16. Diagram Eksperimen Pemberian Vaksin


Simpulan: pemberian vaksin adalah efektif
Dengan demikian, secara umum suatu rancangan
penelitian digambarkan seperti diagram berikut ini.Studi
deskriptif atau observasional melaporkan bagaimana sesuatu
digambarkan apa adanya. Eksperimen membantu menjawab
"Mengapa?"
Apakah ada kelompok kontrol?

Tidak : Ya
Studi deskriptif atau Survei

Apakah penempatan ke dalam kelompok-kelompok


melalui proses secara acak?

Tidak : Ya:
Studi analitik atau Observasional eksperimen

Gambar 1.17. Diagram Rancangan Penelitian

| 38
Statistik Dengan Pendekatan Matematik

F. Pengantar kepada Statistika Inferensial


Suatu rancangan yang menyertakan randomisasi
menghasilkan data dan analisis hasil mengikuti hukum
probabilitas. Data yang diperoleh dari suatu rancangan studi
yang sesuai digunakan untuk menggambarkan simpulan
mengenai populasi lebih luas, yakni suatu proses yang
dinamakan statistik inferensial. Alasan mengenai inferensial
tergantung pada hukum-hukum probabilitas. Untuk alasan
ini, variabilitas (atau apa yang akan terjadi apabila percobaan
diulang berkali-kali) dan teori probabilitas (studi matematika
mengenai keacakan) didiskusikan pada bagian lain dalam
buku ini.
Untuk memahami atau membahas statistik inferensial,
diuraikan beberapa bagian yang mengantarnya, yakni sebagai
berikut.

1. Eksplorasi Data dalam Tabel


Pada bagian ini kita akan memandang cara penyajian
data dua atau lebih variabel dalam tabel. Contoh, tabel
berikut ini memuat sejumlah pelamar untuk masuk ke suatu
universitas menurut gender dan program pilihan utama.

Tabel 1.11
Data Pelamar Masuk Universitas

Banyak Pelamar
Program Pilihan Utama Laki-Laki Perempuan Total
A 825 108 933
B 560 25 585
C 325 593 918
D 417 375 792
E 191 393 584
F 373 341 714
TOTAL 2691 1835 4526

| 39
Statistik Dengan Pendekatan Matematik

Bagaimana kita menemukan dan menyajikan ”pesan”


utama dalam data tersebut? Untuk membandingkan pilihan
utama (variabel hasil)) antara laki-laki dan perempuan
(variabel prediktor) kita hitung persentase dari total pelamar
berdasarkan pilihan utama untuk masing-masing gender
(yakni persentase kolom). Untuk menghitungnya, kalikan
masing-masing bilangan pada kolom "laki-laki" dengan
100/2691 dan kalikan setiap kolom "perempuan" dengan
100/1835. Perhatikan tabel berikut.
Tabel 1.12
Persentase Perbandingan Program Pilihan

Program Pilihan Utama Laki-Laki(%) Perempuan (%)


A 31 6
B 21 1
C 12 32
D 15 20
E 7 21
F 14 19
TOTAL 100 99*
*Pembulatan ke 100%.
Simpulan, laki-laki lebih menyukai program A atau B,
sedangkan perempuan lebih menyukai program C, D, E atau
F. simpulan tersebut juga dapat dibaca melalui penyajian
berbentuk Dot Chart (diagram noktah). Diagram ini
menunjukkan persentase kolom pada diagram batang atau dot
chart. Perhatikan dua diagram berikut ini.

Gambar 1.18. Dot Chart Persentase Pilihan Program


Oleh Pelamar
| 40
Statistik Dengan Pendekatan Matematik

Untuk membandingkan sebaran gender (luaran) untuk


pilihan utama (prediktor), hitung % laki-laki dan perempuan
untuk masing-masing pilihan utama (yakni persentase baris).
Perhatikan tabel berikut.
Tabel 1.13
Persentase Perbandingan Gender

Program Pilihan Laki-Laki (%) Perempuan (%) Total


Utama (%)
A 88 12 100
B 96 4 100
C 35 65 100
D 53 47 100
E 33 67 100
F 52 48 100

Simpulan, Pilihan Utama A dan B sebagian besar


adalah laki-laki, C dan E sebagian besar adalah perempuan,
serta pilihan utama D dan F agak seimbang antara laki-laki
dan perempuan.
Contoh dua adalah dari suatu survei di restoran.
Survei dilakukan tahun 1990. Restoran ini dikelompokkan
berdasarkan jenis kepemilikan dan ukurannya. Variabel
kepemilikan terdiri atas 3 nilai:
1. Perusahaan perseorangan (sole proprietorship)
2. Patungan (partnership), dan
3. Korporasi (corporation).

Variabel ukuran juga mempunyai 3 nilai:


1. kurang dari 5 pekerja
2. antara 5 hingga 20 pekerja
3. lebih dari 20 pekerja

| 41
Statistik Dengan Pendekatan Matematik

Tabel 1.14
Sebarasan Data 20 Restoran

Kepemilikan Ukuran Kepemilikan Ukuran


3 3 1 2
1 2 3 2
1 1 3 2
3 1 3 3
1 1 1 2
3 1 3 3
1 2 3 1
1 1 3 2
2 1 3 1
2 3 2 1

Sebagai contoh, restoran pertama dalam himpunan


data tersebut dimiliki oleh suatu korporasi (kode 3) dan
mempekerjakan lebih dari 20 orang (kode 3). Data dari tabel
tersebut selanjutnya disajikan ke dalam tiga tabel turunannya
sebagai berikut.
Tabel 1.15
Sebaran Nominal Pada Masing-Masing Sel

Ukuran
Kepemilikan Total
1 2 3
1 3 4 0 7
2 2 0 1 3
3 4 3 3 10
Total 9 7 4 20

Tabel 1.16
Persentase Kolom Pada Masing-Masing Sel

Ukuran
Kepemilikan Total
1 2 3
1 33,33 57,14 0 35
2 22,22 0 25 15
3 44,44 42,86 75 50
Total 100 100 100 100

| 42
Statistik Dengan Pendekatan Matematik

Tabel 1.17
Persentase Baris Pada Masing-Masing Sel

Ukuran
Kepemilikan Total
1 2 3
1 42,86 57,14 0 100
2 66,67 0 33,33 100
3 40,00 30,00 30,00 100
Total 45 35 20 100

1. Kategori mana dari kepemilikan mempunyai frekuensi


tertinggi?
2. Berapa persentase dari seluruh kepemilikan dalam
kategori tersebut?
3. Kategori mana dari ukuran mempunyai frekuensi
tertinggi?

2. Tabel Kontingensi (Contingency Tables)


Contoh: Angka kematian di suatu negara tahun 1995.
Tabel berikut menunjukkan angka kematian tahun 1995 pada
penduduk berusia 15-24 tahun:

Tabel 1.18
Distribusi Frekuensi Penyebab Kematian Menurut Gender

Penyebab Kematian Laki-Laki Perempuan Total


Kecelakaan kendaraan bermotor 448 146 594
Bunuh diri (Suicide) 350 84 434
Kecelakaan lainnya 257 74 331
Kanker menular (Malignant
86 50 136
cancer)
Penyakit lainnya 267 153 420
Total 1.408 507 1.915

| 43
Statistik Dengan Pendekatan Matematik

Setiap orang yang meninggal dikategorikan


berdasarkan gender (laki-laki atau perempuan) dan
berdasarkan penyebab kematian. Suatu tabel yang
menyajikan data yang dikelompokkan secara bersilang
dinamakan tabel kontingensi.
Apakah laki-laki dan perempuan dalam kelompok
usia tersebut meninggal dunia dari kasus-kasus yang sama?
Untuk membandingkan penyebab kematian kita memerlukan
frekuensi relatif atau persentase karena total banyaknya
kematian tidak sama untuk laki-laki dan perempuan.
Perhatikan penyajian data pada tabel berikut.

Tabel 1.19
Distribusi Frekuensi Marginal Kematian Menurut Gender

Statistik Laki-Laki Perempuan Total


Frekuensi 1408 507 1915
Frekuensi Relatif 0,74 0,26 1,00
(1408/1915 mendekati 0,74)
Simpulan, dalam kelompok usia ini terdapat sekitar 3
kali atau lebih laki-laki meninggal dunia daripada
perempuan.

Tabel 1.20
Distribusi Frekuensi Marginal Penyebab Kematian

Frekuensi
Penyebab Frekuensi
Relatif
Kecelakaan Kendaraan Bermotor 594 0,31
Bunuh Diri 434 0,23
Kecelakaan Lainnya 331 0,17
Kanker Menular 136 0,07
Penyakit Lainnya 420 0,22
Total 1915 1,00

| 44
Statistik Dengan Pendekatan Matematik

Tabel tersebut diperoleh dengan cara menghilangkan


faktor ”gender” dari tabel asli. Simpulan –penyebab utama
kematian dalam kelompok usia ini adalah kecelakaan
kendaraan bermotor, yakni 31% penyebab dari seluruh
kematian, dan bunuh diri sebesar 23%.
Secara keseluruhan (bersyarat) disajikan seperti tabel
berikut.
Tabel 1.21
Distribusi Frekuensi Bersyarat

Laki-Laki Perempuan
Penyebab
Frekuensi % Frekuensi %
Kecelakaan
448 32 146 29
kendaraan bermotor
Bunuh diri 350 25 84 17
Kecelakaan lainnya 257 18 74 15
Kanker 86 6 50 10
Penyakit lainnya 267 19 153 30
Total 1408 100% 507 100%

Simpulan, kecelakaan kendaraan bermotor merupakan


penyebab utama kematian bagi laki-laki dan perempuan
dalam kelompok umur 15-24 tahun, bertanggungjawab
sekitar 30% dari kematian. Bunuh diri lebih biasa terjadi pada
laki-laki daripada perempuan.
Contoh lain, tabel frekuensi mengenai banyak guru
yang datang lagi ke tempat wisata sejarah pada tangga 26
Maret 2007. Variabelnya adalah binomium, yaitu dua
kategori: (1) kunjungan pertama dan (2) telah berkunjung dua
kali atau lebih. Perhatikan tabel berikut.
Tabel 1.22
Distribusi Frekuensi Guru Berkunjung

Nilai/Kategori Frekuensi Persentase


Kunjungan pertama 156.0 89.15
Dua kali atau lebih kunjungan 19.0 10.85

| 45
Statistik Dengan Pendekatan Matematik

Jika kita nyatakan bahwa probabilitas kunjungan


pertama adalah sukses, maka parameter p dalam binomial
distribution (distribusi binomial) sama dengan 0,8915.

3. Kepentingan Ukuran Kelompok


Untuk memperoleh perbandingan yang valid antara
kelompok-kelompok diperlukan memandang ukuran
kelompok dan melaporkan hasilnya dengan cara yang sama
untuk semua kelompok. Contoh –Kematian bayi dalam tahun
1989.Banyak bayi yang meninggal dunia sebelum atau
setelah lahir di suatu daerah dalam tahun 1989 disajikan pada
tabel berikut.
Tabel 1.23
Distribusi Frekuensi Angka Kematian

Lahir Lahir Total Rasio Kematian


Daerah
Meninggal Hidup Kelahiran (%)
A 24 2304 2328 1.03
B 26 1835 1861 1.40
C 5 814 819 0.61
D 7 725 732 0.96
E 10 631 641 1.56
F 2 295 297 0.67

Kita tentu tidak dapat secara langsung


membandingkan banyak kematian dalam masing-masing
daerah karena hal tersebut tergantung pada banyak kelahiran.
Kita perlu mengubah angka kematian menjadi rasio
kematian, yakni sebagai berikut:
𝑏𝑎𝑛𝑦𝑎𝑘 𝑘𝑒𝑚𝑎𝑡𝑖𝑎𝑛
𝑟𝑎𝑠𝑖𝑜 𝑘𝑒𝑚𝑎𝑡𝑖𝑎𝑛 (%) = × 100
𝑡𝑜𝑡𝑎𝑙 𝑘𝑒𝑙𝑎ℎ𝑖𝑟𝑎𝑛
Latihan – 1 :
1. Apa yang dimaksud data diskrit dan data kontinu.
Berikan masing-masing dua puluh (20) contoh.
2. Tuliskan empat level pengukuran, jelaskan masing-
masing. Berikan masing-masing sepuluh contoh.

| 46
Statistik Dengan Pendekatan Matematik

3. Bedakan data-data berikut menurut jenisnya, apakah


merupakan data kualitatif, data diskritatau data kontinu.
a. Kecepatan lari dalam jarak 100 m.
b. Waktu terlama yang dapat dicapai dengan menahan
nafas sewaktu menyelam.
c. Kesan mahasiswa terhadap Perkuliahan Statistika.
d. Banyak kepala keluarga yang kehilangan rumah
akibat bencana alam.
e. Jumlah korban kecelakaan lalulintas selama tahun
2013.
4. Jelaskan mengenai survei, dan buat satu contoh survei.
5. Jelaskan perbedaan diagram batang dari probabilitas
teoritis dan dari hasil percobaan. Gambarkan sketsanya.
6. Seorang mahasiswa Ilmu Kesehatan Masyarakat sedang
melakukan penelitian mengenai kualitas higienisitas
makanan yang dijajakan di kantin. Untuk itu, ia membeli
7 jenis makanan dari 7 pedagang di kantin tersebut untuk
dibawa dan diteliti di laboratorium. Tentukan populasi
dan sampelnya.
7. Seorang dosen meminta beberapa mahasiswa maju ke
depan kelas untuk mengerjakan soal. Apakah hal tersebut
merupakan kejadian acak? Jelaskan!
8. Dilakukan percobaan mengambil satu bola bilyard dari
satu set nine ball secara acak sebanyak 100 kali dengan
pengembalian. Tabel berikut memperlihatkan frekuensi
munculnya sembilan nomor pada nine ball yang
mungkin muncul.

Nomor 1 2 3 4 5 6 7 8 9
Frekuensi 8 9 11 7 12 9 15 13 16

| 47
Statistik Dengan Pendekatan Matematik

Tentukanlah:
a. Frekuensi relatif munculnya nomor 7.
b. Frekuensi relatif munculnya nomor bukan prima.
c. Frekuensi relatif munculnya nomor ganjil.
9. Pada pelemparan dua buah dadu ke udara sebanyak satu
kali. Jika peluang munculnya mata dadu berjumlah ganjil
5
adalah , maka tentukanlah peluang munculnya mata
12
dadu berjumlah genap.
10. Suatu lembaga swadaya masyarakat yang bergerak di
bidang kesehatan bekerja sama dengan suatu rumah sakit
untuk mengadakan penelitian terhadap satu jenis
penyakit pada anak usia sekolah di suatu kabupaten.
Hasil penelitian menyatakan 375 dari 1500 anak usia
sekolah yang dijadikan subyek penelitian dinyatakan
pernah mengalami penyakit tersebut. Tentukan peluang
anak usia sekolah tersebut dinyatakan tidak pernah
terkena penyakit itu.
11. Manakah diantara kejadian-kejadian berikut yang
merupakan kejadian saling lepas atau bebas.
a) Munculnya tiga angka atau munculnya dua gambar
pada pelemparan tiga keping mata uang logam.
b) Munculnya kartu As atau kartu berwarna merah pada
pengambilan sebuah kartu dari satu set kartu bridge.
c) Munculnya bola nomor ganjil atau munculnya bola
nomor prima pada pengambilan satu buah bola
bilyard dari masing-masing kantung tertutup berisi
satu set bola bilyard (nine ball).
12. Sekeping mata uang logam dilemparkan ke udara
sebanyak m kali. Kejadian muncul sisi gambar (G)
sebanyak 9 kali dan kejadian muncul sisi angka (A)
sebanyak a kali. Jika m cukup besar, tentukanlah:
9 𝑎
a. +𝑚 b) 9 + 𝑎
𝑚
| 48
Statistik Dengan Pendekatan Matematik

13. Empat (4) kartu diberi label EFGH dan dikocok. Jika
kartu-kartu tersebut diambil satu per satu secara acak
tanpa pengembalian, tentukan peluang bahwa kartu-kartu
yang terambil memenuhi urutan alfabetis!
14. Jika frekuensi harapan munculnya angka pada sisi mata
uang logam dan mata dadu prima pada pelemparan satu
mata uang logam dan satu dadu adalah 56. Tentukan
berapa kali mata uang logam dan dadu dilempar ke
udara?
15. Herdi mempunyai koleksi dasi merah dan kuning, baju
warna hijau, biru, ungu dan cokelat serta celana warna
hitam, putih dan abu-abu. Tentukan banyak pasangan
dasi, baju dan celana yang bisa dipakai Herdi.
16. Di dalam kantung A terdapat 4 buah kartu yang diberi
nomor 1, 3, 5, 6 dan di dalam kantung B terdapat 3 buah
kartu yang diberi nomor 2, 4, 7. Akan diambil masing-
masing sebuah kartu dari setiap kantung. Tentukan
peluang terambilnya kartu berjumlah genap.
17. Dua buah dadu dilempar ke udara sebanyak satu kali.
Berapa peluang mata dadu yang muncul berjumlah 7?
18. Akan dipilih secara acak 2 dari 4 orang pasangan suami
istri. Berapa peluang keduanya merupakan pasangan
suami istri?
19. Akan dipilih secara acak masing-masing satu huruf dari
kata-kata PARALLEL dan LEVEL. Berapa peluang
terambilnya huruf yang sama?
20. E dan F adalah dua kejadian saling lepas. Jika P(E), P(F),
P(E atau F) berturut-turut adalah peluang kejadian E,
kejadian F dan kejadian (E atau F). Tentukan hubungan
P(E) dan P(F).
21. Seorang pesulap mencoba membuka satu pintu dengan 8
kunci dimana hanya satu kunci yang bisa membuka pintu

| 49
Statistik Dengan Pendekatan Matematik

tersebut. Berapa peluang pesulap tersebut bisa membuka


pintu dengan hanya tiga kali memasukkan kunci?
22. Dua dadu dilempar ke udara sebanyak 180 kali. Berapa
frekuensi harapan munculmata dadu berjumlah 9?
23. Peluang balita yang menderita campak adalah 0,24.
Apabila balita yang tidak menderita campak adalah 380
anak, maka berapakah jumlah balita yang diperiksa?
24. Jika diketahui frekuensi harapan munculnya mata dadu
prima pada pengetosan satu dadu adalah 270, maka
berapa kali dadu tersebut ditos?
25. Dua dadu dilempar ke udara sebanyak satu kali. Jika
jumlah mata dadu yang muncul adalah 10, maka berapa
peluang salah satu mata dadu 6 dan yang lainnya 4?
26. Dua dadu dilempar ke udara sebanyak satu kali. Peluang
mata dadu yang muncul berjumlah bukan prima adalah
15
. Berapa peluang muncul mata dadu yang berjumlah
36
prima?
27. Tiga keping mata uang logam dilempar ke udara
sebanyak satu kali. Berapa peluang muncul paling sedikit
dua angka?
28. Pada pengambilan satu kartu dari satu set kartu bridge
yang telah dikocok, berapa peluang terambil kartu Jack
hitam?
29. Jika hari ini tidak hujan, maka peluang besok hujan
adalah 0,2. Jika hari ini hujan, maka peluang besok hujan
adalah 0,4.
a) Jika hari senin tidak hujan, maka hari rabu hujan atau
tidak! Analisis dan jelaskan implikasi ini!
b) Jika hari senin hujan, maka hari rabu hujan atau tidak!
Analisis dan jelaskan implikasi ini!
30. Di dalam kantung A terdapat 3 bola biru dan 4 bola
hijau. Di dalam kantung B terdapat 5 bola biru dan 7

| 50
Statistik Dengan Pendekatan Matematik

bola hijau. Satu bola diambil secara acak dari kantung A


kemudian dimasukkan ke dalam kantung B. Tentukan
peluang terambilnya bola biru dari kantung B!
31. Terdapat tiga rute yang dapat dipilih dari kota P ke kota
Q. Abi berangkat dari kota P menuju kota Q dan Beni
berangkat dari kota Q menuju kota P. Tentukan peluang
Abi dan Beni berpapasan di jalan!
32. Jumlah seluruh siswa kelas IX di suatu SMP adalah 40
orang. Sebanyak 18 siswa diantaranya gemar sepak bola,
14 siswa gemar bola basket dan 8 siswa gemar kedua
olahraga tersebut. Jika dipanggil seorang siswa secara
acak, tentukan:
a. Peluang siswa yang terpanggil gemar sepak bola dan
bola basket!
b. Peluang siswa yang terpanggil gemar sepak bola tapi
tidak gemar bola basket!
c. Peluang siswa yang terpanggil tidak gemar sepak bola
maupun bola basket!
33. Empat orang siswa dipilih secara acak, kemudian satu
per satu ditanya apakah mereka lulus atau tidak dalam
UTS salah satu mata pelajaran. Tentukanlah:
a. Ruang sampel dari peristiwa di atas!
b. Peluang tiga orang siswa tidak lulus!
c. Peluang sedikitnya dua orang siswa lulus!
d. Peluang semua siswa lulus!

| 51
Statistik Dengan Pendekatan Matematik

BAB II
KONSEP DASAR STATISTIK

B
ab ini merupakan pengantar yang memuat
secara singkat mengenai konsep-konsep
dasar statistik sebagai landasan dalam
mempelajari analisis data statistik. Pokok bahasan yang
diuraikan menggambarkan asumsi dasar metode statistik
paling populer dan sudah dilakukan banyak peneliti sebagai
komponen pemahaman umum mengenai "naturalitas
kuantifikasi" dari realitas. Tulisan pada bab ini menunjukkan
perhatian pada aspek fungsional suatu konsep dan disajikan
secara ringkas. Informasi lanjut pada setiap konsep dapat
ditemukan dalam buku-buku ajar statistika.
Dalam bab ini, secara singkat diuraikan mengenai:(1)
variabel; (2) penelitian korelasional dan eksperimental; (3)
variabel terikat dan bebas; (4) skala-skala pengukuran; (5)
relasi antara variabel; (6) keutamaan relasi antara variabel;
(7) dua ciri dasar setiap relasi antara variabel; (8) signifikansi
statistik (nilai-p); (9) penentuan hasil yang benar-benar
signifikan; (10) signifikansi statistik dan analisis yang
dilakukan; (11) kekuatan dan reliabilitas relasi antara
variabel-variabel; (12) relasi lebih kuat antara variabel yang
lebih signifikan; (13) signifikansi relasi antara variabel terikat
terhadap ukuran sampel; (14) contoh rasio; relasi kecil dalam
sampel besar; (16) tidak terdapat relasi sebagai hasil yang
signifikan;(17) mengukur kekuatan relasi antara variabel;
(18) format paling umum dari uji statistik; menghitung taraf
signifikansi statistik; (19) kepentingan distribusi normal; (20)
distribusi normal dalam penalaran statistik (induksi); (21) uji

| 52
Statistik Dengan Pendekatan Matematik

statistik dan distribusi normal; serta (22) pelanggaran dari


asumsi normal.

A. Variabel
Dalam kerja-kerja statistik, sangat berguna
membedakan antara dua jenis variabel, yakni kualitatif dan
kuantitatif (atau numerik). Masing-masing dikelompokkan ke
dalam dua jenis, yakni data kualitatif, ordinal atau nominal,
dan data numerik yang diskrit (seringkali adalah bulat) atau
kontinu.
Kata "variabel" digunakan dalam dua pengertian.
Yakni, variabel dapat bermakna sebagai item data yang
dikumpulkan pada tiap satuan (unit) penarikan sampel, dan
berarti pula sebagai "variabel acak". Variabel acak
merupakan variabel dalam pengertian matematika, tetapi
peneliti dapat mengambil nilai-nilai berbeda menurut suatu
sebaran probabilitas.
Kata "variat" kadang-kadang juga digunakan
bermakna sebagai variabel acak. Dalam statistik, digunakan
variabel acak untuk membangun model probabilitas untuk
variabel-variabel data karena, sewakltu data dikumpulkan
pada satuan-satuan pengamatan yang diambil sampelnya
secara acak, nilai-nilai tersebut dicatat untuk variabel-
variabel data dapat dipandang sebagai realisasi dari variabel
acak matematik.
Mengingat bahwa data kualitatif selalu terbatas
banyak nilai-nilai pilihannya, variabel seperti ini juga
digambarkan berbentuk diskrit. Semua data kualitatif adalah
diskrit, sedangkan beberapa data numerik adalah diskrit dan
beberapa kontinu. Untuk analisis statistik, data kualitatif
dapat dikonversi ke dalam data numerik diskrit dengan cara
menghitung nilai-nilai berbeda yang muncul.

| 53
Statistik Dengan Pendekatan Matematik

Variabel merupakan sesuatu yang diukur, dikontrol,


atau dimanipulasi dalam penelitian. Peran variabel berbeda
dalam banyak kegiatan. Paling khusus dari peran variabel
adalah dalam penelitian dan jenis ukuran yang dapat
digunakan untuk penelitian itu. Variabel juga diartikan
sebagai item data yang dikumpulkan pada setiap satuan
penarikan sampel. Sedangkan variabel acak (variat) diartikan
sebagai suatu pengambilan nilai berbeda sesuai dengan
probabilitas sebaran. Kuantitas-kuantitas seperti gender dan
berat dinamakan variabel, karena nilai yang dimaksud
berubah-ubah dari suatu pengamatan ke pengamatan lain.
Secara umum ada dua jenis variabel, yakni: (1)
variabel kualitatif yang bersifat diskrit, dan dapat berbentuk
ordinal atau nominal, (2) variabel kuantitatif yang berciri
numeric, dan dapat berbentuk diskrit atau kontinu. Variabel
kualitatif merupakan kumpulan data kualitatif, misalnya
untuk gender adalah pria atau perempuan; hasil ujian, yakni
lulus atau gagal; serta status sosial-ekonomi, yakni miskin,
menengah atau kaya.
Data kualitatif yang dikumpulkan dapat
dikelompokkan, yakni berdiri nominal atau ordinal. Ciri
nominal bermakna bahwa data yang dikumpulkan tersebut
tidak terdapat urutan antara kategori, sedangkan yang berciri
ordinal adalah apabila terdapat urutan seperti hasil-hasil ujian
dan status sosial-ekonomi.
Data Kuantitatif atau numerik diperoleh dengan cara
menghitung atau mengukur. Misalnya, banyak siswa di
beberapa sekolah (diskrit) dan berat badan (sebarang nilai,
biasanya dalam suatu rentang, merupakan data kontinu).
Bilangan-bilangan yang dihitung untuk menggambarkan ciri
penting dari data dinamakan statistik. Contoh statistik
misalnya proporsi dari perempuan-perempuan dalam suatu
sampel penduduk di suatu wilayah dan rata-rata usia

| 54
Statistik Dengan Pendekatan Matematik

pengangguran dalam suatu sampel penduduk di suatu


wilayah.

B. Penelitian Korelasional dan Eksperimental.


Sebagian besar penelitian empiris termasuk dari dua
kategori umum, yakni korelasional dan eksperimental. Dalam
penelitian korelasional, peneliti tidak (atau sekurang-
kurangnya tidak mencoba) mempengaruhi sebarang variabel,
tetapi hanya mengukur dan mencari relasi (korelasi) antara
beberapa himpunan variabel, seperti variabel pemahaman
konseptual dan variabel perolehan belajar. Dalam
penelitian eksperimental, peneliti memanipulasi beberapa
variabel dan kemudian mengukur pengaruh manipulasi
tersebut terhadap variabel lain. Contoh, peneliti sengaja
membenarkan pemahaman konseptual siswa dan kemudian
mencatat capaian belajar mereka.
Analisis data dalam penelitian eksperimental juga
termasuk menghitung "korelasi" antara variabel, secara
khusus adalah variabel yang dimanipulasi dan pengaruh
manipulasi itu. Data eksperimen berpotensi menyediakan
informasi yang secara kualitatif lebih baik, maksudnya hanya
data eksperimen secara meyakinkan dapat menunjukkan
hubungan kausal (sebab-akibat) antara variabel. Contoh, jika
ditemukan bahwa sewaktu mengubah variabel A maka
variabel B berubah, atau dapat disimpulkan bahwa "A
mempengaruhi B." Data dari penelitian korelasional hanya
dapat "diinterpretasikan" dalam terminologi kausal
berdasarkan teori yang ada, tetapi data korelasional tidak
dapat secara meyakinkan membuktikan hubungan kausalitas.

C. Variabel Terikat dan Variabel Bebas


Variabel bebas adalah yang dimanipulasi, sedangkan
variabel terikat hanya diukur atau dicacat. Istilah variabel

| 55
Statistik Dengan Pendekatan Matematik

terikat dan bebas sebagian besar digunakan dalam penelitian


eksperimental dimana beberapa variabel dimanipulasi, dan
dalam hal ini variabel-variabel tersebut adalah "bebas" dari
pola reaksi awal, ciri, tujuan, dan lain-lain dari subjek.
Beberapa variabel lain diharapkan "terikat" pada suatu
manipulasi atau kondisi eksperimen.
Dengan demikian, variabel terikat tergantung pada
"apa yang subjek akan lakukan" sebagai respon. Memang
agak bertentangan dengan naturalitas dari perbedaan kedua
jenis variabel tersebut. Dalam hal ini, istilah variabel bebas
juga digunakan dalam studi dimana peneliti tidaklah secara
harfiah memanipulasinya, tetapi hanya memasangkan subjek
dengan "kelompok eksperimen" yakni berdasarkan beberapa
sifat subjek sebelumnya. Contoh, jika dalam suatu
eksperimen, laki-laki dibandingkan dengan perempuan
dengan memandang hasil pencacahan pada sel (perpotongan
baris dan kolom), maka gender dinamakan variabel bebas dan
hasil cacahan merupakan variabel terikat.

D. Skala Pengukuran
Pengukuran terdiri atas aturan pemasangan bilangan
kepada atribut dari objek didasarkan pada aturan-aturan.
Bahasa aljabar tidak mempunyai makna di dalam dan dari
dirinya sendiri. Matematikawan teoritik berhubungan
seluruhnya dalam realita dari bahsa formal dan
memperhatikan struktur serta hubungan dalam bahasa
tersebut. Matematikawan terapan atau ahli statistik, pada sisi
lain, tidak hanya memperhatikan bahasa aljabar, tetapi
hubungan dari simbol-simbol dalam bahasa itu dengan objek
dan peristiwa nyata dalam kehidupan. Perhatian mengenai
makna simbol-simbol matematika (bilangan) merupakan
perhatian mengenai pengukuran.

| 56
Statistik Dengan Pendekatan Matematik

Berdasarkan definisi, sebarang himpunan aturan


memasangkan bilangan-bilangan kepada atribut dari objek
merupakan pengukuran. Tidak semua pengukuran secara
sama berguna dalam hubungan dengan dunia nyata,
meskipun demikian, peran ilmuwan adalah memilih
pengukuran sehingga lebih bermanfaat. Ilmuwan fisika dan
biologi secara umum memiliki sistem pengukuran dengan
penetapan yang baik dan terstandar. Ilmuwan mengetahui,
sebagai contoh, ikan "ghundefelder" digambarkan berpanjang
10,23 cm dan berat 34,23 gram. Ilmuwan sosial tidak
memiliki sistem seperti itu. Suatu deskripsi mengenai
individu dengan 23 "satuan" yang dibutuhkan misalnya, tidak
berkaitan dengan rekognisi dari sebagian besar ilmuwan.
Karena alasan ini, maka ilmuwan sosial memberikan
perhatian mengenai naturalitas dan makna dari sistem
pengukuran melebihi perhatian daripada ilmuwan fisika dan
biologi.

1. Sifat-Sifat Sistem Pengukuran


S.S. Stevens (1951, h. 123) menggambarkan sifat-sifat
sistem pengukuran yang terkait dengan dibolehkannya
keputusan mengenai kualitas atau kecocokkan dari suatu
teknik pengukuran. Satu sifat dari sistem pengukuran
berhubungan dengan perluasan bahwa hubungan yang ada
antara atribut-atribut dari objek-objek dalam "dunia nyata"
dipertahankan dalam bilangan yang dipasangkan dengan
objek tersebut. Sebagai contoh dari hubungan dalam "dunia
nyata", apabila atribut dalam pertanyaan mengenai tinggi,
maka objek (orang) dalam "dunia nyata" adalah lebih atau
kurang dari atribut tersebut (tinggi) daripada objek
(orang)lain. Dalam cara yang sama, bilangan mempunyai
hubungan dengan bilangan lain. Contoh, 59 kurang dari 62,
48 sama dengan 48, dan 73 lebih besar dari pada 68.

| 57
Statistik Dengan Pendekatan Matematik

Objek dalam dunia nyata dapat disajikan dalam


bentuk simbol Oi dimana "O" merupakan notasi singkat untuk
"objek" dan "i" adalah indeks (subscript) yang menunjuk ke
objek mana yang digambarkan tersebut dan dapat merupakan
sebarang bilangan bulat. Sebagai contoh O1 adalah objek
pertama, O2 kedua, O3 ketiga dan seterusnya. Simbol M(Oi)
dapat digunakan untuk menyimbolkan bilangan, yang
berukuran (M), dari sebarang objek yang dipasangkan dengan
objek menggunakan suatu sistem aturan. Dengan demikian,
M(O1) merupakan bilangan yang dipasangkan dengan objek
pertama, M(O2) dengan objek kedua, dan seterusnya.
Ungkapan O1> O2 berarti bahwa objek pertama mempunyai
sesuatu yang lebih di "dunia nyata" dari pada yang kedua.
Ungkapan M(O1) > M(O2) bermakna bahwa bilangan yang
dipasangkan dengan objek pertama lebih besar daripada yang
dipasangkan dengan objek kedua.
Dalam terminologi matematika pengukuran
merupakan fungsi pemetaan dari himpunan objek {Oi : i
merupakan bilangan bulat} ke himpunan bilangan real
{M(Oi)}. Perhatikan ilustrasi berikut.
Objek Bilangan

Gambar 2.1
Diagram Pemasangan Objek dengan Bilangan

Tujuan dari suatu sistem pengukuran adalah untuk


menstrukturisasi aturan pemasangan bilangan ke objek
melalui suatu cara sehingga hubungan antara objek-objek
dipertahankan sebagai bilangan yang dipasangkan ke objek
| 58
Statistik Dengan Pendekatan Matematik

tersebut. Perbedaan jenis hubungan yang dipertahankan


dinamakan sifat-sifat dari sistem pengukuran.

a. Ukuran/Besar Objek
Sifat dari ukuran/besar ada apabila suatu objek yang
mempunyai lebih banyak atribut dari pada objek lain,
diberikan suatu bilangan yang lebih besar berdasarkan suatu
sistem aturan. Hubungan seperti itu haruslah memenuhi
untuk semua objek dalam "dunia nyata". Secara matematika,
sifat adanya ukuran/besar objek digambarkan sebagai berikut:
Sifat ukuran/besar ada apabila untuk semua i,j jika Oi> Oj
maka M(Oi) > M(Oj).

b. Rentang (Interval)
Sifat interval terkait dengan hubungan dari perbedaan-
perbedaan antara objek-objek. Jika suatu sistem pengukuran
memiliki sifat-sifat interval berarti bahwa satuan pengukuran
dari pengukuran bermakna sebagai sesuatu yang sama
menurut skala dari bilangan. Misalnya, satu inci adalah satu
inci, tidak ada masalah pada bagian mana pengukuran
dilakukan.
Secara lebih tepat, perbedaan yang sama antara dua
bilangan mencerminkan perbedaan yang sama dalam "dunia
nyata" antara objek yang dipasangkan dengan bilangan-
bilangan itu. Dalam kaitan pendefinisian sifat interval dalam
notasi matematika, diperlukan empat objek yakni: Oi, Oj, Ok,
dan Ol. Perbedaan antara objek-objek disajikan menggunakan
tanda "-"; dimana Oi-Oj menunjukkan perbedaan aktual pada
"dunia nyata" antara objek i dan objek j, sedangkan M(Oi)-
M(Oj) menunjuk perbedaan antara bilangan-bilangan yang
dipasangkan atau yang merupakan ukuran dari masing-
masing objek tersebut.Sifat dari interval adalah:Untuk semua
i, j, k, ljikaOi-Oj=Ok- Olmaka M(Oi)-M(Oj)=M(Ok)-M(Ol).

| 59
Statistik Dengan Pendekatan Matematik

Akibat dari definisi tersebut adalah bahwa, jika suatu


bilangan yang dipasangkan dengan dua pasang objek adalah
sama, maka pasangan objek itu sama bedanya dalam dunia
nyata. Secara matematika dinyatakan bahwa sifat interval ada
yakni sebagai berikut: Untuk semua i, j, k, l apabila M(Oi)-
M(Oj) = M(Ok)-M(Ol) maka Oi-Oj = Ok- Ol .
Pernyataan tersebut bermanfaat untuk menguji apakah
suatu sistem pengukuran memiliki sifat interval, yakni
apabila dua pasang objek dipasangkan dengan bilangan-
bilangan yang berjarak sama pada skala bilangan, maka harus
diasumsikan bahwa objek-objek itu secara sama berbeda
dalam dunia nyata. Sebagai contoh, untuk menguji apakah
hasil belajar statistik mempunyai sifat interval, seharusnya
benar bahwa dua siswa yang masing-masing memiliki skor
23 dan 28 mencerminkan perubahan yang sama dalam
pengetahuan statistik seperti dua siswa yang mempunyai skor
30 dan 35.
Sifat interval tersebut adalah kritis menurut
kemampuan menggunakan operasi matematika "+" dan "-".
Untuk memperluas kepada sifat mana dari interval yang tidak
terpenuhi, sebarang statistik yang dihasilkan dengan cara
menambah atau mengurangi bilangan-bilangan dapat berada
dalam kesalahan.

c. Nol Rasional (Rational Zero)


Suatu sistem pengukuran mempunyai nol rasional jika
suatu objek yang tidak memiliki atribut dipasangkan dengan
bilangan nol menggunakan suatu sistem aturan tertentu.
Suatu objek tidak memerlukan keberadaan secara nyata
dalam "dunia nyata", seperti sulitnya menggambarkan
"seseorang tanpa ketinggian". Persyaratan untuk nol rasional
adalah: Jika objek tanpa atribut ada diberikan nilai nol.
Definisikan O0sebagai objek tanpa atribut, dan definisi dari

| 60
Statistik Dengan Pendekatan Matematik

nol rasional adalah: Sifat Nol Rasional ada apabila M(O0)


= 0.
Sifat dari nol rasional perlu untuk rasio antara
bilangan-bilangan agar bermakna. Hanya dalam sistem
pengukuran dengan nol rasional akan menjadi masuk akal
berargumentasi bahwa seseorang dengan skor 30 beratribut
dua kali lebih banyak dibandingkan dengan seseorang yang
mendapatkan skor 15. Dalam banyak terapan dari statistik,
sifat tersebut tidak perlu dalam rangka mendapatkan
simpulan yang bermakna.

2. Jenis-Jenis Skala
S. S. Stevens (1951, h. 147) mengusulkan empat jenis
skala.Jenis skala yang dimaksud adalah Nominal, Ordinal,
Interval,dan Ratio, dan masing-masing memiliki perbedaan
sifat-sifat dari sistem pengukuran.
a. Skala Nominal
Skala-skala nominal merupakan sistem pengukuran
yang tidak memiliki tiga sifat sebagaimana diuraikan yakni,
besar, interval, dan nol rasional. Skala-skala nominal dibagi
ke dalam dua kelompok, yakni: Penamaan Kembali
(Renaming) dan Kategori (Categorical).
Penamaan kembali skala nominal (Nominal-
Renaming) terjadi apabila tiap objek dalam suatu himpunan
dipasangkan dengan bilangan berbeda, oleh karena itu,
namakan kembali menggunakan suatu bilangan. Contoh
penamaan kembali skala nominal adalah bilangan-bilangan
kode sosial atau bilangan pada bagian punggung pemain
sepak bola. Bilangan kode sosial perlu dinamakan kembali
karena indivisu berbeda dengan nama sama, misalnya
Ahmad, dan karena komputer memerlukan waktu lebih
singkat dan lebih mudah menangani mengenai bilangan
dibandingkan karakter bilangan (alpha-numeric).

| 61
Statistik Dengan Pendekatan Matematik

Kategori skala nominal (Nominal-categorical)


digunakan apabila objek-objek dikelompokkan
menjadisubgrup dan masing-masing diberikan bilangan yang
sama. Sub grup haruslah saling lepas, yakni suatu objek tidak
menjadi anggota lebih dari satu kategori atau subgrup.
Contoh pengukuran nominal-kategori adalah
pengelompokkan orang ke dalam kategori-kategori yang
berdasarkan pilihan partai politik atau gender (Laki-laki atau
Perempuan). Misalnya, dalam pilihan partai politik ada tiga
partai, Partai A dipasangkan dengan bilangan "1", Partai B
adalah "2", dan partai C "3", sedangkan gender, perempuan
dipasangkan dengan bilangan "1" dan laki-laki "2".
Secara umum tentulah tidak bermakna untuk
mendapatkan rata-rata, standardeviasi, koefisien korelasi, dan
lainnya, apabila data adalah nominal-kategori. Jika rata-rata
sampel berdasarkan pada pilihan partai politik maka nilainya
adalah 1,89, dimana tidak dapat diketahui apakah sebagaian
besar pemilih adalah untuk Partai B atau apakah partai A dan
Partai C secara sama dipilih. Tentulah bukan rata-rata, yakni
sistem pengukuran seperti itu tak berguna, karenanya
diperlukan ukuran lain sehingga dapat memberikan banyak
informasi.
Suatu pengecualian terhadap aturan dimana ukuran
statistik tidak didapatkan terhadap data dengan jenis skala
kategori-nominal adalah apabila data tersebut dikotomi, atau
mempunyai dua level, seperti Perempuan = 1 dan Laki-Laki
= 2. Dalam kasus seperti ini cocok ditangani dengan cara
menghitung dan menginterpretasikan statistik yang
mengasumsikan sifat interval bersesuaian, karena satu
interval memenuhi persyaratan dari sifat interval.

| 62
Statistik Dengan Pendekatan Matematik

b. Skala Ordinal (Ordinal Scales)


Skala ordinal merupakan sistem pengukuran yang
memiliki sifat besar, tetapi tidak mempunyai sifat interval.
Sifat nol rasional tidak penting jika sifat interval tidak
dipenuhi. Sebarang urutan waktu, ranking, atau penguruan
rangking yang digunakan dapat diperiksa sebagai skala
ordinal. Contoh skala ordinal adalah urutan rangking siswa
dalam kelas dilihat dari tinggi dan memasangkan siswa
paling rendah dengan bilangan "1", berikutnya bilangan "2",
dan seterusnya.
c. Skala Interval (Interval Scales)
Skala interval merupakan sistem pengukuran yang
memiliki sifat besar dan interval, tetapi tidak sifat nol
rasional. Skala ini cocok untuk menghitung statistik-statistik
dan banyak digambarkan atau dipaparkan dalam buku-buku
statistik apabila jenis skala adalah interval.
d. Skala Rasio (Ratio Scales)
Skala rasio merupakan sistem pengukuran yang
memiliki ketiga sifat, yakni : besar, interval, dan nol rasional.
Tambahan kekuatan dari nol rasional memungkinkan rasio
dari bilangan-bilangan diinterpretasikan dan bermakna,
misalnya rasio tinggi Ahmad terhadap tinggi Ani adalah 1,32
sedangkan bilangan tersebut tak mungkin pada skala interval.
Variabel-variabel berbeda dalam hal bagaimana
secara tepat variabel itu diukur, atau berapa banyak informasi
terukur dapat diberikan menggunakan skala
pengukuran.Terdapat beberapa kesalahan yang tampak dalam
setiap pengukuran sehingga menentukan banyaknya
informasi yang dapat diperoleh. Faktor lain yang menentukan
banyak informasi yang dapat disediakan dari suatu variabel
adalah jenis skala pengukuran yang digunakan. Secara
khusus,skala pengukuran variabel diklasifikasikan ke dalam

| 63
Statistik Dengan Pendekatan Matematik

empat jenis, yakni: (a) nominal, (b) ordinal, (c) interval, atau
(d) rasio.
Variabel nominal hanya untuk klasifikasi kualitatif.
Jenis variabel ini hanya dapat diukur berdasarkan apakah
item individual secara jelas milik beberapa kategori berbeda,
tetapi kita tidak dapat mengkuantifikasi atau bahkan
mengurutkan peringkat kategori-kategori itu. Contoh, peneliti
dapat mengatakan bahwa dua individu berbeda dalam kaitan
dengan variabel A (misal, keduanya berbeda warna kulit),
tetapi kita tidak dapat menyatakan mana yang "memiliki
kelebihan" kualitas berdasarkan penyajian variabel tersebut.
Contoh khusus variabel nominal adalah gender, suku, warna,
dan jenis kota.
Variabel ordinal memungkinkan bagi peneliti
memeringkat urutan item yang diukur berkaitan dengan mana
berkualitas kurang dan lebih baik (tinggi) yang disajikan
variabel itu. Namun, masih belum membolehkan peneliti
mengatakan "berapa kelebihannya". Contoh khusus variabel
ordinal adalah status sosial-ekonomi dari keluarga. Misal,
peneliti mengetahui bahwa kelas atas adalah lebih tinggi dari
pada kelas menengah tetapi tidak dapat menyatakan 18%
lebih tinggi.
Perbedaan utama skala nominal, ordinal, dan interval
juga dapat dilihat dalam menyajikan suatu variabel ordinal.
Sebagai contoh, peneliti dapat menyatakan bahwa
pengukuran nominal menyediakan sedikit informasi
dibandingkan pengukuran ordinal, tetapi tidak dapat
menyatakan "berapa banyak kekurangannya" atau bagaimana
perbedaan tersebut dibandingkan dengan perbedaan antara
skala ordinal dan interval.
Variabel interval memungkinkan peneliti tidak
hanya memeringkat urutan item yang diukur, tetapi juga
mengkuantifikasi dan membandingkan ukuran perbedaan

| 64
Statistik Dengan Pendekatan Matematik

antar item tersebut. Sebagai contoh: suhuyang diukur dalam


derajat Fahrenheit atau Celsius menyatakan suatu skala
interval. Peneliti dapat menyatakan bahwa suhu 40 derajat
lebih tinggi daripada suhu 30 derajat, dan pertambahan dari
20 ke 40 derajat adalah dua kali pertambahan dari 30 ke 40
derajat.
Variabel rasio sama seperti variabel interval. Sebagai
tambahan dari semua sifat variabel interval, variabel rasio
mencirikan titik nol mutlak yang dapat dikenali. Dengan
menggunakan skala rasio memungkinkan bagi peneliti
menyatakan misalnya, x adalah dua kali lebihnya daripada y.
Contoh khusus skala rasio adalah mengukur waktu atau
ruang. Sebagai contoh, skala suhu Kelvin adalah skala rasio,
tidak hanya dapat dikatakan bahwa suhu 200 derajat lebih
tinggi daripada 100 derajat, juga benar menyatakan bahwa
tingginya dua kali. Skala interval tidak mempunyai sifat rasio
(perbandingan). Catatan, sebagai besar prosedur analisis data
statistik tidak membedakan antara sifat-sifat skala
pengukuran interval dan rasio.

E. Hubungan antar Variabel


Tanpa memandang jenisnya, dua atau lebih variabel
berhubungan apabila, dalam suatu sampel pengamatan, nilai
dari variabel tersebut tersebar dalam suatu cara yang
konsisten. Dengan perkataan lain, variabel-variabel adalah
berhubungan apabila nilai-nilai variabel itu secara sistematis
berkorespondensi dengan masing-masing variabel lain dalam
pengamatan yang dilakukan. Contoh: (1) Gender dan
Keterampilan Berhitung dipandang berhubungan apabila
sebagian besar laki-laki mempunyai keterampilan berhitung
tinggi dan sebagian besar perempuan keterampilan berhitung
mereka rendah, atau sebaliknya, (2) Tinggi berhubungan
dengan Berat karena, secara khusus, individu tinggi lebih

| 65
Statistik Dengan Pendekatan Matematik

berat badannya daripada yang rendah, dan (3)IQ


berhubungan dengan Banyak Kesalahan dalam suatu tes
apabila seseorang dengan IQ lebih tinggi memiliki kesalahan
lebih sedikit.
1. Relasi antar Variabel
Secara umum, tujuan akhir dari setiap penelitian atau
analisis ilmiah adalah mendapatkan hubungan antar variabel.
Filsafat ilmu pengetahuan mengajarkan bahwa tidak ada cara
lain guna menyajikan "makna" kecuali dalam kaitan dengan
hubungan antara beberapa kuantitas atau kualitas, atau cara
melibatkan hubungan antar variabel. Dengan demikian,
perkembangan ilmu pengetahuan haruslah selalu meliputi
penemuan hubungan-hubungan baru antara variabel-variabel.
Penelitian korelasional melibatkan pengukuran
hubungan, terutama adalah secara langsung. Akan tetapi,
penelitian eksperimental dilakukan tidak terhadap sebarang
perbedaan dalam pengukuran hubungan tersebut. Sebagai
contoh, penelitian eskperimental yang membedakan
keterampilan kali-laki dan perempuan dapat digambarkan
untuk mencari hubungan antara dua variabel: Gender dan
Keterampilan. Statistik tidak lain kecuali membantu kita
menilai hubungan antara variabel-variabel. Sesungguhnya,
semua dari ratusan prosedur yang dibicarakan dalam buku-
buku statistik (termasuk online textbook) dapat
diinterpretasikan dalam rangka menilai berbagai jenis
hubungan antar-variabel.

2. Dua Ciri Dasar Setiap Hubungan antara Variabel


Dua sifat formal paling dasar dari setiap hubungan
antara variabel adalah (a) besar hubungan (atau "ukuran
hubungan") dan (b) reliabilitas hubungan (atau "keadaan
sebenarnya dari suatu hubungan").

| 66
Statistik Dengan Pendekatan Matematik

a. Besar (atau "ukuran") hubungan mudah dipahami dalam


hal mengukur besar hubungan daripada mengukur
reliabilitas. Sebagai contoh, jika setiap laki-laki dalam
sampel ditemukan memiliki keterampilan berhitung
lebih tinggi daripada setiap perempuan dalam sampel
tersebut, dapat dikatakan bahwa besar hubungan antara
dua variabel itu (Gender and Keterampilan Berhitung)
adalah sangat tinggi dalam sampel yang dimaksud.
Dengan perkataan lain, dapat diprediksi sesuatu bagian
berdasarkan sesuatu lainnya (sekurang-kurangnya
diantara anggota dari sampel tersebut).
b. Reliabilitas suatu relasi sedikit banyak merupakan
konsep intuitif, tetapi masih sangat penting. Reliabilitas
berkenaan dengan "keterwakilan (representativeness)"
hasil yang ditemukan dalam suatu sampel tertentu untuk
keseluruhan populasi. Dengan perkataan lain, reliabilitas
menyatakan bagaimana kemungkinan bahwa relasi yang
sama ditemukan apabila eksperimen diulang pada sampel
lain dari populasi yang sama. Perlu diingat bahwa
peneliti hampir tak pernah "pada akhirnya" tertarik hanya
pada apayang terjadi dalam sampel yang diteliti, tetapi
peneliti tertarik hanya dalam sampel itu untu
kmemperluas menyediakan informasi mengenai
populasi. Apabila dalam suatu penelitian (studi)
ditemukan beberapa kriteria khusus (diuraikan pada
bagian selanjutnya), maka reliabilitas hubungan antara
variabel-variabel yang diamati dalam sampel penelitian
dapat secara kuantitatif diestimasi dan disajikan
menggunakan ukuran baku (secara teknis adalah nilai-p
atau taraf signifikansi).

| 67
Statistik Dengan Pendekatan Matematik

F. Signifikansi Statistik (nilai-p)


Signifikansi statistik dari suatu hasil merupakan
probabilitas bahwa hubungan yang diamati (yakni antara
variabel-variabel) atau suatu perbedaan (yakni antara rerata-
rerata) dalam suatu sampel terjadi murni karena peluang
("keberuntungan") dan populasi adalah dari sampel yang
diambil, tidak karena hubungan atau perbedaan yang ada.
Dengan menggunakan sedikit istilah teknis, dapat dinyatakan
bahwa signifikansi statistik dari hasil menjelaskan mengenai
derajat suatu hasil adalah "benar" (dalam pengertian adalah
"keterwakilan dari populasi").
Secara lebih teknis, nilai-p menyajikan penurunan
indeks dari reliabilitas hasil (Brownlee, 1960, h. 72). Apabila
nilai-p lebih tinggi, maka sedikit yang dapat dipercaya bahwa
hubungan yang diamati antara variabel dalam suatu sampel
merupakan indikator reliabel dari hubungan antara masing-
masing variabel dalam populasi itu. Secara khusus, nilai-p
menyajikan probabilitas kesalahan yang terlibat dalam
penerimaan hasil yang diamati adalah valid, yakni, sebagai
"keterwakilan dari populasi". Sebagai contoh, nilai-psebesar
0,05 (yakni 1/20) menunjukkan probabilitas 5% bahwa
hubungan antara variabel yang ditemukan dalam sampel
adalah sangat kecil, seperti menemukan sesuatu yang berada
di sutau tempat kecil dalam suatu keseluruhan yang besar.
Oleh karena itu, dengan berasumsi bahwa dalam
populasi tidak terdapat hubungan antara variabel-variabel
bagaimana pun keadaannya, dan eksperimen diulang setelah
setiap satu kali melakukan percobaan, dapat diharapkan
bahwa dalam setiap 20 pengulangan eksperimen akan
terdapat satu yang merupakan hubungan antara variabel
dalam pertanyaan penelitian, yakni akankah sama atau lebih
kuat hubungan yang diperoleh pada akhir percobaan daripada
hubungan yang telah dilakukan? Pertanyaan tersebut

| 68
Statistik Dengan Pendekatan Matematik

bermakna bahwa jawabannya adalah tidak sama, yakni suatu


hubungan antara variabel diharapkan mengulangi hasil
sebesar 5% dari waktu atau 95% dari waktu. Apabila ada
hubungan antara variabel dalam populasi, probabilitas
pengulangan studi dan mendapatkan hubungan yang berelasi
dengan kekuatan statistik dari rancangan. Dalam banyak
wilayah penelitian, nilai-p sebesar 0,05 merupakan
perlakukan biasa sebagaimana taraf kesalahan sebagai "garis
batas yang dapat diterima”. Pelajari penjelasan berikut.
1. Hasil yang ”Signifikan”
Tidak ada cara menghindari keberpihakan dalam
mengambil keputusan akhir bahwa, taraf signifikansi akan
dilakukan untuk yang benar-benar ”signifikan". Maksudnya,
pemilihan beberapa taraf signifikan sehingga mencapai hasil
yang akan ditolak adalah tak valid, merupakan keberpihakan.
Dalam praktek, keputusan akhir biasanya tergantung pada
apakah hasil diprediksi berdasarkan dugaan atau hanya
setelah berbagai analisis dan perbedaan dikerjakan pada
himpunan data, pada keseluruhan fakta pendukung yang
konsisten dalam seluruh himpunan data, dan pada kebiasaan
dalam penelitian.
Secara khusus, dalam berbagai ilmu pengetahuan,
hasil yang diperoleh p≤ 0,05 dipandang signifikan secara
statistik, tetapi ingat bahwa taraf signifikansi masih
melibatkan probabilitas kesalahan cukup tinggi (yakni, 5%).
Hasil-hasil yang signifikan pada taraf p ≤ 0,01 biasanya
diterima signifikan secara statistik, dan taraf p ≤ 0,005 atau
p ≤ 0,001 seringkali dinamakan bersignifikansi "tinggi".
Namun perlu diingat bahwa klasifikasi tersebut tidak lain
menyajikan kesepakatan keberpihakan bahwa hanya secara
informal berdasarkan pengalaman penelitian secara umum.

| 69
Statistik Dengan Pendekatan Matematik

2. Signifikansi Statistik dan Banyak Analisis yang


Dilakukan
Tidaklah perlu menyatakan bahwa, semakin banyak
analisis yang digunakan pada himpunan data, semakin
banyak hasil yang sesuai "peluang" sebagaimana taraf
signifikansi umum yang digunakan (konvensional). Sebagai
contoh, jika hasil perhitungan korelasi antara sepuluh (10)
variabel diperoleh 45 koefisien korelasi berbeda, maka
diharapkan diperoleh peluang bahwa sekitar dua koefisien
korelasi (yakni, satu dalam setiap 20 kefisien korelasi) adalah
signifikan pada taraf p ≤ 0,05, bahkan apabila nilai-nilai
variabel adalah acak keseluruhannya dan variabel-variabel
tersebut tidak berkorelasi dalam populasi.
Beberapa metode statistik melibatkan banyak
perbandingan dan, dengan demikian, peluang yang baik
untuk kesalahan seperti itu termasuk beberapa "koreksi" atau
penyesuaian untuk total perbandingan. Akan tetapi, banyak
metode statistik (khususnya eksplorasi sederhana analisis
data) tidak menawarkan pengulangan secara langsung untuk
masalah ini. Karena itu, kembali kepada peneliti untuk
menilai secara berhati-hati temuan yang tidak diharapkan.
Banyak contoh dalam berbagai buku ajar termasuk yang
tersedia secara online memberikan saran khusus mengenai
bagaimana melakukan hal ini. selain itu,informasi yang
cocok dapat juga ditemukan dalam banyak buku ajar metode
penelitian.

G. Kekuatan dan Reliabilitas Relasi antara Variabel


Kekuatan relasi dan reliabilitas merupakan dua sifat
berbeda dari hubungan antara variabel-variabel. Akan tetapi,
keduanya tidaklah secara keseluruhan saling bebas. Secara
umum, dalam suatu sampel berukuran khusus, lebih besar

| 70
Statistik Dengan Pendekatan Matematik

relasi antara variabel-variabel, lebih reliabel relasi itu.


Pelajari uraian pada paragraf berikut.
1. Signifikansi Relasi Lebih Kuat antara Variabel
Dengan berasumsi bahwa tidak ada relasi antara
masing-masing variabel dalam suatu populasi, hasil paling
mungkin adalah tidak ditemukan relasi antara variabel-
variabel tersebut dalam sampel penelitian. Dengan demikian,
relasi lebih kuat dalam sampel berkemungkinan bahwa relasi
yang berkorespondensi dalam populasi itu sesungguhnya
kurang kuat. Dapat diamati bahwa, besar (kekuatan) dan
signifikansi relasi adalah berhubungan, dan peneliti dapat
menghitung signifikansi kekuatan hubungan dan sebaliknya,
yakni signifikansi relasi dan kekuatannya berhubungan
sehingga peneliti dapat menghitung taraf signifikansi relasi.
Namun, hal ini benar hanya apabila ukuran sampel
dipertahankan tetap, karena hubungan dari kekuatan relasi
yang diperoleh dapat bersignifikansi tinggi atau tidak
signifikan sama sekali, tergantung pada ukuran sampel.
Pelajari paragraf berikut.
2. Signifikansi Relasi dan Ukuran Sampel
Apabila ada beberapa pengamatan, maka terdapat
pula dari masing-masing pengamatan tersebut beberapa
kombinasi mungkin atas nilai-nilai variabel dan, dengan
demikian, probabilitas memperoleh peluang secara kebetulan
untuk kombinasi dari nilai-nilai itu yang menunjukkan
kekuatan hubungan adalah relatif tinggi.
Perhatikan ilustrasi berikut. Jika kajian dalam dua
variabel (Gender: laki-laki/perempuan dan Keterampilan
Berhitung:tinggi/rendah), dan hanya ada empat (4) subjek
dalam sampel (dua laki-laki dan dua perempuan), maka
probabilitas bahwa akan mendapatkan yang benar-benar
secara kebetulan sebesar 100% hubungan antara dua variabel
itu mungkin sebesar satu per delapan (1/8). Secara khusus,

| 71
Statistik Dengan Pendekatan Matematik

ada satu dalam delapan kesempatan bahwa kedua laki-laki


tersebut memiliki keterampilan berhitung adalah tinggi dan
kedua perempuan memiliki keterampilan berhitung yang
rendah, atau sebaliknya. Perhatikan probabilitas memperoleh
pemasangan sempurna seperti itu adalah secara kebetulan
apabila sampel terdiri atas 100 subjek; dan probabilitas
memperoleh hasil serupa secara kebetulan secara praktis akan
sama dengan nol (0).
Contoh yang lebih umum adalah terkait teori populasi
dimana rata-rata keterampilan berhitung laki-laki dan
perempuan tepat sama. Tanpa perlu menyatakan bahwa, jika
kita mulai pengulangan eksperimen sederhana dengan cara
menggambarkan pasangan-pasangan sampel (dari laki-laki
dan perempuan) dengan ukuran tertentu dari populasi dan
menghitung perbedaan antara rata-rata keterampilan
berhitung dalam masing-masing pasangan sampel, sebagian
besar eksperimen akan memberikan hasil mendekati 0.
Namun, dari waktu ke waktu, satu pasangan sampel akan
diambil dimana perbedaan antara laki-laki dan perempuan
akan sangat berbeda dari 0. Seberapa sering peristiwa itu
terjadi? Ukuran sampel lebih kecil dalam setiap eksperimen
tentulahakan diperoleh kesalahan-kesalahan hasil, dimana
dalam hal ini hasil akan menunjukkan keberadaan hubungan
antara Gender dan Keterampilan Berhitung yang diperoleh
dari populasi dimana relasi seperti itu tidak akan ada.
Perhatikan contoh lain yakni dari penelitian mengenai
penalaran statistik. Ada dua Sekolah Menengah Pertama
(SMP): di SMP pertama, 120 siswa belajar matematika
sebagai tambahan setiap hari; di SMP kedua, hanya 12 siswa.
Berdasarkan rata-rata, rasio siswa laki-laki terhadap
perempuan yang belajar matematika setiap hari dalam
masing-masing SMP adalah 50/50. Akan tetapi, satu hari, di
satu SMP itu, dua kali siswa perempuan lebih banyak belajar

| 72
Statistik Dengan Pendekatan Matematik

daripada siswa laki-laki. Di SMP mana kejadian itu lebih


mungkin terjadi? Jawabannya jelas untuk ahli statistik, tetapi
penelitian menunjukkan, tidak begitu jelas untuk letak siswa,
tetapi lebih mungkin terjadi di SMP yang lebih kecil.
Alasannya secara teknis sederhana saja, probabilitas deviasi
acak dari ukuran tertentu (dari rata-rata populasi) berkurang
dengan bertambahnya ukuran sampel.
3. Relasi Kecil Signifikan dalam Sampel Besar
Contoh yang disajikan terdahulu menunjukkan bahwa
apabila suatu hubungan antara variabel "sesungguhnya" kecil
(yakni dalam populasi), maka tidak ada cara mengidentifikasi
relasi seperti itu dalam suatu studi kecuali sampel penelitian
yang terkait adalah besar. Bahkan apabila sampel penelitian
sesuai fakta, yakni"terwakilkan secara sempurna," maka
pengaruhnya tidak akan signifikan secara statistik apabila
sampel tersebut kecil. Secara analogis (sejalan), jika suatu
relasi "secara objektif" adalah sangat besar, maka ia dapat
ditemukan bersignifikansi tinggi bahkan dalam suatu studi
berbasis pada sampel yang sangat kecil.
Perhatikan ilustrasi tambahan berikut. Jika satu koin
adalah asimetris dan, sewaktu dilempar, sepertinya lebih
mungkin keluar bagian gambar daripada angka (yakni 60%
dengan 40%), maka sepuluh kali lemparan tidak cukup untuk
meyakinkan kita bahwa koin itu asimetris bahkan jika hasil
yang diperoleh (enam gambar dan empat angka) secara
sempurna adalah bias dari koin itu. Akan tetapi, apakah
bahwa 10 lemparan tidak cukup membuktikannya?
Jawabannya adalah tidak, karena, jika pengaruh hubungan
lemparan dan keasimetrisan cukup besar, maka sepuluh
lemparan sangat cukup. Misal, bayangkan bahwa koin benar-
benar asimetris meski bagaimana pun dilempar, hasil
mungkin saja gambar. Jika koin tersebut dilempar sepuluh
kali dan masing-masing lemparan muncul gambar, maka

| 73
Statistik Dengan Pendekatan Matematik

sebagian besar orang akan memandangnya sebagai kejadian


yang cukup bahwa ada yang salah pada koin itu. Dengan
perkataan lain, dapat dipandang sebagai kejadian meyakinkan
bahwa dalam teori populasi mengenai pelemparan koin
secara tak terbatas, akan muncul gambar lebih banyak
daripada angka. Dengan demikian, jika suatu relasi adalah
besar, maka dapat ditemukan signifikansinya bahkan dalam
sampel kecil.
4. "Tidak terdapat Hubungan" dan Hasil yang
Signifikan
Relasi lebih kecil antara variabel-variabel dan ukuran
sampel lebih besar perlu dibuktikan signifikansi relasi
tersebut. Sebagai contoh, bayangkan berapa banyak lemparan
diperlukan untuk membuktikan bahwa satu koin adalah
asimteris apabila biasanya hanya 0,000001%! Oleh karena
itu, ukuran sampel minimum perlu ditambah dikaitkan
dengan menurunnya pengaruh yang ditunjukkan. Apabila
ukuran pengaruh mendekati 0, maka ukuran sampel yang
diperlukan untuk membuktikannya secara meyakinkan adalah
mendekati tak hingga atau tak terbatas. Maksudnya, jika
hampir tidak terdapat hubungan antara dua variabel, maka
ukuran sampel haruslah sama dengan ukuran populasi, yang
diasumsikan besar secara tak terbatas. Signifikansi statistik
menyajikan probabilitas bahwa hasil yang sama akan
diperoleh jika kita menguji keseluruhan populasi. Jadi, setiap
sesuatu yang akan ditemukan setelah pengujian seluruh
populasi adalah, berdasarkan definisi, signifikan pada taraf
kemungkinan paling tinggi, termasuk semua hasil-hasil "tak
berhubungan".

H. Mengukur KekuatanHubungan antara Variabel


Terdapat banyak cara mengukur kekuatan (besar)
hubungan antara variabel yang dikembangkan ahli statistik.

| 74
Statistik Dengan Pendekatan Matematik

Pilihan ukuran dalam suatu keadaan yang diberikan


tergantung pada banyak variabel yang terlibat, skala
pengukuran yang digunakan, kewajaran hubungan, dan
lainnya. Hampir semuanya mengikuti prinsip umum, yakni
bahwa metode mengukur besar adalah mengamati hubungan
dengan cara membandingkan hubungan tersebut dengan
"hubungan maksimum yang dapat dibayangkan" antara
variabel-variabel yang diamati.
Secara teknis, cara umum mengevaluasinya adalah
melihat bagaimana nilai-nilai yang dapat dibedakan
merupakan variabel, dan kemudian menghitung bagian-
bagian dari "keseluruhan perbedaan yang ada" yang
merupakan keadaan menentukan apabila perbedaan itu adalah
"biasa/umum" pada dua (atau lebih) variabel. Sedikit agak
teknis, dibandingkan "apa yang umum dalam variabel-
variabel itu" dengan "apa yang secara potensial menjadi
umum apabila variabel-variabel tersebut berhubungan secara
sempurna".
Perhatikan ilustrasi sederhana berikut. Misalkan
dalam suatu sampel penelitian, rata-rata indeks Keterampilan
Berhitung adalah 100 pada laki-laki dan 102 pada
perempuan. Dengan demikian, dapat dinyatakan bahwa
berdasarkan rata-rata, simpangan (deviation) masing-masing
skor individu dari rata-rata keseluruhan (grand mean) yakni
101 yang memuat komponen atas gender dari subjek. Ukuran
dari komponen ini adalah 1. Nilai itu menyajikan beberapa
ukuran relasi antara Gender dan Keterampilan. Akan tetapi,
nilai tersebut merupakan ukuran paling lemah karena tidak
menjelaskan secara relatif mengenai berapa besar komponen
itu berkonstribusi terhadap "keseluruhan perbedaan" dari skor
keterampilan berhitung. Perhatikan dua kemungkinan ekstrim
berikut.

| 75
Statistik Dengan Pendekatan Matematik

1. Jika semua skor keterampilan berhitung laki-laki tepat


sama dengan 100 dan perempuan sama dengan 102,
maka semua penyimpangan dari rata-rata keseluruhan
dalam sampel seluruhnya ditentukan oleh gender. Kita
dapat mengatakan bahwa dalam sampel itu, gender
berkorelasi sempurna dengan keterampilan berhitung,
yakni, 100% dari perbedaan teramati antara subjek
berkenaan dengan keterampilan berhitung adalah
menurut gender.
2. Jika skor keterampilan berhitung berada dalam rentang
0-1000, perbedaan yang sama (dari 2) antara rata-rata
keterampilan berhitung laki-laki dan perempuan yang
ditemukan dalam studi akan berperan sebagai bagian
kecil dari keseluruhan perbedaan skor yang paling
mungkin dan adalah akan kecil untuk dipertimbangkan.
Sebagai contoh, satu lagi subjek yang berperan akan
berubah, atau bahkan berkebalikan arah dari perbedaan
itu. Karena itu, setiap ukuran relasi yang baik antara
variabel-variabel haruslah berperan terhadap perbedaan
keseluruhan dari skor individu dalam sampel dan menilai
hubungan itu berdasarkan (secara relatif) seberapa besar
dari perbedaan ini berperan sebagai suatu bentuk relasi.

I. Format Umum Uji-Uji Statistik


Karena tujuan akhir dari sebagian besar uji statistik
adalah mengevaluasi hubungan antara variabel-variabel,
maka sebagian besar uji statistik mengikuti prinsip umum
sebagaimana telah dijelaskan. Secara teknis, uji-uji statistik
menyajikan rasio dari beberapa ukuran umum mengenai
perbedaan dalam variabel terhadap keseluruhan perbedaan
dari variabel-variabel itu.
Sebagai contoh adalah penyajian rasio sebagian dari
keseluruhan perbedaan skor keterampilan berhitung yang

| 76
Statistik Dengan Pendekatan Matematik

dapat diperankan oleh gender terhadap keseluruhan skor


keterampilan. Rasio ini secara umum dinamakan rasio variasi
yang dijelaskan terhadap variasi total. Dalam statistik, istilah
variasi yang dijelaskan tidak secara perlu berimplikasi
sebagai "pemahaman secara konseptual". Istilah tersebut
hanya digunakan untuk menandakan variasi umum dalam
variabel, yakni, bagian dari variasi dalam satu variabel yang
"dijelaskan" menggunakan nilai tertentu dari variabel lain,
dan sebaliknya.

J. Menghitung Taraf Signifikansi Statistik


Asumsikan bahwa sudah ada perhitungan ukuran
relasi antara dua variabel. Pertanyaan selanjutnya adalah
"berapa besar taraf signifikansi relasi itu? "Sebagai contoh,
apakah 40% dari varians yang dijelaskan antara dua variabel
cukup untuk mempertimbangkan bahwa suatu relasi adalah
signifikan? Jawabannya adalah "tergantung". Secara khusus,
signifikansi terutama tergantung pada ukuran sampel. Dalam
sampel sangat besar, relasi sangat kecil pun akan signifikan,
sedangkan dalam sampel sangat kecil, relasi sangat besar
tidak dapat dipandang reliabel (signifikan). Jadi, untuk
menentukan taraf signifikansi statistik, diperlukan fungsi
yang menyajikan hubungan antara "besar" dan "signifikansi"
relasi antara dua variabel, yang tergantung pada ukuran
sampel.
Fungsi sebagaimana dimaksud adalah yang
menjelaskan secara tepat "bagaimana kemungkinan
mendapatkan relasi besar hubungan yang diberikan (atau
lebih besar) dari suatu sampel dengan ukuran yang diberikan,
dan asumsikan bahwa tidak ada relasi seperti itu antara
variabel-variabel dalam populasi". Dengan perkataan lain,
fungsi itu akan memberikan taraf signifikansi (p), dan akan
menjelaskan probabilitas kesalahan yang terlibat dalam

| 77
Statistik Dengan Pendekatan Matematik

menolak hipotesis bahwa tidak terdapat relasi dalam


populasi.
Hipotesis "alternatif" tersebut (yakni tidak terdapat
hubungan dalam populasi) biasanya dinamakan hipotesis
nol(null hypothesis). Akan menjadi ideal apabila fungsi
probabilitas adalah linear, yakni hanya ada kemiringan
berbeda untuk ukuran-ukuran sampel berbeda. Sayangnya,
fungsi tersebut sangat rumit dan tidak selalu tepat sama.
Namun dalam banyak kasus dapat diketahui bentuknya dan
dapat digunakan untuk menentukan taraf signifikansi pada
temuan dalam sampel berukuran tertentu. Sebagian besar dari
fungsi-fungsi yang dimaksud berhubungan dengan jenis
umum dari fungsi, yakni dinamakan fungsi normal.

K. Distribusi Normal
Distribusi normal memang penting karena, dalam
banyak kasus, sebaran tersebut paling baik mendekati fungsi
sebagaimana diuraikan secara singkat pada bagian J (uraian
lebih lanjut pada Bab tersendiri dalam buku ini). Kepentingan
distribusi normal dari banyak uji statistik adalah karena
sebaran data adalah mengikuti fungsi normal atau mengikuti
beberapa bentuk yang dapat diturunkan dari distribusi
normal. Secara filosofis, distribusi normal menyajikan satu
dari verifikasi dasar peristiwa empiris yakni, "kebenaran atas
dasar kewajaran umum dari realita," dan kedudukannya dapat
dibandingkan dengan hukum-hukum dasar mengenai ilmu
pengetahuan alam. Bentuk tepat dari distribusi normal (ciri
"kurva lonceng") didefinisikan sebagai suatu fungsi yang
hanya mempunyai dua parameter, yakni: rata-rata dan standar
deviasi.
Sifat khusus distribusi normal adalah bahwa 68% dari
semua observasi berada dalam rentang ±1 standar deviasi dari
rata-rata, dan rentang ±2 standar deviasi memuat 95% dari

| 78
Statistik Dengan Pendekatan Matematik

skor. Dengan perkataan lain, dalam distribusi normal,


pengamatan dimana nilai-nilai standar kurang dari -2 atau
lebih dari +2 memiliki frekuensi relatif sebesar5% atau
kurang. Nilai standar bermakna bahwa suatu nilai yang
dinyatakan berdasarkan perbedaannya dari rata-rata, dibagi
standar deviasi.
Nilai standar ini dinamakan pula nilai Z (yakni nilai
yang distandarkan/dibakukan). Beberapa alat distribusi data,
misalnya Kalkulator Probabilitas dapat digunakan untuk
menampilkan nilai baku Z. Misalnya, nilai baku Z dari 4,
probabilitasnya kurang dari 0,0001, karena dalam distribusi
normal hampir semua pengamatan (yakni, lebih dari 99.99%)
berada dalam rentang ±4 standar deviasi. Pelajari uraian
berikut.
1. Distribusi Normal dan Penalaran Statistik (Induksi)
Perhatikan kembali contoh yang telah didiskusikan,
yakni pasangan-pasangan sampel laki-laki dan perempuan
yang diambil dari suatu populasi dimana nilai rata-rata
keterampilan laki-laki dan perempuan adalah tepat sama.
Walaupun hasil paling mungkin dari eksperimen tersebut
(satu pasang dari sampel setiap eksperimen) adalah bahwa
perbedaan rata-rata keterampilan berhitung laki-laki dan
perempuan dalam masing-masing pasangan mendekati nol,
dari waktu ke waktu, satu pasang sampel akan ditarik dimana
perbedaan antara laki-laki dan perempuan sangat berbeda dari
0. Seberapa sering hal ini terjadi?
Jika ukuran sampel cukup besar, maka hasil dari
pengulangan adalah "berdistribusi normal". Dengan
mengetahui bentuk kurva normal, secara tepat dapat dihitung
probabilitas memperoleh hasil "secara kebetulan" yang
menyajikan berbagai taraf penyimpangan dari rata-rata
populasi hipotetis dari 0. Jika probabilitas yang dihitung
sangat kecil dibandingkan kriteria signifikansi statistik yang

| 79
Statistik Dengan Pendekatan Matematik

diterima sebelumnya, maka hanya ada satu pilihan, yakni:


menyimpulkan bahwa hasilnya memberikan pendekatan lebih
baik mengenai apa yang terjadi pada populasi daripada
"hipotesis nol" (hipotesis nol hanya dipandang merupakan
"alasan teknis" sebagai benchmark menghadapi hasil empiris
yang dievaluasi). Perhatikan bahwa seluruh alasan tersebut
berdasarkan asumsi bahwa bentuk distribusi dari "replikasi"
(secara teknis, "distribusi sampling") adalah normal. Asumsi
ini diuraikan pada alinea bagian 2 berikut.
2. Uji Statistik dan Distribusi Normal
Tidak semua, tetapi sebagian besar uji statistik adalah
salah satu, berbasis pada distribusi normal secara langsung
atau pada distribusi yang berhubungan dengan dan dapat
diturunkan dari distribusi normal, misalnya, Uji-t, Uji-F, atau
Kai-Kuadrat (Chi-square). Secara khusus, uji-uji tersebut
mensyaratkan bahwa variabel yang dianalisis adalah
berdistribusi normal dalam populasi, yaknimemenuhi "asumsi
normalitas". Terdapat banyak variabel penelitian yang
apabila diamati sebenarnya berdistribusi normal. Hal ini juga
menjadi alasan lain mengapa distribusi normal menyajikan
"ciri umum" dari realita empiris.
Perhatikan dan kaji bahwa ada masalah yang mungkin
muncul sewaktu peneliti mencoba menggunakan uji berbasis
distribusi normal untuk menganalisis data dari variabel-
variabel yang tidak berdistribusi normal (kajian uji normalitas
dalam Nonparametrik atau ANOVA/MANOVA). Dalam
kasus seperti ini, ada dua pilihan umum, sebagai berikut.
Pertama, digunakan beberapa pilihan uji "nonparametrik"
(atau dinamakan pula sebagai "uji bebas distribusi"). Namun
pilihan tersebut seringkali merepotkan karena uji bebas
distribusi secara khusus kurang kuat dan kurang luwes
ditinjau dari simpulan yang dapat diberikan. Sebagai
alternatif, dalam banyak kasus peneliti dapat menggunakan

| 80
Statistik Dengan Pendekatan Matematik

uji berbasis distribusi normal apabila diyakini bahwa ukuran


sampel cukup besar.
Kedua adalah uji berbasis pada suatu prinsip umum ekstrim
bahwa ukuran sampel yang besar memerlukan uji-uji berbasis
pada fungsi normal. Dalam hal ini, apabila ukuran sampel
bertambah, bentuk distribusi sampling (yakni, distribusi
statistik dari sampel) mendekati bentuk normal, meskipun
distribusi variabel tidak normal.
Namun, apabila ukuran sampel (dari sampel-sampel
yang digunakan untuk membuat distribusi sampling dari rata-
rata) bertambah, maka bentuk distribusi sampling menjadi
normal. Pelajarilah bahwa untuk n = 30, bentuk distribusi
"hampir" normal sempurna. Prinsip ini dinamakan teorema
limit pusat (central limit theorem).
3. Pelanggaran Asumsi Normal
Walaupun banyak pernyataan telah dibuat dalam
uraian Bab-2 ini dapat dibuktikan secara matematika,
beberapa diantaranya tidak mempunyai bukti teoritis dan
hanya dapat ditunjukkan secara empiris, melalui eksperimen
Monte-Carlo. Dalam eksperimen yang dimaksud, sampel
berukuran besar dibangun menggunakan komputer yang
mengikuti spesifikasi rancangan awal, dan hasil dari sampel
tersebut dianalisis menggunakan berbagai uji. Cara ini dapat
mengevaluasi secara empiris jenis dan besar kesalahan atau
bias yang terekspos sewaktu asumsi teoritis tertentu dari uji
yang sedang digunakan tidak sesuai data.
Secara khusus, studi-studi Monte-Carlo yang
digunakan secara luas dengan uji berbasis distribusi normal
adalah untuk menentukan seberapa peka uji tersebut terhadap
pelanggaran dari asumsi distribusi normal dari variabel yang
dianalisis dalam populasi. Simpulan umum dari studi tersebut
adalah bahwa akibat dari pelanggaran sebagaimana
teridentifikasi adalah tidak begitu jelas dibandingkan

| 81
Statistik Dengan Pendekatan Matematik

pemikiran sebelumnya. Walaupun simpulan haruslah secara


keseluruhan mengingatkan peneliti (orang yang melakukan
studi) dari fokus pada asumsi normal, studi tersebut telah
meningkatkan seluruh popularitas uji statistik yang
bergantung distribusi dalam semua area penelitian.

LATIHAN 2
1. Tuliskan lima (5) contoh variabel penelitian.
2. Tuliskan dua (2) variabel dalam penelitian korelasional.
Jelaskan!
3. Tuliskan dua (2) variabel dalam penelitian
eksperimental. Jelaskan!
4. Tuliskan dua (2) variabel penelitian dimana satu
merupakan variabel bebas dan yang lain adalah variabel
terikat.
5. Tuliskan masing-masing lima (5) variabel nominal,
ordinal, interval dan rasio. Jelaskan!
6. Apa yang dimaksud ”hubungan antar variabel”. Jelaskan!
7. Apa yang dimaksud ”signifikansi statistik”. Jelaskan!
8. Apa yang dimaksud ”fungsi normal”. Jelaskan!
9. Berikut adalah daftar atribut berbeda dan aturan untuk
memasangkan bilangan dengan objek-objek. Coba
klasifikasikan sistem pengukuran berbeda ke dalam satu
dari empat jenis skala.
a. Numor rekening sebagai nama untuk rekening.
b. Keseimbangan rekening sebagai ukuran banyak uang
pada rekening itu.
c. Keseimbangan rekening sebagai ukuran of your
wealth.
d. Bilangan yang diperoleh dari mesin (32, 33, ...)
sebagai ukuran waktu seseorang antri.

| 82
Statistik Dengan Pendekatan Matematik

e. Urutan dimana dimana seseorang yang hilang


mengucapkan ”kan” sebagai ukuran kemampuan
melafalkan.
f. Skor pada ujian statistik pertama sebagai ukuran
pengetahuan statistik seseorang.
g. Skor pada tes kecerdasan sebagai ukuran kecerdasan.
h. The distance around your forehead measured with a
tape measure as a measure of your intelligence.
i. Respon terhadap pernyataan "Pilihan politik adalah
hak asasi seseorang" dimana "Sangat Tidak Setuju" =
1, "Tidak Setuju" = 2, "Tidak Berpendapat" = 3,
"Setuju" = 4, dan "Sangat Setuju" = 5, sebagai ukuran
sikap seseorang terhadap pilihan politik sebagaimana
dimaksud.

| 83
Statistik Dengan Pendekatan Matematik

BAB III
MENYARIKAN DAN MENYAJIKAN DATA

B
ab-3 ini memuat sebagian dari uraian pada
Bab-2 dalam rangka mengingatkan kembali
beberapa terminologi dalam statistika.
Beberapa uraian yang diulang antara lain terkait dengan data
serta beberapa ukuran sebaran data.

A. Menyarikan Data
Uraian mengenai penyarian data diawali pengertian
mengenai variabel sebagaimana telah disinggung juga pada
Bab-2. Uraian mengenai variabel sebaiknya berawal dari
pengertian variabel dimana selanjutnya akan dapat dipahami
data variabel serta kedudukan suatu variabel, yakni bebas
atau terikat.
1. Jenis Variabel
Secara umum, variabel merupakan item data yang
dikumpulkan pada setiap satuan penarikan sampel. Dikenal
pula istilah variabel acak yang biasa dinamakan variat. Variat
merupakan pengambilan nilai berbeda sesuai probabilitas
sebaran. Kuantitas-kuantitas seperti gender dan berat badan
misalnya dinamakan variabel, karena nilai yang dimaksud
berubah-ubah dari suatu pengamatan ke pengamatan lain.
Terdapat dua jenis variabel, yakni:
(a) Variabel kualitatif, yakni merupakan pengambilan data
berciri diskrit atau berupa angka atau sering pula
dinamakan variabel kategori. Variabel ini dapat berjenis
ordinal atau nominal. Jenis variabel kualitatif berciri
ordinaldigunakan apabila terdapat urutan dari data yang
diambil. Misalnya hasil-hasil ujian dan status sosial-
| 84
Statistik Dengan Pendekatan Matematik

ekonomi. Sedangkan ciri nominaladalah apabila pada


data yang diamati atau diambil tidak terdapat urutan
antara kategori, misalnya gender. Contoh variabel
kualitatif antara lain adalah: gender, yakni pria atau
perempuan; hasil ujian, misalnya lulus atau gagal; dan
status sosial–ekonomi, yakni miskin, menengah atau
kaya.
(b) Variabel kuantitatif, yakni merupakan jenis variabel
berciri numerik atau berupa bilangan. Variabel ini juga
ada yang diskritatau kontinu. Data variabel ini diambil
melalui pengukuran dalam bentuk perhitungan-
perhitungan. Contoh variabel kuantitatif antara lain
adalah: banyak siswa di beberapa sekolah dimana
pengamatannya adalah diskrit; banyak batang tanaman
yang ditebang per hari juga merupakan data diskrit; dan
berat badan (sebarang nilai, biasanya dalam suatu
rentang), merupakan data kontinu.
Bilangan-bilangan yang dihitung (atau diperoleh)
untuk menggambarkan ciri penting dari data dinamakan
statistik.

Contoh statistik:
1. Proporsi perempuan dalam suatu sampel penduduk di
suatu wilayah, misalnya p = 0,2. Statistiknya adalah 0,2
dimana p adalah nama/istilah/konsep atau ukuran
sebaran data.
2. Misalkan ada 10 data : 6, 7, 5, 8, 8, 6, 4, 9, 7, 4. Rata-
ratanya = (4 + 4 + 5 + 6 + 6 + 7 + 7 + 8 + 8 + 9)/10 =
6,4. Artinya ukuran statistik tertentu dari sepuluh data
tersebut adalah 6,4 sedangkan rata-rata adalah suatu
konsep.
3. Rata-rata usia sekolah dalam suatu sampel penduduk di
suatu wilayah juga merupakan statistik.

| 85
Statistik Dengan Pendekatan Matematik

Perhatikan Tabel 3.1 berikut, yakni sebaran sebagian


dari beberapa data (hipotetik) pada suatu sampel dengan 48
subjek.

Tabel 3.1. Sebaran Data Hipotetik

Penghasilan
No Kelompok
Usia (tahun) Tahunan Gender
Subjek Usia
(10 juta)
1 32 3 4,1 P
2 20 2 1,5 L
3 45 4 2,3 P
. . . . .
. . . . .
. . . . .
47 19 1 0,5 P
48 32 3 1,9 P

1. 'Usia' dan 'penghasilan' merupakan variabel numerik


kontinu,
2. 'kelompok usia' merupakan variabel kualitatif berciri
ordinal,
3. 'gender' adalah variabel kualitatif.

Variabel kualitatif ordinal, yakni 'kelompok usia'


dapat dibuat dari variabel kontinu 'usia' menggunakan lima
kategori, misalnya:
a. kelompok usia = 1 apabila usia <20 tahun;
b. kelompok usia= 2 apabila usia adalah dari 20 sampai
dengan 29 tahun;
c. kelompok usia = 3 jika usia adalah dari 30 hingga 39
tahun;
d. kelompok usia = 4 jika usia adalah dari 40 hingga 49
tahun;
e. kelompok usia = 5 untuk usia 50 tahun atau lebih (≥ 50
tahun.

| 86
Statistik Dengan Pendekatan Matematik

B. Menyajikan Data Diskrit


1. Data diskrit (kualitatif atau kuantitatif) diperoleh dengan
menghitung banyak pengamatan pada masing-masing
kategori.
2. Bilangan yang terkait dengan masing-masing kategori
dinamakan frekuensi.
3. Himpunan frekuensi atas masing-masing kategori yang
disajikan ke dalam tabel distribusi frekuensidan
merupakan cara efektif sederhana untuk menyarikan data
diskrit dinamakan variabel. (ingat-ingat mengenai cases
dan variable sewaktu menggunakan SPSS).
4. Frekuensi relatif merupakan suatu bilangan yang
menggambarkan proporsi dari pengamatan pada
kategori.
5. Hasil tabulasi dalam tabel frekuensi menunjukan
frekuensi dan frekuensi relatif atau persentase.
Selanjutnya diperlihatkan beberapa model penyajian
data diskrit, sebagai berikut.
1. Penyajian menggunakan tabel
Misalnya kita mengamati model pembelajaran yang
digunakan 1664 guru di suatu wilayah. Hasilnya disajikan
seperti tabel berikut.
Tabel.3.2
Distribusi Frekuensi Penerapan Model Pembelajaran

Model Pembelajaran Frekuensi Frekuensi Relatif Persentase


A – Model A 16 0.0096 1%
B – Model B 17 0.0102 1%
C – Model C 132 0.0793 8%
D – Model D 95 0.0571 6%
E – Model E 87 0.0523 5%
F – Model F 984 0.5913 59 %
G – Model G 15 0.0090 1%
H – Model H 303 0.1821 18 %
I – Model I 15 0.0090 1%
Total 1664 0.9999* 100%
(* frekuensi relatiftidak berjumah 1,0000 karena pembulatan).

| 87
Statistik Dengan Pendekatan Matematik

2. Penyajian menggunakan Diagram Batang (Bar


Chart/Bar Diagram)
Distribusi frekuensi dari suatu variabel seringkali
disajikan menggunakan grafik, misalnya diagram
batang.Sebagai contoh, data pada Tabel3.2 dapat ditunjukkan
sebagai berikut.
Contoh 1:
Diagram batang yang menunjukkan persentase guru yang
menggunakan berbagai Model Pembelajaran.

Gambar 3.1
Diagram Batang Persentase Penggunaan
Model Pembelajaran Di Suatu Wilayah

Skala pada sumbu vertikal (sumbu-y) dapat


merupakan frekuensi atau frekuensi relatif atau persentase.
Pada sumbu horizontal: (1) semua batang harus sama lebar;
(2) antara batang terpisah karena tidak terdapat saling
hubungan; dan (3) diagram batang dapat disusun secara
berurutan.
3. Penyajian data menggunakan Diagram Pareto
Diagram/Carta Pareto digambarkan yakni setelah
disusun ulang batang-batang pada diagram batang menurut
urutan kepentingan–mulai dengan kategori berfrekuensi
tertinggi, seperti berikut.
| 88
Statistik Dengan Pendekatan Matematik

1200

Percent
1000
984

50
800

600

400 25

303
200

132
95 87
0 0
F H C D E B A G I

Kategori Model Pembelajaran

Gambar. 3.2
Diagram Pareto Frekuensi Penggunaan Model Pembelajaran

4. Penyajian data menggunakan Diagram Garis


Diagram garis merupakan cara mendeskripsikan dua
bagian informasi yang berhubungan. Bilangan pada sisi-sisi
diagram dinamakan skala. Contoh, amati dan pelajari
diagram garis berikut.

Gambar 3.3
Diagram Garis Sebaran Data Tahun dan Berat Badan

5. Penyajian data menggunakan Diagram Lingkaran


Diagram Lingkaran menampilkan ukuran bagian-
bagian yang membentuk lingkaran secara utuh. Bagian-
bagian dari diagram lingkaran dapat dinyatakan dalam bentuk

| 89
Statistik Dengan Pendekatan Matematik

pecahan, satuan sebenarnya atau persen. Berikut adalah satu


contoh diagram lingkaran dalam bentuk persen.

Gambar 3.4
Diagram lingkaran dan bagiannya dalam persen

C. Menyajikan Data Kontinu


Distribusi frekuensi variabel kuantitatif kontinu dapat
dikonstruksi dengan cara yang sama yakni mengelompokan
pengamatan-pengamatan. Maksudnya, dengan cara memilih
suatu himpunan interval tak tumpang tindih, yang dinamakan
kelas interval, pengamatan dapat dikelompokkan untuk
membentuk variabel diskrit dari variabel kontinu. Penyajian
data kontinu antara lain adalah sebagai berikut.
1. Histogram
Diagram yang menunjukan distribusi frekuensi dari
variabel kontinu adalah pada statistik deskriptif dan
dinamakan histogram. Berbeda dengan diagram batang,
histogram digambarkan tanpa jarak antara batang-batangnya
karena sumbu-x digunakan untuk meletakkan interval-
interval kelas, yang merupakan ciri penting dari distribusi
frekuensi itu.

| 90
Statistik Dengan Pendekatan Matematik

Tabel 3.3
Distribusi Frekuensi Harga Mobil Bekas
Harga Ribu Frekuensi
Frekuensi
Rupiah Frekuensi Kumulatif
Tally Frekuensi kumulatif
(kelas Relatif Kurang
lebih dari
interval) Dari
2000 – 4999 //// / 6 0,16 0 38
5000 – 7999 //// // 7 0,18 6 32
8000 – 10999 //////// // 13 0,34 13 25
11000 – 13999 //// 5 0,13 26 12
14000 – 16999 //// 4 0,11 31 7
17000 – 19999 / 1 0,03 35 3
20000 atau
// 2 0,05 36 2
lebih
38 1,00 38

Histogram dari sebaran data Tabel 3.3 adalah sebagai


berikut.

Gambar 3.5
Histogram Distribusi Frekuensi Harga Mobil Bekas

Dalam membuat histogram, perhatikan bahwa:


a. Gambarlah persegipanjang untuk masing-masing interval
sehingga luasnya = frekuensi (atau frekuensi relatif).
b. Luas = panjang interval x tinggi, dengan demikian
apabila semua interval sama panjang, misalkan L maka
luas frekuensi
tinggi   .
panjang L

| 91
Statistik Dengan Pendekatan Matematik

c. Tinggi persegipanjang adalah proporsional secara


langsung terhadap frekuensi saja apabila semua interval
sama panjang.
d. Pada histogram tersebut, interval "20.000 atau lebih"
diubah menjadi empat interval untuk memperoleh titik
(nilai) ujung akhir dan sama panjang semua intervalnya,
yaitu sebagai berikut.
20.000 – 22.999
23.000 – 25.999
26.000 – 28.999
29.000 – 31.999
e. Jika interval tidak sama panjang maka tinggi harus di-
skala-kan sehingga masing-masing luas adalah
proporsional terhadap frekuensi untuk interval itu.
2. Stem-and-Leaf
Harga Stem-and-Leaf Plot digambarkan sebagai
berikut.
Frequency Stem & Leaf
6.00 0 . 234444
18.00 0 . 555667788999999999
7.00 1 . 0011223
4.00 1 . 5568
1.00 2. 0
1.00 Extremes (>=29500)
Stem width: 10000
Each leaf: 1 case(s)

3. Dotplots
Suatu histogram mengelompokkan data hanya ke
dalam beberapa interval.Suatu dotplot mengelompokkan data
sekecil mungkin.Dotplot lebih bermanfaat pada himpunan
data kecil. Dotplot berguna apabila kita akan
membandingkan dua atau lebih himpunan data. Terhadap

| 92
Statistik Dengan Pendekatan Matematik

himpunan yang lebih besar dari data, kelompokkan data


tersebut dan gambar histogramnya.
Contoh - Data harga buku dari penerbit

harga

Gambar 3.6
Dotplot Data Harga Buku Dari Penerbit

4. Boxplots
40000

30000 19

20000

10000

0
N = 38

Frekuensi Penampilan

Gambar 3.7
Boxplot data Harga Buku Dari Penerbit

D. Distribusi Frekuensi
Perhatikan masing-masing satu contoh Tabel
Distribusi Frekuensi Numerik dan Distribusi Frekuensi
Kategori berikut.
Tabel 3.4
Dua Contoh Distribusi Frekuensi

Kelas Nilai Ujian Frekuensi No Kategori Frekuensi


1 0,00 – 19,99 3 1 Anak-anak 30
2 20,00 – 39,99 10 2 Gadis 35
3 40,00 – 59,99 20 3 Bersuami 25
4 60,00 – 79,99 12 4 Janda 10
5 80,00 – 99,99 5 Total 100
Total 50

| 93
Statistik Dengan Pendekatan Matematik

Cara atau langkah membuat tabel distribusi frekuensi


dari data yang dikelompokkan adalah sebagai berikut:
1. Pada penelitian bidang sosial, banyak kelas interval
biasanya 6 sampai 15 atau pada rentang : 6 ≤ k ≤ 15,
dimana banyak kelas interval dinotasikan menggunakan
huruf k. Secara umum, k dihitung menggunakan Aturan
Sturges : k = 1 + 3,3 log n, n adalah banyak data atau
pengamatan dalam kumpulan data (sampel). Apabila k
tidak bulat, maka bulatkanlah ke atas atau ke bawah.
2. Panjang (aproksimasi) masing-masing kelas interval
diperoleh dari hasil bagi range (R) dengan banyak kelas
interval. R, singkatan dari Range (Rentang atau
Jangkauan) merupakan selisih data/nilai terbesar dengan
terkecil. Panjang Kelas Interval = R/k.
3. Tetapkan nilai ujung akhir kelas interval sehingga tidak
tumpang tindih atau terdapat jarak (yakni interval-
interval tersebut saling lepas dan habis) sehingga
terjamin bahwa setiap pengamatan merupakan anggota
tepat dari satu kelas interval. Ide yang lebih sederhana
adalah bahwa semua interval sama panjang. Kalau
panjang kelas interval tidak sama, diperlukan kehati-
hatian. Suatu pengamatan hendaklah hanya masuk dalam
satu kelas agar tidak tumpang tindih, perhatikan batas-
batas kelas.
4. Hitung banyak dari nilai data pada masing-masing kelas
interval (frekuensi kelas), telusuri data yang ada cukup
satu kali dan gunakan cara atau tanda tally untuk
memudahkan penghitungan.
5. Biasanya frekuensi relatif atau persentase sangat
membantu menunjukan distribusi dari data.
Contoh:
Data-data (setelah diurutkan) dari 150 pengamatan disajikan
sebagai berikut:
| 94
Statistik Dengan Pendekatan Matematik

10 20 25 30 30 35 40 40 45 50 55 59 65 70 80
10 20 25 30 30 35 40 40 45 50 55 59 65 70 80
15 20 25 30 30 35 40 40 45 50 55 60 65 70 80
15 20 25 30 30 35 40 40 45 50 55 60 65 70 85
15 20 25 30 31 36 40 45 47 50 57 60 65 70 85
15 20 25 30 33 40 40 45 47 50 57 60 65 75 85
15 20 25 30 35 40 40 45 47 55 58 60 65 75 90
15 20 25 30 35 40 40 45 48 55 58 61 65 75 90
18 20 25 30 35 40 40 45 48 55 58 62 65 75 90
20 25 30 30 35 40 40 45 49 55 58 63 70 75 95

Apabila data-data tersebut dikelompokkan, salah satu


contoh sebaran datanya disajikan pada tabel berikut:
Tabel 3.5
Sebaran Data Yang Dikelompokkan

No Kelas Interval Frekuensi


1 10 – 19 9
2 20 – 29 20
3 30 – 39 26
4 40 – 49 35
5 50 – 59 22
6 60 – 69 17
7 70 – 79 11
8 80 – 89 6
9 90 – 99 4
Jumlah Pengamatan 150

Dari tabel tersebut dapat digambarkan histogram


seperti gambar berikut ini.

Gambar 3.8
Histogram Sebaran Data Dari Tabel 3.5
| 95
Statistik Dengan Pendekatan Matematik

Contoh-contoh dengan perhitungan:


1. Banyak kelas (k)
a. 6 ≤ k ≤ 15 (terapan)
b. Aturan Sturges: k = 1 + 3,3 log n dengan n adalah
banyak data atau pengamatan dalam kumpulan data.
(Perhatian pembulatan ke atas atau ke bawah)
Contoh: untuk n = 60; log 60 = 1,778; 3,3 log 60 = 3,3
× 1,778 k = 1 + 3,3 log 60 = 1 + (3,3)×(1,778) = 1 +
5,867 = 6,867. Banyak kelas tersebut kemudian
dibulatkan sama dengan 6 atau 7.
Catatan : a log b artinya a kali logaritma b
2. Interval kelas (panjang kelas): hasil bagi R dengan k
a. Range/Rentang (R): selisih data/nilai terbesar dengan
terkecil, untuk 150 pengamatan dari Tabel 3.5
diperoleh R = 95 – 10 = 85.
b. Banyak kelas k = 1 + 3,3 log 150 = 1 + 7,18118 =
8,18118 (gunakan tabel logaritma atau kalkulator atau
komputer atau media lain untuk mendapatkan log
150). Dengan demikian, k terletak antara 8 dan 9.
Ingatlah bahwa kmerupakan bilangan bulat positif
atau bilangan asli.
c. Panjang interval kelas = R/k = 85/8 = 10,625 atau
85/9 = 9,444; atau 85/8,18118 = 10,39. Diambil
panjang kelas 11 atau 10 atau 9.
d. Panjang interval kelas = selisih antara batas atas dan
batas bawah dari suatu kelas.

E. Karakteristik Distribusi Data


Beberapa ciri yang merupakan karakteristik distribusi
frekuensi adalah: modalitas, simetri, ukuran pemusatan
(central tendency) dan variabilitas.

| 96
Statistik Dengan Pendekatan Matematik

1. Modalitas and Simetri


a. Modus
Setiap nilai data dari suatu variabel atau variabel acak
dimana kurva frekuensi atau kurva probabilitas mencapai
paling besar dinamakan suatu modus. Sebagian besar
distribusi dalam praktek (empirik) mempunyai satu data yang
paling banyak muncul dan dinamakan "unimodal". Suatu
distribusi dengan dua data yang paling banyak muncul
dinamakan "bimodal" (dua modus). Modus adalah nilai atau
kategori yang paling sering muncul (frekuensi paling banyak)
jika hanya satu. Apabila beberapa nilai data muncul sama
banyak, semuanya merupakan modus.
Contoh modus data-data tunggal:
a. Usia siswa di suatu sekolah adalah : 5, 9, 1, 3, 4, 6, 6, 6,
7, 3. Bilangan sama yang paling sering muncul adalah 6,
yaitu sebanyak tiga kali. Tidak ada bilangan lain
sebanyak tiga kali. Jadi modus usia siswa tersebut
adalah 6.
b. 2,2,5,6,7,7,7,9,10,11. Modus = 7 karena banyak
bilangan 7 yang muncul sama dengan 3 adalah lebih
banyak daripada kemunculan bilangan yang lain’
c. 1,2,3,4,5,6,7,8,9. Modusnya tidak ada.
d. 5,6,7,8,8,8,10,11,13,13,13,14,15.Modus = 8 dan 13

Modus data dikelompokan (data tersusun) dihitung


menggunakan rumus:
 d1 
Modus = Bb  i  
 1
d  d 2 

Bb : adalah batas bawah kelas modus


adalah selisih antara frekuensi dalam kelas modus
d1 :
dengan frekuensi satu kelas yang mendahului

| 97
Statistik Dengan Pendekatan Matematik

selisih frekuensi dalam kelas modus dengan


d2 : frekuensi satu kelas berikutnya (satu kelas setelah
kelas modus)
i : adalah panjang interval pada kelas modus
Perhatikan contoh-contoh berikut.
Contoh 1:
Tabel 3.6. Distribusi Frekuensi

No Interval Kelas Frekuensi


1 10,00 – 19,99 9
2 20,00 – 29,99 20
3 30,00 – 39,99 26
4 40,00 – 49,99 35
5 50,00 – 59,99 22
6 60,00 – 69,99 17
7 70,00 – 79,99 11
8 80,00 – 89,99 6
9 90,00 – 99,99 4
Jumlah 150

Dari Tabel 3.6, modus berada di kelas ke-4, yaitu


frekuensinya 35, berada dalam rentang data yang paling
banyak muncul. Cara mendapatkan (menghitung) modus dari
sebaran data tersebut adalah sebagai berikut.
1. Kelas ke-4 adalah kelas modus
2. Tentukan batas bawah kelas modus, yakni 39,995
3. Hitung panjang kelas modus, yaknii = 10
4. Hitung d1 = fModus – fsatu kelas sebelum kelas modus = 35 – 26 = 9
5. Hitung d2 = fModus – fsatu kelas sesudah kelas modus = 35 – 22 = 13
6. Jadi modus = 39,995 + 10{(35-26)/(35-26+35-22)}
= 39,995 + 10 {9/22}
= 39,995 + 90/22
= 39,995 + 4,091
= 44,086

| 98
Statistik Dengan Pendekatan Matematik

Contoh 2:
Tabel 3.7. Distribusi Frekuensi

No Kelas Interval Frekuensi


1 10 – 19 9
2 20 – 29 20
3 30 – 39 26
4 40 – 49 35
5 50 – 59 22
6 60 – 69 17
7 70 – 79 11
8 80 – 89 6
9 90 – 99 4
Jumlah 150

Modus = 39,5 + 10 [(35-26)/{(35-26)+ (35-22)}


= 39,5 + 10{9/(9+13)}
= 39,5 + (10×0,409091)
= 39,5 + 4,09091
= 43,59091

b. Simetri
Suatu distribusi dikatakan simetris apabila frekuensi
relatif (atau probabilitas) adalah sama, atau berjarak sama di
sisi lain dari pusat–m. Secara matematik, distribusi X-m
adalah sama seperti distribusi m-X. Rata-rata (mean) dan nilai
tengah (median) dari distribusi simetris adalah sama.
Distribusi simetris yang paling penting adalah
distribusi normal (normal distribution), yang adalah
unimodal dan relatif simetris terhadap modus. Apabila suatu
distribusi adalah unimodal dan simetris, maka rata-rata,
median dan modus semuanya bernilai sama.
Distribusi frekuensi asimetris (tidak simetris) adalah
menceng ke kiri apabila bagian ekor bawah lebih panjang
daripada bagian ekor atas, dan menceng ke kanan sebaliknya,
yaitu ekor atas lebih panjang daripada ekor bawah. Sebaran
| 99
Statistik Dengan Pendekatan Matematik

yang relatif acakdan bernilai positif seringkali menceng ke


kanan.Perhatikan gambar berikut.
Contoh menceng positif Contoh menceng negatif
(menceng ke kanan) (menceng ke kiri)

Gambar 3.9 Kurva Distribusi Frekuensi Asimetris

Porsi ekstrim dari suatu distribusi, dimana frekuensi


relatif menjadi kecil pada salah satu sisi, ke kiri atau ke kanan
dinamakan ekor (tail).

2. Ukuran Pemusatan (Central Tendency) Data-Data


Tunggal
Ukuran kecenderungan pusat merupakan bilangan
yang menunjukan tengah-tengah dari sebaran nilai-nilai data.
Tiga ukuran kecenderungan pusat yang penting adalah
median, modus dan mean.
a. Median (nilai di tengah-tengah)
Median adalah bilangan yang merupakan nilai tengah
dari data-data yang telah diurutkan. Apabila banyak data
ganjil maka median adalah yang tepat di tengah-tengah.
Apabila terdapat sebanyak genap data, maka median
merupakan rata-rata dari dua nilai tengah. Oleh karena itu,
bilangan di tengah dari suatu daftar bilangan setelah
| 100
Statistik Dengan Pendekatan Matematik

diurutkan dari terkecil ke terbesar atau sebaliknya dinamakan


median.
Median data-data tunggal
Contoh 1:
Usia (dalam satuan tahun) siswa di suatu sekolah adalah : 4,
29, 4, 3, 4, 11, 16, 14, 17, 3. Median dari usia tersebut
ditentukan setelah data usia diurutkan, yaitu: 3, 3, 4, 4, 4, 11,
14, 16, 17, 29. Karena banyak bilangan adalah genap yaitu
10, maka bilangan di tengah adalah 4 dan 11, atau bilangan
ke-5 dan ke-6 pada susunan yang sudah diurutkan itu.
4  11
Dengan demikian, median =  7,5 .
2
Contoh 2:
Tujuh pohon paling tinggi (dalam satuan meter) di suatu
lahan parkir adalah 41, 60, 47, 42, 44, 42, dan 47.Mediannya
adalah 44.

Contoh 3:
Perhatikan sebaran data : 6, 6.7, 3.8, 7, 5.8, 9.975.Median
={(6+6,7)/2} = 6,35.

Median data dikelompokkan.


Perhatikan sebaran data yang dikelompokkan berikut ini.
Tabel 3.8. Sebaran Data Kelompok
No Kelas Frekuensi (fi)
1 10,00 – 19,99 9
2 20,00 – 29,99 20
3 30,00 – 39,99 26
4 40,00 – 49,99 35
5 50,00 – 59,99 22
6 60,00 – 69,99 17
7 70,00 – 79,99 11
8 80,00 – 89,99 6
9 90,00 – 99,99 4
Jumlah 150

| 101
Statistik Dengan Pendekatan Matematik

Rumus menghitung median data tersusun adalah:

𝑓𝑚𝑒𝑑𝑖𝑎𝑛 − ∑𝑠𝑎𝑡𝑢
𝑖=1
𝑘𝑒𝑙𝑎𝑠 𝑠𝑒𝑏𝑒𝑙𝑢𝑚 𝑘𝑒𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑛
𝑓𝑖
𝐵𝑏 + 𝑖 ( )
𝑓𝑘𝑒𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑛

Bb adalah batas bawah kelas median;


i adalah panjang kelas median;

Langkah/prosedur perhitungan:
1. Hitung panjang interval kelas median, yaitu sama dengan
10
2. Tentukan kelas interval dari median, yaitu di kelas interval
ke-4
3. Hitung batas bawah kelas median, sama dengan 40,00 –
0,005 = 39,995.
4. Hitung jumlah frekuensi sampai satu kelas sebelum kelas
3
median, yaitu f
i 1
i = 9 + 20 + 26 = 55. Jumlah frekuensi

dari kelas pertama sampai ketiga adalah kelas-kelas


sebelum kelas median.
3
f median   fi
i 1
5. Median = Bb + i ; f4 adalah frekuensi
f4
kelas median.
= 39,995 + 10{(75 – 55)/35}
= 39,995 + 10 {20/35}
= 39,995 + 40/7
= 45,71
Atau dihitung menggunakan patokan nilai (pivot) batas
atas (Ba) kelas median dengan rumus:

| 102
Statistik Dengan Pendekatan Matematik
4

f f
i 1
median
Median = Ba – i
f4
= 49,995 – 10{(90-75)/35}
= 49,995 – 10 (15/35)
= 49,995 – (10 x 0,4285)
= 49,995 – 4,285
= 45,71

b. Mean (Rerata Hitung)


Mean data tunggal
Rata-rata diperoleh dengan cara menambahkan
bilangan dan dibagi dengan banyak bilangan yang
ditambahkan tersebut.

jumlah bilangan
Re rata 
banyak bilangan

Contoh 1:

Rata-rata dari 3, 6, 11, dan 8 adalah

3  6  11  8 28
 7
4 4

Contoh 2:
Rata-rata dari bilangan 11, 11, 4, 10, 11, 7, dan 8 tepat pada
dua angka di belakang koma (per seratus) adalah 8,86.
Catatan:
Notasi rata-rata menggunakan huruf diberi garis di atasnya,
seperti x dan merupakan rata-rata hitung (aritmatika) dari
semua nilai data.Huruf x menyatakan simbol atau notasi
untuk suatu nilai data (kuantitatif) dari suatu variable dan

| 103
Statistik Dengan Pendekatan Matematik

garis di atas huruf dinamakan “bar”. Oleh karena itu notasi


x dinamakan/dilisankan ”eks bar”.

Apabila terdapat sebanyak n data, maka secara


simbolis rata-rata aritmatika dari nilai-nilai data (data
n

x1  x2  ...  xn 
xi
tunggal) dituliskan: x   1
.
n n

Mean data dikelompokkan.

Contoh 1:

Tabel.3.9
Distribusi frekuensi data usia siswa pada suatu sekolah

No
Usia Siswa x i Frekuensi f i xi . f i
1 18 9 162
2 19 8 152
3 20 2 40
4 21 1 21
Jumlah 20 375
x1 f1  x 2 f 2  ...  x k f k
Rata-rata aritmatika adalah x  =
n
k

1 k
x i fi
 xi f i = i 1
k

f
n i 1
i
i 1

Dengan demikian:
Rata-rata =
(18 x9)  (19 x8)  (20 x2)  (21x1) 375
  18,75 Tahun.
20 20

| 104
Statistik Dengan Pendekatan Matematik

Apabila diduga bahwa rata-rata usia siswa (dinotasikan


Md) adalah 18 tahun (frekuensi terbesar pada sebaran
data), maka rata-rata dari data tersebut dapat dihitung
menggunakan dugaan (disingkat d). Perhatikan tabel
berikut.
Tabel 3.10
Distribusi frekuensi data usia mahasiswa pada suatu PT

No Usia Mahasiswa x i Frekuensi fi d= x i - Md fi.di


1 18 9 0 0
2 19 8 1 8
3 20 2 2 4
4 21 1 3 3
Jumlah 20 15

Mean = 18 + (15/20) = 18 + 0,75 = 18,75


Dengan demikian, rumus menghitung rata-rata aritmatika
∑𝒌𝒊=𝟏 𝒇𝒊 𝒅𝒊
̅ = 𝑴𝒅 +
menggunakan dugaan adalah: 𝒙 ∑𝒌𝒊=𝟏 𝒇𝒊

Contoh 2 :
menghitung rata-rata menggunakan nilai tengah
Tabel. 3.11
Distribusi frekuensi data tersusun

No Kelas Frekunsi = fi Nilai Tengah = Nt fi .Nt


Interval
1 10 - 19 9 14.5 130.5
2 20 – 29 20 24.5 490
3 30 – 39 26 34.5 897
4 40 – 49 35 44.5 1557.5
5 50 – 59 22 54.5 1199
6 60 – 69 17 64.5 1096.5
7 70 – 79 11 74.5 819.5
8 80 - 89 6 84.5 507
9 90 - 99 4 94.5 378
Jumlah 150 7075

| 105
Statistik Dengan Pendekatan Matematik
9

 f .Nt i i
7075
Mean = i 1
9
  47.16667
f
150
i
i 1

Contoh 3 :
Rata-rata dengan dugaan adalah nilai tengah. Misalkan rata-
rata dugaan Md = 44,5
Tabel 3.12
Distribusi frekuensi data tersusun

Kategori Kelas Interval fi Nt di fidi


1 10 - 19 9 -30 -270
2 20 – 29 20 -20 -400
3 30 – 39 26 -10 -260
4 40 – 49 35 44.5 0 0
5 50 – 59 22 10 220
6 60 – 69 17 20 340
7 70 – 79 11 30 330
8 80 - 89 6 40 240
9 90 - 99 4 50 200
Jumlah 150 400

Rata-rata =
9

fd i i
400
Md  1
9
 44,5   44,5  2.666667
f
150
i
1

= 47.16667

Informasi penting: Perbandingan Mean dan Median


Perhatikan dan pelajari dua himpunan data berikut
Data A: 2,3,3,4,5,7,8
Data B: 2,3,3,4,5,8,20

| 106
Statistik Dengan Pendekatan Matematik

Kedua kelompok data tersebut mempunyai banyak data yang


sama yaitu 7. Namun, perhatikan nilai rata-rata dan median
masing-masing kelompok.
32
Rata-rata data A =  4,57 ; Median data A = 4
7
45
Rata-rata data B =  6,43 ; Median data B = 4
7

3. Variabilitas
a. Ukuran Variabilitas
Ukuran variabilitas merupakan statistik yang
menyarikan penyebaran nilai-nilai data. Ukuran penyebaran
tersebut juga dinamakan dispersi. Masing-masing ukuran
dispersi diuraikan berikut ini.
1) Ukuran penyebaran mutlak (absolute dispersion)
dinyatakan menggunakan satuan yang sama dengan
satuan data asli, misalnya orang, tahun, kilogram, meter,
rupiah, dll.
2) Range:
i. Range 10-90 persentil adalah 80 % data
ii. Range interquartil range (Q3 – Q1)
iii. Range semi-interquartil range (deviasi quartil) : ½
(Q3 – Q1)
Range merupakan selisih antara nilai tertinggi dan
terendah: maksimum dikurangi minimum. Range hanya
tergantung pada nilai-nilai ekstrim dalam himpunan data.
Sebagai contoh harga buku, nilai masimumnya adalah 29.500
dan minimum 2.200. Dengan demikian, Range = 29.500 –
2.200 = 27.300.
b. Kuartil
Apabila data disusun berurutan menurut besar
nilainya (data tersebut dirangking/diurutkan), maka kuartil
merupakan 3 bilangan yang membagi (mengelompokkan)
| 107
Statistik Dengan Pendekatan Matematik

data menjadi empat kelompok masing-masing (hampir)


mempunyai nilai sama banyak. Perhatikan ilustrasi-ilustrasi
mengenai persentase letak data dispersi kuartil pada beberapa
karakteristik sebaran data berikut.

Contoh, perhatikan letak nilai-nilai kuartil data-data


tunggal berikut.

1 11 15 19 20 24 28 34 37 47 50 57

Q1 Q2 Q3

Kuartil Bawah Median Kuartil Atas

17 26 42

Prosedur Perhitungan
1. Urutkan nilai-nilai data dari terkecil ke terbesar.
2. Kuartil kedua, Q2 merupakan median dari seluruh
himpunan data.
3. Jika n genap, maka:
a) kuartil pertama Q1 adalah median dari n/2
pengamatan terkecil dan,
b) kuartil ketiga Q3 merupakan median dari n/2
pengamatan terbesar.
n 1
4. Apabila n ganjil maka Q1 merupakan median dari
2
n 1
pengamatan terkecil, dan Q3 adalah median dari
2
pengamatan yang terbesar.

| 108
Statistik Dengan Pendekatan Matematik

Contoh 1:
Perhatikan 9 harga barang (dalam ribuan): 6.0, 6.7, 3.8,
7.0, 5.8, 9.975, 10.5, 5.99, 20.0. Tentukan Q1, Q3, Q2,
IQR, dan SIQR dari harga barang tersebut.
Penyelesaian:
a. Data diurutkan: 3,8; 5,8; 5,99; 6,0; 6,7; 7,0; 9,975; 10,5;
20,0
b. Q1 = (5,8 + 5,99)/2 = 11,79/2 = 5,895
c. Q2 = Median = 6,7
d. Q3 = (9,975 + 10,5)/2 = 20,475/2 = 10,2375
e. IQR = Q3 – Q1 = 10,2375 – 5,895 = 4,3425
f. SIQR = ½ IQR = ½ × 4,3425 = 2,17125

Contoh 2:
Perhatikan 8 harga barang berikut: 6.0; 6.7; 3.8; 7.0; 5.8;
9.975; 10.5; 5.99. Tentukan Q1 dan Q3 dari harga barang
tersebut.
Penyelesaian:
a. Data diurutkan: 3,8; 5,8; 5,99; 6,0; 6,7; 7,0; 9,975; 10,5
b. Q1 = (5,8 + 5,99)/2 = 11,79/2 = 5,895
c. Q3 = (7,0 + 9,975)/2 = 16,975/2 = 8,487

Data yang dikelompokkan


Contoh 1:
Perhatikan sebaran frekuensi usia siswa berikut,kemudian
tentukan median, Q1 dan Q3 dari sebaran datanya.
Tabel 3.13
Sebaran Data Usia Siswa
No
Usia Siswa ( xi ) Frekuensi ( f i )
1 18 9
2 19 8
3 20 2
4 21 1
Jumlah 20

| 109
Statistik Dengan Pendekatan Matematik

Median = Q2= 19; Q1 = 18; dan Q3 = 19.

Contoh 2:
Hitung kuartil bawah (Q1) dan kuartil atas (Q3) dari sebaran
frekuensi berikut.
Tabel 3.14
Sebaran Data Tersusun

Kelas
Kategori fi Keterangan
Interval
1 10 – 19 9
2 20 – 29 20
3 30 – 39 26 Kelas Q1
4 40 – 49 35
5 50 – 59 22
6 60 – 69 17 Kelas Q3
7 70 – 79 11
8 80 - 89 6
9 90 - 99 4
150

Kuartil bawah berada di kategori ke 3. Batas bawahnya sama


dengan 29,5 dan panjang interval kelas adalah 10. Rumus
menghitung kuartil sama seperti rumus mencari median, yaitu
:

 9 
  fi 2

 1   fi 
 4 
Q1  Bb  i 1

 f kelas Q1 .
 
 
 
Bb adalah batas bawah kelas Q1;
i adalah panjang interval kelas;
9

f
1
i adalah banyak seluruh pengamatan (atau n); dan

| 110
Statistik Dengan Pendekatan Matematik

f kelas Q1 adalah frekuensi kelas Q1, yakni 26


Q1 = 29,5 + 10 {(150/4 – 29)/26}= 32,77
Q3 = 59,5 + 10 [{(3 × 150)/4 – 112}/17] = 59,5 + 0,29 = 59,79

Secara umum, rumus menghitung kuartil adalah


sebagai berikut:
𝑓𝑄 𝑠𝑎𝑡𝑢 𝑘𝑒𝑙𝑎𝑠 𝑠𝑒𝑏𝑒𝑙𝑢𝑚 𝑘𝑒𝑙𝑎𝑠 𝑄1
1 −∑𝑖=1 𝑓𝑖
𝑄1 = 𝑖 ( )
𝑓𝑘𝑒𝑙𝑎𝑠 𝑄1
𝒇 𝒔𝒂𝒕𝒖 𝒌𝒆𝒍𝒂𝒔 𝒔𝒆𝒃𝒆𝒍𝒖𝒎 𝒌𝒆𝒍𝒂𝒔 𝑸𝟑
𝑸𝟑 −∑𝒊=𝟏 𝒇𝒊
𝑸𝟑 = 𝒊 ( )
𝒇𝒌𝒆𝒍𝒂𝒔 𝑸
𝟑

c. Percentil dan Desil


Kuartil membagi data menjadi per-empat-an, tetapi
kajian dapat dikembangkan kepada pembagian lain sesuai
keinginan (kebutuhan). Misalnya, yang paling biasa adalah
per-seratus-an atau "persentil". Kuartil pertama adalah
persentil ke-25, median ialah persentil ke-50 dan kuartil atas
merupakan persentil ke-75.
Persentil paling lazim digunakan, setelah ke-50 adalah
yang dekat ke-100. Dengan demikian persentil ke-90
merupakan nilai yang melebihi karena nilai yang hanya
tersisa 10% dari sampel atau populasi. Dan persentil ke-99
lebih tinggi pula karena hanya tinggal 1 dalam 100.
Ada pula yang dinamakan per-sepuluh-an atau "desil",
yaitu membagi data kedalam sepuluh bagian, dan "kuintil",
yang membagi data menjadi lima kelompok. Kuintil pertama
identik dengan persentil ke-20, median merupakan desil
kelima, dan begitu seterusnya.Perhatikan dua ilustrasi visual
berikut.

| 111
Statistik Dengan Pendekatan Matematik

80% kasus di bawah ini 20% kasus di atas ini

Rank Persentil =80

Gambar 3.10 Dispersi Persentil pada Sebaran Normal

90 dari kasus 10% dari kasus

Gambar 3.11
Dispersi Persentil 90 atau 10% yang Diambil

Perhatikan tabel distribusi frekuensi berikut,


selanjutnya digunakan untuk menghitung beberapa dispersi
desil dan persentil.Tabel distribusi frekuensi untuk
menghitung persentil dan desil disajikan sebagai berikut.

Tabel 3.15
Sebaran Data Tersusun

Frekuensi
Kelas Frekuensi kumulatif
(fi)
10,00 – 19,99 9 9
20,00 – 29,99 20 29
30,00 – 39,99 26 55
40,00 – 49,99 35 90

| 112
Statistik Dengan Pendekatan Matematik

50,00 – 59,99 22 112


60,00 – 69,99 17 129
70,00 – 79,99 11 140
80,00 – 89,99 6 166
90,00 – 99,99 4 150
Jumlah 150 5,45

Contoh-contoh perhitungan:
Persentil (P)
1. P5 = 9,995 + {10 (7,5)}/9 = 9,995 + 8,33 = 18,325
2. P35 = 29,995 + {10 (52,5 – 29)}/26 = 29,995 + 9,04 =
39,035

Desil (D)
1. D2 = 29.995 + {10 (30 – 29)}/26 = 29,995 + 0,38 = 30,375
2. D9 = 69,995 + {10 (135 – 129)}/11 = 69,995 + 5,45 = 75,445

Penyajian rumus menghitung persentil dalam bentuk


(𝑃−𝑐𝑓𝑏 )
lain adalah: 𝑃𝑒𝑟𝑠𝑒𝑛𝑡𝑖𝑙 𝑘𝑒 − 𝑘 = 𝐿 + [ (𝑈 − 𝐿)].
𝑓
Definisi simbol-simbol dalam rumus menghitung persentil
tersebut adalah:
1. Persentil ke-k adalah persentil yang akan dihitung,
hasilnya adalah nilai persentil tersebut.
2. P = (k ÷ 100) (n), k merupakan persentil yang dimaksud
dan n adalah banyak data pada suatu sebaran. Contoh,
untuk menghitung percentile ke-50 (P50) dan ada sebanyak
400 (n) nilai-nilai data pada sebarannya, maka P
merupakan nilai ke-200 atau (50÷100) (400) = 200.
3. L merupakan batas bawah (limit bawah) dari interval kritis
(interval kelas persentil yang akan dicari). Batas bawah
interval kritis merupakan nilai mungkin terkecil dari
interval kritis. Contoh, batas bawah interval kritis 200 -
249 adalah 199,50 karena semua nilai yang lebih besar

| 113
Statistik Dengan Pendekatan Matematik

dari 199,50 dibulatkan menjadi 200 dan masuk dalam


interval itu.
4. cfb adalah frekuensi kumulatif dari semua interval
sebelumnya(tetapi tidak termasuk interval kritis).
5. f = frekuensi interval kritis.
6. U = batas atas interval kritis. Ini merupakan nilai tertinggi
yang memuat interval kritis. Contoh: batas atas interval
80-90 adalah 90,5.

Dari data seperti pada tabel, penggunaan rumus


tersebut dapat dicoba misalnya untuk menghitung P35 sebagai
berikuit.
P35 = 29,995 + {(52,5 – 29)(39,995 – 29,995)}/26 = 39,035.
Dari pengerjaan perhitungan P35 tersebut dapat disimpulkan
bahwa panjang interval = U – L.

Contoh lain:
Misalkan seorang peneliti memiliki data mengenai biaya
konsultasi psikologi per hari dan dibayar oleh sekolah untuk
sebanyak 400 sampel dan ingin diketahui 10% teratas uang
yang didapat per hari. Pertama data tersebut disusun dalam
bentuk matriks seperti berikut. Berdasarkan data, keinginan
tersebut dapat dijawab dengan cara menemukan persentil
yang bersesuaian.
Tabel. 3.16.
Sebaran Data (Matriks) Biaya Konsultasi Psikologi
Interval Biaya (Ribu Rupiah) f cf
1 250 – 500 32 400
Interval Kritis 200 – 249 27 P-368 atau
Nilai ke-360
terjadi di sini
3 160 – 199 48 341
4 130 – 159 72 293
5 100 – 129 92 221
6 80 – 99 51 129
7 60 – 79 35 78
8 40 – 59 43 43
400

| 114
Statistik Dengan Pendekatan Matematik

Selesaian:
Persentil ke-90?
P = 90/100 × 400 adalah posisi ke-360
𝑃−𝑐𝑓
P90 =𝐿+[ (𝑈 − 𝐿)]
𝑓
360−341
= 199,5 + [( ) (249,5 − 199,5)] = 234,5
27

Simpulan peneliti:
Sepuluh persen teratas membayar biaya konsultasi psikologi
antara 234,5 hingga 500 ribu rupiah per hari. Sembilan puluh
persen membayar 234,5 ribu atau kurang per hari.

Secara visual digambarkan sebagai berikut.


90% dari kasus 10% dari kasus
234,50

Gambar 3.12
Posisi Persentil ke-90 Pada Kurva Normal

Contoh tersebut menunjukkan perhitungan persentil


yang bermula dengan penentuan persentase yang diinginkan
dan kemudian digunakan untuk memperoleh suatu nilai.
Perhitungan persentil rank melibatkan prosedur berlawanan.
Bermula dari suatu nilai tertentu dan hitung persentase kasus-
kasus di bawahnya.

d. Rank persentil (percentile rank)


Rumus untuk menghitung rank persentil pada sebaran
data sederhana (tunggal) atau individual adalah: 𝑃𝑅 =
𝑋𝑝
( 𝑛 ) × 100.
PR= Percentile Rank, dalam persen.

| 115
Statistik Dengan Pendekatan Matematik

Xp= Posisi skor dalam suatu distribusi. Diawali dengan nilai


paling kecil dan hitung banyak kasus hingga mencapai skor
yang diinginkan.
n = banyak kasus dalam suatu distribusi.

Perhatikan ilustrasi gambar berikut ini.

Gambar 3.13
Posisi Dispersi Pada Kurva Normal

Suatu percentile rank didefinisikan sebagai proporsi


dari skor dalam suatu distribusi dimana skor tertentu lebih
besar atau sama dengan skor tertentu tersebut. Percentile
rank suatu skor merupakan persentase dari skor dalam
distribusi frekuensinya yang lebih rendah daripadanya.
Percentile ranks biasanya digunakan untuk menjelaskan
tafsiran skor pada tes standar. Pada teori tes (test theory),
percentile rank dari suatu skor mentah ditafsirkan sebagai
persentase peserta tes dalam kelompok norma (norm group)
yang diberi skor dibawah skor yang menjadi perhatian.
Percentile ranks (PR atau "persentil") adalah
berdistribusi normal dan berbentuk lonceng, sedangkan
ekivalensi kurva normal (normal curve equivalents disingkat
NCE) adalah seragam (uniform) dan berbentuk segiempat.
Rank persentil tidak berada pada skala interval yang sama,
| 116
Statistik Dengan Pendekatan Matematik

yakni bahwa perbedaan antara sebarang dua skor tidak sama


antara sebarang dua skor lainnya. Misal, 50 - 25 = 25 tidak
sama jaraknya seperti 60 - 35 = 25 dikarenakan bentuk
distribusi kurva lonceng. Beberapa rank persentil lebih dekat
ke beberapa daripada lainnya. Misalnya, percentile rank 30
lebih dekat ke 40 pada kurva lonceng daripada ke 20.

Contoh 1:
Apabila seseorang memperoleh skor 95 pada ujian
matematika dan skor tersebut lebih besar atau sama dengan
skor dari 88% siswa yang mengikuti ujian, maka percentile
rank adalah 88. Artinya ia berada pada percentile ke-88.
Contoh 2:
Skor tes yang lebih besar atau sama dengan 75% dari skor
siswa yang mengikuti tes itu dikatakan berada pada persentil
75. Tidak ada persentil ke-100 karena tidak ada skor yang
lebih rendah dari skor itu sendiri. Bahkan skor sempurna
adalah persentil 99 karena 99 persen dari skor siswa yang
mengikuti ujian adalah lebih rendah daripada skor sempurna
itu.
Rumus lain untuk menghitung rank persentil adalah:
𝑐𝑓𝑙 + 0,5𝑓𝑖
𝑃𝑅 = × 100%
𝑁
1. cfl adalah frekuensi kumulatif dari semua skor yang
lebih rendah daripada skor yang akan dihitung PR nya,
2. fi adalah frekuensi skor yang dikaji, dan
3. N adalah banyak peserta tes dalam suatu sampel.
4. Apabila suatu sebaran adalah normal, percentile rank
dapat diinferensi dari skor standar (standard score).
Data tersusun (dikelompokkan)
Rumus untuk menghitung PR data yang
dikelompokkan (tersusun) pada suatu distribusi frekuensi
sama seperti rumus untuk menghitung dispersi persentil.

| 117
Statistik Dengan Pendekatan Matematik

Contoh: perhatikan distribusi frekuensi berikut.

Distribusi frekuensi pendapatan pekerja per hari


(dalam ribu rupiah)

𝒄𝒇𝒃
Kelas Interval f cfb × 𝟏𝟎𝟎
𝒏
1 250 – 500 32 400 100%
2 200 – 249 27 368 92%
3 160 – 199 48 341 85.25%
4 (interval kritis) 130 – 159 72 293 73.25%
5 100 – 129 92 221 55.25%
6 80 – 99 51 129 32.25%
7 60 – 79 35 78 19.50%
8 40 – 59 43 43 10.75%
400

Apabila berdasarkan tabel tersebut akan diketahui


persentase pekerja yang mendapatkan penghasilan 135 ribu
rupiah atau lebih per hari. Atau menghitung persentil rank
135. Caranya adalah sebagai berikut.
135  129.50
135 = 55.25% + 18.00
30
135 = 55.25% + 3.24%
135 = 58.49%
Secara visual, hasil dari penghasilan 135 ribu rupiah
atau lebih per hari disajikan dalam kurva normal berikut ini.

Gambar 3.14.
Porsi Dispersi Persentil Rank 135 pada Kurva Normal

| 118
Statistik Dengan Pendekatan Matematik

Persentil dan rank persentil merupakan alat statistik


dengan banyak kegunaan. Secara khusus median atau
persentil ke-50 merupakan ukuran tendensi sentral adalah
paling bermanfaat dalam mengevaluasi distribusi menceng.
Terdapat banyak penerapan dalam penelitian statistik
sehingga menjadi praktislah pensentil dan rank persentil.

e. Simpangan rata-rata (mean deviation)


Simpangan rata-rata merupakan rata-rata dari nilai
mutlak simpangan. Contoh, simpangan rata-rata dari data 70,
65, 45, 40, 30. Rata-rata = (70+65+45+40+30)/5 = 50.
Perhatikan tabel berikut.

Nilai Mutlak Simpangan Nilai

xi
70
xi - x xi  x
20
65 20
15
45 15
-5
40
-10 5
30
-20 10
20
Jumlah = 70

Simpangan rata-rata = {│x1 - x │+ │x2 - x │+ ... + │x5 - x


5

 x x
i 1
i
│}/5. Atau duliskan sebagai: . Atau, simpangan
5
rata-rata = SR (MD) = 70/5 = 14
Simpangan rata-rata data dikelompokkan.
Perhatikan tabel distribusi frekuensi berikut.

| 119
Statistik Dengan Pendekatan Matematik
Titik
Kelas Tengah
Frekuensi
(fi)
fiti ti - x ti  x ti  x f i
(ti)
10,00 – 19,99 15 9 135 -32,667 32,667 294,003
20,00 – 29,99 25 20 500 -22,667 22,667 453,34
30,00 – 39,99 35 26 910 -12,667 12,667 329,342
40,00 – 49,99 45 35 1575 -2,667 2,667 93,345
50,00 – 59,99 55 22 1210 7,333 7,333 161,326
60,00 – 69,99 65 17 1105 17,333 17,333 294,661
70,00 – 79,99 75 11 825 27,333 27,333 300,663
80,00 – 89,99 85 6 510 37,333 37,333 223,998
90,00 – 99,99 95 4 380 47,333 47,333 189,332
Jumlah 150 7150 207,333 2340,01

Titik tengah = (batas atas + batas bawah)/2


= (19,995 + 9,995)/2 = 30/2 = 15
= (tepi kiri kelas tertentu + tepi kiri kelas
berikutnya)/2
= (10 + 20)/2 = 30/2 = 15
Rata-rata` = 7150/150 = 47,667
Simpangan rata-rata = (2340,01)/150 = 15,600

b. Simpangan Baku (Standard Deviation) dan Varians


Standar deviasi menggambarkan "jarak rata-rata"
nilai-nilai data dari rata-ratanya.Perhatikan ilustrasi berikut.
x x xxx x x x x x

nilai xi

rata-rata x

jarak xi dari x yang sama dengan xi - x

Jarak masing-masing nilai xi dari rata-rata x


dinotasikan sebagai di. Rata-rata dari jarak-jarak tersebut
selalu sama dengan nol, atau secara simbolik d  0 . Dengan
demikian, agar data atau sebaran data bermakna, gunakan
statistik kuadrat dari jarak tersebut, yaitu 𝑑𝑖 2. Kemudian,
mengingat bahwa besaran 𝑑𝑖 dan 𝑑𝑖 2 berbeda, maka yang
| 120
Statistik Dengan Pendekatan Matematik

lebih memberikan makna adalah rata-rata dari 𝑑𝑖 2, atau nilai


1
dari ungkapan √𝑛 ∑𝑖 𝑑𝑖 2 .
Biasanya penyebut n-1 sebagai ganti n karena akan
memberikan estimasi sifat-sifat matematika lebih baik.
Ungkapan matematisnya adalah sebagai berikut.

1 1
√𝑛−1 ∑𝑛𝑖=1 𝑑𝑖 2 = √𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 .

Nilai dari ungkapan (rumus) tersebut dinamakan


standar deviasi sampel (sample standard deviation). Nilai
dari ungkapan tersebut tanpa akar dinamakan varian sampel
1
(sample variance) dan dinotasikan s2, atau 𝑠 2 = 𝑛−1 ∑ 𝑑𝑖 2 .
Contoh:
Himpunan data A: {xi} = 2, 3, 3, 4, 5, 7, 8. Ada sebanyak n = 7
pengamatan dan x = 4,57. Deviasi dari mean, di = xi - x , adalah -
1
2.57, -1.57, -1.57, -0.57, 0.43, 2.43, 3.43. Jadi 𝑠2 = [(−2,57)2 +
6
(−1,57)2 + (−1,57)2 + ⋯ + (3,43)2 ]
1
= × 29,7143 = 4,9524
6
𝑠 = √4,9524 = 2,225
Contoh lain, perhatikan sebaran data dalam tabel berikut:
nilai simpangan kuadrat
simpangan
xi xi - x (xi - x )2
70 70-50 = 20 (x1- x ) 400
65 65-50 = 15 225
45 45-50 = -5 25
40 40-50 = -10 100
30 30-50 = -20 400
Jumlah = 1150
Dengan demikian, varians = 1150/5 = 230

| 121
Statistik Dengan Pendekatan Matematik

Varians dari data tersusun (data dikelompokkan)

Perhatikan sebaran data pada tabel berikut.


Kelas (ti) (fi) fiti
ti - x (ti - x )2 fi (ti - x )2
10,00 – 19,99 15 9 135 -32,667 1067,133 9604,197
20,00 – 29,99 25 20 500 -22,667 513,792 10275,84
30,00 – 39,99 35 26 910 -12,667 160,453 4171,778
40,00 – 49,99 45 35 1575 -2,667 7,113 248,955
50,00 – 59,99 55 22 1210 7,333 53,773 1183,006
60,00 – 69,99 65 17 1105 17,333 300,433 5107,361
70,00 – 79,99 75 11 825 27,333 747,093 8218,023
80,00 – 89,99 85 6 510 37,333 1393,753 8362,518
90,00 – 99,99 95 4 380 47,333 2240,413 8961,652
Jumlah 150 7150 56133,33

 x  x 
n
2
i fi
2 i 1
Varians (s ) = , dengan xi adalah data tengah-
n
tengah dari kelas ke- i. Varians = 56133,33/150 = 374,22.

 x  x 
n 2
i fi
i 1
SD = .Simpangan baku (SD) = 374,22 =
n
19,345
c. Sifat-sifat simpangan baku (standar deviasi)
1. Penting dalam berbagai penggunaan dan atau
pengujian secara statistik.
2. Untuk ukuran data kecil, yaitu untuk n < 100, rumus
SD yang digunakan berbeda dengan rumus yang
umum seperti diuraikan.

∑𝑛
𝑖=1(𝑥𝑖 −𝑥̅ )
2
3. Untuk data tak tersusun:𝑠 =√ atau
𝑛−1
2
n
 n 
n xi    xi 
2
∑𝑖=1 𝑥𝑖 𝑛 2 − 1 (∑𝑛 𝑥 )2
𝑠=√ 𝑛 𝑖=1 𝑖
atau =
i 1  i 1 
𝑛−1 n(n  1)

| 122
Statistik Dengan Pendekatan Matematik

4. Rumus menghitung standar deviasi data tersusun


∑𝑛 2
𝑖=1(𝑥𝑖 −𝑥̅ ) 𝑓𝑖
adalah : 𝑠=√ atau 𝑠=
𝑛−1

1 (∑ 𝑓𝑖 𝑥𝑖 )2
√ [∑ 𝑓𝑖 𝑥𝑖 2 − ],𝑛 = ∑𝑘𝑖=1 𝑓𝑖
𝑛−1 𝑛

dengan nilai data x1, x2, …, xk dan frekuensi masing-


masing adalah f1, f2, …, fk .

Contoh data usia siswa yang tersebar sebagai berikut.

𝑥𝑖 𝑓𝑖 𝑓𝑖 𝑥𝑖 𝑓𝑖 𝑥𝑖 2
18 9 162 2916
19 8 152 2888
20 2 40 800
21 1 21 441
k=4 ∑ 𝑓𝑖 =20 ∑ 𝑓𝑖 𝑥𝑖 =375 ∑ 𝑓𝑖 𝑥𝑖 2 = 7045

1 (375)2 13,75
Dengan demikian, 𝑠 2 = 19 [7054 − ]= =
20 19
0,7237 dan 𝑠 = √0,7237 = 0,8507
5. Simpangan baku dapat pula dihitung selain
menggunakan rata-rata hitung, misalnya menggunakan
nilai modus, median, atau nilai rata-rata lain; hanya saja
SD yang dihitung menggunakan nilai rata-rata hitung
hasilnya adalah paling kecil.
6. Sifat yang paling banyak digunakan dalam penaksiran
dan pengujian hipotesis.

Contoh:
Apabila dari sekumpulan data tentang tinggi badan
diperoleh bahwa rata-rata hitung sama dengan 157 cm dan
SD = 22 (asumsi berdistribusi normal), maka

| 123
Statistik Dengan Pendekatan Matematik

a. Sebanyak 68,27% data tinggi badan berada dalam


interval x - SD dan x + SD.
b. Range tinggi badan dalam inteval = 179 – 135 = 44
c. Sebanyak 95,45% terletak dalam interval x - 2SD dan x
+ 2SD
d. Sebanyak 99,73% terletak dalam interval x - 3SD dan x
+ 3SD
m

n s
i 1
i i
2

e. Standar deviasi gabungan m

n
i 1
i

f. Ukuran Penyebaran Relatif

penyebaran mutlak
Penyebaran relatif = = koefisien
rata  rata
s
varians (V) =
x
d. Bentuk Penyebaran Frekuensi
1. simetris: pencerminan, kiri dan kanan rata-rata
hitung
2. tidak simetris: menceng, keruncingan, lebih runcing
jika dibandingkan dengan bagian lain (yang lain)
3. berbentuk U
4. berbentuk U terbalik
5. berbentuk J
6. berbentuk J terbalik
7. berbentuk merata
e. Kemencengan (Skewness)
1. perhatikan perbedaan antara letak modus dan letak
rata-rata hitung; dan kadang-kadang juga
memperhatikan ukuran penyebaran lainnya (seperti

| 124
Statistik Dengan Pendekatan Matematik

median); contoh penyebaran berbentuk U terbalik


(lonceng, normal)
2. menceng kanan (menceng negatif): ujung kiri lebih
panjang
3. menceng kiri (menceng positif): ujung kanan lebih
panjang
4. semakin tinggi derajat asimetris makin besar
penyimpangan antara ukuran-ukuran penyebaran
(rata-rata, median, modus)
x  Mo
5. koefisien kemencengan Pearson : sk =
s
(rumus pertama)
3( x  M d )
6. karena x  M o  3( x  M d ), maka s k 
s
(rumus kedua).

f. Kurtosis (keruncingan). Keruncingan penyebaran


frekuensi = koefisien kurtosis, terdiri atas:
1. lepto kurtis: sempit pada bagian puncak
2. platy kurtis: puncak agak mendatar, tersebar agak
merata pada seluruh kelas, kecuali pada beberapa
kelas pertama dan terakhir
3. meso kurtis (penyebaran normal)
4. penyebaran (pencaran) normal
a) banyak dipakai dalam penelitian (mungkin
mendekati normal), banyak populasi
berdistribusi normal
b) baik digunakan untuk mendekati penyebaran
lain
c) kurva simetris terhadap garis vertikal yang
melalui rata-rata = μ
d) penyebaran normal baku, dengan rata-rata
hitung μ = 0 dan standar deviasi  = 1
| 125
Statistik Dengan Pendekatan Matematik

e) variabel acak yang tersebar adalah nilai baku z


(bukan x), dengan nilai dihitung menggunakan
x
rumus z = untuk setiap variabel acak

yang terpencar secara normal.

Rangkuman:
A. Statistika Dan Data
1. Statistika: merupakan metode dan aturan tentang
pengumpulan, penyajian pengolahan, analisis,
interpretasi, dan penarikan kesimpulan dari data-data
(statistik); Statistik adalah data yang telah dihitung
menggunakan berbagai ukuran statistika.
2. Statistika Deskriptif : penyajian atau penyusunan
data dan tidak berkenaan dengan penarikan
kesimpulan atau generalisasi. Penyajian data dalam
bentuk tabel, gambar, diagram, dan grafik;
3. Statistika Induktif (Inferensial) : metode dan
aturan penarikan kesimpulan dari data tersusun dan
diolah. Statistika ini juga menyediakan aturan
peramalan (prediksi) dan penaksiran (estimasi)
4. Data: informasi atau keterangan (dapat diukur,
diamati, dan bernilai)
a. Data kualitatif : secara umum bukan
merupakan bilangan (mungkin hanya angka
ordinal atau kategori); Contoh: warna, jenis
kelamin, status perkawinan, dll
b. Data kuantitatif : merupakan bilangan.
Contoh: umur, tinggi/berat badan, nilai, dll
c. Cara mengumpulkan data:
1) Wawancara
2) Kuesinoner
3) Melalui media IT (non cetak)
| 126
Statistik Dengan Pendekatan Matematik

4) Dokumen
5) Media cetak
6) Buku sumber: buku ajar, jurnal, dll
d. Data dikumpulkan dari :
1) sumber internal dan eksternal
2) sumber primer atau sekunder

B. Distribusi Frekuensi (frequency distribution)


Distribusi atau sebaran atau pencaran frekuensi dari
data. Faktor penting dari data adalah :
a. Ketepatan
b. Banyak/ukuran
c. Memberi arti/makna
d. Dapat menafsirkan
e. Keteraturan
f. Mudah dimengerti
Peran distribusi frekuensi(data kualitatif dan
kuantitatif) antara lain adalah dalam:
a. Mengatur, menyusun, meringkas data
b. Pengelompokan dengan aturan tertentu
c. Daftar pengelompokan data (banyak dan golongan/kelas)

Kesalahan pada pengakurasian data:


1. Untuk nilai data tanpa desimal adalah pada nilai tempat
satuan yaitu ½ = 0,5;
2. Untuk nilai data dengan satu angka desimal adalah pada
0,1
nilai tempat desimal pertama yaitu  0,05 ;
2
3. Untuk nilai data dengan dua angka di belakang koma
adalah pada nilai tempat desimal kedua yaitu
0,01
 0,005 .
2
4. Perhatikan ilustrasi berikut.
| 127
Statistik Dengan Pendekatan Matematik

9,995 19,995 29,995

10 20 30
9,99 19,99
29,99

5. Distribusi frekuensi relatif: hasil bagi frekuensi setiap


kelas dengan frekuensi seluruhnya (n).Frekuensi relatif =
k

f i
1 k
n
i 1
 fi  1
n i 1

; ∑ sigma, berarti jumlah.
6. Contoh Gambar/Diagram Distribusi FrekuensiPoligon
(poligon frekuensi)

C. Ukuran Tendensi Sentral


1. Rata-rata hitung (mean) data tak tersusun (tidak
dikelompokan)
n

1 n
x i
x1  x 2  ...  x n
x   xi  i 1

n i 1 n n
2. 
Simpangan: x i  x ; deviasi 
n
3. Jumlah simpangan sama dengan nol (  ( xi  x)  0
i 1

| 128
Statistik Dengan Pendekatan Matematik
n
4.  (x
i 1
i  x) 2 disebut jumlah kuadrat terkecil

5. rata-rata hitung dibobot


k

n m  n2 m2  ...  nk mk n m i i
x 1 1  i 1
dengan ni
n1  n2  ...  nk k

n i 1
i

merupakan banyak data (pengamatan) dan m i adalah


rata-rata hitungnya.
6. Rata-rata hitung juga dapat dihitung sebagai
n

d i
xM i 1
dimana M merupakan suatu nilai
n
yang diterka sebagai rata-rata hitung dan di = xi – M
atau xi = M + di.
7. Median: nilai di tengah data yang telah diurutkan,
sehingga setengah dari nilai-nilai itu (atau lebih)
sama dengan atau kurang dari nilai median itu dan
setengah lagi (atau lebih) lebih besar atau sama
dengan nilai median itu.

D. Ukuran Dispersi
1. Kuartil, nilai-nilai dari sekumpulan data yang dibagi
ke dalam empat bagian yang sama banyak. Dengan
demikian maka Q1, Q2, dan Q3. Q2 di tengah-tengah,
biasanya dituliskan pula bahwa Q2 = Me (median).
2. Desil: sekumpulan data yang telah diurutkan dan
dibagi menjadi 10 kelas/kelompk data.
3. Persentil: sekumpulan data yang telah diurutkan dan
dibagi menjadi 100 kelas/kelompk data.

| 129
Statistik Dengan Pendekatan Matematik

Latihan:
1. Jenjang pendidikan tertinggi seseorang adalah tipe
variable apa?
a. kontinu
b. numerik diskrit
c. ordinal
d. nominal
2. Banyak terjadi kecelakan pada kendaraan bermotor di
suatu jalan bebas hambatan dalam satu minggu
merupakan tipe variablel apa?
a. kontinu
b. numerik diskrit
c. nominal
d. ordinal
3. Data nominal seringkali dianalisis dalam bentuk:
a. pencacahan
b. rata-rata
c. ranking
4. Apa tipe variabel masing-masing berikut ini?
a. warna rambut
b. banyak televisi di rumah tinggal
c. respon terhadap item pertanyaan : ya, tidak, tidak tau
d. intensitas gempa bumi
e. posisi final dalam suatu pertandingan olahraga,
pertama, kedua, ke- 30, dst.
5. Suatu histogram dibuat untuk himpunan data kontinu.
Mana dari yang berikut merupakan pernyataan yang
benar?
(a) median membagi luas histogram menjadi dua bagian
yang sama
(b) data adalah numerik kontinu
(c) mean (rata-rata) adalah pada kolom paling tinggi.
1. a dan b

| 130
Statistik Dengan Pendekatan Matematik

2. a dan c
3. b dan c
6. Pada suatu histogram, sifat apa dari masing-masing
persegipanjang mewakili frekuensi pengamatan dalam
rentang yang sesuai?
a. tingginya
b. lebarnya
c. luasnya
7. Konsultan pendidikan mencatat uang yang dibelanjakan
oleh 20 guru di suatu toko grosir. Banyak uang tersebut
disusun secara berurut naik sebagai berikut:

6.61 6.90 8.04 9.45 10.26 11.63 12.95 13.67 14.35 14.55

15.01 15.33 16.55 18.22 18.30 19.54 20.58 20.89 21.13 33.80

a.
Gambarkan diagram (plotting) stem and leaf untuk
data tersebut.
b. Tentukan mean (rata-rata) dan median (nilai tengah)
dari banyak uang yang dibelanjakan tersebut?
8. Jika rata-rata berat 20 paket buku yang dikirim ke
sekolah adalah 60 kilogram, tentukan berat total semua
paket buku itu ?
9. Suatu distribusi simetris mempunyai
a. mean (rata-rata) sama dengan nol
b. varians sama dengan nol
c. skewness (kemencengan) sama dengan nol
10. Dalam suatu distribusi simeris, mana yang sama?
a. Rata-rata dan median
b. Rata-rata dan modus
c. Median dan modus
d. Ketiga-tiganya
11. Median dari suatu distribusi merupakan
a. ukuran dispersinya
b. ukuran lokasinya
| 131
Statistik Dengan Pendekatan Matematik

c. pusat sebaran
12. Lebih mudah memperoleh rata-rata suatu himpunan
besar dari data daripada median karena
a. median mempunyai satu rumus untuk n genap dan
satu untuk n ganjil
b. tidak perlu mengurutkan data untuk mendapatkan
rata-rata
c. mean memberikan bobot yang sama untuk semua
pengamatan
13. Kelebihan utama median atas mean adalah bahwa
a. hasilnya adalah selalu satu dari nilai-nilai data
b. median lebih dekat ke modus dari sebaran data
c. tidak begitu sensitif terhadap kesalahan dalam data
d. lebih sensitif terhadap nilai yang penting dalam data
14. Mana yang secara numerik lebih besar, varians atau
standar deviasi?
a. Varians
b. Standar deviasi
c. Dapat salah satunya
15. Waktu dalam menit digunakan oleh siswa untuk
melengkapi latihan dicatat oleh guru, dan variansnya
dihitung. Satuan dari varians itu adalah
a. Bilangan saja
b. Akar kuadrat menit
c. Menit
d. Menit kuadrat
16. Hitung Median (Me), Q1, dan Q3 dari distribusi frekuensi
berikut.
Kelas Nilai Ujian Frekuensi
1 0,00 – 19,99 3
2 20,00 – 39,99 10
3 40,00 – 59,99 20
4 60,00 – 79,99 12
5 80,00 – 99,99 5
Total 50

| 132
Statistik Dengan Pendekatan Matematik

17. Jabarkanlah (masing-masing dilengkapi penjelasan)


bahwa:

 x  x  {x
n n
2
 2 xi x  ( x ) 2 }
2
i i
i 1
 i 1

n n =
n n

x i
2
x i
n( x ) 2
i 1
 2x i 1

n n n
n n

x i
2
x i
2

i 1
 2 xx  ( x ) 2 i 1
 (x ) 2
= n = n
n
1 n
 n
 n 2
x 2
 ( xi ) 2
x
  xi 
2 i
i 1 i
n i 1
=
i 1
  i 1  = n
n  n 
 
 
2
18. Hitung varians = s menggunakan turunan dari rumus

  x  x   x  x
n 2 n 2
i i
i 1
 i 1 (pendekatan matematis)
n n 1
19. Buktikan bahwa :
2
1 n 
 
n

   xi 
n

  2 2
xi  x x i
i 1 i 1 n  i 1 
SD = =
n n
20. Bilangan berikut merupakan persentase pendapatan 110
keluarga di Kota Pontianak yang dibelanjakan untuk
membeli buku.
18 61 2445 4941 2523 6220
2434 4644 2252 2228 3739
2039 4346 4717 3942 4341
4542 3532 5732 2460 5955
1926 5248 3038 5761 3144
5942 5145 2646 4148 4125

| 133
Statistik Dengan Pendekatan Matematik
2942 5434 3247 2847 5456
3653 5652 2443 4754 3124
3653 5652 2443 4754 3124
4148 3825 4635 4830 4532
4442 6329 4230 6269 2433

a. Buat tabel distribusi frekuensi dari data tersebut,


lengkap dengan kolom frekuensi relatif dan
frekuensi kumulatif labih dari serta kurang dari.
b. Dengan menggunakan sebaran data tersebut,
buatlah:
1) Histogram dan poligon frekuensinya
2) Histogram dan poligon frekuensi relatif
3) Histogram dan poligon frekuensi komulatif
kurang dari dan lebih dari.
21. Apa yang dimaksud:
a. Persentil
b. Rank Persentil
c. Kuartil
d. Desil
e. Interval Kritis
f. Frekuensi Kumulatif
g. Persentase Kumulatif
22. Rata-rata banyak hari suatu sampel siswa berkebutuhan
khusus harus menunggu untuk penanganan selama tahun
2012 adalah sebagai berikut: 70, 70, 90, 20, 20, 20, 21,
25, 26, 27, 28, 30, 30, 31, 31, 31, 32, 34, 35, 36, 36, 67,
74, 84,71, 14, 36, 86, 40, 40, 41, 45, 46, 47, 48, 49, 50,
50, 52, 53, 55, 58, 59, 15, 91, 100, 101. Bermula dengan
nilai 10, susun data tersebut dalam interval berlebar 15
dan cari median serta rank persentil 30 hari waktu
tunggu. Tuliskan simpulan yang diambil dari jawaban
mengenai waktu tunggu penanganan siswa berkebutuhan
khusus tersebut. Hitung rata-rata dan modus dari sebaran
tersebut.

| 134
Statistik Dengan Pendekatan Matematik

23. Cari persentil ke-75 (atau Q3) serta rank persentil dari
130 dan 145 dari distribusi berikut. Tentukan pula mean
dan mediannya.

Interval f
151 – 160 3
141 – 150 4
131 – 140 6
121 – 130 9
111 – 120 6
101 - 110 4
91 – 110 5
81 – 90 1

24. Suatu kelas dengan 15 siswa memperoleh skor kuis


sebagai berikut: 0,3,3,6,6,6,9,12,12,12,12,15,15,15,15
a. Buat tabel distribusi frekuensi sederhana (data
tunggal)
b. Hitung rank persentil untuk siswa yang memperoleh
skor 12
c. Cari persentil ke-75

| 135
Statistik Dengan Pendekatan Matematik

BAB IV
INFERENSI DATA NOMINAL

A. Populasi, Sampel, Estimasi, dan Sampling Berulang

S
tatistika inferensial memerlukan teori probabilitas
untuk menarik kesimpulan tentang suatu populasi
dari data sampel. Misalkan menaksir ciri suatu
populasi seperti rata-rata berat badan dari semua mahasiswi
berusia 30 tahun di Indonesia, atau persentase pemilih yang
menyatakan bahwa pemerintah saat ini sedang melaksanakan
program pengawasan terhadap dana BOS (Bantuan
Operasional Sekolah).
Dalam praktek, tidaklah dapat (sukar) memperoleh
data dari setiap anggota populasi. Sebagai gantinya,
didapatkan data dari suatu sampel dan menggunakannya
untuk menarik kesimpulan tentang populasi. Perhatikan
ilustrasi berikut

SAMPEL POPULASI
Statistika
Inferensial

Gambar 4.1
Diagram Penarikan Kesimpulan Tentang Populasi

Populasi adalah kumpulan semua subjek atau objek


atau objek perhatian (tidak selalu orang). Sample adalah
himpunan bagian (subset) dari suatu populasi yang digunakan
untuk menarik kesimpulan tentang karakteristik dari populasi
| 136
Statistik Dengan Pendekatan Matematik

itu. Sedangkan parameter populasi merupakan karakteristik


numerik dari suatu populasi, yaitu suatu kuantitas tetap dan
biasanya tidak diketahui. Contoh parameter :
1. rata-rata berat badan, µ, dari semua mahasiswi berusia 30
tahun dan
2. prosentase pemilih, p, yang percaya bahwa pemerintah
akan melakukan yang terbaik guna meningkatkan mutu
pendidikan.
Data merupakan nilai-nilai yang diukur atau dicatat
pada sampel. Statistik sampel merupakan karakteristik
numerik dari data sampel seperti rata-rata (mean), proporsi
ataupun varians. Karakteristik numerik tersebut dapat
digunakan sebagai penaksir atau estimator dari parameter
populasi terkait. Contoh, prosentase pemilih dalam suatu
pengumpulan pendapat di Indonesia tentang kepercayaan
mereka bahwa pemerintah akan melakukan yang terbaik
untuk meningkatkan mutu pendidikan.
Sampel berbeda memberikan nilai sampel yang
berbeda pula. Dengan mengambil banyak sampel berbeda
dan menghitung suatu statistik untuk setiap sampel (misalnya
rata-rata), akan dapat digambar histogram dari semua rata-
rata sampel. Suatu statistik dari sampel atau dari suatu
eksperimen acak dapat dipandang sebagai variable random
dan histogram merupakan pendekatan terhadap distribusi
probabilitasnya. Istilah distribusi sampel (distribution
sampling) digunakan untuk menggambarkan distribusi itu,
yakni bagaimana statistik (dipandang sebagai variabel acak)
bervariasi jika sampel acak secara berulang diambil dari
populasi.
Jika distribusi sampel diketahui maka keampuhan
suatu statistik sampel sebagai penaksir parameter populasi
yang berkorespondensi dapat ditentukan. Secara khusus,
distribusi sampel menentukan nilai harapan dan varians dari

| 137
Statistik Dengan Pendekatan Matematik

statistik sampel tertentu. Jika nilai yang diharapkan tentang


suatu statistik sama dengan parameter populasi, maka nilai
tersebut merupakan penaksir adalah tak bias. Apabila varians
dari suatu statistik adalah ”kecil” dan juga tak bias maka
statistik yang diamati mungkin cukup dekat ke parameter
populasi.
Bias merupakan jarak antara parameter dan nilai
harapan dari statistik sampel. Statistik-statistik sampel dapat
dikelompokkan seperti ditunjukkan dalam diagram-diagram
berikut.
1. Estimasi dengan bias kecil dikarenakan rata-rata dekat ke
parameter populasi, tetapi memiliki variabilitas tinggi
karena tersebar luas dan nilai sampel tunggal dapat jauh
dari parameter. Perhatikan ilustrasi berikut.

Parameter populasi (biasanya tidak diketahui)

Statitik sampel dari sampel-sampel berbeda

Gambar 4.2 Estimasi dengan Bias Kecil

2. Estimasi dengan bias karena nilai yang diharapkan tidak


sama dengan suatu parameter. Estimasi itu juga
mempunyai variabilitas tinggi dikarenakan tersebar luas.
Perhatikan ilustrasi berikut.
Rata-rata statistik
sampel

| 138
Statistik Dengan Pendekatan Matematik

Gambar 4.3 Estimasi dengan Bias


3. Dalam kasus seperti ilustrasi berikut ini, estimasi
dibiaskan karena semuanya secara sistematis lebih tinggi
daripada parameter populasi.

Gambar 4.4 Estimasi Dibiaskan

4. Statistik sampel mempunyai variabilitas rendah karena


semuanya berdekatan. Perhatikan ilustrasi berikut.

Gambar.4.5
Estimasi dengan Bias dan Variabilitas Rendah

Dalam kasus ini estimasi mempunyai bias rendah dan


variabilitas rendah. Rancangan eksperimental dimaksudkan
untuk mengurangi bias secara serempak dengan cara
menghasilkan suatu distribusi sampel seperti ditunjukan pada
Gambar 5.5. Secara umum: statistik sampel = parameter
populasi + bias + variasi.
Inferensi mengenai karakteristik populasi didasarkan
data dari sampel. Perhatikan diagram berikut.

Statistik sampel = parameter populasi + bias + variasi

peneliti peneliti ingin


mengetahui mengetahui

Gambar 4.6
Ilustrasi Karakteristik Populasi dari Data Sampel

| 139
Statistik Dengan Pendekatan Matematik

Keterangan diagram:
1. Jika sampel bukan representasi populasi yang diteliti,
statistik sampel akan bias sehingga peneliti tidak dapat
menggunakannya untuk membuat kesimpulan yang valid
mengenai parameter populasi.
2. Untuk meminimalkan bias, sampel harus dipilih secara
acak (random sampling) dari daftar semua individu
dalam population yang sesuai. Daftar seperti ini
dinamakan bingkai penarikan sampel (sampling frame).
Hal ini penting.
3. Untuk sampel acak sederhana (simple random sample),
individu-individu di pilih dalam suatu cara dimana setiap
individu dalam bingkai sampling punya kesempatan
yang sama untuk dipilih.
4. Asumsikan bahwa distribusi suatu variabel adalah secara
kuat digambarkan dengan suatu distribusi menggunakan
satu atau lebih parameter (tidak/belum diketahui).
Dengan demikian upayakan mengestimasi parameter
populasi (population parameter) menggunakan data
sampel.
5. Untuk mempelajari perbedaan antara sampel dan
populasi, parameter yang diperlukan untuk mengestimasi
dinamakan parameter-parameter populasi.
6. Estimasi dari parameter populasi yang diperoleh dari
suatu sampel dinamakan statistik sampel (atau estimasi
sampel).
Pada masalah estimasi, yang diperlukan adalah
mendapatkan estimasi titik dan interval keduanya. Estimasi
titik merupakan tebakan terbaik dari nilai parameter
sesungguhnya, sedangkan estimasi interval memberikan
suatu ukuran akurasi dari estimasi titik itu dengan
menyediakan rentang yang memuat nilai-nilai yang masuk
akal. Apabila variabel yang dikaji adalah kuantitatif, mean

| 140
Statistik Dengan Pendekatan Matematik

sampel 𝑥 merupakan estimasi titik dari rata-rata populasi


yang tidak diketahui. Apabila variabel itu berdistribusi
binomial, proporsi sampel merupakan estimasi titik dari
proporsi populasi p yang tidak diketahui.
Interval kepercayaan seringkali digunakan sebagai
estimasi interval. Dalam penelitian biasanya digunakan
interval kepercayaan 95% (95% Confidencial Interval).
Interval kepercayaan 95% dihitung dengan cara bahwa pada
sampling berulang-ulang akan diperoleh suatu parameter
populasi tertentu 95% dari waktu itu. Bilangan 95%
merupakan ukuran kepercayaan bahwa interval memuat
parameter populasi yang benar. Interval kepercayaan
biasanya juga dihitung untuk berbagai tingkat kepercayaan:
90% atau 99% interval kepercayaan.

B. Satu Variabel Kontinu


1. Distribusi Sampel dari Rata-Rata Sampel
Misalkan sampel pada n pengamatan dari suatu
variabel acak kontinu adalah X (misalnya, tinggi, biaya,
suhu). Misalkan µ = E(X) adalah mean populasi, dan σ =
√𝑣𝑎𝑟𝑖𝑎𝑛𝑠 (𝑋) merupakan standar deviasi populasi dari X.
Biasayanya, µ dan σ keduanya tidak diketahui, dan pertama
estimasikan µ. Dari sampel, hitung rata-rata sampel 𝑥 dan
standar deviasi sampel s. Rata-rata sampel merupakan suatu
estimasi dari µ, tetapi seberapa akurat? Distribusi sampling
suatu variabel acak 𝑥dapat diketahui dari Teorema Limit
Pusat (Central Limit Theorem). Andaikan berbagai sampel
berbeda berukuran sama ditarik secara berulang-ulang dari
suatu populasi, masing-masing nilai𝑥 sampel dihitung dan
histogram dari 𝑥 digambarkan, maka bentuk histogram
tergantung pada ukuran sampel (n), dan apoksimasi terhadap
distribusi sampling itu akan berkemiripan dengan tiga
ilustrasi visual berikut.
| 141
Statistik Dengan Pendekatan Matematik

Gambar 4.7
Aproksimasi Histogram Distribusi Sampling

2. Sifat-sifat Distribusi Sampling


a. Distribusi sampling dari 𝑥 mempunyai nilai harapan
yang sama, tanpa memperhatikan ukuran sampel n,
sama dengan µ.
b. Walaupun distribusi dari nilai-nilai X tidak Normal,
yaitu n menambah distribusi untuk 𝑥 menjadi seperti
distribusi Normal – inilah yang dinamakan Teorema
Limit Pusat (Central Limit Theorem).
c. Apabila n bertambah, distribusi dari 𝑥menjadi
ramping – yakni kluster 𝑥 lebih dekat sekitar µ.
Dengan demikian, varians berbanding terbalik
terhadap n.atau dituliskan secara simbolik sebagai :
𝜎 2
𝑣𝑎𝑟(𝑋̅) = 𝑛 .

d. Akar kuadrat dari varians tersebut, yaitu √𝑣𝑎𝑟(𝑋)

dinamakan “kesalahan baku” (standard error) dari 𝑋,


𝜎
atau dinotasikan SE (𝑋 ) = 𝑛.
e. Distribusi sampling dari 𝑋 merupakan (aproksimasi)
𝜎2
𝑋~𝑁(µ, ).
𝑛

| 142
Statistik Dengan Pendekatan Matematik

Dengan demikian,

∑𝑋 1
𝑣𝑎𝑟(𝑋̅) = 𝑣𝑎𝑟 ( ) = 2 𝑣𝑎𝑟 (∑ 𝑋)
𝑛 𝑛
1
= 2 𝑣𝑎𝑟(𝑋1 + ⋯ + 𝑋𝑛 )
𝑛
1 1 𝜎2
= 2 (𝜎 2 + ⋯ + 𝜎 2 ) = 2 𝑛𝜎 2 =
𝑛 𝑛 𝑛

3. Limit Kepercayaan untuk Mean Populasi apabila σ


diketahui
Menghitung probabilitas untuk 𝑋 menggunakan
rumus Z berikut dari tabel Z ~ 𝑁(0,1).Rumusnya adalah:
𝑋̅ −𝜇
𝑍= 𝜎 ~𝑁(0,1). Perhatikan ilustrasi berikut.
√𝑛

Gambar 4.8 Kurva Normal

Perhatikan gambar kurva Normal tersebut, dan dari


tabelnya diperoleh bahwa P (Z<1) = 0,8413, sehingga P(- 1 <
Z < 1) = 0,8413 - (1- 0,8413) = 0,6826. Probabilitas 0,6826,
𝜎 𝜎
ekivalen dengan - 1 < Z < 1.Berarti :𝑋̅ − 𝑛 < 𝜇 < 𝑋̅ + 𝑛.
√ √
Dengan demikian, 68,3% dari seluruh sampel akan memuat
mean populasi µ antara interval random: 𝐿 = (𝑋̅ −
𝜎 𝜎
) 𝑑𝑎𝑛 𝑈 = (𝑋̅ + ). L merupakan batas bawah
√𝑛 √𝑛
| 143
Statistik Dengan Pendekatan Matematik

kepercayaan 68% untuk µ dan U adalah batas atas


kepercayaan 68% untuk µ.
Contoh: Pada tabel N(0,1), P(Z < 1,96) = 0,975.
Karena P(- 1,96 < Z < 1,96) = 0,95, maka

Gambar 4.9
Batas-Batas Kepercayaan 95% untuk μ

Dengan cara yang sama, 90% batas kepercayaan


𝜎
untuk µ adalah 𝑋 ± 1,645 𝑛 dan 99% batas kepercayaan

𝜎
untuk µ adalah 𝑋 ± 2,575 . Probabilitas bahwa µ terletak
√𝑛
𝜎
dalam interval random 𝑋 ± 1,96 adalah 0,95. Apabila
√𝑛
𝜎
diamati mean sampel 𝑋, maka interval ± 1,96 adalah 95%
√𝑛
interval kepercayaan untuk µ. Namun, interval tersebut
merupakan interval pengamatan (tidak random) dan dengan
demikian ia memuat atau tidak memuat µ. Jadi bahwa 𝑋 ±
𝜎
1,96 𝑛 memuat µ dengan probabilitas 0.95 adalah tidak tepat

(salah), karena tidak ada variabel random dalam pernyataan
ini untuk suatu probabilitas yang dirujuk.
𝜎
Sebagai gantinya, katakan bahwa interval 𝑋 ± 1,96 𝑛

memuat nilai-nilai masuk akal untuk µ dan konsisten dengan
data sampel, atau bahwa 95% kepercayaan bahwa µ terletak
𝜎
dalam interval 𝑋 ± 1,96 . Sebesar 95% kepercayaan tidak
√𝑛
merujuk kepada probabilitas interval yang diamati, tetapi
| 144
Statistik Dengan Pendekatan Matematik

untuk memberikan pengertian dari sampling berulang. Dalam


praktek, σ biasanya tidak diketahui, tetapi dapat diestimasi
dari standar deviasi sampel, s. Apabila hal ini dilakukan,
distribusi-t harus digunakan sebagai ganti normal standar.

Contoh:
Sampel n = 100 mahasiswi berusia 25-29 tahun.
Mean 𝑋 = 165 cm, dan standar deviasi sampel s = 5 cm.
Misalkan SD populasi diketahui tepat sama dengan 5.
Estimasi adalah nilai 5 tersebut. Metode yang hanya
menetapkan estimasi tersebut didasarkan pada distribusi-t,
sebagbai ganti dari distribusi normal. Perbedaan keduanya
adalah kecil apabila ukuran sampel besar. Pelajari
perhitungannya sebagai berikut.

95% batas kepercayaan untuk mean populasi µ adalah:


5
165 + 1,96 × = 165,98 166
√100
5
165 – 1,96 × = 164,02 164
√100

Dengan demikian, interval kepercayaan 95% untuk µ


adalah (164, 166) cm. Yang berarti bahwa nilai-nilai untuk µ
yang masuk akal adalah 164-166 cm, atau dengan
kepercayaan 95% tinggi rata-rata populasi wanita berusia 25-
29 benar terletak antara 164 dan 166 cm.
4. Interpretasi dari interval kepercayaan
Misalkan kita mengambil beberapa sampel masing-
masing berukuran n dari populasi dan kemudian dihitung
𝜎
(masing-masing) adalah 𝑋 ± 1,96 𝑛. Dari rata-rata, 95%

interval memuat nilai µ yang benar tetapi nilai µ yang tidak
diketahui yaitu 5% bolehjadi tidak benar. Apabila interval-
interval diletakkan secara vertikal, maka ilustrasinya adalah
sebagai berikut.
| 145
Statistik Dengan Pendekatan Matematik

Gambar 4.10
Ilustrasi Interval Kepercayaan Secara Vertikal

Sampel

Benar tetapi nilai μ Interval kepercayaan 95%


𝜎
tidak diketahui Nilai atas = U = 𝑥̅ + 1,96
√𝑛
𝜎
Nilai bawah = L = 𝑥̅ − 1,96
√𝑛
Keterangan:
1. Mean sampel menyediakan estimasi titik (point estimate)
yang merupakan aproksimasi (pendekatan) nilai tunggal
untuk µ. Pada contoh tersebut, rata-rata tinggi
mahasiswi adalah 165cm, yang berarti bahwa µ
mendekati 165cm.
2. Batas kepercayaan menyediakan estimasi interval
(interval estimate) bersama-sama dengan derajat
kepercayaan bahwa parameter itu berada dalam suatu
interval. Dari contoh tersebut, dengan kepercayaan 95%
rata-rata tinggi populasi mahasiswi µ adalah berada
dalam interval (164, 166) cm.
3. Panjang interval atau ketepatan estimasi (precision of
estimate) tergantung pada ukuran sampel.
4. Pada contoh mengenai tinggi mahasiswi, ukuran sampel
n=100, sehingga 95% interval kepercayaan adalah 𝑋 ±
5
1.96 atau (164, 166) cm.
√100
5. Misalkan ukuran sampel n = 40 tetapi rata-rata dan
standar deviasi tetap, yaitu 𝑋 = 165 and σ = 5. Oleh
karena itu 95% interval kepercayaan untuk µ adalah
(163.5, 166.5).

| 146
Statistik Dengan Pendekatan Matematik

6. Perhatikan bahwa penambahan ukuran sampel


1
menambah ketepatan estimasi untuk tetapi tidak untuk
√𝑛
1
. Contoh, 95% interval kepercayaan = U - L = (𝑋 +
𝑛
𝜎 𝜎 𝜎
1,96 ) - (𝑋 – 1,96 ) = 2 × 1,96 . Dengan demikian,
√𝑛 √𝑛 √𝑛
apabila n = 100, maka panjang interval sama dengan
2𝑥1,96𝜎
= 0,392 σ. Jika n = 25, panjangnya 0,784 σ.
√100
7. Jika ukuran sampel bertambah 4, maka interval
kepercayaan berkurang ½. Ketepatan estimasi tergantung
1 𝜎
pada bentuk dalam kesalahan standar SE (𝑋) = .
√𝑛 √𝑛

5. Pengujian hipotesis (Hypothesis Testing)


Untuk menguji hipotesis bahwa suatu parameter
populasi mempunyai beberapa nilai spesifik, biasanya
digunakan dua pendekatan. Perhatikan contoh berikut.

Contoh:
Panjang pensil yang digunakan siswa SD/MI
Pabrik pensil memproduksi pensil-pensil yang panjangnya 15
cm. Panjang sesungguhnya berbeda sedikit-sedikit. Proses
produksi stabil dan SD populasi diketahui yaitu σ = 0,3 cm.
Sampel sebanyak 50 dengan rata-rata = 14,85 cm. Apakah
panjang rata-rata pensil semuanya bukan 15 cm?

Penyelesaian:
Distribution sampling dari mean sampel adalah:
𝜎2
𝑋̅~𝑁 (𝜇, ). Dalam contoh ini, σ = 0,3, n = 50, dan𝑋 =
𝑛
14,85 dan ingin diketahui apakah µ = 15 benar.

Pendekatan pertama adalah mendapatkan interval


kepercayaan untuk µ. Interval kepercayaan 95% adalah
| 147
Statistik Dengan Pendekatan Matematik

(14.77, 14.93)cm. Karena interval ini tidak memuat 15,0,


maka berarti data tidak sesuai dengan hipotesis bahwa µ =
15. Data tidak mendukung hipotesis bahwa rata-rata panjang
semua pensil adalah 15cm.
Interval kepercayaan dengan probabilitas lain,
misalnya 0,9 atau 0,99, dapat dihitung menggunakan cara
yang sama. Dari contoh tersebut, interval kepercayaan 99%
adalah (14.74, 14.96) cm.
Pendekatan kedua adalah menguji hipotesis yaitu µ
= 15cm secara langsung seperti berikut.
1. Asumsikan bahwa µ = 15 yaitu hipotesis nol benar.
2. Hitung probabilitas perolehan mean sampel dari rata-rata
populasi yang diamati yaitu 𝑋 = 14.85.Perhatikan gambar
pada kurva normal berikut.

Gambar 4.11
Kurva Normal untuk Nilai μ = 15

Luas daerah yang diarsir merupakan nilai-nilai dari µ


= 15 dengan nilai yang diamati adalah 𝑋= 14,85. Nilai ini
dinamakan ”nilai-p” ("p-value"). Dalam hal ini, nilai-p =
(0,3) 2
P(𝑋≤14,85 atau 𝑋≥15,15). Jika𝑋̅~𝑁 (15, 50 ) maka Z =
𝑋−15
0,3 . Dengan demikian,
√50

P(𝑋≤ 14,85 atau 𝑋≥15,15)

| 148
Statistik Dengan Pendekatan Matematik
14,85 −15 15,5 −15
= P(Z ≤ 0,3 atau Z ≥ 0,3 )
√50 √50
= P(Z < - 3,5 atau Z > 3,5) < 0,001 (diperoleh dari
tabel).

Perhatikan ilustrasi pada kurva normal berikut.

Gambar 4.12
Kurva Normal Nilai P (Z < -3,5 atau Z > 3,5)

3. Probabilitas ini, nilai-p <0,001 adalah sangat kecil


sehingga disimpulkan bahwa data sampel merupakan
fakta ketidaksesuaian dengan asumsi µ = 15. Hipotesis
bahwa panjang rata-rata pensil adalah 15 cm ditolak.

6. Langkah-langkah pengujian hipotesis


Secara umum langkah-langkah pengujian hipotesis
adalah sebagai berikut.
1. Nyatakan hipotesis (seringkali merupakan nilai
parameter) sehingga dapat dihitung probabilitas (sampel)
distribusi untuk statistik sampel yang akan diamati,
dalam contoh adalah µ = 15, yakni dengan mengambil σ
0,3 2
= 0,3, sebaran pada kurva normal adalah 𝑋̅~𝑁 (15, 50 )
2. Menghitung statistik dari data, (yakni, 𝑥̅ = 14,85)

| 149
Statistik Dengan Pendekatan Matematik

3. Menghitung nilai p = Pr(perolehan nilai ekstrim atau


lebih ekstrim daripada statistik yang dihitung apabila
hipotesis benar). Misal, contoh sebelumnya yakni nilai p
= Pr (𝑋̅ ≤ 14,85 𝑎𝑡𝑎𝑢 𝑋̅ ≥ 15,15)
4. Apabila nilai p kecil, yang berarti bahwa nilai sampel
tersebut sangat diharapkan tidak terjadi jika hipotesis
benar, maka hipotesis tersebut ditolak.

7. Interpretasi dari Nilai-Nilai p


Nilai-nilai p atau interval kepercayaan dapat
digunakan untuk menguji hipotesis. Pendekatan ini ekivalen
dimana simpulan yang sama akan dapat diperoleh
menggunakan pendekatan manapun. Dalam literatur
penelitian, hasil-hasil dari uji statistik biasanya dilaporkan
menggunakan nilai p. Nilai p menyediakan suatu ukuran
objektif mengenai kekuatan kejadian dimana data sesuai
hipotesis nol. Hal tersebut merupakan probabilitas
mendapatkan hasil ekstrim atau lebih ekstrim daripada data
yang diamati apabila hipotesis nol yang dirumuskan
benar.Nilai p kecil menyediakan peristiwa yang menolak
hipotesis nol, karena data yang sudah diamati tidak sesuai
apabila hipotesis nol benar. Dengan demikian kita menolak
hipotesis nol bila nilai p cukup kecil.
Selama ini dikenal (konvensional) dalam statistik
menolak hipotesis nol pada level (taraf keberartian) 5%.
Maksudnya, Ho ditolak apabila terdapat satu dalam dua puluh
kesempatan, atau kurang, dari peristiwa yang sedang terjadi.
Apabila nilai p kurang dari 0,05, peristiwa yang terjadi
dikatakan signifikan secara statistik pada taraf 0,05. Taraf
0,05 sederhananya merupakan nilai cutoff yang diambil
menurut kesepakatan/harapan. Nilai-nilai yang dekat ke 0,05
menyediakan peristiwa konservatif menolak hipotesis nol,
sementara nilai-nilai yang kurang dari 0,01 menyediakan
| 150
Statistik Dengan Pendekatan Matematik

peristiwa yang pantas dipertimbangkan menolak hipotesis


nol.
Satu pendekatan adalah memutuskan sebelum
mempelajari nilai p yang akan digunakan untuk menolak atau
tidak menolak suatu hipotesis. Hal ini dinamakan taraf
keberartian dari suatu uji (significance level of the test),
misalnya taraf keberartian = 0,05 dinotasikan menggunakan
α, huruf Yunani (Greek) dan dibaca alpha. Dengan
demikian, hipotesis ditolak jika nilai p <taraf signifikansi
αdan data dikatakan signifikan secara statistik pada taraf α.
Hipotesis khusus untuk nilai parameter populasi
dinamakan hipotesis nol (dinotasikan H0). Suatu hipotesis nol
haruslah secara cukup mendefinisikan distribusi sampel
untuk pengambilan contoh statistik yang digunakan dalam
menghitung nilai p. Suatu uji keberartian dirancang untuk
menilai kekuatan dari peristiwa yang menolak hipotesis nol.
Biasanya hipotesis nol merupakan pernyataan mengenai
”tidak ada pengaruh” atau ”tidak ada perbedaan”. Hipotesis
nol dibandingkan dengan hipotesis alternatif, dinotasikan H1
atau HA, yang biasanya menunjuk pada nilai mungkin lain
untuk parameter suatu populasi. Hal tersebut merupakan
suatu pernyataan yang diharapkan atau yang diduga benar
sebagai ganti dari H0.
H1 tidak khusus sebagai suatu nilai yang unik untuk
parameter populasi. H1dapat berupa rentang nilai-nilai serta
dapat pada satu sisi (one-sided) atau dua sisi (two-sided).
Perhatikan penjelasan berikut.
1. Jika H1 menerima nilai parameter pada sisi lain dari nilai
khusus H0 (yakni, H0: µ = 100 dihadapkan dengan H1 :
µ≠100) maka nilai-p merupakan probabilitas suatu
statistik diamati adalah ekstrim atau lebih ekstrim dari
pada pengamatan sesungguhnya, dalam arah yang lain.
Uji ini dinamakan dua-ekor atau dua-sisi.

| 151
Statistik Dengan Pendekatan Matematik

2. Adakalanya hanya nilai-nilai parameter pada satu sisi


dari nilai khusus H0 yang diperhatikan.Yakni
membandingkan H0 : µ = 100 dengan H1 : µ > 100.Oleh
karena itu nilai-p = P (statistik ekstrim atau lebih ekstrim
daripada nilai yang diamati hanya dalam arah yang
konsisten dengan H1). Uji seperti ini dinamakan satu-
ekor atau satu-sisi.
3. Tidaklah dapat dibuktikan secara statistik bahwa suatu
hipotesis benar atau salah. Akan tetapi dapat ditunjukkan
bahwa fakta melawan hipotesis nol sangat kuat sehingga
masuk akal menolaknya dalam rangka menerima
hipotesis alternatif. Dengan perkataan lain, apabila tidak
terdapat data/fakta yang kuat melawan hipotesis nol,
maka tentu tidak masuk akal menolaknya. Jika peneliti
tidak memiliki arah tertentu secara kuat (dalam pikiran)
pada awal penelitiannya, maka gunakan hipotesis
alternatif dua-arah atau dua-sisi. Jarang sekali benar
menggunakan uji 1-arah atau 1-sisi dalam
praktek/kegiatan praktis.

8. Kesalahan Tipe I dan Tipe II, dan Kekuatan Uji


Statistik
Dalam pengujian hipotesis terdapat dua jenis
kesalahan yang dapat terjadi, yakni:
a. Menolak H0 (karena nilai-p kecil) ketika H0 benar, dan
b. Tidak menolak H0 (karena nilai-p tidak kecil) ketika H0
salah.

| 152
Statistik Dengan Pendekatan Matematik

Perhatikan tabel berikut.

Tabel 4.1
Jenis-Jenis Kesalahan dalam Pengujian Hipotesis

Kebenaran (tidak diketahui)


No
Keputusan H0 benar H0 salah
1 Tidak menolak H0 Keputusan benar Kesalahan Tipe II

2 Menolak H0 Kesalahan Tipe I Keputusan salah

Penjelasan:
1. Taraf signifikansi
= P (kesalahan tipe I yang memberikan H0 benar)
= probabilitas menolak hipotesis nol ketika benar
Probabilitas ini secara konvensional dinamakan "alpha".
2. Kekuatan
= 1 – P (kesalahan tipe II yang memberikan H0 salah)
= probability menolak hipotesis nol ketika salah
Probabilitas menerima hipotesis nol ketika salah (yakni
probabilitas kondisional dari kesalahan tipe II) secara
konvensional dinamakan β ("beta"), sehingga: kekuatan
= 1-β. Studi-studi ideal sebaiknya dirancang sehingga
kekuatan yakni 1-β sekurang-kurangnya 0,8. Hal ini
mensyaratkan suatu rancangan efisien dan ukuran sampel
cukup besar.

Contoh:
Botol-botol minuman ringan (softdrink) berisi 300ml. Suatu
sampel dengan n = 10 botol diukur dan isinya (dalam ml)
masing-masing adalah: 299, 276, 283, 301, 297, 281, 300,
291, 295, 291.
a. Uji hipotesis nol H0 : µ = 300 terhadap hipotesis
alternatif H1: µ≠300.
b. Cari interval kepercayaan 90% untuk µ.
| 153
Statistik Dengan Pendekatan Matematik

Penjelasan:
Untuk data tersebut, asumsikan distribusi sampel adalah
X~N(µ, σ2) tetapi µ dan σ tidak diketahui. Dari data
diperoleh 𝑥̅ = 291,4, s = 8,72, dan n = 10.Untuk menguji
hipotesis nol, pertama asumsikan bahwa H0benar.
Asumsikan µ = 300, sehingga nilai pengamatan dari statistik-
t adalah:

𝑥̅ − 𝜇 291,4 − 300
𝑡= 𝑠 = 8,72 = −3,12
√𝑛 √10

Perhatikan ilustrasi pada kurva normal berikut.

Nilai Tabel

Gambar 4.13
Ilustrasi pada Kurva Normal Nilai Distribusi t

Nilai-p sebesar p merupakan probabilitas pengamatan


statistik t, atau yang lebih ekstrim, dalam arah lain p = P(t9< -
3,12 atau t9> 3,12) < P(t9< - 2,82 atau t9> 2,82). Karena itu p
< 2 × P(t9> 2,82) = 0,02. Perhatikan bahwa tabel-t (t-tables)
untuk derajat kebebasan 9 tidak mempunyai probabilitas
untuk nilai 3,12. Nilai paling kecil dan sangat dekat pada
tabel adalah 2,82. Saat ini, tidak ada alasan tidak
menggunakan program komputer untuk mendapatkan nilai

| 154
Statistik Dengan Pendekatan Matematik

distribusi-t (the exact t-distribution) secara tepat, yang


memberikan nilai-p dua arah dari 0,0123.
Apabila nilai-p kurang dari 0,05 dikatakan nilai-p
adalah kecil dan ada data yang masuk akal ditandingkan
dengan H0. Peneliti dapat menyimpulkan data tersebut
memberikan fakta yang menolak H0: µ ≠300. Untuk
mendapatkan Interval Kepercayaan 90% untuk µ, dari tabel
untuk t9 perlu mendapatkan nilai c sehingga P(- c < t9< c) =
0,9. Untuk mendapatkannya, luas daerah dari 0,05 haruslah
ditinggalkan dalam masing-masing ekor dari distribusi t9, dan
kemudian dari Tabel 2, ambil nilai 1,833. Berarti, Pr (-1.833
𝑠
< t9< 1.833) = 0,9. Oleh karena itu 𝑥̅ ± 1,833 𝑛 memberikan

Interval Kepercayaan 90% pengamatan, dimana 𝑥̅ dan
smerupakan nilai-nilai yang diamati.
Penggunaan 𝑥̅ = 291,4, s = 8,72 berinterval 291,4 ±
𝑠
1.833 10= (286,3, 296,5). Dengan kepercayaan 90%

mean/rata-rata (populasi) isi botol berada dalam interval
(286,3ml, 296,5ml). interval tersebut tidak memuat nilai 300,
data tidak mendukung hipotesis bahwa rata-rata isi yang
benar dari semua botol minuman adalah 300ml. Perhatikan
bahwa untuk Interval Kepercayaan 95% dengan
𝑠
menggunakan distribusi t9 perhitungan menjadi 𝑥̅ ± 2,262 𝑛.

Apabila peneliti menginginkan suatu nilai untuk distribusi t
yang tidak berdaftar dalam Tabel 2 (misalnya untuk df = 37)
maka gunakan distribusi df lebih rendah pada tabel (yakni df
= 30) atau dengan interpolasi untuk mengestimasi nilai
tersebut.

Catatan:
1. Pengujian hipotesis distribusi-t memberikan nilai-p lebih
tinggi daripada distribusi normal, sehingga hipotesis nol
berkemungkinan kecil ditolak (bahkan apabila salah).
| 155
Statistik Dengan Pendekatan Matematik

Dengan demikian kekuatan (power) lebih rendah karena


uji tersebut berdasarkan dari sedikit informasi (sebab
estimasi sampel s digunakan menggantikan nilai populasi
σ).
2. Interval kepercayaan dari distribusi-t lebih lebar daripada
dari distribusi normal (normal distribution) (karena ada
sedikit informasi dan statistik-t mempunyai varians lebih
besar daripada statistik-z).

̅ apabila 𝛔 tidak diketahui


C. Distribusi Sampel dari 𝑿
Apabila suatu sampel acak berukuran n diambil dari
populasi berdistribusi normal dengan rata-rata µ dan standar
𝜎2
deviasi σ, maka 𝑋̅~𝑁 (𝜇, ). Apabila σ tidak diketahui maka
𝑛
estimasikan standar deviasi menggunakan data sampel.
𝑋̅ −𝜇
Dengan demikian sebagai ganti uji statistik Z = 𝜎
√𝑛
𝑋̅ −𝜇
digunakan t = 𝑠 . Uji statistik t yang dihitung menggunakan
√𝑛
s sebagai ganti dari σ tidak berdistribusi normal.
Nilai 𝑋̅ dan s keduanya dihitung dari data dan karena
itu keduanya merupakan variabel acak, maka t adalah rasio
dari dua variabel acak dan lebih variabelistik daripada Z.
distribusi sampel dari tditurunkan oleh W. S. Gosset yang
menulis menggunakan nama samaran (pseudonym) "Student"
yang oleh karena itu kadang-kadang dinamakan distribusi-t
Student (Student's t-distribution).
Distribusi-t memiliki bentuk serupa dengan sebaran
normal, yakni agak mendekati dan mempunyai daerah lebih
besar pada bagian ekor daripada distribusi normal. Bentuk
distribusi tersebut tergantung pada derajat kebebasan yakni
(n-1), dimana n adalah ukuran sampel, sehingga seringkali
dituliskan menggunakan notasi t atau tn-1. Perhatikan ilustrasi
berikut.
| 156
Statistik Dengan Pendekatan Matematik

DEVIASI

Gambar 4.14 Distribusi-t dan Sebaran Normal

Perbandingan distribusi t1 dan t5 terhadap sebaran


normal baku (standard normal distribution), N(0,1)
diperlihatkan pada tabel berikut.

Tabel 4.2
Perbandingan Nilai t terhadap Sebaran Normal

Statistik N(0,1) t5 t1
Mean (rata-rata) 0 0 0
Varians 1 5/3 inf.
Skewness (kemencengan) 0 0 0
Kurtosis (keruncingan) 3 9 inf.

Dapatkan distribusi t pada tabel (a conventional table)


atau, lebih baik, sebagai fungsi pada terprogram
(programmed function), yakni bahwa:

P(t5> 2.015) = 0.05


P(t20> 1.725) = 0.05
P(t50> 1.676) = 0.05
| 157
Statistik Dengan Pendekatan Matematik

P(tinf> 1.645) = 0.05, bandingkan dengan P(Z >


1.645) = 0.05 where Z ~ N(0, 1). Dengan demikian
distribusi tn mendekati N(0, 1) apabila n mendekati ∞.

Untuk ukuran sampel acal n yang ditarik dari suatu


𝑥̅ −𝜇
populasi dimana X ~ N (µ, σ2), statistik𝑡 = 𝑠 mempunyai
√𝑛
distribusi t dengan df adalah n–1, dimana 𝑥̅ adalah rata-rata
sampel dan s standar deviasi sampel. Perhatikan ilustrasi
berikut.

Gambar 4.15 Distribusi t5

D. Uji Hipotesis Data Kategori


1. Pengujian Dua Kategori
Perhatikan contoh-contoh berikut.

Contoh 1: Uji Keberhasilan Belajar Di Luar Kelas.


Enam dari 7 "uji keberhasilan belajar di luar kelas" di
suatu sekolah adalah perempuan. Hal ini memunculkan
spekulasi bahwa keberhasilan belajar di luar kelas berkaitan
dengan gender. Berdasarkan data tersebut, uji hipotesis nol
adalah H0 : P (perempuan) = ½ terhadap hipotesis alternatif
H1 : P (perempuanl) ≠½.
Misalkan X = banyak perempuan. Untuk menguji
hipotesis, pertama asumsikan hipotesis nol benar dan
| 158
Statistik Dengan Pendekatan Matematik

kemudian hitung nilai-p yang bersosiasi dengan nilai sampel


yang diperoleh, yakni asumsikan X ~ Binomial (7, ½) (n = 7
siswa, asumsikan pr (perempuan) = ½). Dengan demikian
E(X) = 7 × ½ = 3,5. Nilai yang diamati dari X adalah 6 yang
bernilai ekstrim 6 atau lebih ekstrim dalam arah lain
daripada yang diharapkan (yakni 3,5) adalah X = 6 atau X
= 7 atau X = 1 atau X = 0. Perhitungan nilai-p berikut
menggunakan rumus binomial eksak karena n tidak besar.
Nilai-p = P(X=6 atau 7 atau 1 atau 0)
7 1 6 1 1 7 1 7 1 0
= ( ) (2) (2) + ( ) (2) (2) +
6 7
7 1 1 1 6 7 1 0 1 7
( ) (2) (2) + ( ) (2) (2)
1 0
1 7 7 7 7 7
= ( ) [( ) + ( ) + ( ) ( )]
2 6 7 1 0
1 7 1
= (2) [7 + 1 + 7 + 1] = 8 = 0,12.
Karena nilai-p lebih besar daripada 0,05 maka secara statistik
tidak signifikan. Simpulannya adalah data konsisten bahwa
H0 : P(perempuan) = P(laki-laki) = 1/2
Contoh 2:
Tiga (3) dari 21 siswa adalah laki-laki. Andaikan
hanya 3 dari 21 siswa pertama yang belajar di luar kelas
adalah laki-laki. Dapatkah dinyatakan bawa rasio gender
untuk keberhasilan belajar di luar kelas bukan 1:1?
Misalkan X = banyak perempuan. Asumsikan X ~
Binomial (21,½). Dalam hal ini, nilai-p = P(X ≤3 atau X
1 21 21 21 21 21
≥18) = 221 [( ) + ( ) + ( ) + ( ) + ( ) + ⋯ +
3 2 1 0 18
21
( )]≈ 0,0015 (dari kalkulator). Secara statistik adalah
21
signifikan (karena nilai-p sangat kecil daripada 0,05)
sehingga H0ditolak dan simpulannya adalah rasio gender
bukan 1:1.
| 159
Statistik Dengan Pendekatan Matematik

Perhatikan bahwa proporsi laki-laki yang diamati, 1/7,


adalah sama untuk kedua sampel tersebut. Nilai-p
dipengaruhi total, n, dari siswa atau secara ekivalen, banyak
laki-laki dan prerempuan yang diharapkan, masing-masing np
dan n(1-p). perhatikan contoh berikut.

Contoh 3:
Misalkan dalam 50 kali pelemparan pertama dari satu
koin muncul 20 angka dan 30 gambar. Dapatkah diduga
bahwa koin itu tidak seimbang?
Misalkan X = banyak angka. Asumsikan X ~
Binomial (50,½). Dalam kasus ini, banyak kali muncul angka
yang diharapkan, dengan berasumsi koin seimbang adalah 50
×½ = 25. Nilai-p merupakan probabilitas mendapatkan nilai
harapan 20 atau nilai lebih ekstrim (≤ 20 angka) dalam arah
lain (yakni ≥30 angka), atau nilai-p = P(X≤20 atau X ≥30)
yang membosankan menghitungnya secara langsung.
Oleh karena itu digunakan pendekatan Normal
terhadap sebaran, karena nbesar, yakni jika X ~ Binomial
(n,p) maka kira-kira X ~ Normal (np,npq). Untuk n = 50 dan
𝑋−25
p = ½, np = 25, npq = 12,5 dan 𝑍 = .
√12,5
Nilai-p = P(X≤20 atau X ≥30) dan dengan
menggunakan koreksi kekontinuan,
20,5−25 29,5−25
= P(Z ≤ atau Z ≥ )
√12,5 √12,5
≈P(Z≤- 1,273 atau Z ≥1,273)
= 2 × (1 - 0.898)
≈0.20
Mengingat bahwa nilai-p tersebut secara statistik tidak
signifikan maka disimpulkan data konsisten dengan hipotesis
P (angka) = ½ yakni bahwa koin yang dimakdud mungkin
seimbang.

| 160
Statistik Dengan Pendekatan Matematik

2. Pengujian lebih dari 2 kategori


Untuk menggeneralisasi uji pada lebih dari dua
kategori, pendekatan uji dua kategori berikut ekivalen dengan
metode yang digunakan pada contoh bagian 1 yang dapat
diperluas pada lebih banyak kategori. Perhatikan tabel
berikut.
Tabel 4.3
Luaran Dua Kategori Pelemparan Koin

Kategori : Angka Gambar


Frekuensi Yang : o1 = x o2 = n-x
Diamati
Frekuensi Yang : e1 = np e2 = n(1- p)
Diharapkan

Perhitungannya menggunakan rumus:


(𝑜1 −𝑒1 )2 (𝑜2 −𝑒2)2
𝜒2 = + . Lambang 𝜒 adalah huruf
𝑒1 𝑒2
Yunani (Greek) chi dan diucapkan ki.
Keterangan:
1. Rumus tersebut mempertimbangkan perbedaan antara
frekuensi diamati (o) untuk kategori-kategori dan
frekuensi diharapkan (e) apabila hipotesis nol benar.
2. Namun rumus itu mengabaikan arah perbedaan (karena
nilainya dikuadratkan) sehingga berkorespondensi
dengan uji dua-ekor.
3. Rumus tersebut menyesuaikan ukuran nilai-nilai yang
diharapkan – seperti dua contoh pertama pada bagian 1
(pengujian dua kategori).
4. Dalam kasus dua kategori metode ini identik dengan
pendekatan normal terhadap sebaran binomial, yakni
sebagai berikut:

| 161
Statistik Dengan Pendekatan Matematik

(𝑥 − 𝑛𝑝)2 [(𝑛 − 𝑥) − 𝑛(1 − 𝑝)]2


𝜒2 = +
𝑛𝑝 𝑛(1 − 𝑝)
(1 − 𝑝)(𝑥 − 𝑛𝑝)2 + 𝑝(−𝑥 + 𝑛𝑝)2
=
𝑛𝑝(1 − 𝑝)
(𝑥−𝑛𝑝)2
= , sebab (1 – p) + p = 1
𝑛𝑝(1−𝑝)
𝑥−𝑛𝑝
= 𝑍 2 , dimana𝑍 = , dan q = 1 – p
√𝑛𝑝𝑞

Dengan demikian, apabila hanya terdapat dua kategori


dan frekuensi total pada suatu jumlah tetap n, (sehingga
hanya ada satu variabel acak X), maka 𝜒 2 = Z2.

Contoh:
Perhitungan nilai-p memerlukan probabilitas sebaran untuk
𝜒2 seperti pada tabelnya. Tabel dimaksud merupakan sebaran
ki-kuadrat(chi-squared) dengan derajat kebebasan (df)1,
ditulis𝜒 21, lihat Tabel 3, yakni
P(Z < - 1.96 atau Z > 1.96) = 0,05
Ekivalen dengan
P(Z2> 1.962)
= P(Z2> 3.84)
= P (𝜒21> 3.84)
= 0.05 dari Table 3 (baris pertama)
Perhatikan ilustrasi visual berikut.

Gambar 4.16.
Ekivalensi Normal terhadap Sebaran Ki-Kuadrat

| 162
Statistik Dengan Pendekatan Matematik

3. Pengujian untuk k kategori


Perhatikan tabel frekuensi untuk k kategori berikut.
Tabel 4.4
Distribusi Frekuensi k Kategori

Kategori : A1 A2 ... Ak
Frekuensi Diamati : o1 o2 ... ok
Frekuensi diharapkan : e1 e2 ... ek

Misalkan e1, e2,...,ek adalah frekuensi diharapkan yang


diduga merupakan hipotesis (nol) atau suatu model. Untuk
melihat sebagai baik data (frekuensi diamati)
berkorespondensi dengan hipotesis itu (frekuensi
diharapkan), lakukan perhitungan sebagai berikut:

(𝑜1 − 𝑒1 )2 (𝑜2 − 𝑒2 )2 (𝑜𝑘 − 𝑒𝑘 )2


𝜒2 = + + ⋯+
𝑒1 𝑒2 𝑒𝑘
Jika data berkorespondensi dekat ke hipotesis maka
(oi- ei) kecil untuk tiap kategori, sehingga 𝛘2 kecil. Apabila
data tidak konsisten dengan hipotesis maka beberapa atau
semua nilai (oi-ei) besar, sehingga χ2 besar.
Untuk menentukan seberapa besar χ 2 dapat dilakukan
(hanya kemungkinan) jika hipotesis benar, yakni perlu
diketahui sebaran sampelnya. Inilah yang merupakan sebaran
ki-kuadrat (chi-squared distribution) dengan derajat
kebebasan (degrees of freedom) yakni (k-1). Dengan
demikian, untuk k = 3 kategori, gunakan derajat kebebasan 3
- 1 = 2.
Tabel 3 memberikan probabilitas nilai pengamatan χ 2
lebih besar daripada berbagai nilai pada tabel. Manfaatnya
diilustrasikan dalam contoh mengenai 60 kali melempara
dadu. Untuk menguji apakah dadu benar-benar seimbang,

| 163
Statistik Dengan Pendekatan Matematik

dilakukan pelemparan sebanyak 60 kali. Hasilnya disajikan


seperti pada tabel berikut.
Tabel 4.5
Hasil 60 Kali Melempar Dadu
Permukaan Dadu, xi : 1 2 3 4 5 6
Frekuensi diamati, oi : 12 7 10 17 5 9

Apakah data seperti pada tabel menunjukkan dadu


benar-benar seimbang? Hipotesis nol: dadu benar-benar
1
seimbang sehingga probabilitas masing-masing nilai adalah 6.
Jika benar, maka untuk n = 60 lemparan frekuensi harapan
1
untuk masing-masing xi adalah 60× = 10. Perhatikan tabel
6
berikut.
Tabel 4.6
Sebaran Frekuensi dari 60 Kali Melempar Dadu

Permukaan Dadu xi 1 2 3 4 5 6 Total


Frekuensi diamati oi 12 7 10 17 5 9 60
Frekuensi diharapkan ei 10 10 10 10 10 10 60
(12−10)2 (7−10)2
Selanjutnya dihitung nilai 𝜒 2 = + +
10 10
(9−10)2
⋯+ 10
=8,8. Jika dadu benar-benar seimbang semua
permukaannya, χ2 kecil. Apabila dadu tidak seimbang pada
semua permukaannya, maka χ2 besar. Bagaimana
memutuskan, apakah χ2 = 8,8 adalah besar atau kecil?
Untuk k = 6 kategori digunakan sebaran ki-kuadrat
dengan derajat kebebasan (k-1)=5. Nilai χ2 besar
menunjukkan fakta yang berlawanan dengan hipotesis
sehingga nilai-nilai "ekstrim" lebih besar atau sama dengan
nilai χ2 hitung. Hasil perhitungan nilai-p = P(χ25> 8,8). Dari
baris ke-5 pada Tabel 3, probabilitas yang diperlukan adalah
antara 0.1 and 0.15, yang berarti bahwa nilai-p> 0.1. Karena
nilai-p tidak kecil, maka tidak ditolak H0. Simpulannya
| 164
Statistik Dengan Pendekatan Matematik

adalah data konsisten dengan hipotesis bahwa dadau benar-


benar seimbang semua permukaannya. Perhatikan grafik
fungsi distribusi ki-kuadrat berikut.

Gambar 4.17
Sebaran Ki-Kuadrat Dengan df = 5

Komentar
1. Nilai χ2 kecil menunjukkan bahwa data konsisten dengan
H0. Nilai χ2 besar menunjukkan bahwa data tak konsisten
dengan H0 dan apabila nilai-p sangat kecil maka tolak H0.
2. Distribusi sampel χ2 mendekati sebaran ki-kuadrat
apabila tidak satu pun dari nilai harapan yang sangat
kecil (biasanya disyaratkan ei≥5). Apabila masing-
masing eisangat kecil maka dapat dikombinasikan
karegori bersebelahan hingga frekuensi harapan ≥5.
3. Jika terdapat k kategori dan frekuensi harapan semuanya
ditetapkan sebagai H0 (yakni tidak ada parameter yang
perlu diestimasi dari data) maka χ2 mempunyai derajat
kebebasan (k - 1).
4. Jika frekuensi harapan tidak semuanya ditetapkan
sebagai H0dan sebanyak m parameter harus diestimasi
dari data maka χ2 mempunyai derajat kebebasan (k - m -
1).
Contoh: Konsumsi vitamin C terhadap demam
Apakah vitamin C mengurangi demam? Untuk mengujinya,
guru meminta 100 siswa menjawab pertanyaan: apakah
| 165
Statistik Dengan Pendekatan Matematik

siswa-siswa tersebut mengkonsumsi vitamin C, dan apakah


mereka mengalami demam tahun lalu.Hasilnya disajikan
pada tabel berikut.
Tabel 4.7.
Kontingensi Distribusi Frekuensi

Mengkonsumsi Vitamin C?
Mengalami Demam? Ya Tidak Total
Tidak 35 5 40
Ya 35 25 60
Total 70 30 100

Apakah data tersebut menegaskan bahwa vitamin C


mencegah deman?Hitung frekuensi harapan dengan
berasumsi bahwa Vitamin C tidak berhubungan dengan
demam, (yakni tidak terdapat relasi antara kedua variabel
tersebut). Jika 40% dari populasi itu tidak demam dan 60%
mengalami demam (diestimasi dari kolom terakhir pada
tabel) maka dari 70 yang mengkonsumsi vitamin C
diharapkan sebanyak 70 × 40% = 28 tidak mengalami demam
dan 70× 60%= 42 mengalami demam.
Dengan cara yang sama diantara 30 siswa yang tidak
30×40
mengkonsumsi vitamin C diharapkan sebanyak 100
= 12
30×60
tidak mengalami demam, dan sebanyak 100
= 18
mengalami demam. Bandingkan frekuensi harapan tersebut
dengan frekuensi pengamatan seperti pada tabel berikut.
Tabel 4.8
Kontingensi Sebaran Frekuensi Uji Ki-Kuadrat

Mengkonsumsi Vitamin C
Mengalami Demam? Ya Tidak Total
Tidak 35(28) 5(12) 40
Ya 35(42) 25(18) 60
Total 70 30 100

| 166
Statistik Dengan Pendekatan Matematik

(35−28)2 (5−12)2
Dari Tabel 5.8 dihitung nilai 𝜒 2 = + +
28 12
(35−42)2 (25−18)2
+ = 9,72.Prosedur yang digunakan pada
42 18
contoh tersebut adalah sebagai berikut:
1. Rumuskan hipotesis nol bahwa mengkonsumsi vitamin C
dan mengalami demam secara statistik merupakan
peristiwa saling bebas (independent events), yakni, H0 :
vitamin C dan demam adalah bebas
2. Esimasikan probabilitas pv dari mengkonsumsi vitamin C
(dan karena itu qv = 1 - pv) dan probabilitas pc dari tidak
mengalami demam (dan karenanya qc = 1 - pc).
3. Gunakan H0 untuk menghitung probabilitas masing-
masing sel dalam tabel, yakni untuk vitamin C dan tidak
demam, probilitas = pv × pc karena saling bebas = 70% ×
40%= 0,28. Hitung frekuensi harapan dengan
mengalikan probabilitas tersebut dengan frekuensi total n
= 100, yakni untuk konsumsi vitamin C dan tidak
demam, e = 100×0,28= 28. Untuk contoh ini pv dan pc
diestimasi dari data (tetapi qv dan qc dihitung dari pv dan
pc) sehingga derajat kebebasan = banyak kategori –
banyak parameter yang diestimasi – 1 = 4 - 2 - 1 = 1.
Jadi nilai-p adalah P( χ21> 9.72).
4. Dari baris pertama dalam Table 3, P( χ 21> 9.72) terletak
antara 0.0025 dan 0.001 sehingga nilai-p kurang dari
0.0025 (p<0.0025). perhatikan ilustrasi visual berikut.

Gambar 4.18
Sebaran Ki-Kuadrat

| 167
Statistik Dengan Pendekatan Matematik

5. Frekuensi pengamatan secara signifikan berbeda dari


fekuensi harapan, jika frekuensi harapan berdasarkan
pada hipotesis bahwa konsumsi vitamin C dan demam
saling bebas (independent). Dengan demikian hipoyesis
ini ditolak dan disimpulkan terdapat beberapa asosiasi
(hubungan).

4. Kasus Umum
Secara umum, variabel-variabel dua kategori
berkelompok silang seperti tabel berikut.
Tabel 4.9
Matriks Variabel Dua Kategori Kelompok Silang

Variabel B
Variabel A B1 B2 . . . Bc
A1 o11 o12 . . . o1c o1.
A2 o21 . . .
. .
. .
. .
Ar or1 . . . orc or.
o1 oc n

Estimasi probabilitas untuk A1, .... , Ar masing-masing


𝑜1 02 𝑜𝑟
adalah ,
𝑛 𝑛
, … , 𝑛
(melibatkan estimasi (r-1) parameter
independen karena total harus 1 yang merupakan nilai
probabilitas). Dengan cara yang sama estimasi probabilitas
𝑜1 02 𝑜𝑐
untuk B1 ,..., Bc adalah , ,…, (melibatkan (c-1) estimasi
𝑛 𝑛 𝑛
bebas). Dengan demikian,

Hipotesis nol H0: A dan B bebas


Hipotesis alternatif H1 : A dan B tidak bebas

| 168
Statistik Dengan Pendekatan Matematik

Jika H0 benar, maka probabilitas untuk sel Ai Bj


𝑜𝑖 𝑜𝑗
adalah 𝑝𝑖𝑗 = × untuk i = 1, .... , r ; j = 1, .... , c. Dengan
𝑛 𝑛
demikian frekuensi harapan untuk sel Ai Bjadalah n × pij ,
𝑜𝑖. 𝑜.𝑗 𝑜𝑖. ×𝑜.𝑗 𝑡𝑜𝑡𝑎𝑙 𝑏𝑎𝑟𝑖𝑠 × 𝑡𝑜𝑡𝑎𝑙 𝑘𝑜𝑙𝑜𝑚
yakni 𝑒𝑖𝑗 = 𝑛 × × = = .
𝑛 𝑛 𝑛 𝑔𝑟𝑎𝑛𝑑 𝑡𝑜𝑡𝑎𝑙
(𝑜11 −𝑒11 )2 (𝑜12 −𝑒12 )2
Kemudian hitung, 𝜒 2 = + +⋯
𝑒11 𝑒12
(𝑜21 −𝑒21 )2
+ +⋯
𝑒21
(𝑜𝑟𝑐 −𝑒𝑟𝑐)2
+ 𝑒𝑟𝑐
Secara matematis, rumus menghitung ki-kuadrat
(0−𝑒)2
adalah :𝜒 2 = ∑ . Derajat kebebasan = banyak sel –
𝑒
banyak estimasi – 1= (r×c) - [ (r-1) + (c-1) ] - 1 = rc - r - c + 1
= (r - 1)(c - 1).

Contoh : Kelompok homogen.

Suatu studi lain dilakukan menggunakan satu


kelompok homogen, dengan mengestimasi rata-rata banyak
vitamin C yang diambil dari semua sumber (buah-buahan dan
lain-lain) dan kemudian mengikuti siswa selama satu tahun
dan melihat berbagai keadaan deman yang mereka alami.
Andaikan hasilnya disajikan seperti dalam tabel berikut.

Tabel 4.10
Sebaran Frekuensi Konsumsi Vitamin C dan Demam

Vitamin C (jumlah dalam gram)


Deman 0 ≤g < 1 1 ≤g < 2 g≥ 2 Total
Tidak 64 62 24 150
Sekurangnya 1 kali 36 6 8 50
100 68 32 200

| 169
Statistik Dengan Pendekatan Matematik

Apakah data tersebut bahwa vitamin C melindungi


dari demam? Hipotesis nol H0: demam dan vitamin C are
independen. Asumsikan H0 benar, frekuensi harapan
dihitung sebagai berikut: yakni untuk tidak mengalami
150 ×100
demam dan 0≤g < 1, e11 = 200
= 75 dan dengan cara yang
sama untuk semua sel lainnya. Frekuensi harapan seringkali
ditunjukkan dalam tabel (disajikan dalam kurung). Perhatikan
tabel berikut.
Tabel 4.11
Sebaran Frekuensi Konsumsi Vitamin C dan Demam
Dengan Frekuensi Harapan

Vitamin C (jumlah dalam gram)


Demam 0≤g < 1 1≤g < 2 g ≥2 Total
Tidak 64 (75) 62 (51) 24 (24) 150
≥1 kali 36 (25) 6 (17) 8 (8) 50
100 68 32 200

Perhatikan bahwa total baris dan kolom adalah sama


untuk frekuensi pengamatan dan harapan (silahkan hitung
untuk masing-masing frekuensi tersebut). Kemudian hitung
(64−75)2 (62−51)2 (8−8)2
ki-kuadrat, yakni 𝜒 2 = + + ⋯+ =
75 51 8
15,94, derajat kebebasan = (3 - 1) × (2 - 1) = 2, dan nilai-p =
P( χ2> 15,9). Perhatikan ilustrasi pada fungsi k-kuadrat
berikut.

Gambar 4.19
Sebaran Ki-Kuadrat dari Data Dalam Tabel
| 170
Statistik Dengan Pendekatan Matematik

Dari Tabel 3, baris kedua, nilai probabilitas kurang


dari 0.0005. karena nilai-p kecil, maka tolak hipotesis nol
mengenai kekebasan (independence) dan simpulannya adalah
terdapat beberapa asosiasi antara banyak vitamin C dan
mengalami demam. Perhatikan, bagaimanapun, pola
perbedaan antara frekuensi pengamatan dan harapan tidak
konsisten dengan relasi antara dosis dengan demam.

Latihan:
𝝈
̅−
1. Buktikan (gunakan rumus Z) bahwa : 𝑿 ̅+
<𝝁<𝑿
√𝒏
𝝈
√𝒏

2. Botol-botol minuman ringan (softdrink) berisi 300ml.


Suatu sampel dengan n = 10 botol diukur dan isinya
(dalam ml) masing-masing adalah: 299, 276, 283, 301,
297, 281, 300, 291, 295, 291.
a. Uji hipotesis nol H0 : µ = 300 terhadap hipotesis
alternatif H1: µ≠300.
b. Cari interval kepercayaan 99% untuk µ.
3. Pabrik pensil memproduksi pensil-pensil yang
panjangnya 20,5 cm. Panjang sesungguhnya berbeda
sedikit-sedikit. Proses produksi stabil dan SD populasi
diketahui yaitu σ = 0,25 cm. Sampel sebanyak 100
dengan rata-rata = 19,85 cm. Apakah panjang rata-rata
pensil semuanya bukan 20,5 cm?
4. Botol-botol minuman ringan (softdrink) berisi 200ml.
Suatu sampel dengan n = 20 botol diukur dan isinya
(dalam ml) masing-masing adalah: 199, 189, 188, 191,
194, 195, 197, 198, 200, 201, 202, 203, 204, 205, 206,
196, 190, 207, 192, 193.
a. Uji hipotesis nol H0 : µ = 200 terhadap hipotesis
alternatif H1: µ≠200.
b. Cari interval kepercayaan 95% untuk µ.
| 171
Statistik Dengan Pendekatan Matematik

6. Misalkan dalam 100 kali pelemparan pertama dari satu


koin muncul 40 angka dan 60 gambar. Dapatkah diduga
bahwa koin itu tidak seimbang?
7. Apakah Metode Inkuiri meningkatkan pemahaman
konsep perkalian? Untuk mengujinya, guru meminta 150
mahasiswa menjawab pertanyaan: apakah mahasiswa
menerima pembelajaran menggunakan merode ikuiri, dan
apakah pemahaman konsep perkalian mereka
meningkat.Hasilnya disajikan pada tabel berikut.

Tabel Kontingensi Distribusi Frekuensi

Menerima Pembelajaran
Menggunakan Metode Inkuiri?
Pemahaman Konsep Perkalian
Ya Tidak Total
Meningkat?
Tidak 60 10 70
Ya 45 35 80
Total 105 45 150

| 172
Statistik Dengan Pendekatan Matematik

BAB V
PENYAJIAN DATA KONTINU

A. Korelasi

K
orelasi menunjukkan kekuatan asosiasi
(hubungan) linear antara dua variabel
kontinu, misalkan x and y. misalkan (x1, y1),
(x2, y2), ..., (xn, yn) merupakan titik-titik data. Titik-titk data
tersebut dapat disajikan pada diagram pencar (scatter plot)
yang menunjukkan "kumpulan" titik-titik seperti berikut.
Sketsa Kasar

Gambar 5.1. Scatter Plot Titik-Titik Data

Apabila terdapat asosiasi linear kuat antara kedua


variabel tersebut, maka titik-titik itu terletak mendekati suatu
garis lurus, seperti dua gambar berikut:

atau

Asosiasi positif Asosiasi negatif

Gambar 5.2
Titik-Titik Mendekati Suatu Garis Lurus

| 173
Statistik Dengan Pendekatan Matematik

1. Asosiasi Positif dan Negatif


Asosiasi positif antara variabel x dan y (yakni
penambahan x diikuti penambahan y) ditunjukkan
menggunakan scatterplot yang mempunyai kemiringan
positif (positive slope). Begitu pula sebaliknya, asosiasi
negatif kuat (yakni pengurangan x diikuti pengurangan y)
ditunjukkan oleh titik-titik dengan kemiringan negatif
(negative slope).
Jika titik-titik tersebut mendekati suatu garis lurus
maka dengan mengetahui nilai dari satu variabel membantu
memprediksi nilai variabel lain. Apabila asosiasi kecil atau
tidak terdapat asosiasi, maka "kumpulan titik" lebih tersebar
dan informasi mengenai satu variabel tidak tidak menjelaskan
mengenai variabel lain. Perhatikan gambar berikut.

Gambar.5.3
Titik Tersebar Menunjukkan Tidak Terdapat Asosiasi

2. Asisiasi Linear dan Nonlinear


Perhatikan bahwa korelasi mengukur esksistensi
aosiasi linear. Variabel-variabel dapat berasosiasi kuat
nonlinear (berbentuk kurva) sekalipun begitu tetap
korelasinya nol. Jika dua variabel saling bebas (tidak
berasosiasi untuk sebarang jenisnya) maka korelasinya nol,
tetapi korelasi nol tidak cukup menyatakan bahwa variabel-
variabel tersebut adalah saling bebas, hanya dapat dikatakan
bahwa antara variabel-variabel tidak mempunyai hubungan
linear.

| 174
Statistik Dengan Pendekatan Matematik

3. Koefisien Korelasi
Bandingkan dua bentuk data yang digambarkan
seperti berikut.

Gambar 5.4 Dua Bentuk Kumpulan Data

"Kumpulan" data seperti pada Gambar 5.4., memiliki


pusat yang sama, yang didefinisikan yakni (𝑥̅ , 𝑦̅) dan standar
deviasi sama yakni 𝑠𝑥 dan 𝑠𝑦 untuk sebaran marginal dari x
dan y. akan tetapi gambar bagian (A) berkelompok rapat dan
(B) berkelompok renggang (bebas). Derajat kelompok
merupakan kekuatan asosiasi linear, atau dinamakan
𝑠𝑥𝑦
koefisien korelasi, dan didefinisikan 𝑟 = 𝑠 , dimana 𝑠𝑥𝑦 =
𝑥 𝑠𝑦

1 1
∑𝑛𝑖=0(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅), 𝑠𝑥 = √𝑛−1 ∑𝑛𝑖=0(𝑥𝑖 − 𝑥̅ )2
𝑛−1
merupakan standar deviasi dari nilai-nilai x, dan 𝑠𝑦 =
1
√𝑛−1 ∑𝑛𝑖=0(𝑦𝑖 − 𝑦̅)2 standar deviasi y.

Selanjutnya diperlukan pemahaman mengenai letak


titik-titik data menurut kuadran dalam sistem koordinat
kartesius. Perhatikan ilustrasi visual berikut.

| 175
Statistik Dengan Pendekatan Matematik

Gambar 5.5
Letak Titik-Titik Data dalam Sistem Koordinat Kartesius

Jika titik-titik yang berada dalam kuadran positif


adalah dominan (yakni adalah (𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) > 0) maka
1
𝑠𝑥𝑦 = 𝑛−1 ∑𝑛𝑖=0(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) > 0, sehingga r>0 dan
terdapat aosiasi positif antara xdan y, yakni secara bersama
bertambah. Apabila titik-titik dalam kuadran negatif
mendominasi (yakni adalah (𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) > 0) maka r<0
dan terdapat asosiasi negatif dimana ycenderung berkurang
apabila x bertambah. Perhatikan kejadian dominasi letak titik-
titik menurut kuadran pada sistem koordinat kartesius
berikut.

Gambar 5.6
Dominasi Letak Titik Pada Sistem Koordinat Kartesius

| 176
Statistik Dengan Pendekatan Matematik

Contoh: perhitungan r mengenai tinggi dan berat badan


siswa melalui penyajian seperti pada tabel berikut.

Tabel 5.1
Penyajian Data untuk Perhitungan Korelasi

Siswa Tinggi Berat (𝒚𝒊


(𝒙𝒊 − 𝒙
̅) ̅ )𝟐
(𝒙𝒊 − 𝒙 ̅ )𝟐
(𝒚𝒊 − 𝒚 (𝒙𝒊 − 𝒙
̅ )(𝒚𝒊 − 𝒚
̅)
(i) (xi) (yi) −𝒚̅)

1 167 60 6 4,67 36 21,8089 28,02


2 170 64 9 8,67 81 75,1689 78,03
3 160 57 -1 1,67 1 2,7889 -1,67
4 152 46 -9 -9,33 81 87,0489 83,97
5 157 55 -4 -0,33 16 0,1089 1,32
6 160 50 -1 -5,33 1 28,4089 5,33

Total 966 332 0 ≈0 216 215,3334 195,0

Berdasarkan tabel ini, dapat dihitung bahwa :


966 332
𝑥̅ = = 161; 𝑦̅ = = 55,33;
6 6

216 215,3334
𝑠𝑥 = √ = 6,573; 𝑠𝑦 = √ = 6,563; 𝑠𝑥𝑦 =
5 5
195
= 39,0.
5

Dengan demikian,

39,0
𝑟 = 6,572 ×6,563 = 0,904.

4. Sifat-Sifat Koefisien Korelasi


Sifat koefisien korelasi merupakan ukuran kecocokan
atau goodness of fit dari garis regresi. Nilai koefisien korelasi
r berada pada rentang dari -1 hingga +1, yakni nilai r selalu
berada dalam rentang :-1 ≤r≤1. Perhatikan tabel berikut.

| 177
Statistik Dengan Pendekatan Matematik

Tabel 5.2
Interpretasi Nilai-Nilai Korelasi r

Nilai r Interpretasi
r=0 Dua variabel sama sekali tidak dapat saling bertukar
bersama-sama
0<r<1 Dua variabel cenderung naik atau turun bersama-sama
r = 1,0 Korelasi sempurna
-1 < r < 0 Satu variabel naik dan yang lain turun
r = -1,0 Korelasi negatif atau berkebalikan sempurna

Berikut uraian mengenai masing-masing nilai r.


a. Nilai r = 1 apabila semua titik terletak pada garis dengan
kemiringan positif (naik). Perhatikan ilustrasi kejadian
dimana r = 1 berikut.

Gambar 5.7
Letak Titik-Titik Berkemiringan Positif

b. Nilai r = -1 apabila semua titik pada garis dengan


kemiringan negatif (menurun). Perhatikan ilustrasi
berikut.

Gambar 5.8
Letak Titik-Titik Berkemiringan Negatif

| 178
Statistik Dengan Pendekatan Matematik

c. Nilai r = 0 jika tidak terdapat asosiasi antara X dan Y.


Perhatikan ilustrasi berikut.

Gambar 5.9
Letak Titik-Titik yang Menunjukkan r = 0

d. Nilai r tidak menunjukkan perluasan asosiasi non linear.


P erhatikan satu ilustrasi berikut.

Gambar 5.10
Visual Letak Titik-Titik Bukan Asosiasi Non Linear

e. Nilai r dapat dipengaruhi pencilan-pencilan (outliers).


Perhatikan ilustrasi berikut. Nilai r << 1 menyatakan
jauh dari 1.

Gambar 5.11
Letak Titik-Titik dengan Pencilan dan r << 1

| 179
Statistik Dengan Pendekatan Matematik

a. Nilai r merupakan bilangan tanpa satuan. Nilainya


dipengaruhi :
1) Pertukaran variabel X dan Y.
2) Penambahan bilangan yang sama kepada semua nilai
dari satu variabel.
3) Perkalian semua nilai dari satu variabel dengan suatu
bilangan positif yang sama (yakni perkalian semua
nilai dari satu variabel dengan k > 0, k merupakan
anggota bilangan real).
b. Atas dasar letak titik-titik sebagaimana dimaksud,
korelasi antara dua variabel tidak dipengaruhi (tidak
terkait) normalisasi atau standarisasi sebaran titik-titik
itu untuk mendapatkan nilai mean=0 dan varians = 1.
Apabila dilakukan, rumus perhitungan koefisien relasi
menjadi lebih sederhana, yakni rata-rata X dikalikan Y
(soal 1 pada bagian latihan).
c. Jika r jauh dari nol, ada empat kemungkinan yang
terjadi, yakni:
1) variabel X membantu menentukan nilai variabel Y.
2) variabel Y membantu menentukan nilai variabel X.
3) variabel lain mempengaruhi keduanya, yakni X dan
Y.
4) X dan Y benar-benar tak berkorelasi, mungkin hasil
pengamatan hanya kebetulan. Nilai P menentukan
keseringan hal tersebut terjadi.
5. Interpretasi Korelasi
a. r mengukur perluasan asosiasi linear antara dua
variabel kontinu.
b. Assosiasi tidak berimplikasi sebagai penyebab
(sebab-akibat), yakni kedua variabel boleh jadi
dipengaruhi variabel ketiga.

| 180
Statistik Dengan Pendekatan Matematik

Contoh 1:
Total pengetahuan siswa dan banyak guru keduanya
bertambah dari waktu ke waktu dan berkorelasi positif tetapi
penambahan salah satunya tidak menyebabkan penambahan
yang lain (keduanya dikaitkan dengan total ukuran populasi)

Contoh 2:
Ukuran sepatu siswa pernah dilaporkan berkorelasi positif
dengan skor tes kemampuan matematika. Laporan ini
diilustrasikan seperti gambar berikut.
Skor Matematika

Ukuran Sepatu

Gambar 5.12
Sebaran Titik Data (ukuran sepatu, skor matematika)

Apabila data dibagi lagi menurut umur akan tampak


seperti gambar berikut, yakni dalam masing-masing
kelompok tidak terdapat asosiasi. Dalam kasus ini usia
merupakan variabel yang tidak diharapkan (confounding
variable).

Gambar 5.13
Data Dalam Kelompok Masing-Masing Tidak Berasosiasi

| 181
Statistik Dengan Pendekatan Matematik

Penafsiran (interpretasi) hasil dari suatu korelasi


adalah sebagai berikut:
1. Jika dua variabel saling dapat bertukar, terdapat
kovariasi atau korelasi.
2. Koefisien korelasi r menyatakan arah dan besar korelasi.
3. Korelasi tidak sama dengan regresi linear, tetapi
keduanya berhubungan.
4. Regresi linear menghasilkan garis sebagai peramal
terbaik bagi Y dari X.
5. Apabila variabel X dikontrol (misalnya waktu, dosis,
konsumsi, konsentrasi), maka tak usah gunakan korelasi,
pakailah regresi linear.
6. Nilai korelasi tidak membedakan X dan Y, tetapi
menyatakan hubungan antara kedua variabel tersebut.
7. Regresi linear membedakan antara X dan Y, yakni
a. Regresi linear mendapatkan garis terbaik yang
meramalkan Y dari X dengan meminimalkan jumlah
kuadrat (sum of the square disingkat SS) jarak
vertikal titik-titik dari garis regresi.
b. Variabel X dan Y adalah tak simetris dalam
perhitungan regresi. Karena itu hanya regresi yang
dipilih daripada korelasi, jika secara jelas dapat
didefinisikan variabel mana adalah X dan mana pula
Y.

6. Contoh Penggunaan Korelasi


Sebagaimana diuraikan bahwa datauntuk satu
kelompok atau sampel terdiri atas dua ukuran (skala) kontinu
pada tiap subyek (atau obyek). Dalam hal ini, data adalah :
(x1,y1), (x2,y2),..., (xn,yn). penempatan yterhadap x
digambarkan pada sistem koordinat seperti berikut.

| 182
Statistik Dengan Pendekatan Matematik

Gambar 5.14
Letak Titik-Titik (xi,yi) pada Sistem Koordinat

Korelasi mengukur perluasan asosiasi linear antara x


dan y. Koefisien korelasi dihitung menggunakan

𝑠𝑥𝑦 ∑(𝑥𝑖 −𝑥̅ )(𝑦𝑖 −𝑦̅)


rumus: 𝑟𝑥𝑦 =𝑠 = atau
𝑥 𝑠𝑦 √[∑(𝑥𝑖 −𝑥̅ )2 ][∑(𝑦𝑖 −𝑦̅)2 ]

∑ 𝑥𝑖 𝑦𝑖 −𝑛𝑥̅ 𝑦̅
𝑟𝑥𝑦 = .
√(∑ 𝑥𝑖 2 −𝑛𝑥̅ 2 )(∑ 𝑦𝑖 2 −𝑛𝑦̅ 2 )

Dalam perhitungan korelasi, x dan y diperlakukan


dengan dapat dipertukarkan. Kedua ukuran diasumsikan
merupakan subjek terhadap variasi acak. Contoh: Berikut
adalah data 20 Mahasiswi yang mengikuti kuliah Pengantar
Statistika.
Tabel 5.2
Data Tinggi dan Berat Badan

Nomor
Tinggi (cm) Berat (kg)
Mahasiswa
1 167 60
2 164 65
3 170 64
4 163 47
5 152 46
6 160 57
7 170 57

| 183
Statistik Dengan Pendekatan Matematik

8 160 55
9 157 55
10 170 65
11 150 50
12 156 46
13 168 60
14 159 55
15 160 50
16 172 69
17 175 56
18 169 56
19 169 72
20 156 56

Diagram pencar asosiasi tinggi dan berat badan 20


mahasiswi disajikan berikut ini. Korelasi antara kedua
variabel adalah 0,673.

Gambar 5.15
Diagram Pencar (Tinggi,Berat) 20 Subyek

7. Memeriksa korelasi
Untuk memeriksa bahwa korelasi sesuai data,
perhatikan tabel berikut.

| 184
Statistik Dengan Pendekatan Matematik

Tabel 5.3 Uraian Ciri Korelasi

Pertanyaan Uraian
Apakah subyek Korelasi mengasumsikan bahwa setiap faktor acak hanya
independen? mempengaruhi satu subyek, dan tidaklainnya. Asumsi
dapat diabaikan apabila dipilih separoh subyek dari satu
kelompok dan separoh lagi dari kelompok yang lain.
Perbedaan antara kelompok dapat mempengaruhi
separoh subyek dan tidak untuk separoh lainnya.
Apakah X dan Y Perhitungan adalah tak valid apabila X dan Y terjalin.
diukur secara Kita dapat mengabaikan asumís ini apabila kita
independen? mengkorelasikan satu bagi dari skor dengan keseluruhan
skor, yakni satu bagian skor merupakan satu dari
keseluruhan komponen skor.
Apakahnilai X Jika nilai-nilai X dikontrol (misalnya konsentrasi, dosis
diukur atau waktu) maka yang dapat dihitung adalah regresi
(bukandikontrol)? linear regression bukan korelasi.
Apakahkovariasi Analisis korelasi tidak membantu apabila Y bertambah
linear? sementara X berkurang menuju ke suatu titik, dan
kemudian Y menurun sedangkan X meningkat. Dalam
hal ini akan diperoleh nilai r kecil meskipun kedua
variable berhubungan kuat. Koefisien korelasinya hanya
menunjukkan kovariasi linear.
Apakah X dan Y Untuk menerima nilai P dari korelasi standar (Pearson),
berdistribusi nilai-nilai X dan Y masing-masing haruslah diambil dari
Gauss? populasi yang berdistribusi Gauss. Korelasi
nonparamterik Spearman tidak membuat asumsi ini.

8. Penaksiran Menggunakan Nilai r2


Cara terbaik menaksir nilai r adalah dengan
memangkatduakannya (dikuadratkan), yaitu menghitung nilai
r2. Nilai r2 adalah dari 0 sampai 1, dan pecahan dari variasi
dalam kedua variable lsaling berperan.Contoh, jika r2 =0,59
maka 59% dari varians dalam X dapat dijelaskan dengan
variasi dalam Y. Sebaliknya, 59% varians dalam Y dapat
diterangkan dengan variasi dalam X. Singkatnya, 59% dari
varians adalah bergantian antara X dan Y.
Perhitungan r2 lebih sesuai untuk koefisien korelasi
Pearson, dan tidak sesuai apabila dihitung dari koefisien

| 185
Statistik Dengan Pendekatan Matematik

korelasi nonparametrik Spearman. Rumus yang digunakan


berikut dinamakan koefisien determinasi, yakni:
  y  yˆ 2
r  1
2
atau
  y  y 2
SS Re g
r2  1 .
SSTot

Nilai r dapat dihitung dengan menarik akar pangkat


dua dari nilai r2, yakni menggunakan rumus seperti berikut.
n xy   x y
r , atau
n x   x  n y   y 
2 2 2 2

r
  y  y     y  yˆ 
2 2

, atau
 y  y 2

r
  y  y x  x  , atau yang
  y  y   x  x 
2 2

menggunakan SE (standard error),

s y2  s y2. x
r
s y2

9. Uji Signifikansi r
a. Pengambilan berulang-ulang dari suatu sampel besar,
korelasi dari sampel seperti itu cenderung
berdistribusi normal dengan standard error
1  2
sr  ;
n 1
| 186
Statistik Dengan Pendekatan Matematik

b. Pengujian hipotesisya adalah:


i. H0 : ρ = 0
ii. H1 : ρ ≠ 0
c. Mean = 0
d. Nilai empiris z dihitung menggunakan humus
z  r n 1
e. Jika α = 5% maka
i. H0 ditolak apabila z < -1,96 (yaitu –z 0,025) atau z >
1,96 dan
ii. H0 diterima apabila -1,96 ≤ z ≤ 1,96

10. Korelasi Sampel

a) kovarians sample, s XY 
 xy atau
n 1

 X i  X Yi  Y  ;
1
s XY 
n 1
1  Xi  X  Yi  Y 
b) korelasi sample, r   
n  1  s X
  atau
 sY 
s XY
c) r atau
s X sY

d) r
 xy ;
x y
2 2

Contoh: perhitungan signifikansi korelasi dari data X


:skor hasil ujian dan Y : nilai disiplin siswa.

| 187
Statistik Dengan Pendekatan Matematik

Tabel 5.4
Sebaran Data Hasil Ujian dan Disiplin Siswa

Disiplin Disiplin
No Hasil Ujian No Hasil Ujian
Siswa Siswa
1 9.0 36 17 9.3 37
2 8.5 34 18 7.3 29
3 6.3 25 19 7.4 29
4 8.0 32 20 7.8 31
5 9.5 38 21 9.2 37
6 7.5 30 22 8.4 33
7 9.1 30 23 7.8 31
8 8.0 36 24 9.9 40
9 6.0 32 25 9.0 36
10 6.0 25 26 8.6 34
11 8.5 24 27 7.9 32
12 8.1 34 28 9.1 42
13 6.6 32 29 9.7 39
14 9.0 26 30 7.5 30
15 7.0 36 31 6.7 27
16 8.7 25 32 8.2 32

| 188
Statistik Dengan Pendekatan Matematik

Tabel 5.5 Tabel Perhitungan Signifikansi r

No x y xy x2 y2 Yˆ  Y  x Y  Yˆ 
2
Xˆ  X  * y X  X̂ 
2

1 0,8875 3,6875 3,272656 0,787656 13,59766 34,48836 2,285064 8,585791 0,17157


2 0,3875 1,6875 0,653906 0,150156 2,847656 33,26252 0,543874 8,329091 0,02921
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
32 0,0875 -0,3125 -0,02734 0,007656 0,097656 32,52702 0,277751 8,072391 0,01628
86,87504 35,434992 676,875064

Berdasarkan data dan hasil perhitungan sebagaimana dalam Tabel 6.5, diperoleh:
86,87504
1. β = 35,434992 = 2,45167375796
86,87504
2. β* = 676,875064 = 0,12834723071
86,87504
3. r= = 0,560950566
√35,434992 ×676,875064

4. Ujihipotesisnol, yaituρ = 0 (distribusi normal)

5. z  r n  1 = 0,560950566 32  1 = 0.560950566 x 5.567764= 3.123240367


6. z0,025 = 1,96
7. Tolak H0 karena zhitung> z0,025

| 189
Statistik Dengan Pendekatan Matematik

B. Regresi
Contoh: Pengaruh Bobot Tugas dari Guru terhadap
Perasaan Siswa
Untuk memeriksa pengaruh bobot pemberian tugas oleh
guru terhadap perasaan siswa dilakukan beberapa kali
percobaan. Satu pengukuran yang dilakukan yakni bobot tugas
yang diberikan guru pada level berbeda dari perasaan relatif
siswa.
Hasilnya adalah sebagai berikut:

Bobot Tugas (%) x : 30 35 40 45 50 55


Perasaan Siswa (%) y : 7 10 11 12 15 16

Diagram pencaran (x,y) dari data tersebut adalah sebagai


berikut:

Perasaan

Gambar 5.16
Diagram Pencar Titik Data Bobot Tugas terhadap Perasaan

Titik-titik pada diagram pencar terletak hampir pada


suatu garis lurus sehingga dapat disajikan hubungan antara
bobot tugas dan perasaan menggunakan persamaan, yakni: y = a
+ b x, dimana y merupakan perasaan siswa (relatif), a adalah
titik potong dengan sumbu-y, b merupakan kemiringan (slope),

| 190
Statistik Dengan Pendekatan Matematik

dan x adalah bobot tugas yang diberikan guru. Perhatikan


ilustrasi diagramatik berikut.

y = a + bx
nilai bobot tugas
nilai perasaan kemiringan
konstanta
titik potong dengan sumbu-y

Selanjutnya, perlu diestimasi konstanta a dan b dalam


persamaan itu, kemudian diprediksi perasaan relatif untuk bobot
tugas tertentu. Perhatikan tahapan kerja berikut.
Pertama buat garis yang cocok untuk sebaran titik seperti
pada Gambar 5.16. Garis lurus yang cocok adalah paling
mendekati, atau secara matematis (pencocokan paling
baik/tepat) adalah suatu garis lurus yang melalui lebih banyak
titik). Perhatikan garis lurus berikut.

Perasaan

Gambar 5.17
Garis Lurus dari Sebaran Titik Data

Dari garis lurus seperti pada Gambar 6.17 diperoleh


bahwa pada x = 35 maka y = a + 35b = 9 dan pada x = 50
persmaannya adalah y = a + 50b = 14. Selanjutnya nilai a dan b
dapat dicari dari dua persamaan, yakni : 35b + a = 9 dan 50b + a
| 191
Statistik Dengan Pendekatan Matematik

= 14. Selesaiannya adalah b = 1/3 ≈ 0,33 dan a ≈ -2,67. Dengan


demikian garis lurus tersebut mendekati persmaan : y = - 2,67
+ 0,33x.
Tentu tidak memuaskan mencocokkan garis ”menurut
pandangan mata” atau secara sebarang mengambil dua titik pada
garis untuk menghitung a dan b karena orang lain akan
mendapatkan persamaan berbeda. Oleh karena itu, secara umum
diperlukan cara sistematis mendapatkan persamaan garis lurus y
= a + bx untuk sehimpunan titik-titik data
{(x1,y1),(x2,y2),...,(xn,yn)}. Cara yang dimaksud adalah metode
kuadrat terkecil (method of least squares).
Metode kuadrat terkecil merupakan cara atau langkah
paling umum digunakan dan ia sistematis untuk mengestimasi a
dan b. perhitungan kuadrat terkecil untuk mendapatkan a dan b
dengan meminimalkan jumlah dari jarak kuadrat S. Jarak
vertikal dari titik (xi, yi) ke garis y = a + bx adalah yi - (a + bxi).
Jumlah jarak kuadrat adalah:

𝑆 = [𝑦1 − (𝑎 + 𝑏𝑥1 )]2 + [𝑦2 − (𝑎 + 𝑏𝑥2 )]2 + ⋯


+ [𝑦𝑛 − (𝑎 + 𝑏𝑥𝑛 )]2
𝑛

= ∑[𝑦𝑖 − 𝑎 − 𝑏𝑥𝑛 ]2
𝑖=1

Metode kuadrat terkecil terdiri atas pencarian nilai a dan


b dengan meminimalkan S. Untuk memperoleh nilai minimum
tersebut, diferensialkan S masing-masing terhadap a dan b,
𝜕𝑆 𝜕𝑆
tetapkan turunan parsial dan sama dengan nol, dan
𝜕𝑎 𝜕𝑏
selesaikan untuk mendapatkan a dan b. Perhatikan kerja
matematika (aljabar) berikut.

| 192
Statistik Dengan Pendekatan Matematik

∂S
= 2[y1 − (a + bx1 )](−1) + 2[y2 − (a + bx2 )](−1) + ⋯
∂a
+ 2[yn − (a + bxn )](−1)
𝜕𝑆
= 2[𝑦1 − (𝑎 + 𝑏𝑥1 )](−𝑥1 ) + 2[𝑦1 − (𝑎 + 𝑏𝑥2 )](−𝑥2 ) + ⋯
𝜕𝑏
+ 2[𝑦𝑛 − (𝑎 + 𝑏𝑥𝑛 )](−𝑥𝑛 )
𝜕𝑆
= −2 ∑ 𝑦𝑖 + 2 ∑(𝑎 + 𝑏𝑥𝑖 ) = 0
𝜕𝑎
𝜕𝑆
= −2 ∑ 𝑥𝑖 𝑦𝑖 + 2 ∑ 𝑥𝑖 (𝑎 + 𝑏𝑥𝑖 ) = 0
𝜕𝑏

Dengan demikian, nilai untuk a dan b diperoleh dari


selesaian dua persamaan berikut:

∑ 𝑦𝑖 − 𝑛𝑎 − 𝑏 ∑ 𝑥𝑖 (1)
∑ 𝑥𝑖 𝑦𝑖 − 𝑎 ∑ 𝑥𝑖 − 𝑏 ∑ 𝑥𝑖 2 = 0 (2)

Selesaian diperoleh untuk a dalam persmaan (1), yakni:


𝑎̂ = 𝑦̅ − 𝑏̂𝑥̅ , simbol∧ digunakan untuk menyatakan estimasi.
Substitusikan 𝑎̂ke dalam persamaan (2) memberikan selesaian
untuk 𝑏̂, yakni
1
∑𝑖 𝑥𝑖 𝑦𝑖 − (∑𝑖 𝑥𝑖 )(∑𝑖 𝑦𝑖 )
𝑏̂ = 𝑛
1 yang dapat dituliskan
∑𝑖 𝑥𝑖 2 − (∑𝑖 𝑥𝑖 )
𝑛
Sebagai
𝑠𝑥𝑦 1 1
𝑏̂ = 𝑠 2 dimana 𝑏̅ = 𝑛 ∑𝑛𝑖 𝑦𝑖 , 𝑥̅ = 𝑛 ∑𝑛1 𝑥𝑖 .
𝑥

Selanjutnya:
1
𝑠𝑥𝑦 = ∑𝑛𝑖(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) dan 𝑠𝑥 2 =
𝑛−1
1
∑𝑛𝑖(𝑥𝑖 − 𝑥̅ . )2
𝑛−1

Bentuk komputasional dari 𝑠𝑥𝑦 dan 𝑠𝑥 2 tersebut


masing-masing adalah:

| 193
Statistik Dengan Pendekatan Matematik
1
𝑠𝑥𝑦 = 𝑛−1 [∑𝑛𝑖 𝑥𝑖 𝑦𝑖 − (𝑥̅ 𝑦̅)𝑛]dan
𝑛
1
𝑠𝑥 2 = (∑ 𝑥𝑖 2 − 𝑥̅ 2 . 𝑛)
𝑛−1
𝑖

Dari data mengenai perasaan siswa tersebut, perhitungan


garis kuadrat terkecil adalah sebagai berikut:

Tabel 5.6
Perhitungan a dan b Menggunakan Metode Kuadrat Terkecil

x y x2 xy
30 7 900 210
35 10 1225 350
40 11 1600 440
45 12 2025 540
50 15 2500 750
55 16 3025 880
255 71 11275 3170

Dari data pada tabel, diperoleh hitungan-hitungan


sebagai berikut.

255
𝑥̅ = = 42,5
6
71
𝑦̅ = = 11,833
6
11275 6 × (42,5)2
𝑠𝑥 2 = − = 87,5
5 5
3170 6 × 42,5 × 11,833
𝑠𝑥𝑦 = − = 30,5
5 5
30,5
𝑏̂ = = 0,348
87,5
𝑎̂ = 11,8333 − 0,3486 × 42,5 = −2,981

| 194
Statistik Dengan Pendekatan Matematik

Dengan demikian, persamaan yang diestimasi


menggunakan metode kuadrat terkecil adalah y = -2,98 + 0,35x
(bandingkan dengan pendekatan yang diperoleh berdasarkan
yang tampak yakni y = -2,67 + 0,33x). Persamaan tersebut
menyarikan hubungan antara variabel x dan y sehingga dapat
digunakan sebagai pengganti tabel nilai-nilai.
Untuk mengestimasi rata-rata perasaan siswa untuk bobit
tugas sebesar 37%, substitusikan x = 37 ke dalam persamaan y =
-2,98 + 0,35 (37) = 9,97, yakni mendekati 10%. Biasanya
prediksi untuk nilai x dalam lingkup data dari model yakni
antara 30% dan 55% bobot tugas. Titik-titik pun tidak terletak
secara tepat pada suatu garis – terdapat beberapa variasi acak.
Karena itu estimasi 𝑎̂ dan 𝑏̂ serta prediksi nilai-nilai y juga
merupakan subjek untuk beberapa variasi. Perhatikan
bahwa:Garis y = 𝑎̂ + 𝑏̂x dinamakan garis regresi dari y pada x
(garis regresi kuadrat terkecil). Variabel x dinamakan peramal
(predictor) atau variabel yang menjelaskan (explanatory
variable), kadang-kadang variabel bebas (independent variable).
Variabel y dinamakan hasil atau luaran (outcome) atau variabel
respon (response variable), kadang-kadang variabel terikat
(dependent variable). Ide ini dapat digeneralisasi pada
persamaan yang melibatkan lebih dari satu peramal, misalnya :y
= a + bx + ct + dz, dimana y adalah pertumbuhan tanaman, x
menyatakan curah hujan, t merupakan suhu, dan d adalah
kesuburan.

C. Relasi antara Korelasi dan Regresi


𝑠𝑥𝑦
Koefisien korelasi adalah 𝑟 = 𝑠 sehingga x dan y
𝑥 𝑠𝑦

dapat saling dipertukarkan. Garis regresi adalah y = 𝑎̂ + 𝑏̂x


𝑠𝑥𝑦
dimana 𝑎̂ = 𝑦̅ − 𝑏̂𝑥̅ dan 𝑏̂ = 𝑠 2 sehingga x dan y tidak dapat
𝑥
saling dipertukarkan.

| 195
Statistik Dengan Pendekatan Matematik

Apabila dalam suatu penelitian x sebagai respon dan y


sebagai peramal akan diperoleh garis berbeda karena peneliti
meminimalkan jarak horisontal bukan vertikal. Perhatikan
ilustrasi visual berikut.

Gambar 5.18
Garis Regresi Peramal Horisontal dan Vertikal

𝑥 = 𝑎∗ + 𝑏 ∗ 𝑦

y = a + bx

(xi,yi)

𝑠𝑥𝑦 𝑠𝑥𝑦
Dari Gambar 5.18 diperoleh 𝑏̂ = 𝑠 2 dan 𝑏∗ = 𝑠 2,
𝑥 𝑦
2
̂∗ = (𝑠𝑥𝑦
sehingga 𝑏
)
= 𝑟 2, yakni kuadrat dari koefisien korelasi
𝑠 2𝑠 2
𝑥 𝑦

r merupakan hasil kali kemiringan dari kedua garis itu. Jika


hubungan linear adalah sempurna, kedua garis akan sama, maka
karena "X" dan "Y" dapat dipertukarkan, masing-masing
kemiringan akan merupakan kebalikan dari yang lain, dan hasil
kalinya akan sama dengan 1.
Garis-garis diestimasi dari himpunan data kecil atau
titik-titik terpencar lebar (yakni dengan korelasi kecil) akan
menjadi subnjek kesalahan dan prediksi (ramalan) yang
diperoleh boleh jadi tidak reliabel. Selalu lihat titik pencar
sebelum pencocokan garis regresi untuk melihat apabila suatu
hubungan linear masuk akal. Apabila alurnya (atau teori)
mengusulkan hubungan non-linear mungkin satu dari dua, yakni
mentransformasi data ke dalam suatu hubungan linear dan

| 196
Statistik Dengan Pendekatan Matematik

kemudian cocokkan dengan suatu garis lurus atau lainnya


menggunakan fungsi non-lineardari variabel peramal.

Contoh: pelari wanita Indonesia


Tabel berikut merupakan kecepatan(dalam meter per detik) dan
panjang langkah (stride rates) yakni banyak langkah per detik
dari pelari wanita Indonesia yang paling baik.
Kecepatan (x):15,86 16,88 17,50 18,62 19,97 21,06
Panjang Langkah (y):3,05 3,12 3,17 3,25 3,36 3,46

Gambar. 5.19
Diagram Pencar Kecepatan dengan Panjang Langkah

Persamaan regresi dihitung dari tabel berikut.

Tabel 5.7
Data untuk Perhitungan a dan b dalam Persamaan Regresi

Panjang
Kecepatan
No Langkah y2 x2 xy
(x)
(y)
1 15,86 3,05 9,3025 251,5396 48,373
2 16,88 3,12 9,7344 284,9344 52,6656
3 17,50 3,17 10,0489 306,25 55,475
4 18,62 3,25 10,5625 346,7044 60,515
5 19,97 3,36 11,2896 398,8009 67,0992
6 21,06 3,46 11,9716 443,5236 72,8676
Jumlah 109,89 19,41 62,9095 2031,7529 356,9954

| 197
Statistik Dengan Pendekatan Matematik

Dari Tabel 5.7 dapat dihitung bahwa:


109,89
𝑥̅ = = 18,35
6
19,41
𝑦̅ = = 3,235
6
2031,7529 6 ×(18,35)2
𝑠𝑥 2 = − =2,28358
5 5
62,9095 6 ×(3,235)2
𝑠𝑦 2 = − = -0,68485
5 5
356,9954 6 ×18,35 ×3,235
𝑠𝑥𝑦 = − =0,16438
5 5
0,16438
𝑏̂ = = 0,0719835
2,28358
𝑎̂ = 3,235 − 0,0719835 × 18,35 = 1,9141028

Dengan demikian, persamaan regresi yang diestimasi


menggunakan metode kuadrat terkecil dari sebaran data Tabel
5.7 adalah: y = 1,9141028 + 0,0719835 x, atau pembulatan
sampai dua angka di belakang koma (dua desimal): y = 1,91 +
0,07 x.
Dari persamaan regresi yang diestimasi menggunakan
metode kuadrat terkecil, nilai-nilai y yang diestimasi (𝑦̂) dari
nilai x disajikan pada tabel berikut.

Tabel 5.8
Nilai y Estimasi serta Residual

Kecepatan Panjang
No (𝒚
̂) Residual
(x) Langkah (y)
1 15,86 3,05 3,0202 0,0298
2 16,88 3,12 3,0916 0,0284
3 17,50 3,17 3,135 0,035
4 18,62 3,25 3,2134 0,0366
5 19,97 3,36 3,3079 0,0521
6 21,06 3,46 3,3842 0,0758

Residu atau kesalahan perhitungan kecepatan dapat


dilihat dari garis referensi, yakni garis yang ditetapkan untuk
| 198
Statistik Dengan Pendekatan Matematik

melihat sebaran kesalahan. Garis referensi ini juga sebagai


patokan dalam perhitungan besar kesalahan sebaran data
terhadap garis regresi yang diestimasi menggunakan metode
kuadrat terkecil.
Garis referensi beserta kesalahan pada variabel
kecepatan disajikan pada gambar berikut. Garis referensi sejajar
sumbu-x, yakni y = 0,05.

Gambar 5.20
Garis Referensi y = 0,05 dari Program SPSS

Hasil perhitungan menggunakan Program SPSS disajikan


pada tabel berikut.

Tabel 5.9 Hasil Perhitungan dari Program SPSS

Coefficientsa
Unstandardized Standardized
Model/Prediktor Coefficients Coefficients t Sig.
B Std. Error Beta
1 (Constant) 1.834 .049 37.271 .000
Kecepatan .077 .003 .998 28.612 .000
a. Dependent Variable: Panjang_Langkah

| 199
Statistik Dengan Pendekatan Matematik

Tabel 5.9 menginformasikan bahwa nilai konstanta


persamaan regresi adalah 1,834 dengan kesalahan baku 0,049.
Pertambahan panjang (atau banyak) langkah adalah 0,077 untuk
tiap meter per detik. Nilai 0,077 merupakan nilai koefisien yang
diberikan dalam presisi lebih tinggi.
Hasil-hasil regresi dari program SPSS juga
mengeluarkan nilai koefisien korelasi dan determinasi r2 serta
tabel analisis varians (anava). Perhatikan tabel-tabel berikut.

Tabel 5.10
Hasil Perhitungan Koefisien Korelasi dan Determinasi

Model Summary
Adjusted R Std. Error of
Model R R Square
Square the Estimate
1 .998a .995 .994 .01198
a. Predictors: (Constant), Kecepatan

Berdasarkan Tabel 5.10, koefisien korelasi adalah 0,998


≈ 1,0 dan koefisien determinasi adalah 0,995 yang berarti bahwa
hampir 100% variasi dari xdapat diterangkan pada y. Nilai
koefisien korelasi dengan pencocokan adalah 0,994 atau
kecocokan asosiasi linear tinggi yakni 99,4%.
Selain hasil olahan berupa koefisien korelasi, luaran
SPSS juga menampilkan tabel anava. Hasil olahan sebagaimana
Tabel 5.10 akan diuraikan pada bagian mengenai Anava dalam
buku ini.
Sebagaimana diuraikan, untuk regresi, satu variabel y
dipandang sebagai hasil dari, atau menjawab variabel lain x.
Kedua variabel itu tidak dapat bertukar tempat. Persamaan garis
lurus yang diperoleh " y = a + b.x " menyarikan hubungan antara
keduanya. Dalam hal ini, variabel y merupakan hasil (outcome),
variabel respon atau variabel terikat (output), sedangkan x
| 200
Statistik Dengan Pendekatan Matematik

adalah prediktor, variabel yang menerangkan atau variabel


bebas (input).
Seringkali nilai-nilai dari x dipilih peneliti dan tidak
acak, sementara nilai-nilai y diukur dan diperlakukan sebagai
variabel acak yang diambil dari sebaran yang tergantung pada x.
Perhatikan ilustrasi berikut.

Titik

Jarak

Titik

Gambar 5.21
Ilustrasi Komponen Pencocokan Garis Regresi

Pencocokan persamaan garis regresi 𝑦̂ = 𝑎̂ − 𝑏̂𝑥


menggunakan metode kuadrat terkecil (method of least squares)
untuk menghitung 𝑎̂ dan 𝑏̂ sehingga jumlah kuadrat-kuadrat dari
jarak vertikal ∑𝑛𝑖=1(𝑦̂ − 𝑦𝑖 )2 adalah diminimumkan. Nilai 𝑎̂ dan
𝑏̂ dapat dihitung dan kemudian prediksi nilai yuntuk sebarang x
yang diberikan adalah 𝑦̂ = 𝑎̂ − 𝑏̂𝑥, dimana 𝑦̂ dinamakan nilai
yang dicocokkan.

D. Analisis Varians
Analisis varians merupakan teknik pengukuran penting
dari suatu regresi serta untuk mengestimasi seberapa besar
variasi dalam Y yang tak dapat diterangkan agar diabaikan
setelah mempertimbangkan X. Keseluruhan (total) variasi

| 201
Statistik Dengan Pendekatan Matematik

antara nilai-nilai y yang diukur, dengan mengabaikan nilai-nilai


x, adalah ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2. Variasi nilai-nilai y dari garis adalah
kecil, yakni ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂𝑖 )2 . Garis regresi secara tepat
merupakan garis yang membuat kuantitas tersebut sekecil
mungkin. Dapat ditunjukkan sebagai berikut:

2 2
Total variasi = ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅ ) = ∑𝑛𝑖=1[(𝑦𝑖 − 𝑦̂ 𝑖 ) + (𝑦̂ 𝑖 − 𝑦̅ )]

= ∑(𝑦𝑖 − 𝑦̂𝑖 )2 + ∑(𝑦̂𝑖 − 𝑦̅)2

Variasi tak variasi dapat diterangkan dapat diterangkan


menggunakan garis geresi
Perhatikan kembali contoh pelari wanita Indonesia,
dimana hasil dari program SPSS juga memiliki analisi varians
seperti pada tabel berikut.

Tabel 5.11
Analisis Varians Regresi dari Program SPSS

ANOVAb
Mean
Model Sum of Squares df Square F Sig.
1 Regression .118 1 .118 818.660 .000a
Residual .001 4 .000
Total .118 5
a. Predictors: (Constant), Kecepatan
b. Dependent Variable: Panjang_Langkah

Luaran sebagaimana Tabel 5.11 merupakan tabel analisis


varians (anava). Kolom model merupakan sumber-sumber
variasi dalam variabel Y. Sumber variasi tersebut terdiri atas
regresi dan residual. Variasi residual biasa dinamakan kesalahan
(error). Regresi merupakan variasi yang dapat diterangkan,

| 202
Statistik Dengan Pendekatan Matematik

yakni ∑(𝑦̂𝑖 − 𝑦̅)2, sedangkan variasi kesalahan adalah ∑(𝑦𝑖 −


𝑦̂𝑖 )2 . Jumlah kuadrat-kuadrat variasi total adalah ∑(𝑦𝑖 − 𝑦̅)2 .
Koefisien determinasi (Coefficient of Determination)
dari anava merupakan ukuran seberapa tepat (baik) garis regresi
mencocokkan data. Koefisien determinasi adalah :

𝑣𝑎𝑟𝑖𝑎𝑠𝑖 𝑦𝑎𝑛𝑔 𝑑𝑎𝑝𝑎𝑡 𝑑𝑖𝑡𝑒𝑟𝑎𝑛𝑔𝑘𝑎𝑛 ∑(𝑦̂ −𝑦̅)2


= ∑(𝑦𝑖−𝑦̅)2 = 𝑟 2 =
𝑡𝑜𝑡𝑎𝑙 𝑣𝑎𝑟𝑖𝑎𝑠𝑖 𝑖

koefisien korelasi kuadrat.

Dengan demikian, 100r2 merupakan persentase variasi


yang dapat diterangkan oleh garis regresi.
Jika titik-titik semuanya terletak secara tepat pada garis
itu (garis regresi) yakni 𝑦𝑖 = 𝑦̂𝑖 , maka variasi yang tidak dapat
diterangkan (kesalahan) adalah nol sehingga koefisien
determinasi adalah satu, apabila 𝑦̂𝑖 = 𝑦̅ sehingga kemiringan
(gradient/slope) garis 𝑏̂ adalah nol (yakni tidak terdapat efek
regresi) maka koefisien determinasi sama dengan nol. Secara
umum: 0≤koefisien determinasi ≤1 .
Contoh: berikut diberikan pertumbuhan nilai belanja
pendidikan (dalam juta rupiah) di suatu kabupaten yang diamati
selama 6 tahun.
Tabel 5.12
Data Pertumbuhan Belanja Pendidikan

Tahun Pertumbuhan Belanja Pendidikan (Juta Rupiah)


Ke-
1 4.600
2 2.700
3 4.100
4 2.300
5 1.800
6 2.000

| 203
Statistik Dengan Pendekatan Matematik

Persamaan regresi dapat dituliskan dari luaran program


SPSS dalam tabel berikut, yakni Pertumbuhan Belanja
Pendidikan = 4.667 – 0,500 tahun.

Tabel 5.13 Output untuk Persamaan Regresi

Unstandardized Standardized
Model Coefficients Coefficients t Sig.
B Std. Error Beta
1 (Constant) 4.667 .717 6.508 .003
Tahun -.500 .184 -.805 -2.715 .053
a. Dependent Variable: Belanja_Pendidikan

Persamaan regresi tersebut menunjukkan pula hubungan


antara pertumbuhan belanja pendidikan dan tahun, yakni rata-
rata pertumbuhan tersebut menurun ½ % per tahun. Selain
luaran untuk mendapatkan persamaan regresi, SPSS juga
menampilkan tabel ringkasan model hubungan serta koefisien
determinasi. Berikut disajikan tabel sebagaimana dimaksud.
Tabel 5.14
Ringkasan Model Hubungan antara Variabel

Adjusted R Std. Error of the


Model R R Square
Square Estimate

1 .805a .648 .560 .77028


a. Predictors: (Constant), Tahun

Dari Tabel 5.14 dapat diketahui bahwa koefisien


determinasi untuk pencocokan garis regresi yakni r 2 (dalam
tabel adalah R Square) sebesar 64,8%. Artinya, 64,8% variasi
dalam pertumbuhan diterangkan menggunakan persamaan yang
dicocokkan.
Analisis varians luaran dari program SPSS adalah
sebagai berikut.
| 204
Statistik Dengan Pendekatan Matematik

Tabel 5.15
Analisis Varians Persamaan Regresi Luaran SPSS

ANOVAb
Sum of
Model df Mean Square F Sig.
Squares
1 Regression 4.375 1 4.375 7.374 .053a
Residual 2.373 4 .593
Total 6.748 5
a. Predictors: (Constant), Tahun
b. Dependent Variable: Belanja_Pendidikan

Persamaan regresi yang dengan pencocokkan adalah:


dicocokkan Nilai yang diprediksi menggunakan persamaan
regresi yang diperoleh disajikan pada tabel berikut.

Obs.year growth Fit Stdev Fit* Residual St.Resid*


1 1.00 4.600 4.167 0.557 0.433 0.82
2 2.00 2.700 3.667 0.419 -0.967 -1.49
3 3.00 4.100 3.167 0.328 0.933 1.34
4 4.00 2.300 2.667 0.328 -0.367 -0.53
5 5.00 1.800 2.167 0.419 -0.367 -0.57
6 6.00 2.000 1.667 0.557 0.333 0.63
* Not treated in this course.

E. Metode Sederhana untuk Analisis Deret Waktu


Pengamatan pada rentang waktu berurutan dinamakan
deret waktu (time series). Biasanya ukuran waktu adalah pada
ruang berdimensi-2 (bidang datar). Penempatan waktu pada
sumbu-x dapat mengungkap ciri utama dari deret waktu, yakni
mengenai :
1. Kecenderungan (trend), misal perubahan jangka panjang (a
long term change) dalam level dari variabel;
2. Variasi menurut musim (seasonal variation), misal
kemarau dan hujan secara teratur yang terjadi tiap tahun;

| 205
Statistik Dengan Pendekatan Matematik

3. Variasi siklis (cyclical variation), yakni perubahan kemarau


dan hujan yang tak begitu teratur dibandingkan variasi musim
dan tidak diterangkan menggunakan efek musim;
4. Turun naik tak teratur (irregular fluctuations), yakni
dikarenakan iklim atau keadaan khusus atau peristiwa tak
biasa pada suatu periode waktu tertentu.
Terdapat empat (4) alasan utama penggunaan analisis
deret waktu, yakni:
1. Untuk meramalkan nilai variabel terikat, misalnya pedagang
perlu meramalkan permintaan suatu produk; seorang kepala
sekolah meramalkan calon siswa peminat memasuki
sekolahnya; dan lain-lain.
2. Untuk menggambarkan atau menerangkan pola-pola musim,
misalnya bagaimana fluktuasi penjualan suatu toko atau pusat
perbelanjaan dari waktu ke waktu; bagaimana kementerian
pendidikan dan kebudayaan menjelaskan fluktuasi angka
putus sekolah dari periode waktu ke periode waktu tertentu.
3. Untuk mengkuantifikasi teori, misalnya berapa besar efek
dari penjualan suatu barang selama terjadi peningkatan bunga
pinjaman (interest rates); berapa besar efek dari penerapan
suatu kurikulum selama penerapannya; dan lain-lain.
4. Untuk menguji teori, yakni menguji hipotesis mengenai
hubungan antara variabel-variabel.

Contoh –ekspor kayu lapis Indonesia

| 206
Statistik Dengan Pendekatan Matematik

Tabel 5.12
Sebaran Data Ekspor Kayu Lapis Indoensia (Ribu Kubik)
Tahun Kayu Lapis Tahun Kayu Lapis Tahun Kayu Lapis
1954 6902 1964 9103 1974 7483
1955 7228 1965 8639 1975 6428
1956 6829 1966 8248 1976 6348
1957 6833 1967 8734 1977 6369
1958 6421 1968 8971 1978 6709
1959 7260 1969 8165 1979 7053
1960 7686 1970 8221 1980 6131
1961 7882 1971 8181 1981 5649
1962 7568 1972 8630 1982 6237
1963 7804 1973 9746 1983 6895
1984 6643

Gambar 5.20
Diagram Pencar Ekspor Kayu Lapis dalam Tahun

Apabila titik-titik tersebut dihubung-hubungkan, maka


diperoleh gambar garis seperti berikut ini.

Gambar 5.21
Diagram Garis Mengenai Ekspor Kayu Lapis dalam Tahun
| 207
Statistik Dengan Pendekatan Matematik

Data tersebut sangat berubah-ubah. Untuk mendapatkan


gagasan yang lebih jelas dari pola utama sebaran perlu
dilakukan penghalusan atau penajaman data itu. Ada dua
pendekatan yang dapat digunakan, yakni:
1. Mencocokkan persamaan matematika menggunakan metode
regresi. Akan tetapi memilih persamaan yang cocok mungkin
sukar karena
a. persamaan equation dapat saja menjadi rumit
(complicated)
b. apa makna dari itu?
2. Menggunakan metode aritmatika sederhana.
Pada bagian ini, penulis memperlihatkan metode untuk
pendekatan (2), yakni menggunakan metode aritmatika
sederhana, yakni pergerakan rata-rata (moving average).
Pergerakan nilai rata-rata (analisis kecenderungan) dapat
merupakan perhitungan nilai rata-rata dalam kelompok
berukuran sampel tertentu, misalnya 5 sampel dalam tiap
kelompok. Dapat juga menggunakan ukuran statistik lainnya.
Perhatikan uraian berikut.
Menghitung rata-rata dari 5 nilai, misalnya untuk tahun
6902 +7228+6829+6421
1954 hingga 1958, yakni 𝑚1 = = 6842,6.
5
Kemudian, hitung rata-rata 5 nilai berikutnya dari 1955 hingga
7260 +7686 +7882+7568+7804
1959, yakni: 𝑚2 = = 6981,2. Dan
5
seterusnya.
Lalu letakkan nilai rata-rata tersebut terhadap tengah-
tengah periode waktu yang digunakan untuk tiap nilainya, yakni
letakkan m1untuk 1956, m2untuk 1957, dan seterusnya.
(Penempatan seperti itu menghilangkan titik awal dan akhir).
Grafik dari kedua kelompok nilai yakni data mentah dan
kecenderungan pergerakan rata-rata dari program excel disajikan
berikut ini.

| 208
Statistik Dengan Pendekatan Matematik

15000

10000 Data Mentah

5000
Pergerakan
Rerata
0
1954
1957
1960
1963
1966
1969
1972
1975
1978
1981
1984
Gambar 5.22
Grafik Pergerakan Rerata dari Data Mentah

Rumus umum pergerakan rata-rata (analisis


kecenderungan) adalah sebagai sebagai berikut. Misalkan y1, y2,
... , ynmenyatakan data.Untuk pergerakan rata-rata 5-titik, nilai
𝑦1 +𝑦2+𝑦3 +𝑦4 +𝑦5
pertamanya adalah 𝑚1 = dan nilai ke-k adalah:
𝑦
𝑦𝑘 +𝑦𝑘+1 +𝑦𝑘+2 +𝑦𝑘+3 +𝑦𝑘+4
𝑚𝑘 = .
5
Catatan
1. Perhitungan pergerakan rata-rata dapat dikerjakan
menggunakan berbagai banyak data (titik data), misalnya
pergerakan rata-rata 4 titik.
2. Dengan cara yang sama, pergerakan(atau perjalanan)
median dapat digunakan, misalnya pergerakan median 3-
titik, yakni median dari(y1, y2 , y3) atau median dari (y2 , y3 ,
y4 ),dan seterusnya.
3. Banyak pengamatan yang digunakan untuk pergerakan rata-
rata tergantung pada aplikasi dan rata-rata data, dimana
banyak rata-rata menghaluskan semua polanya sedangkan
sedikit rata-rata data sedikit pula penghalusannya.
4. Pergerakan rata-rata lebih kompleks dan sering digunakan
𝑦𝑘 +2𝑦𝑘+1 +𝑦𝑘+2
misalnya adalah 𝑚𝑘 = (yakni pembobotan
4
pergerakan rata-rata 3-titik dengan bobot 1/4, 2/4 dan 1/4)
| 209
Statistik Dengan Pendekatan Matematik

5. Jika fluktuasi beraturan (yakni berciri periodik) maka


kenaik-turunan tersebut dapat dihilangan menggunakan
pergerakan rata-rata dari panjang yang sama sebagaimana
periode tersebut.

Soal Latihan
1
1. Tunjukkan bahwa: 𝑠𝑥𝑦 = 𝑛−1 ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) =
1
[(∑ 𝑥𝑖 𝑦𝑖 ) − 𝑥̅ 𝑦̅. 𝑛].
𝑛−1
1
2. Tunjukkan bahwa: 𝑠𝑥 = √ (∑ 𝑥𝑖 2 − (𝑥̅ )2 . 𝑛)dan 𝑠𝑦 =
𝑛−1

1
√𝑛−1 (∑ 𝑦𝑖 2 − (𝑦̅)2 . 𝑛)
3. Hitung korelasi antara Tinggi (cm) dan Berat (kg) dari 20
mahasiswa seperti data pada tabel berikut. Perhitungan
dilakukan secara manual menggunakan rumus korelasi
melalui tabel yang sesuai.

Nomor Tinggi Berat Nomor Tinggi Berat


(cm) (kg) (cm) (kg)
1 167 60 11 150 50
2 164 65 12 156 46
3 170 64 13 168 60
4 163 47 14 159 55
5 152 46 15 160 50
6 160 57 16 172 69
7 170 57 17 175 56
8 160 55 18 169 56
9 157 55 19 169 72
10 170 65 20 156 56

𝑠𝑥𝑦
4. Koefisien korelasi adalah 𝑟 = 𝑠 sehingga x dan y dapat
𝑥 𝑠𝑦

saling dipertukarkan. Garis regresi adalah y = 𝑎̂ + 𝑏̂x


𝑠𝑥𝑦
dimana 𝑎̂ = 𝑦̅ − 𝑏̂𝑥̅ dan 𝑏̂ = 2 sehingga x dan y tidak
𝑠𝑥
dapat saling dipertukarkan. Jelaskan!
| 210
Statistik Dengan Pendekatan Matematik

5. Tuliskan rumus pergerakan rata-rata 4 titik dan 6 titik.


6. Dari data seperti tertera pada tabel berikut, hitung
pergerakan rata-rata dan pergerakan median 3 titik dan 4
titik.

Tahun Kayu Lapis Tahun Kayu Lapis Tahun Kayu Lapis


1954 6902 1964 9103 1974 7483
1955 7228 1965 8639 1975 6428
1956 6829 1966 8248 1976 6348
1957 6833 1967 8734 1977 6369
1958 6421 1968 8971 1978 6709
1959 7260 1969 8165 1979 7053
1960 7686 1970 8221 1980 6131
1961 7882 1971 8181 1981 5649
1962 7568 1972 8630 1982 6237
1963 7804 1973 9746 1983 6895
1984 6643

7. Buat tabel anava dari data berikut.

No Kecepatan (x) Panjang Langkah (y)


1 15,86 3,05
2 16,88 3,12
3 17,50 3,17
4 18,62 3,25
5 19,97 3,36
6 21,06 3,46

8. Tuliskan persamaan regresi dan koefisien determinasi


sebaran data pada tabel dari soal nomor 7.

| 211
Statistik Dengan Pendekatan Matematik

DAFTAR PUSTAKA

Agresti, Alan (1996). Introduction to categorical data analysis.


NY: John Wiley and Sons.
Aiken, Lewis R. and Lewis A. (1996).Rating Scales and
Checklists : Evaluating Behavior, Personality, and
Attitudes. NY: John Wiley & Sons, ISBN 0471127876.
Bishop, Lloyd K. and Paula E. Lester (1993). Instrumentation in
Education : An Anthology . Garland Publishing, ISBN
0815306385.
Davis, James A. (1971). Elementary survey analysis. Englewood
Cliffs, NJ: Prentice-Hall. Davis discusses other
measures in this section more extensively, including
setting confidence limits on Q (pp. 51-58).
DeVellis, Robert F. (2003). Scale development: Theory and
applications. Second edition.. Thousand Oaks, CA:
Sage Publications. Covers factor analysis and item
response theory.
Gardner, P. L. (1975). Scales and statistics.Review of
Educational Research. 45: 43-57. Discusses
assumptions of the t-test.
Landis, J. R., Koch, G. G. (1977). The measurement of observer
agreement for categorical data.Biometrics 33:159-174.
This article sets cut-offs for Cohen's Kappa.
Liebetrau, Albert M. (1983). Measures of association. Newbury
Park, CA: Sage Publications. Quantitative Applications
in the Social Sciences Series No. 32.
Mokken, Robert J. (1971). A theory and procedure of scale
analysis. The Hague: Mouton.
Moore, D. S. (1995).The basic practice of statistics. NY:
Freeman and Co.

| 212
Statistik Dengan Pendekatan Matematik

Tarkkonen, L. (1987). On reliability of composite


scales.Statistical Research Reports 7. Finnish Statistical
Society.
Vehkalahti, K. (2000). Reliability of measurement scales.
Statistical Research Reports 17. Finnish Statistical Society.

| 213

Anda mungkin juga menyukai