Anda di halaman 1dari 51

statistika untuk

penelitian

Kelompok Ilmiah Remaja (KIR)


Delayota Experiment Team (DExpert)
2013
Freeaninationwallpaper.blogspot.com

Apa itu Statistika ?


Statistika adalah ilmu yang mempelajari cara
pengumpulan, pengolahan, penyajian, dan
pengambilan kesimpulan berdasarkan data.

Ilmu Statistika berperan penting dalam penelitian-penelitian kuantitatif, yakni sebagai dasar
dalam melakukan analisis hingga pengambilan
kesimpulan untuk memecahkan masalah.

Cabang Statistika
STATISTIKA DESKRIPTIF merupakan cabang
statistika yang secara khusus mempelajari cara
pengumpulan, pengolahan, hingga penyajian
data.
STATISTIKA INFERENSI merupakan cabang
statistika yang secara khusus mempelajari cara
penarikan kesimpulan dari sekumpulan data.
Kedua cabang statistika ini saling berkaitan
dan sama pentingnya dalam penelitian.

Ilustrasi (1)
Fino ingin mengetahui pengaruh Bantuan
Program Nasional Pemberdayaan Masyarakat
(PNPM) Mandiri di DIY terhadap laba usaha
para penerimanya.
Lihat kembali materi tentang populasi dan
sampel penelitian!

Populasi dalam penelitian ini adalah seluruh


masyarakat DIY yang menerima bantuan PNPM
Mandiri.
Populasi ini tersebar di berbagai kecamatan di DIY,
sehingga perlu dilakukan pengambilan sampel.

Ranah
Statistika
deskriptif

Ranah
Statistika
inferensi

Fino mengumpulkan data penerima


bantuan PNPM Mandiri di DIY.
Fino mengambil beberapa penerima
bantuan PNPM Mandiri sebagai
sampel penelitian.
Fino mengumpulkan data penghasilan
sampel sebelum dan sesudah adanya
bantuan PNPM Mandiri.
Fino menghitung rata-rata dan
simpangan baku penghasilan sampel.
Fino menarik kesimpulan tentang
kondisi populasi berdasarkan sampel:
menjawab pertanyaan apakah laba
usaha populasi dipengaruhi oleh
adanya bantuan PNPM Mandiri.

Ilustrasi (2)
Aga ingin mengetahui
pengaruh pemberian
ekstrak buah kluwih
terhadap kadar glukosa
darah pada mencit (tikus).
Untuk itu, ia melakukan
percobaan pengukuran
kadar gula darah mencit
sebelum dan sesudah
pemberian ekstrak buah
kluwih pada dosis tertentu.

Ranah
Statistika
deskriptif

Ranah
Statistika
inferensi

Bagaimana cara Aga mengetahui


adanya perubahan kadar gula darah
mencit sebelum dan sesudah
pemberian ekstrak buah kluwih ?
Berapa banyak mencit yang harus
digunakan sebagai bahan dalam
percobaan ini ?
Bagaimana Aga menjamin bahwa
perubahan kadar gula darah pada
mencit (bila ada) merupakan akibat
dari pemberian ekstrak buah kluwih ?
Seandainya Budi mengulangi
percobaan Aga ini, apakah ia juga akan
mendapatkan kesimpulan yang sama
dengan Aga ?

Bagian I

STATISTIKA DESKRIPTIF

Ringkasan Data
Pada umumnya, orang tidak dapat mengambil
kesimpulan apapun hanya dengan melihat atau
membaca sekumpulan angka.
Agar kumpulan angka tersebut dapat memiliki
makna dan dapat digunakan untuk menarik
kesimpulan, angka-angka tersebut haruslah
diringkas, diolah, atau disajikan sedemikian rupa
dengan bantuan statistika deskriptif.
Teknik penyajian data telah dibahas pada slide
lain berjudul Penyajian Data, sehingga tidak
akan dibahas lagi pada slide ini.

Ukuran Kecenderungan Data


Para ahli statistika umumnya menggunakan
beberapa ukuran di bawah ini untuk
menggambarkan karakteristik suatu data.
Ukuran kecenderungan memusat
Ukuran kecenderungan memencar / menyebar
Ukuran letak
Ukuran kelancipan
Ukuran kemencengan
Frekuensi relatif / proporsi

Ukuran Kecenderungan Memusat


Pada umumnya, hasil amatan berada di sekitar
nilai-nilai tertentu. Nilai tertentu inilah yang
dinamakan ukuran kecenderungan memusat.
Beberapa contoh ukuran kecenderungan
memusat yang dapat digunakan:
Rata-rata hitung (arithmatic mean)
Rata-rata ukur (geometric mean)
Rata-rata harmonis (harmonic mean)
Modus
Median

Rata-rata Hitung
Misal dimiliki n buah data, x1, x2, ..., xn. Rata
rata hitung didefinisikan sebagai
1 n
rata - rata hitung x i
n i 1

Bila tidak disebutkan lain, maka yang


dimaksud dengan rata-rata biasanya adalah
rata-rata hitung (arithmatic mean) di atas.

Rata-rata Ukur
Misal dimiliki n buah data, x1, x2, ..., xn. Rata
rata ukur didefinisikan sebagai
rata - rata ukur n x 1x 2 ...x n

Rata-rata ukur pada umumnya digunakan bila


perbandingan tiap dua data berurutan tetap
atau hampir tetap (lihat Sudjana, 1992:72).

Rata-rata Harmonis
Misal dimiliki n buah data, x1, x2, ..., xn. Rata
rata harmonis didefinisikan sebagai
rata - rata harmonis

n
n

x
i1

Rata-rata harmonis dapat digunakan misalnya


pada ukuran rasio / perbandingan (lihat
Sudjana, 1992:75; Dajan, 1995:159).

Modus
Modus didefinisikan sebagai data yang paling
sering muncul atau data dengan frekuensi
kemunculan tertinggi.
Pada data kuantitatif, modus jarang digunakan
sebagai ukuran kecenderungan memusat
karena suatu kumpulan data
Bisa tidak memiliki modus, atau
Bisa memiliki tepat satu modus, atau
Bisa memiliki lebih dari satu modus.

Median
Misal dimiliki statistik peringkat atau order
statistics, yakni data yang telah diurutkan dari
yang terkecil hingga terbesar. Median
merupakan nilai yang membagi statistik
peringkat tersebut menjadi dua kumpulan
yang jumlah anggotanya sama.
Ilustrasi:
x1

x2

x3

...

Median

...

xn-1

xn

Ukuran Kecenderungan Menyebar


Ukuran kecenderungan menyebar / memencar
menunjukkan persebaran data di sekitar nilai
tengah (ukuran kecenderungan memusat).
Beberapa ukuran
yang sering digunakan:
- jangkauan (range)
- ragam (variance)
- simpangan baku
Same center,
different variation

Jangkauan
Jangkauan (range) menyatakan selisih datum
terbesar (xmax) dengan datum terkecil (xmin).
Meskipun paling mudah dihitung, jangkauan
jarang digunakan karena sangat dipengaruhi
oleh nilai-nilai ekstrim. Selain itu, jangkauan
tidak dipengaruhi oleh data di antara datum
terbesar dan datum terkecil itu.

Ragam
Ragam atau varians (variance) didefinisikan
sebagai rata-rata kuadrat jarak masing-masing
datum terhadap nilai tengah (rata-rata).
Misal dimiliki n buah data, x1, x2, ..., xn, dan x
menyatakan rata-rata sampel, ragam sampel
didefinisikan sebagai:
n
2
Akar kuadrat dari ragam
(x i x)
disebut simpangan baku 2
i1
s
atau deviasi standar.
n -1

Ukuran Kemencengan
Ukuran kemencengan (skewness)
menunjukkan bentuk distribusi data; suatu
data dapat berdistribusi simetris, menceng ke
kanan, maupun menceng ke kiri.

Ukuran Kelancipan
Ukuran kelancipan suatu distribusi data disebut
kurtosis. Berdasarkan nilai kurtosis, kita mengenal
tiga macam distribusi.
Dalam analisis statistika sehari-hari, kurtosis maupun
ukuran kemencengan jarang digunakan.

Bagian II

STATISTIKA INFERENSI

Mengapa diperlukan Inferensi ?


Dalam penelitian, seringkali kita berhadapan
dengan penentuan sifat-sifat populasi, yang
meliputi:
Rata-rata populasi (biasa dilambangkan )
Simpangan baku populasi (biasa dilambangkan )
Proporsi dalam populasi (biasa dilambangkan )

Baik , , maupun tidak dapat diketahui


atau dihitung secara langsung, namun dapat
dipelajari melalui proses inferensi
berdasarkan data sampel yang dimiliki.

Contoh 1:
Dalam kasus I di muka, seharusnya Fino
membandingkan rata-rata penghasilan
populasi, yakni seluruh penerima bantuan
PNPM Mandiri, sebelum dan sesudah
penyaluran bantuan. Fino tidak mungkin
menanyai seluruh penerima bantuan ini,
sehingga rata-rata penghasilan populasi tidak
dapat diketahui. Yang dapat Fino kumpulkan
hanyalah data penghasilan sebagian penerima
bantuan PNPM Mandiri sebagai sampel. Dari
data sampel inilah Fino harus menyelidiki ratarata penghasilan populasi.

Contoh 2:
Menanggapi ide penggunaan hasil UN sebagai
syarat masuk Perguruan Tinggi, ingin diketahui
persepsi siswa SMA di Indonesia (setuju/tidak
setuju) terhadap ide tersebut. Untuk itu,
seharusnya dilakukan referendum kepada
seluruh siswa SMA, namun hal ini tidak dapat
dilakukan mengingat banyaknya jumlah siswa
dan distribusi sekolah dari kota hingga pelosok.
Oleh karena itu, tidak dapat diketahui besarnya
bagian (proporsi) keseluruhan siswa SMA yang
setuju terhadap wacana tersebut. Yang dapat
diketahui hanyalah proporsi dari sampel siswasiswi SMA.

Dalam ilustrasi di atas, parameter populasi


dapat berupa rata-rata (), simpangan baku (),
maupun proporsi () akan dipelajari melalui
statistik sampel (1, ..., k).

Alur Berpikir dalam Inferensi


Diambil sebagian
(secara acak)

sampel
populasi

Parameter
populasi

Dianalisis
untuk
memperoleh

PROSES
INFERENSI

statistik sampel

Prosedur Inferensi

Estimasi

Menduga nilai-nilai
parameter populasi
berdasarkan informasi atau
data statistik sampel

Uji
Hipotesis

Menentukan apakah
hipotesis tentang parameter
populasi didukung oleh
informasi sampel.

Estimasi
Estimasi atau pendugaan dapat dilakukan dengan
dua cara, yakni estimasi titik dan estimasi
interval.
Pada estimasi titik, nilai statistik sampel langsung
digunakan sebagai penduga (estimator)
parameter populasi.
Pada estimasi interval, statistik sampel digunakan
membentuk suatu selang (interval) yang memuat
parameter populasi dengan probabilitas tertentu.
Hasil estimasi interval disebut selang
kepercayaan atau interval konfidensi.

Contoh: Diketahui 60% sampel siswa SMA menolak


ide penggunaan hasil UN sebagai syarat masuk
perguruan tinggi.
Hasil estimasi titik: 60% siswa SMA di Indonesia
(populasi) menolak ide tersebut.
Hasil estimasi interval: Peluang bahwa 55%
sampai 65% siswa SMA di Indonesia menolak ide
tersebut adalah sebesar 0,95. Interval 55% - 65%
ini merupakan suatu interval konfidensi.

populasi
(rata-rata, ,
tidak diketahui)

Rata-rata
X = 50

Saya 95% yakin


bahwa rata-rata
populasi di
antara 40 & 60.

Sampel
acak

Permasalahan yang timbul pada estimasi interval


adalah bagaimana menentukan batas keyakinan
dengan peluang tertentu.
Untuk ini perlu dipahami distribusi / sebaran data.

Uji Hipotesis
Dalam pengujian hipotesis, mula-mula peneliti
menyusun hipotesis statistik, yakni dugaan
tentang nilai parameter populasi.
Suatu hipotesis statistik selalu dinyatakan
dalam bentuk pasangan
Hipotesis nol (H0): hipotesis yang tidak memihak
Hipotesis alternatif (H1 atau Ha): lawan dari
hipotesis nol.

Contoh pembentukan hipotesis statistik dari


masalah nyata dapat dilihat pada slide berikut.

Dalam kasus 1 di muka, misal 1 menyatakan


rata-rata laba usaha masyarakat penerima
PNPM Mandiri sebelum bantuan diberikan
dan 2 menyatakan rata-rata laba usaha
masyarakat penerima PNPM Mandiri setelah
bantuan diberikan.
Hipotesis nol dan hipotesis alternatif dapat
disusun sebagai berikut:
H0: 1 - 2 0 (rata-rata laba usaha masyarakat
sebelum penerimaan bantuan tidak lebih besar
daripada setelah penerimaan bantuan)
H1: 1 - 2 > 0 (rata-rata laba usaha masyarakat
sebelum penerimaan bantuan lebih besar
daripada setelah penerimaan bantuan)

Selanjutnya, dari data sampel akan dihitung ratarata selisih laba usaha sampel penerima bantuan
PNPM Mandiri sebleum dan sesudah pemberian
bantuan. Rata-rata selisih laba usaha sampel ini
akan dibandingkan dengan nilai tertentu.
Bila nilainya jauh lebih besar daripada nol,
maka kita akan menolak Hipotesis nol (dengan
demikian menerima hipotesis alternatif).
Bila nilainya lebih kecil atau berada di sekitar
nol, kita akan menerima hipotesis nol (dengan
demikian menolak hipotesis alternatif).
Aturan penerimaan atau penolakan hipotesis nol
ini dinamakan daerah kritik.

Kesalahan dalam Uji Hipotesis


Dalam pengujian hipotesis, kesimpulan yang
diambil berdasarkan sampel belum tentu cocok
dengan kondisi populasi, namun kita tak pernah
tahu kondisi populasi tersebut. Yang dapat kita
ketahui mengenai tepat tidaknya kesimpulan
pada uji hipotesis adalah sebagai berikut.
Kesimpulan
yang diambil
H0 tidak ditolak
H0 ditolak

Kondisi Populasi Sebenarnya


Sesuai H0

Tidak sesuai H0

Keputusan Tepat
Keputusan salah (tipe II)
Keputusan salah (tipe I)
Keputusan tepat

Pandang suatu kasus persidangan seseorang yang


diduga melakukan tindak pidana korupsi.
H0: terdakwa tidak bersalah
H1: terdakwa bersalah
Bila H0 benar, tentu terdakwa harus dinyatakan
bebas, sebaliknya bila H1 benar, terdakwa akan
dihukum.
Dalam analogi di atas, kesalahan tipe I adalah
menghukum terdakwa yang tidak bersalah, sedang
kesalahan tipe II adalah membebaskan terdakwa
yang bersalah. Kesalahan tipe I dipandang lebih
serius daripada tipe II, sehingga perlu diperhatikan
peluang terjadinya kesalahan tipe I (biasa
dilambangkan dengan huruf yunani ).

Nilai selalu dibuat kecil, namun tidak pernah sama


dengan nol karena kesalahan tipe I akan selalu ada.
Oleh karena itu,
Pada penelitian-penelitian kedokteran atau
farmasi (yang berkaitan dengan nyawa manusia),
umumnya diambil sebesar 0,01.
Pada penelitian-penelitian pertanian, sosial
budaya, kependidikan, umumnya diambil yang
lebih besar, yakni 0,05.
Penentuan nilai akan berpengaruh terhadap
daerah kritik suatu pengujian hipotesis.

Contoh Prosedur Uji Hipotesis


Claim: rata-rata usia
populasi penduduk
suatu daerah adalah
50 tahun.
H0: = 50

Populasi
Ambil sampel
acak

Is X 20 likely if = 50?
If not likely,
REJECT
Null Hypothesis

Misalkan
rata-rata usia
sampel
adalah 20
tahun, x = 20

Sampel

Bagian III

SEBARAN PELUANG

Mengapa Perlu Sebaran Peluang ?


Melalui proses inferensi, seorang peneliti akan
menarik kesimpulan mengenai keadaan atau
sifat-sifat populasi berdasarkan informasi dari
sampel.
Proses inferensi tidak pernah lepas dari
kesalahan. Oleh karena itu, diperlukan cara untuk
mengukur peluang atau probabilitas terjadinya
kesalahan tersebut.
Mengingat sifat data populasi yang bermacammacam, peluang dalam inferensi akan ditentukan
dengan memodelkan data populasi mengikuti
suatu sebaran peluang tertentu.

Apa itu Sebaran Peluang?


Sebaran peluang atau probability distribution
merupakan suatu fungsi yang digunakan untuk
menyatakan peluang suatu variabel (random)
memiliki suatu nilai tertentu.
Contoh:
Variabel tinggi badan siswa peluang terdapat
siswa dengan tinggi badan 160 cm 180 cm.
Variabel jenis kelamin siswa dari 5 siswa yang
diambil secara acak di suatu SMU, peluang bahwa
seluruhnya duduk di kelas X program MIPA.

Sebaran Binomial
Sebaran Binomial digunakan untuk memodelkan
peluang data hasil percobaan binomial, yakni:
Hanya dapat menjalani tepat satu dari dua hasil yang
mungkin.
Peluang terjadinya hasil-hasil tersebut selalu tetap.
Percobaan (upaya) dilakukan berulang sebanyak n kali.

Contoh: Memodelkan banyaknya anak yang


terkena penyakit cacar air di suatu daerah: hasil
yang mungkin adalah anak terkena cacar air
dan anak sehat.

Bila percobaan dalam peluang distribusi


binomial diulang n kali, peluang mendapatkan
x hasil sukses dapat dihitung dengan:
P(x)

n!
x ! (n x )!

P (1- P)

nX

Dalam model ini p menyatakan peluang


tercapainya sukses dalam setiap ulangan.
Sebaran binomial umumnya digunakan pada
inferensi tentang proporsi populasi
(banyaknya anggota populasi yang termasuk
dalam suatu kategori / kelompok tertentu)
dan uji independensi antarvariabel kategorik.

Selain menggunakan rumus, peluang suatu


sebaran binomial juga dapat ditentukan
dengan bantuan tabel distribusi binomial atau
dengan bantuan Microsoft Excel.

Sebaran Normal
Sebaran normal lebih
umum dijumpai
daripada sebaran
binomial, karena banyak
sekali distribusi data
dalam kehidupan seharihari yang mengikuti pola
distribusi normal.
Ide dasar distribusi
normal adalah data yang
sedikit memiliki ekstrem
namun tinggi di bagian
tengah.

Bentuk kurva distribusi normal bergantung pada


mean () dan simpangan baku () pada persamaan
berikut:
f(x)

(x )2 /2 2

Secara khusus
didefinisikan
distribusi normal
standar yakni
distribusi normal
dengan nilai = 0
dan = 1.

Peluang pada sebaran normal ekuivalen dengan luas


daerah yang berada di bawah kurva normal, sehingga
dapat dihitung dengan kalkulus integral.

Perhitungan nilai probabilitas dengan pengintegralan


fungsi distribusi normal di atas sangat merepotkan,
sehingga digunakan transformasi berikut

X
Z

untuk membawa distribusi normal N (,2) ke


distribusi normal standard N(0,1).

Peluang distribusi normal standard dapat ditentukan


menggunakan tabel distribusi peluang normal
standard atau sering disebut tabel Z.

Sebaran Student-t
Dibandingkan sebaran normal, distribusi student-t
memiliki ujung (ekor) yang lebih tinggi. Bentuk kurva
student-t ditentukan oleh derajat bebas (degree of
freedom) sebesar k, dengan persamaan:
k 1
k 1

2
1
x
2

f(x;k)
k
k
k


2
Perhitungan peluang dengan mengintegralkan fungsi
di atas sangat sulit, sehingga digunakan tabel.

Perbandingan bentuk kurva distribusi student-t


dengan berbagai nilai derajat bebas.

Catatan: nama student-t merupakan samaran dari


William Searly Gosset, penemu distribusi ini.

RUJUKAN
Dajan, Anto. 1991. Pengantar Metode
Statistika II. Jakarta: LP3ES.
Gunardi. 1999. Diktat Kuliah Metode
Statistika. Yogyakarta: Fakultas Matematika
dan Ilmu Pengetahuan Alam Universitas
Gadjah Mada.
Subanar. 2013. Statistika Matematika.
Yogyakarta: Graha Iklmu
Sudjana. 1989. Metode Statistika. Bandung:
Tarsito

Anda mungkin juga menyukai