Anda di halaman 1dari 85

STATISTIK INFERENSIAL DAN DISTRIBUSI SAMPLING

OLEH:

1. Mulyadi Matanari
2. Boyke S.Padang
3. Giofani Padang

Dosen pengampu : Amirhud Dalimunthe,S.T., M.Kom.

PRODI TEKNIK ELEKTRO


FAKULTAS TEKNIK
UNIVERSITAS NEGERI MEDAN
2019

KATA PENGANTAR
Puji dan syukur kita panjatkan kekhadirat Tuhan Yang Maha Esa yang telah memberikan kasihNya kepada kita semua, sehingga
kami, penulis, dapat menyelesaikan penyusunan makalah ini dengan baik dan lancar..

Seiring dengan berakhirnya penyusunan makalah ini, sepantasnyalah kami mengucapkan terima kasih kepada bapak
Amirhud Dalimunthe, S.T., M.Kom. sebagai dosen pemgampu dasar elektronika yang telah turut membantu dalam penyusunan
makalah ini.

Kami juga menyadari masih banyaknya kekurangan dalam penyusunan makalah ini, oleh karena itu kami mohon maaf
apabila terdapat kesalahan atau kekurangan dalam makalah ini. Selain itu, kami berharap adanya kritik dan saran yang membangun
dari pembaca agar makalah ini menjadi lebih baik. Semoga makalah ini dapat bermanfaat bagi penulis maupun pembaca.

STATISTIK INFERENSIAL

(STATISTIK PARAMETRIK DAN STATISTIK NON PARAMETRIK)


A. Statistik Inferensial

Statistik inferensial adalah statistik yang digunakan untuk menganalisisdata sampel dan hasilnya
akan digeneralisasikan/diinferensialkan kepada populasi dimana sampel diambil. Statistik inferensial ada dua
macam, yaitu:

1) Statistik Parametrik

Statistik Parametrik, yaitu ilmu statistik yang mempertimbangkan jenis sebaran atau distribusi data,
yaitu apakah data menyebar secara normal atau tidak. Dengan kata lain, data yang akan dianalisis
menggunakan statistic
parametrik harus memenuhi asumsi normalitas. Pada umumnya, jika data tidak menyebar normal,
maka data seharusnya dikerjakan dengan metode statistik non-parametrik, atau setidak-tidaknya dilakukan
transformasi terlebih dahulu agar data mengikuti sebaran normal, sehingga bisa dikerjakan dengan statistik
parametrik.

Contoh metode statistik parametrik:

a. Uji-z (1 atau 2 sampel)

b. Uji-t (1 atau 2 sampel)

c. Korelasi pearson,

d. Perancangan percobaan (one or two-way anova parametrik), dll.

Ciri-ciri statistik parametrik:

- Data dengan skala interval dan rasio

- Data menyebar/berdistribusi normal

Keunggulan dan kelemahan statistik parametric:

Keunggulan:

a) Syarat syarat parameter dari suatu populasi yang menjadi sampel biasanya tidak diuji dan dianggap
memenuhi syarat, pengukuran terhadap data dilakukan dengan kuat.

b) Observasi bebas satu sama lain dan ditarik dari populasi yang berdistribusi normal serta memiliki varian
yang homogen.

Kelemahan:

a) Populasi harus memiliki varian yang sama.

b) Variabel-variabel yang diteliti harus dapat diukur setidaknya dalam skala interval.

c) Dalam analisis varian ditambahkan persyaratan rata-rata dari populasi harus normal dan bervarian sama,
dan harus merupakan kombinasi linear dari efek-efek yang ditimbulkan.

2) Statistik Non-Parametrik

Statistik Non-Parametrik, yaitu statistik bebas sebaran (tidak mensyaratkan bentuk sebaran
parameter populasi, baik normal atau tidak). Selain itu, statistik non-parametrik biasanya menggunakan
skala pengukuran sosial, yakni nominal dan ordinal yang umumnya tidak berdistribusi normal.

Contoh metode statistik non-parametrik:

a. Uji tanda (sign test)

b. Rank sum test (wilcoxon)

c. Rank correlation test (spearman)


d. Fisher probability exact test.

e. Chi-square test, Ciri-ciri statistik non-parametrik :

- Data tidak berdistribusi normal

- Umumnya data berskala nominal dan ordinal

- Umumnya dilakukan pada penelitian sosial

- Umumnya jumlah sampel kecil

Keunggulan dan kelemahan statistik non-parametrik :

Keunggulan:

a) Tidak membutuhkan asumsi normalitas.

b) Secara umum metode statistik non-parametrik lebih mudah dikerjakan dan lebih mudah dimengerti jika
dibandingkan dengan statistik parametrik karena ststistika non-parametrik tidak membutuhkan perhitungan
matematik yang rumit seperti halnya statistik parametrik.

c) Statistik non-parametrik dapat digantikan data numerik (nominal) dengan jenjang (ordinal).

d) Kadang-kadang pada statistik non-parametrik tidak dibutuhkan urutan atau jenjang secara formal karena
sering dijumpai hasil pengamatan yang dinyatakan dalam data kualitatif .

e) Pengujian hipotesis pada statistik non-parametrik dilakukan secara langsung pada pengamatan yang nyata.

f) Walaupun pada statistik non-parametrik tidak terikat pada distribusi normal populasi, tetapi dapat digunakan
pada populasi berdistribusi normal.

Kelemahan:

a) Statistik non-parametrik terkadang mengabaikan beberapa informasi tertentu.

b) Hasil pengujian hipotesis dengan statistik non-parametrik tidak setajam statistik parametrik.

c) Hasil statistik non-parametrik tidak dapat diekstrapolasikan ke populasi studi seperti pada statistik
parametrik. Hal ini dikarenakan statistik non-parametrik mendekati eksperimen dengan sampel kecil dan
umumnya membandingkan dua kelompok tertentu. (Khairul Amal) http://forum-
statistik.blogspot.com/2012/05/statistik-parametrik-vs-statistik-non.html

A. Konsep Dasar Pengujian Hipotesis

Dalam statistik, hipotesis dapat diartikan sebagai pernyataan statistik tentang parameter populasi.
Statistik adalah ukuran-ukuran yang dikenakan pada sampel (x=rata-rata, s=simpangan baku, s 2=varians,
r=koefisien korelasi). Parameter adalah ukuran- ukuran yang dikenakan pada populasi (μ rata -rata,
σ=simpangan baku, σ2=varians, ρ=koefisien korelasi). Dengan kata lain, hipotesis adalah taksiran terhadap
parameter populasi, melalui data-data sampel. Penelitian yang didasarkan pada data populasi, atau sampling
total, atau sensus dengan tidak melakukan pengujian hipotesis statistik dari sudut pandang statistik disebut
penelitian deskriptif. Terdapat perbedaan mendasar pengertian hipotesis menurut statistik dan penelitian.
Dalam penelitian, hipotesis diartikan sebagai jawaban sementara terhadap rumusan masalah penelitian.
Rumusan masalah tersebut bisa berupa pernyataan tentang hubungan dua variabel atau lebih, perbandingan
(komparasi), atau variabel mandiri (deskripsi). Disini terdapat perbedaan lagi pengertian deskriptif dalam
penelitian dan dalam statistik. Seperti telah dikemukakan, deskriptif dalam statistik adalah penelitian yang
didasarkan pada populasi (tidak ada sampel), sedangkan deskriptif dalam penelitian menunjukkan tingkat
eksplanasi yaitu menanyakan tentang variabel mandiri (tidak dihubungkan dan dibandingkan).

Dalam statistik dan penelitian terdapat dua macam hipotesis, yaitu hipotesis nol dan alternatif. Pada
statistik, hipotesis nol diartikan sebagai tidak adanya perbedaan antara parameter dengan statistik, atau tidak
adanya perbedaan antara parameter dengan statistik, atau tidak adanya perbedaan antara ukuran populasi
dan ukuran sampel. Dengan demikian hipotesis yang diuji adalah hipotesis nol, karena memang peneliti tidak

mengharapkan adanya perbedaan data populasi dengan data sampel. Selanjutnya hipotesis alternatif adalah
lawannya hipotesis nol, yang berbunyi adanya perbedaan antara data populasi dengan data sampel.

B. Tiga Bentuk Rumusan Hipotesis


1. Hipotesis Deskriptif

Hipotesis deskriptif adalah dugaan tentang nilai suatu variabel mandiri, tidak membuat perbandingan atau
hubungan. Sebagai contoh, bila rumusan masalah penelitian sebagai berikut ini, maka hipotesis (jawaban
sementara) yang dirumuskan adalah hipotesis deskriptif.

a) Seberapa tinggi daya tahan lampu merek X?

b) Seberapa tinggi produktivitas padi di kabupaten Klaten?

c) Berapa lama daya tahan lampu merk A dan B?

a) Daya tahan lampu merk X = 800 jam

b) Produktivitas padi di Kabupaten Klaten 8 ton/ha

c) Daya tahan lampu merk A = 450 jam dan merk B = 600 jam. Dalam perumusan hipotesis statistik, antara
hipotesis nol (Ho) dan hipotesis alternatif (Ha) selalu berpasangan, bila salah satu ditolak, maka yang lain
pasti diterima sehingga dapat dibuat keputusan yang tegas, yaitu kalau Ho ditolak pasti Ha diterima.
Hipotesis statistik dirumuskan dengan simbol-simbol statistic. Berikut ini diberikan contoh berbagai
pernyataan yang dapat dirumuskan hipotesis deskriptif statistiknya:

1) Suatu perusahaan minuman harus mengikuti ketentuan, bahwa salah satu unsur kimia hanya boleh
dicampurkan paling banyak 1% (paling banyak berarti lebih kecil atau sama dengan) Dengan demikian
rumusan hipotesis
statistik adalah:

Ho:μ ≤0.01

Ha:μ>0.01
Dapat dibaca: Hipotesis nol untuk parameter populasi berbentuk proporsi (1%: proporsi) lebih kecil atau
sama dengan 1%, dan hipotesis alternatifnya, untuk populasi yang berbentuk proporsi lebih besar 1%

2) Suatu bimbingan tes menyatakan murid yang dibimbing di lembaga itu, paling sedikit 90% dapat diterima di

Perguruan Tinggi Negeri. Rumusan hipotesis statistik adalah:

Ho:μ≥0.90

Ha:μ<0.90
BAB I

PENDAHULUAN

A. Latar Belakang

Hipotesis dapat diartikan sebagai pernyataan statistik tentang parameter populasi. Statistik adalah ukuran
yang dikenakan pada sampel ( x= rata-rata; s = simpangan baku; s2 = varians; r = koefisien korelasi), dan
parameter adalah ukuran-ukuran yang dikenakan pada populasi (µ= rata-rata;σ=simpangan baku, σ2=
varians; ρ= koefisien korelasi). Dengan kata lain, hipotesis adalah taksiran terhadap parameter populasi,
melalui data-data sampel.

Hipotesis diartikan sebagai jawaban sementara terhadap rumusan masalah penelitian, bisa berupa
pernyataan tentang hubungan dua variabel atau lebih, perbandingan (komparasi), atau variabel mandiri
(deskripsi). Deskriptif dalam statistik adalah penelitian yang didasarkan pada populasi (tidak ada sampel),
sedangkan deskriptif dalam penelitian menunjukkan tingkat ekplanasi yaitu menanyakan tentang variabel
mandiri (tidak dihubungkan dan dibandingkan).

Dalam statistik terdapat dua macam hipotesis, yaitu hipotesis nol dan hipotesis alternatif. Hipotesis nol
diartikan sebagai tidak adanya perbedaan antara parameter dengan statistik, atau tidak adanya perbedaan
antara ukuran populasi dan ukuran sampel. Hipotesis alternatif adalah lawannya hipotesis nol, yang berbunyi
adanya perbedaan antara data populasi dengan data sampel. Secara ringkas hipotesis dalam statistik
merupakan pernyataan statistik tentang parameter populasi sedangkan hipotesis dalam penelitian merupakan
jawaban sementara terhadap rumusan masalah pada suatu penelitian.

Terdapat bermacam-macam teknik statistik yang dapat digunakan dalam suatu penelitian khususnya dalam
pengujian statistik. Teknik statistik yang akan digunakan tergantung pada interaksi dua hal, yaitu macam
data yang akan dianalisis dan bentuk hipotesisnya (untuk lebih jelasnya perhatikan tabel 1.1. Bentuk hipotesis
ada tiga macam,yaitu:

1. Hipotesis deskriptif

Hipotesis deskriptif adalah dugaan tentang nilai suatu variabel mandiri, tidak membuat perbandingan atau
hubungan.

2. Hipotesis Komparatif

Hipotesis komparatif adalah pernyataan yang menunjukkan dugaan nilai dalam satu variabel atau lebih pada
sampel yang berbeda.

3. Hipotesis Asosiatif

Hipotesis asosiatif adalah suatu pernyataan yang menunjukkan dugaan tentang hubungan antara dua
variabel atau lebih.
TABEL 1.1 PENGGUNAAN STATISTIK PARAMETRIS DAN
NONPARAMETRIS UNTUK MENGUJI HIPOTESIS

Bentuk Hipotesis
Macam Deskriptif Komparatif 2 sampel Komparatif (lebih dari 2 Asosiatif
data (satu sampel) (hubunga
variable) related independen related idependen n)
Nominal - Binominal -Mc Fisher X2 k X2 k Coefisient
Nemar Exact sampel sampel contingen
Probability cy
___-X2 1 -x2 2 sampel Cochran(Q) (C)
sampel
NONPARAMETRIS UNTUK MENGUJI HIPOTESIS

B. Permasalahan

Berdasarkan latar belakang diatas, maka permasalahan dalam makalah ini adalah sebagai berikut:
1. Bagaimanakah hipotesis dalam statistik penelitian?

2. Bagaimanakah konsep hipotesis?

3. Bagaimanakah Pengujian Hipotesis Asosiatif?

C. Tujuan

Berdasarkan permasalahan tersebut diatas, maka dapat dirumuskan tujuan makalah ini adalah sebagai
berikut:

1. Mengetahui statistik dalam penelitian

2. Mengetahui konsep hipotesis

3. Mengetahui Pengujian Hipotesis Asosiatif


B. Statistik Nonparametris

Berikut ini dikemukakan dua macam statistik nonparametris yang digunakan untuk menguji hipotesis
asosiatif, yaitu koefisien Kontingensi dan korelasi Spearman Rank.

1. Koefisien Kontingensi

Seperti telah ditunjukkan pada tabel, bahwa koefisien kontingensi digunakan untuk menghitung hubungan
antar variabel bila datanya berbentuk nominal. Teknik ini mempunyai kaitan erat dengan Chi Kuadrat yang
digunakan untuk menguji hipotesis komparatif k sampel independen. Oleh karena itu, rumus yang digunakan
mengandung nilai Chi Kuadrat. Rumusnya adalah:

C=

Harga Chi kuadrat dicari dengan rumus:

BAB II

PEMBAHASAN

2. Korelasi Ganda

Korelasi ganda (multiple correlation) merupakan angka yang menunjukkan angka yang menunjukkan arah
dan kuatnya hubungan antara dua variabel independen secara bersama-sama atau lebih dengan satu variabel
dependen. Simbol korelasi ganda adalah R. korelasi ganda (R) untuk dua variabel independen dan satu
dependen. Rumus korelasi ganda dua variabel adalah:

Ry.x1x2 =

Dimana:
Ry.x1x2
ryx1 = Korelasi antara variabel X1 dengan X2 secara bersama-sama dengan variabel Y = Korelasi
Product Moment antara X1 dengan Y = Korelasi Product Moment antara X2 dengan Y =
ryx2 Korelasi Product Moment antara X1 dengan X2

rx1x2

Jadi untuk dapat menghitung korelasi ganda, maka harus dihitung terlebih dahulu korelasi sederhananya
dulu melalui korelasi Product Moment dari Pearson.

3. Korelasi Parsial

Korelasi Parsial digunakan untuk menganalisis bila peneliti bermaksud mengetahui pengaruh atau
mengetahui pengaruh atau mengetahui hubungan antara variabel independen dan dependen, dimana salah
satu variabel independennya dibuat tetap/dikendalikan. Jadi korelasi parsial merupakan angka yang
menunjukkan arah dan kuatnya hubungan antara dua variabel atau lebih, setelah satu variabel yang diduga
dapat memengaruhi hubungan variabel tersebut tetap/dikendalikan.

Rumus untuk korelasi parsial adalah :

Ryx1x2 =

Uji koefisien korelasi parsial dapat dihitung dengan rumus:

t=

X2 =

Untuk memudahkan perhitungan, maka data-data hasil penelitian perlu disusun ke dalam tabel penolong,
seperti berikut:

Tabel penolong untuk menghitung koefisien C

2. Korelasi Spearman Rank

Kalau pada Product Moment, sumber data untuk variabel yang akan dikorelasikan adalah sama, data yang
dikorelasikan adalah data interval atau rasio, serta data dari kedua variabel masing-masing membentuk
distribusi normal, maka dalam korelasi Spearman Rank, sumber data untuk kedua variabel yang akan
dikonservasikan dapat berasal dari sumber yang tidak sama, jenis data yang dikorelasikan adalah data
ordinal, serta data dari kedua variabel tidak harus membentuk distribusi normal. Jadi korelasi Spearman
Rank adalah bekerja dengan data ordinal atau berjenjang atau rangking, dan bebas distribusi.
Jika sumber datanya berbeda maka untuk menganalisisnya digunakan Spearman Rank yang rumusnya
adalah:

ρ = 1-

dimana:

ρ = koefisien korelasi Spearman Rank

karena korelasi Spearman Rank bekerja dengan data ordinal, maka data tersebut terlebih dahulu harus
diubah menjadi data ordinal dalam bentuk rangking

STATISTIK INFERENSIAL

A. Pengertian

Statistik inferensial adalah teknik analisis data yang digunakan untuk menentukan sejauh mana kesamaan
antara hasil yang diperoleh dari suatu sampel dengan hasil yang akan didapat pada populasi secara
keseluruhan. Jadi statistik inferensial membantu peneliti untuk mencari tahu apakah hasil yang diperoleh
dari suatu sampel dapat digeneralisasi pada populasi .[1] Sejalan dengan pengertian statistik inferensial
menurut Creswell, Muhammad Nisfiannoor berpendapat bahwa statistik inferensial adalah metode yang
berhubungan dengan analisis data pada sampel untuk digunakan untuk penggeneralisasian pada populasi.
Penggunaan statistic inferensial didasarkan pada peluang (probability) dan sampel yang dipilih secara acak
(random). [2]

Konsep statistik inferensial yaitu;

1. Standard Error

Peluang setiap sampel sangat identik dengan populasinya sangat kecil ( nill) meskipun inferensi populasi
didapat dari informasi sampel.Penerapan random sampling tidak menjamin karakteristik sampel sama persis
dengan populasi. Variasi prediksi antara mean disebut sampling error. Sampling error ini tidak bisa dihindari
dan ini bukan kesalahan peneliti. Yang menjadi persoalah adalah apakah error tersebut semata-mata hasil
sampling error atau merupakan perbedaan yang bermakna yang akan pula ditemukan pada papulasi yang
lebih besar.

Ciri standard error adalah bahwa error yang terjadi bisaanya berdistribusi normal yang besarnya berbeda-
bedadan error tersebut cenderung membentuk kurva normal yang menyerupai lonceng.
Faktor utama yang mempengaruhi standard error adalah jumlah sampel. Semakin banyak sampelnya,
semakin kecil standard errornya. Ini menunjukkan bahwasampel penelitian semakin akurat bila banyak
sampelnya.

Faktor utama yang mempengaruhi standard error adalah jumlah sampel. Semakin banyak sampelnya,
semakin kecil standard error meannya yang berarti bahwa semakin kecil standard error-nya, semakin akurat
mean sampel untuk dijadikan estimator untuk mean populasinya .[3]

2. Pengujian Hipotesis

Pengujian hipotesis adalah proses pengambilan keputusan dimana peneliti mengevaluasi hasil penelitian
terhadap apa yang ingin dicapai sebelumnya. Misalnya, kita ingin menerapkan program baru dalam
pelajaran membaca. Pada rencana penelitian dikemukanan hipotesis penelitian yang memprediksi perbedaan
skor siswa yang menjalni program baru tadi dengan proglam lama, dan hipotesis nol (0), yang
memprediksikan skor kedua kelompok tidak akan berbeda. Setelah data dihitung mean dan standar
deviasinya dan hasilnya menunjukkan skor siswa dengan program baru lebih tinggi (berbeda secara
signifikan) daripada siswa yang mengikuti program lama, maka hipotesis penelitian diterima dan hipotesis nol
ditolak. Yang berarti bahwa program baru tersebut efektif untuk diterapkan pada program membaca.
Intinya, pengujian hipotesis adalah proses evaluasi hipotesis nol, apakah diterima tau ditolak.[4]

3. Uji Signifikansi

Uji signifikasi adalah cara mengetahui adanya perbedaan antara dua skor. Signifikansi merujuk pada tingkat
statistik dari probabilitas dimana dengannya kita bisa menolak hipotesis nol. Uji signifikansi dilakukan
dengan menentukan tingkat probabilitas praseleksi yang dikenal dengan tingkat signifikansi

(α). Tingkat probailitas ini dijadikan dasar untuk menolak atau tidak menolak hipotesis nol. Standar yang
digunakan umumnya 0,05 kesempatan (5 dari 100). Adapula yang menggunakan 0.01. Semakin kecil nilai
probabilitasnya, semakin kecil pula kemungkinan temuan tersebut diperoleh karena disebabkan oleh
peluang.[5]

B. Jenis-jenis Statistik Inferensial

1. Statistik Parametrik; yaitu teknik yang didasarkan pada asumsi bahwa data yang diambil mempunyai
distribusi normal dan menggunakan data interval dan rasio .[6]

a. Uji-t

Uji-t digunakan untuk menentukan apakah 2 kelompok skor memiliki perbedaan yang signifikan di tingkat
probabilitas pilihan. Contohnya, Uji- t dapat digunakan untuk membandingkan skor membaca pada laki-laki
dan skor membaca pada perempuan di sekolah A.

Strategi dasar Uji-t adalah membandingkan perbedaan nyata antara mean kelompok (X1-X2)
menentukan apakah ada perbedaan yang diharapkan berdasarkan peluang. Uji-t terdiridari:

Uji-t untuk
uji-t. sampel
independen.
untuk Sampelindependen
independendigunakan
ditentukanuntuk
tanpamenentukan apakah ada
adanya pemadanan jenisperbedaan yang signifikan
apapun. Software antara
SPSS dapat dua sampel
digunakan
Uji-t untuk sampel non-independen digunakan untuk membandingkan dua kelompok terpilih berdasarkan
beberapa kesamaan. Uji ini juga digunakan untuk membandingkan performansi kelompok tunggal dengan
pretest dan posttest atau dengan dua perlakuan berbeda.[7]

b. Analisis Varians (ANOVA)

Dalam Educational Research (2008), Cresswell mengartikan ANOVA sebagai teknik statistik yang digunakan
untuk perbedaan yang ada pada lebih dari dua kelompok data. Adapun jenis analisis varians, yakni:

1. ANOVA sederhana (satu arah) digunakan untuk menentukan apakah skor dari dua kelompok atau lebih
memiliki perbedaan secara signifikan pada tingkat probabilitasnya. Misalnya, pengukuran prestasi siswa
berdasarkan tingkat ekonominya (tinggi, sedang, dan rendah), dimana tingkat ekonomi sebagai variabel
kelompok dan tingkat ekonomi sebagai variabel dependennya.

2. Multi comparison adalah pengujian yang melibatkan perhitungan bentuk istimewa dari uji- t. Setiap kali uji
signifikansi dilakukan, tingkat probabilitasnya kita terima. Misalnya, kita setuju kalau hasil yang akan
didapatakan muncul hanya 5 kali kesempatan pada setiap 100 sampel. Hasil tersebut dikatakan bermakna
dan bukan sekedar karena peluang semata.

3. ANOVA Multifaktor

Seperti pembahasan kelompok sebelumnya, desain factorial digunakan untuk meneliti dua variabel bebas atau
lebih serta hubungan di antara variabel tersebut, maka ANOVA multifaktor adalah jenis analisis statistik
yang paling sesuai. Hasilan alisisnya adalah rasio F terpisah untuk setiap variabel bebas dan satu rasio F
untuk interaksi. Misalnya, kita ingin mengetahui apakah gender dan tingkat ekonomi (tinggi, sedang, dan
rendah) mempengaruhi prestasi mahasiswa. ANOVA multifaktor memungkinkan kita untuk menghitung
kedua variabel bebas (gender dan tingkat ekonomi) dan variabel terikat (prestasi; IPK, skor bahasa, skor
matematika, dsb)

4. Analysis of Covariance (ANCOVA)

Analisis ini model ANOVA yang digunakan dengan cara berbeda dimana variabel bebas dihitung dengan
memperhatikan rancangan penelitian. Bila penelitian memiliki 2 variabel bebas atau lebih, maka uji jenis
inilah yang cocok digunakan melalui dua cara yakni: (1) sebagai teknik pengendalian variabel luar
(extraneous variable) serta sebagai alat untuk meningkatkan kekuatan uji statistik. ANCOVA bisa digunakan
pada penelitian kausal komparatif maupun penelitian ekperimental yang melibatkan kelompok yang sudah
ada dan kelompok yang dibentuk secara acak, dan (2) ANCOVA digunakan untuk memperkuat uji statistic
dengan memperkecil varians dalam kelompok (error). Kekuatan yang dimaksudkan adalah kemampuan uji
signifikansi untuk mengenali temuan riset sebenarnya, yang memungkinkan penguji menolak hipotesis 0 (nol)
yang salah .[8]7

c. Regresi Jamak

Regresi jamak digunakan pada data berbentuk rasio dan interval. Regresi jamak menggabungkan variabel
yang diketahui secara terpisah untuk memprediksi (misalnya, hubungan antara) criteria dalam persamaan
(rumus) prediksi atau dikenal dengan Multiple Regression Equation. Regresi jamak merupakan prosedur
analisis untuk penelitian eksperimental, kausal komparatif, dan korelasional karena teknik ini tidak hanya
untuk menentukan apakah ada hubungan antar variable tetapi juga untuk mengetahui besar (kuatnya)
hubungan tersebut. Salah satu jenis regresi jamak adalah step-wise analysis yang memungkinakn kita
memasukkan atau mengeluarkan variabel utama (predicator) ke dalam persamaan regresi tahap demi tahap.
Regresi jamak juda menjadi dasar analisis jalur yang bertujuan untuk mengidentifikasi tingkat interaksi
variabel utama satu sama lain dan berkontribusi pada variabel terikat.[9]

Sementara dalam Emzir (2011) dikatakan bahwa regresi jamak merupakan perluasan dari regresi dan
prediksi sederhana dengan penambahan beberapa variabel. Kekuatan prediksi akan semakin terdukung
dengan penambahan variabel.[10]

d. Korelasi

Menurut Cohen, dkk., Teknik korelasi digunakan untuk mengetahui tiga hal pada dua variabel atau dua set
data. Pertama, “Apakah ada hubungan antara dua variabel atau set data”. Bila jawabannya “ya”, maka dua
hal berikutnya perlu kita cari yakni; “Bagaimana arah hubugan tersebut”; dan “Apa yang menjadi
ukurannya?” Hubungan yang dimaksudkan adalah kencenderungan dua variabel atau set data berbeda
secara konsisten.[11] Dalam Solusi Mudah dan Cepat Menguasai SPSS 17.0 unruk Pengolahan Data Statistik
(Wahana Komputer, 2009) dikatakan analisis korelasi dilakukan untuk

menunjukkan keeratan hubungan kausal antara variabel-variabel. Jenis-jenis analisis korelasi, yaitu:

Korelasi sederhana, yaitu , korelasi parsial, dan uji distance.[12]

2. Statistik Non-parametrik

Statistik nonparametrik adalah jenis statistic inferensial yang tidak mengharuskan data berdistribusi normal
dan jenis data yang digunakan adalah data nominal dan ordinal .[13]

a. Chi Square

ukura menyangkut perbedaan yang terdapat d antara frekwensi


Chi Square adalah suatu n i
nomparametrik yang digunakan untuk menanalisis data yang berupa frekwensi atau persentase serta yang
berbentu prporsi yang bisa dikonversi menjadi persentase. Chi square digunakan untuk membandingkan
frekwensi yang muncul pada kategori atau kelompok berbeda. Dikenal dua kategori, yaitu; true category
adalah apabila orang atau objek bersifat bebas pada setiap penelitian (laki-laki dan perempuan), dan artificial
category yakni kategori yang secara operasional diartikan sebagai peneliti itu sendiri. Contohnya, mencari
hubungan antara gender dengan keterampilan membaca pada sekolah A. Karena adanya variabel nominal
(gender dan keterampilan membaca), maka data tersebut dianalisis dengan statistik nonparametrik dengan
menggunakan teknik chi square.
1. PENGERTIAN

Sampel adalah sebagian dari anggota populasi yang dipilih dengan cara tertentu yang akan
diteliti sifat-sifatnya dalam penelitian. Nilai-nilai yang berasal dari data sampel dinamakan
dengan Statistik.

Sampling distribution adalah distribusi probabilitas dari suatu statistik.Sampling

distribution tergantung dari ukuran populasi, ukuran sampel, metode memililih sampel.

Distribusi sampling dari X dengan dengan ukuran sampel n adalah suatu distribusi yang bila

percobaan dilakukan secara berulang (selalu dengan jumlah sampel n) akan menghasilkan

banyak nilai sampel dengan rata-rata X

. Distribusi sampling ini menggambarkan variabilitas (perubahan) rata-rata sampel terhadap


rata-rata populasi μ.

Random Sampling atau sampling secara acak adalah suatu proses populasi
pengambilan sampel dimana setiap anggota sama memiliki kesempatan yang

untuk terpilih sebagai sampel.

Manfaat Sampling :

untuk membantu memahami distribusi dari suatu karakteristik populasi yang tidak
diketahui, ilmuwan dan insinyur sering menggunakan data sampel
teknik sampling berguna dalam penarikan kesimpulan (inference) yg valid dan dapat
dipercaya

teknik pengambilan sampling yang baik dan benar dapat menghemat biaya

dan waktu tanpa mengurangi keakuratan hasil

Page | 1
Populasi Terhingga dan Tak Hingga :

Populasi terhingga (finite population) adalah populasi yang jumlah seluruh anggotanya
tetap dan dapat didaftar. Contoh: pengukuran berat badan mahasiswa ITS jurusan
Teknik Kelautan angkatan 2007.

Populasi tak terhingga (infinite population) adalah populasi yang memiliki anggota yang
banyaknya tak terhingga. Contoh: pengamatan kejadian kecelakaan yang terjadi di
bundaran ITS selama kurun waktu yang tidak dibatasi.

Penelitian sensus adalah penelitian yang dilakukan dengan cara mengumpulkan data dari
semua anggota populasi.

Penelitian sampling adalah penelitian yang dilakukan dengan cara mengumpulkan data
dari anggota sample.

Beda antara Statistik Sampel Vs Parameter Populasi? perhatikan tabel berikut:

Ukuran/Ciri Parameter Populasi Statistik Sampel

Rata-Rata µ : myu x

Selisih 2 Rata-rata µ −µ : nilai x −x : nilai

1 2 1 2
mutlak mutlak
Standar Deviasi = σ : sigma S
Simpangan Baku

Varians = Ragam σ² s²

Proporsi π : phi atau p p atau p

Page | 2
Selisih 2 proporsi π−π : nilai p −p : nilai

1 2 1 2
mutlak mutlak

Sampel yang baik diperoleh dengan memperhatikan hal-hal berikut :

a keacakannya (randomness)

b ukuran

c teknik penarikan sampel (sampling) yang sesuai dengan kondisi atau sifat populasi

Beberapa Teknik Penarikan Sampel :

a) Penarikan Sampel Acak Sederhana (Simple Randomized Sampling)

Pengacakan dapat dilakukan dengan : undian, tabel bilangan acak, program


komputer.

- Penarikan Sampel Sistematik (Systematic Sampling)

Tetapkan interval lalu pilih secara acak anggota pertama sampel

Contoh :
Ditetapkan interval = 20

Secara acak terpilih : Anggota populasi ke-7 sebagai anggota ke-1 dalam sampel
maka :

Anggota populasi ke-27 menjadi anggota ke-2 dalam sampel

Anggota populasi ke-47 menjadi anggota ke-3 dalam sampel,


dst.

Page | 3
c) Penarikan Sampel Acak Berlapis (Stratified Random Sampling)

Populasi terdiri dari beberapa kelas/kelompok. Dari setiap kelas diambil sampel
secara acak.

Perhatikan !!!!

Antar Kelas bersifat (cenderung) berbeda nyata (heterogen). Anggota dalam


suatu kelas akan (cenderung) sama (homogen).

Contoh :

Dari 1500 penumpang KA (setiap kelas memiliki ukuran yang sama) akan
diambil 150 orang sebagai sampel, dilakukan pendataan tentang tingkat
kepuasan, maka sampel acak dapat diambil dari :

Kelas Eksekutif : 50 orang

Kelas Bisnis : 50 orang

Kelas Ekonomi : 50 orang


d) Penarikan Sampel Gerombol/Kelompok (Cluster Sampling)

Populasi juga terdiri dari beberapa kelas/kelompok

Sampel yang diambil berupa kelompok bukan individu anggota

Perhatikan !!!!

Page | 4
Antar Kelas bersifat (cenderung) sama (homogen). Anggota dalam suatu kelas
akan (cenderung) berbeda (heterogen).

Contoh :

Terdapat 40 kelas untuk tingkat II Jurusan Ekonomi-GD, setiap kelas terdiri dari 100
orang. Populasi mahasiswa kelas 2, Ekonomi-UGD = 40 × 100 = 4000.

Jika suatu penelitian dilakukan pada populasi tersebut dan sampel yang diperlukan = 600
orang, dilakukan pendataan mengenai lama waktu belajar per hari maka sampel dapat
diambil dari 6 kelas.... Dari 40 kelas, ambil secara acak 6 kelas.

E. Penarikan Sampel Area (Area Sampling)

Prinsipnya sama dengan Cluster Sampling. Pengelompokan ditentukan oleh letak


geografis atau administratif.

Contoh :

Pengambilan sampel di daerah JAWA BARAT, dapat dilakukan dengan

memilih secara acak KOTAMADYA tempat pengambilan sampel, misalnya

terpilih, Kodya Bogor, Sukabumi dan Bandung.

Sampel acak menjadi dasar penarikan sampel lain.


Penarikan Sampel Acak dapat dilakukan dengan 2 cara, yaitu :

a) Penarikan sampel tanpa pemulihan/tanpa pengembalian : setelah didata, anggota


sampel tidak dikembalikan ke dalam ruang sampel.

Page | 5
b) Penarikan sampel dengan pemulihan : bila setelah didata, anggota sampel
dikembalikan ke dalam ruang sampel.

Berdasarkan Ukurannya, maka sampel dibedakan menjadi :

1) Sampel Besar jika ukuran sampel (n) ≥ 30

2) Sampel Kecil jika ukuran sampel (n) < 30

Distribusi Penarikan Sampel atau Distribusi Sampling :

3) Jumlah Sampel Acak yang dapat ditarik dari suatu populasi adalah sangat banyak.

4) Nilai setiap Statistik Sampel akan bervariasi/beragam antar sampel.

5) Suatu statistik dapat dianggap sebagai peubah acak yang besarnya sangat tergantung dari
sampel yang kita ambil.

6) Karena statistik sampel adalah peubah acak maka ia mempunyai distribusi yang kita
sebut sebagai : Distribusi peluang statistik sampel atau Distribusi Sampling atau Distribusi Penarikan Sampel.

2. DISTRIBUSI SAMPLING RATA-RATA

Beberapa notasi :
n : ukuran sampel N : ukuran populasi

x : rata-rata sampel µ : rata-rata populasi

s : standar deviasi sampel σ :standar deviasi populasi

µx : rata-rata antar semua sampel σ x : standar deviasi sampel

Page | 6
2.1 Distribusi Sampling Rata-Rata Sampel Besar

Dalil 1

JIKA

Sampel:

berukuran = n ≥ 30 diambil DENGAN PEMULIHAN dari

rata-rata = x

Populasi berukuran = N
Terdistribusi NORMAL

Rata-rata = µ ; simpangan baku = σ

MAKA

Distribusi Rata-rata akan mendekati distribusi Normal dengan :

σ x−µ

µx=µ dan σx = dan nilai z =

n σ n

Page | 7
Dalil 2

JIKA

Sampel:

berukuran = n ≥ 30 diambil TANPA PEMULIHAN dari

rata-rata = x

Populasi berukuran = N

Terdistribusi NORMAL
Rata-rata = µ ; simpangan baku = σ

MAKA

Distribusi Rata-rata akan mendekati distribusi Normal dengan :

x−µ

σ N−n z=

µx=µ dan σx = dan nilai N−n

n N −1 (σ / n)
N −1

Page | 8
4. N−n disebut sebagai FAKTOR KOREKSI populasi terhingga.
−1

4. Faktor Koreksi (FK) akan menjadi penting jika sampel berukuran n diambil dari
populasi berukuran N yang terhingga/ terbatas besarnya

5. Jika sampel berukuran n diambil dari populasi berukuran N yang sangat besar

maka FK akan mendekati 1 → N−n ≈ 1, hal ini mengantar kita pada dalil

N−1

ke-3 yaitu

DALIL LIMIT PUSAT = DALIL BATAS TENGAH = THE CENTRAL LIMIT THEOREM

Dalil 3 DALIL LIMIT PUSAT

JIKA

Sampel:
berukuran = n diambil dari

rata-rata = x

Populasi berukuran = N yang

BESAR

distribusi : SEMBARANG

Rata-rata = µ ; simpangan baku = σ

Page | 9
MAKA

Distribusi Rata-rata akan mendekati distribusi Normal dengan :

σ x−µ

µx=µ dan σx = dan nilai z =

n σ n

B. Dalil Limit Pusat berlaku untuk : - penarikan sampel dari populasi yang sangat besar,

distribusi populasi tidak dipersoalkan

C. Beberapa buku mencatat hal berikut : Populasi dianggap BESAR jika ukuran sampel

n
KURANG DARI 5 % ukuran populasi atau < 5%
N
Dalam pengerjaan soal DISTRIBUSI SAMPLING RATA-RATA perhatikan asumsi-asumsi dalam
soal sehingga anda dapat dengan mudah dan tepat menggunakan dalil-dalil tersebut!

Contoh :

PT AKUA sebuah perusahaan air mineral rata-rata setiap hari memproduksi 100 juta gelas air
mineral. Perusahaan ini menyatakan bahwa rata-rata isi segelas AKUA

Page | 10
adalah 250 ml dengan standar deviasi = 15 ml. Rata-rata populasi dianggap menyebar normal.

1. Jika setiap hari diambil 100 gelas AKUA sebagai sampel acak DENGAN

PEMULIHAN, hitunglah :

standard error atau galat baku sampel tersebut?

peluang rata-rata sampel akan berisi kurang dari 253 ml?

2. Jika sampel diperkecil menjadi 25 gelas, hitunglah :

standard error atau galat baku sampel tersebut?

peluang rata-rata sampel akan berisi lebih dari 255 ml?

1. Diselesaikan dengan DALIL 1 →karena PEMULIHAN

Diselesaikan dengan DALIL 3 →karena POPULASI SANGAT BESAR

N = 100 000 000 µx = µ = 250 σ = 15 n = 100


P( x < 253) = P(z < ?)

σ 15 15
GALAT BAKU = σx = = == 1.5

n 100 10

z= 253 − 250 = 3 = 2.0

15. 15.

Jadi P( x < 253) = P(z < 2.0) = 0.5 + 0.4772 = 0.9772

Page | 11
2. Diselesaikan dengan DALIL 3 →karena POPULASI SANGAT BESAR

N = 100 000 000 µx = µ = 250 σ = 15 n = 25

P( x > 255) = P(z > ?)

σ 15 15
GALAT BAKU = σx = = = = 3.0

n 25 5

255 − 250 5

z= 3.0 = 3.0 = 167.

Jadi P( x > 255 ) = P(z > 1.67) = 0.5 - 0.4525 = 0.0475

Contoh :
Dari 500 mahasiswa FE-GD diketahui rata-rata tinggi badan = 165 cm dengan standar deviasi = 12
cm, diambil 36 orang sebagai sampel acak. Jika penarikan sampel dilakukan TANPA
PEMULIHAN dan rata-rata tinggi mahasiswa diasumsikan menyebar normal, hitunglah :

a. galat baku sampel?

b. peluang sampel akan memiliki rata-rata tinggi badan kurang dari 160 cm?

Diselesaikan dengan DALIL 2 →TANPA PEMULIHAN

Page | 12
N = 500 µx = µ = 165 σ = 12 n = 36

n 36

Catatan N = 500 = 0.072 = 7.2% > 5% → Dalil Limit Pusat tidak dapat

digunakan

P( x < 160) = P(z < ?)

N−n 500 − 36 464

FK =
N−1 = 500 − 1 = 499 = 0.929... = 0.964...

σ 12

GALAT BAKU σx = x FK = × 0964....= 2 x 0.964... = 1.928...

n 36

160 −165

z= 1928.... = −2.59...

P( x < 160) = P(z < -2.59) = 0.5 - 0.4952 = 0.0048

2.2 Distribusi Sampling Rata-rata Sampel Kecil


2.2.1 DISTRIBUSI t

4. Distribusi Sampling didekati dengan distribusi t Student = distribusi t (W.S.


Gosset).

5. Distribusi-t pada prinsipnya adalah pendekatan distribusi sampel kecil dengan


distribusi normal.

Dua hal yang perlu diperhatikan dalam Tabel t adalah

derajat bebas (db)

Page | 13
nilai α

Derajat bebas (db) = degree of freedom = v = n - 1.

n : ukuran sampel.

• Nilai α adalah luas daerah kurva di kanan nilai t atau luas daerah kurva di

kiri nilai –t

2. Nilai α → 0.1 (10%) ; 0.05 (5%) ; 0.025(2.5%) ; 0.01 (1%) ; 0.005(0.5%)

3. Nilai α terbatas karena banyak kombinasi db yang harus disusun!

4. Kelak Distribusi t akan kita gunakan dalam PENGUJIAN HIPOTESIS

5. Pembacaan Tabel Distribusi-t

Misalkan n = 9 →db = 8; Nilai α ditentukan = 2.5% di kiri dan kanan

kurva

t tabel (db, α) = t tabel(8; 0.025) = 2.306

Jadi t = 2.306 dan -t = -2.306


2.5% 95 % 2.5%

-2.306 0 2.306

Page | 14
Arti Gambar di atas nilai t sampel berukuran n = 9, berpeluang 95% jatuh dalam selang

-2.306 < t < 2.306.

Peluang t >2.306 = 2.5 % dan Peluang t < -2.306 = 2.5 %

Perbedaan Tabel z dan Tabel t

Tabel z →nilai z menentukan nilai α

Tabel t →nilai α dan db menentukan nilai t

Dalam banyak kasus nilai simpangan baku populasi (σ) tidak diketahui, karenanya nilai σ diduga
dari nilai simpangan baku sampel (s)

Dalil 4
JIKA

Sampel:

ukuran KECIL n < 30 diambil dari

rata-rata = x simp. baku = s

Populasi berukuran = N

terdistribusi : NORMAL

Rata-rata = µ

MAKA

Page | 15
Distribusi Rata-rata akan mendekati distribusi-t dengan :

s x−µ

µx=µ dan σx = dan nilai t =

n s n

pada derajat bebas = n-1 dan suatu nilai α

Contoh :

Manajemen PT JURAM menyatakan bahwa 95% rokok produksinya rata-rata mengandung


nikotin 1.80 mg, data tersebar normal. Yayasan Konsumen melakukan pengujian nikotin terhadap
9 batang rokok dan diketahui rata-rata sampel = 1.95 mg nikotin dengan standar deviasi = 0.24
mg. Apakah hasil penelitian Yayasan Konsumen mendukung pernyataan Manajemen PT JURAM?

Jawab : 95 % berada dalam selang →berarti 5 % berada di luar selang;

2.5 % di kiri t dan 2.5% di kanan t

b. = 2.5 % = 0.025

n = 9 →db = n - 1 = 8

t tabel (db, α) = t-tabel(8; 0.025) = 2.306

Jadi 95 % berada dalam selang -2.306 < t < 2.306


Nilai t-hitung = ? µ = 1.80 n=9 x = 1.95 s = 0.24

t= x−µ =t= 195. − 180. = 015. = 1875.

s n 0.24 9 0.08

Page | 16
Nilai t hitung = 1.875 berada dalam selang -2.306 < t < 2.306

jadi hasil penelitian Yayasan Konsumen masih sesuai dengan pernyataan manajemen PT JURAM.

2.3 Distribusi Sampling Beda 2 Rata-Rata

Dalil 5

JIKA

Dua (2) Sampel

berukuran n1 dan n2 diambil dari

rata-rata = x1 dan x2 Dua (2) Populasi berukuran BESAR

Rata-rata µ1 dan µ2
Ragam σ12 dan σ22

MAKA

Distribusi Rata-rata akan mendekati distribusi Normal dengan :

µx −x = µ1 − µ2 dan standard error = σx − x = σ12 σ2 2 dan


+

n1 n2

1 2 1 2

Page | 17
x1 − x2 − µ1 − µ2

z=
2 2

nilai z
σ2
σ1 +

n1 n2

• Beda atau selisih 2 rata-rata = µ1 − µ2 →ambil nilai mutlaknya!

c. Melibatkan 2 populasi yang BERBEDA dan SALING BEBAS

d. Sampel-sampel yang diambil dalam banyak kasus (atau jika dilihat secara akumulatif)
adalah sampel BESAR

Contoh :

Diketahui rata-rata IQ mahasiswa Eropa = 125 dengan ragam = 119 sedangkan rata-rata IQ
mahasiswa Asia = 128 dengan ragam 181. diasumsikan kedua populasi berukuran besar

Jika diambil 100 mahasiswa Eropa dan 100 mahasiswa Asia sebagai sampel, berapa peluang
terdapat perbedaan IQ kedua kelompok akan kurang dari 2?
Jawab :

Populasi

Parameter populasi ke-1 (Mhs. Eropa) populasi ke-2 (Mhs. Asia)

Rata-rata (µ) 125 128

Ragam (σ²) 119 181

Page | 18
Beda 2 Rata-rata = µx1 − x2 = µ1 − µ2 = 125− 128 = − 3 = 3

Sampel : n1 = 100 n2 = 100

P( x 1 −x2 <2 ) = P ( z < ?)

x1 − x2 − µ1 − µ2 2−3 − 1 = −057.7.. .≈ −058.


z= = =

2 2
119 181 3

σ1 σ2
+

+
100 100
n1 n2
P(z<-0.58) = 0.5 - 0.2190 = 0.2810

3. DISTRIBUSI SAMPLING RATA-RATA

3.1 Rata-rata distribusi sampling 1 rata-rata

Bila suatu sampel acak dari suatu n pengamatan diambil dari suatu populasi normal
dengan rata-rata μ dan varians σ2. Maka, setiap pengamatan Xi, i =1,2,3, ..., n dari sampel acak
tersebut akan mempunyai distribusi normal yang

sama seperti popolasi yang bersangkutan. Sehingga dapat disimpulkan bahwa:

memiliki distribusi normal

Page | 19
dengan rata-rata :

dan varians :

Bila sampel yang diambil dari suatu populasi yang tidak diketahui distribuisnya,

distribusi sampling dari X akan tetap mendekati nomal dengan rata-rata μ dan varians σ2
asalkan sampel yang diambil dalam jumlah yang besar. Hasil ini merupakan konsekeuesi

dari suatu teorema batas tengah (central limit theorem)

berikut:

Teorema: Central Limit Theorem. Bila X adalah rata-rata suatu sampel acak yang
diambil dari suatu populasi dengan ukuran n, rata-rata μ dan varians σ2, maka bentuk
batas distribusi :
bila n ∞, distribusinya adalah distribusi normal standar n(z;0,1)

3.1 Distribusi sampling dari dua rata-rata

Teorema: Bila dua sampel yang saling bebas, n1 dan n2, diambil dari dua populasi, diskrit
atau menerus, dengan rata-rata μ1 dan μ2 dan varians σ12 dan σ22 ,

maka distribusi sampling dari perbedaan rata-rata, mendekati distribusi

Page | 20
normal dengan rata-rata dan varians sebagai berikut:

Sehingga:

mendekati variabel normal standar.

4. DISTRIBUSI SAMPLING PROPORSI ( )

Nilai statistik (sampel) dari proporsi adalah , sedangkan nilai parameter (populasi) adalah P.

Rumus untuk menghitung proporsi adalah :

= x/n

di mana :
x : jumlah / anggota sampel

n : jumlah sampel

Proporsi sampel merupakan variabel acak dan distribusi probabilitas sehingga disebut distribusi
sampling p.

Untuk menentukan hubungan proporsi sampel perlu p dengan proporsi populasi P, kita : nilai
memahami sifat-sifat distribusi sampling standar , dan yang diharapkan , deviasi

bentuk distribusi sampling .

4.1 Nilai yang diharapkan

Page | 21
Nilai yang diharapkan p, seluruh nilai kemungkinan p, sama dengan proporsi populasi P.

E( )=P

di mana :

E( ) : nilai yang diharapkan

P : proporsi populasi

karena E ( ) = P, adalah bias pengukur P.

b. Standar deviasi (kesalahan baku)

Seperti kita ketahui di standar deviasi x , pada standar deviasi juga

terdiri dari populasi terbatas dan tidak terbatas.

4. Kesalahan baku populasi terbatas


σp= N–n P ( 1- P )

N–1 n

5. Kesalahan baku populasi tidak terbatas

σ p= P ( 1-P )

Dapat kita lihat bahwa perbedaan kesalahan baku proporsi terbatas dan tidak terbatas

hanya pada faktor koreksi (N –n ) / (N- 1)

Page | 22
Seperti rata-rata sampel x , perbedaan antara kesalahan baku populasi terbatas dan
populasi tak terbatas menjadi diabaikan jika ukuran populasi terbatas lebih besar dibandingkan
dengan ukuran sampel. Jika populasi terbatas dengan n/N <= 0.05 , kita tidak perlu menggunakan
faktor koreksi . Sedangkan jika populasi terbatas dengan n/N > 0.05 maka kita menggunakan
faktor koreksi. Kita menggunakan kesalahan baku proporsi mengacu pada standar deviasi .

Setelah itu, kita dapat menentukan nilai Z :

Z= -P

σp

c. Bentuk distribusi sampling

Seperti kita ketahui, setelah mengetahui standar deviasi distribusi sampling

, langkah selanjutnya adalah menentukan bentuk distribusi sampling. Proporsi

sampel = x/n. Sampel acak sederhana dari populasi besar, nilai x adalah variabel

acak binomial . Karena n merupakan konstan, probabilitas dari x/n sama dengan

probabilitas binomial x, di mana distribusi sampling berbeda dengan distribusi

probabilitas dan probabilitas untuk tiap nilai x/n sama dengan probabilitas x.

Distribusi sampling diperkirakan oleh distribusi normal di mana ukuran sampelnya besar
dan terdapat dua kondisi :
np >= 5 dan n(1-P) >=5

5.Properties Of Point Estimators (Sifat Penduga Titik)

Di bab ini, kita menunjukkan bagaimana statistik sampel seperti mean

,standar deviasi sampel s, dan proposi sampel dapat digunakan sebagai titik

penduga yang berhubungan dengan populasi parameter . Sebelum

Page | 23
menggunakan titik penduga , statistik harus memeriksa apakah statistik sampel menunjukan sifat
yang berkaitan dengan titik penduga yang baik.

Karena beberapa sampel statistik yang berbeda dapat digunakan sebagai poin estimasi
untuk beberapa parameter populasi, kita menggunakan notasi umum berikut dalam bagian ini:

parameter ketertarikan populasi

sampel statistik atau poin estimasi akan

Notasi adalah surat yunani theta, dan notasi disebut “theta-hat”. Umumnya,

mewakili setiap populasi parameter seperti populasi mean, populasi standar deviasi , populasi
proporsi, dan lainnya.

5.1 Unbiased

Unbiased Estimators : jika nilai yang diharapkan dari statistik sampel adalah sama dengan
parameter populasi yang diperkirakan.

Statistik sampel adalah objektif parameter dari populasi parameter jika


E( )=

Dimana

E ( ) = nilai yang diharapkan dari statistik sampel

Gambar 7.1 menunjukkan unbiased dan biased titik penduga. Di dalam ilustrasi tersebut

menunjukkan objektif penduga, mean dari distribusi sampling adalah sama dengan nilai

parameter populasi. kesalahan estimasi mengimbangi dalam

Page | 24
hal ini, karena kadang-kadang nilai estimator titik mungkin kurang dari dan

lainnya kali itu mungkin lebih besar daripada . dalam hal ini dari penduga bias,

mean dari distribusi sampling kurang dari atau lebih daripada nilai parameter populasi. Ilustrasi
di Panel B 7.10 , E ( ) lebih besar daripada .statistik sampel memiliki probabilitas hugh dari
melebih-lebihkan nilai dari parameter populasi. jumlah bias ditunjukkan dalam gambar
Dalam membahas distribusi sampling dari mean sampel dan proporsi sampel, kami
menyatakan bahwa E ( ) = dan E ( )=p. Dengan demikian, keduanya estimators objektif tentang
parameter populasi yang berhubungan.

Dalam hal ini standar deviasi sampel s dan varians sampel , dapat

ditunjukkan bahwa E( )= . Dengan demikian, kita concluede bahwa varians

sampel , adalah penduga yang tidak bias dari varians populasi . Pada kenyataannya, ketika kita

pertama kali presenteed rumus untuk varians sampel dan standar deviasi sampel,n-1 daripada n

digunakan sebagai penyebut. alasan untuk

Page | 25
menggunakan n-1 daripada n adalah untuk membuat sampel varians estimator bias dari varians
populasi.

5.2 Efficiency (Efesiensi)

Berasumsi bahwa sampel randome sederhana n elemen dapat digunakan untuk


menyediakan dua estimator titik objektif tentang parameter populasi yang sama. Dalam situasi ini,
kita akan lebih suka menggunakan estimator titik dengan standard error yang lebih kecil, karena
cenderung memberikan perkiraan lebih dekat dengan parameter populasi. Estimator titik dengan
kesalahan kecil standrad dikatakan memiliki efisiensi relatif lebih besar daripada yang lain.

Gambar 7.11 menunjukkan distribusi sampling dari dua penduga titik bias, 1 dan 2 .

Perhatikan bahwa kesalahan baku, 1 kurang dari kesalahan baku 2. dengan demikian, nilai dari 1

memiliki kesempatan lebih besar untuk menjadi dekat dengan

paramater daripada melakukan nilai-nilai 2. Karena kesalahan baku dari estimator

titik 1 kurang dari kesalahan baku estimator titik 2, 1 relatif lebih efisien

daripada 2 dan merupakan estimator titik pilihan.

5.3 Consistensy (Konsistensi)


Sebuah properti ketiga yang terkait dengan estimator titik yang baik adalah

konsistensi.Estimator titik konsisten jika estimator titik cenderung menjadi lebih dekat dengan

parameter populasi sebagai ukuran sampel menjadi lebih besar. Dengan kata lain, ukuran sampel

yang besar cenderung memberikan estimasi titik yang lebih

baik daripada ukuran sampel yang kecil. Perhatikan bahwa untuk rata-rata sampel ,

kami menunjukkan bahwa kesalahan standar yang diberikan oleh = .

Page | 26
Karena berkaitan dengan ukuran sampel sehingga ukuran sampel besar

menyediakan lebih kecil.


Nilai , kami menyimpulkan bahwa ukuran sampel yang lebih besar

cenderung untuk memberikan estimasi titik lebih dekat dengan populasi berarti .

Dalam hal ini, kita dapat mengatakan bahwa rata-rata sampel adalah estimator

konsisten dari mean populasi . Menggunakan alasan serupa, kita juga dapat

menyimpulkan bahwa propotion sampel adalah estimator konsisten dari proporsi populasi p.

6. Metode Sampling

6.1 Stratified Random Sampling

Page | 27
Di dalam Stratified Random Sampling, elemen dalam populasi yang pertama dipisahkan

menjadi kelompok yang disebut strata sehingga setiap elemen di populasi milik satu dan hanya

satu stratum. Dasar membentuk strata seperti departemen, lokasi, umur, tipe industry, dll adalah

kebijaksanaan pembuat sample. Hasil yang terbaik diperoleh ketika elemen-elemen dalam setiap

stratum hampir sama. Berikut adalah diagram populasi yang memisahkan ke dalam H strata.

Populasi
Populasi

Strata 1 Strata 2 Strata H

Strata 1 Strata 2 Strata H

Setelah strata terbentuk, simple random sampel diambil dari setiap stratum. Rumusnya
adalah dengan mengkombinasi hasil individu stratum sampel ke satu elemen yang diestimasi dari
kepentingan populasi parameter. Nilai dari stratified random sampling bergantung pada
bagaimana homogennya elemen dalam starata. Jika elemen dalam starata menyerupai, starata
akan memiliki selisih yang rendah/ sedikit. Jika staratanya homogen, stratified random sampling
akan memberikan hasil yang tepat seperti simple random sampling dengan menggunakan total
ukuran sample yang kecil.

Jika kondisi populasi mengandung sejumlah katagori yang berbeda, maka kerangka

sampel dapat diorganisasikan dengan menggunakan katagori ini ke dalam strata yang terpisah.

Sampel kemudian dipilih masing-masing stratum secara terpisah untuk membuat stratum
berstrata. Ukuran sampel biasanya proporsional dengan ukuran relatif strata. Sekalipun demikian

semua varian berbeda secara signifikan diantara strata. Semua ukuran sampel harus dibuat seara

proporsional terhadap

Page | 28
standar deviasi stratum. Stratifikasi yang tidak proporsional dapat saja menghasilkan presisi yang

lebih baik daripada stratifikasi yang bersifat proporsional.

6.2 Cluster Sampling

Di dalam cluster sampling, elemen dalam populasi adalah yang pertama dipisahkan

kedalam grup yang disebut cluster. Setiap elemen dalam sample cluster membentuk sebuah

sampel. Cluster sampling cenderung memberikan hasil yang baik ketika elemen dalam cluster

tidak menyerupai. Nilai dari cluster sampling bergantung pada bagaimana perwakilan setiap

cluster dalam seluruh populasi. Jika semua cluster sesuai, sampling cluster yang kecil akan

memberikan estimasi yang baik bagi populasi parameter. Umumnya cluster sampling

membutuhkan ukuran sampel yang besar daripada simple random sampling/stratified random

sampling tetapi hal tersebut dapat menghasilkan penghematan biaya karena pada faktanya ketika

interviewer dikirimkan ke sample cluster, banyak observasi sample yang dapat diperoleh dalam

waktu singkat. Tujuan pokok menggunakan metode ini ialah untuk mengurangi biaya dengan cara

meningkatkan efisiensi penarikan sampel

Populasi

Cluster 1 Cluster 2 Cluster K


6.3 Systematic Sampling

Dalam beberapa situasi sampling terutama dengan populasi besar akan memakan waktu
untuk memilih sebuah simple random sampel dengan mencari

Page | 29
nomor secara acak dan menghitungnya atau mencari sepanjang daftar populasi sampai elemen
yang sesuai ditemukan. Alternatif untuk simple random sampling adalah systematic sampling.
Contoh jika sampel ukuran 50 yang diinginkan dari populasi yang terdiri dari 5000 elemen, kita
akan membuat sampel 1 elemen untuk setiap 5000/50=100 elemen dalam populasi. Systematic
sample untuk masalah ini melibatkan pemilihan acak salah satu dari 100 elemen pertama dari
daftar populasi. Elemen sampel yang lain akan di identifikasikan dengan memulai elemen sampel
pertama dan memilih setiap 100 elemen yang ada di daftar populasi. Sebenarnya, sampel dari 50 di
identifikasi dengan memindahkan secara sistematik ke populasi dan mengindentifikasi setiap 100
elemen setelah pertama kali pemilihan acak elemen. Sampel dari 50 akan lebih mudah untuk di
identifikasi dengan cara ini daripada jika simple random sampling digunakan. Karena elemen
pertama dipilih secara acak, sample systematic seringkali diasumsikan memiliki sifat dari simple
random sampling. Asumsi ini terutama berlaku ketika daftar elemen di populasi adalah urutan
acak elemen.

6.4 Convenience Sampling

Metode Sampling dibahas sejauh ini disebut dengan teknik probability sampling. Elemen
yang dipilih dari populasi yang diketahui sebagai probabilitas dalam sample. Keuntungan dari
sample probabilitas adalah distribusi sampelnya sesuai dengan stastik sampel yang dapat di
identifikasi. Formulanya dengan salah satu sampel random sampling yang disajikan dapat
digunakan untuk menentukan sifat dari distribusi sample sehingga dapat digunakan untuk
membuat probabilitas tentang kesalahan yang terkait dengan penggunaan hasil sampel untuk
membuat kesimpulan populasi.

Convenience sampling adalah teknik nonprobability sampling. Penarikan sample

menggunakan teknik inidilakukan dengan cara memilih unit-unit analisis yang dianggap sesuai

oleh penenliti. Pemilihan sampel didasarkan pada kemudahan akses,


Page | 30
misalnya teman, teman sekerja, para pengunjung mall pada saat belanja, dan sebagainya. Oleh
karena itu, convenience sample memiliki kelebihan yaitu pemilihan sample yang mudah.
Kelemahannya ialah mengandung sejumlah kesalahan sistematik dan variabel-variabel yang tidak
diketahui.

6.5 Judgement Sampling

Teknik nonprobability sampling yang lain adalah judgement sampling. Secara

keseluruhan, metode ini merupakan cara mudah dalam pemilihan sampel. Contoh seorang

reporter ingin mengambil sampel dari 2/3 anggota dewan untuk mendapatkan opini umum yang

mewakili semua anggota dewan. Tetapi kualitas hasil sampel tersebut tergantung pada penilaian

orang-orang yang dipilih menjadi sampel sehingga diperlukan kehati-hatian dalam menarik

kesimpulan yang didasarkan pada penilaian sampel untuk digunakan dalam membuat kesimpulan

populasi.

Teknik judgement/ penelitian atau dikenal juga sebagai teknik penarikan sampel purposif
ini dilakukan dengan cara memilih sampel dari suatu populasi didasarkan pada informasi yang
tersedia serta sesuai dengan penelitian yang sedang berjalan, sehingga perwakilannya terhadap
populasi dapat dipertanggungjawabkan. Teknik ini digunakan terutama apabila hanya ada sedikit
orang yang mempunyai keahlian (expertise) di bidang yang sedang diteliti.

Keuntungannya ialah unit-unit yang terakhir dipilih dapat dipilih sehingga mereka
mempunyai banyak kemiripan. Kerugiannya ialah memunculkan keanekaragaman dan estimasi
terhadap populasi dan sampel yang dipilihnya.
Page | 31
Istilah-Istilah

Parameter karakteristik numerik dari populasi, seperti rata-rata populasi µ, standar deviasi
populasi σ, proporsi populasi p.

Sampel acak sederhana Populasi terbatas: sampel yang dipilih dimana tiap ukuran sampel n
memiliki kemungkinan yang sama untuk terpilih. Populasi tidak terbatas: sampel yang dipilih
dimana tiap bagian berasal dari populasi yang sama dan element tersebut dipilih secara bebas.

Sampling dengan penggantian element yang sudah terpilih dari suatu sampel, tidak bisa dipilih
kembali saat pengambilan berikutnya.

Sampling dengan penggantian element yang sudah terpilih dari suatu sampel, bisa dipilih kembali
pada pengambilan berikutnya.

Sampel statistik sebuah karakteristik sampel, seperti sampel rata-rata, sampel standar deviasi,
sampel proporsi. Nilai dari sampel statistic digunakan untuk mengestimasi nilai parameter
populasi.

Titik estimator sampel statistic seperti x bar, standar deviasi, atau p topi, menyediakan titik
estimasi dari parameter populasi.
Titik estimasi nilai dari titik estimator yang digunakan sebagai contoh tertentu dalam perkiraan
parameter populasi.

Distribusi sampling distribusi kemungkinan yang terdiri dari seluruh nilai sampel statistic.
P
a
g
e

3
2

Anda mungkin juga menyukai