OLEH:
1. Mulyadi Matanari
2. Boyke S.Padang
3. Giofani Padang
KATA PENGANTAR
Puji dan syukur kita panjatkan kekhadirat Tuhan Yang Maha Esa yang telah memberikan kasihNya kepada kita semua, sehingga
kami, penulis, dapat menyelesaikan penyusunan makalah ini dengan baik dan lancar..
Seiring dengan berakhirnya penyusunan makalah ini, sepantasnyalah kami mengucapkan terima kasih kepada bapak
Amirhud Dalimunthe, S.T., M.Kom. sebagai dosen pemgampu dasar elektronika yang telah turut membantu dalam penyusunan
makalah ini.
Kami juga menyadari masih banyaknya kekurangan dalam penyusunan makalah ini, oleh karena itu kami mohon maaf
apabila terdapat kesalahan atau kekurangan dalam makalah ini. Selain itu, kami berharap adanya kritik dan saran yang membangun
dari pembaca agar makalah ini menjadi lebih baik. Semoga makalah ini dapat bermanfaat bagi penulis maupun pembaca.
STATISTIK INFERENSIAL
Statistik inferensial adalah statistik yang digunakan untuk menganalisisdata sampel dan hasilnya
akan digeneralisasikan/diinferensialkan kepada populasi dimana sampel diambil. Statistik inferensial ada dua
macam, yaitu:
1) Statistik Parametrik
Statistik Parametrik, yaitu ilmu statistik yang mempertimbangkan jenis sebaran atau distribusi data,
yaitu apakah data menyebar secara normal atau tidak. Dengan kata lain, data yang akan dianalisis
menggunakan statistic
parametrik harus memenuhi asumsi normalitas. Pada umumnya, jika data tidak menyebar normal,
maka data seharusnya dikerjakan dengan metode statistik non-parametrik, atau setidak-tidaknya dilakukan
transformasi terlebih dahulu agar data mengikuti sebaran normal, sehingga bisa dikerjakan dengan statistik
parametrik.
c. Korelasi pearson,
Keunggulan:
a) Syarat syarat parameter dari suatu populasi yang menjadi sampel biasanya tidak diuji dan dianggap
memenuhi syarat, pengukuran terhadap data dilakukan dengan kuat.
b) Observasi bebas satu sama lain dan ditarik dari populasi yang berdistribusi normal serta memiliki varian
yang homogen.
Kelemahan:
b) Variabel-variabel yang diteliti harus dapat diukur setidaknya dalam skala interval.
c) Dalam analisis varian ditambahkan persyaratan rata-rata dari populasi harus normal dan bervarian sama,
dan harus merupakan kombinasi linear dari efek-efek yang ditimbulkan.
2) Statistik Non-Parametrik
Statistik Non-Parametrik, yaitu statistik bebas sebaran (tidak mensyaratkan bentuk sebaran
parameter populasi, baik normal atau tidak). Selain itu, statistik non-parametrik biasanya menggunakan
skala pengukuran sosial, yakni nominal dan ordinal yang umumnya tidak berdistribusi normal.
Keunggulan:
b) Secara umum metode statistik non-parametrik lebih mudah dikerjakan dan lebih mudah dimengerti jika
dibandingkan dengan statistik parametrik karena ststistika non-parametrik tidak membutuhkan perhitungan
matematik yang rumit seperti halnya statistik parametrik.
c) Statistik non-parametrik dapat digantikan data numerik (nominal) dengan jenjang (ordinal).
d) Kadang-kadang pada statistik non-parametrik tidak dibutuhkan urutan atau jenjang secara formal karena
sering dijumpai hasil pengamatan yang dinyatakan dalam data kualitatif .
e) Pengujian hipotesis pada statistik non-parametrik dilakukan secara langsung pada pengamatan yang nyata.
f) Walaupun pada statistik non-parametrik tidak terikat pada distribusi normal populasi, tetapi dapat digunakan
pada populasi berdistribusi normal.
Kelemahan:
b) Hasil pengujian hipotesis dengan statistik non-parametrik tidak setajam statistik parametrik.
c) Hasil statistik non-parametrik tidak dapat diekstrapolasikan ke populasi studi seperti pada statistik
parametrik. Hal ini dikarenakan statistik non-parametrik mendekati eksperimen dengan sampel kecil dan
umumnya membandingkan dua kelompok tertentu. (Khairul Amal) http://forum-
statistik.blogspot.com/2012/05/statistik-parametrik-vs-statistik-non.html
Dalam statistik, hipotesis dapat diartikan sebagai pernyataan statistik tentang parameter populasi.
Statistik adalah ukuran-ukuran yang dikenakan pada sampel (x=rata-rata, s=simpangan baku, s 2=varians,
r=koefisien korelasi). Parameter adalah ukuran- ukuran yang dikenakan pada populasi (μ rata -rata,
σ=simpangan baku, σ2=varians, ρ=koefisien korelasi). Dengan kata lain, hipotesis adalah taksiran terhadap
parameter populasi, melalui data-data sampel. Penelitian yang didasarkan pada data populasi, atau sampling
total, atau sensus dengan tidak melakukan pengujian hipotesis statistik dari sudut pandang statistik disebut
penelitian deskriptif. Terdapat perbedaan mendasar pengertian hipotesis menurut statistik dan penelitian.
Dalam penelitian, hipotesis diartikan sebagai jawaban sementara terhadap rumusan masalah penelitian.
Rumusan masalah tersebut bisa berupa pernyataan tentang hubungan dua variabel atau lebih, perbandingan
(komparasi), atau variabel mandiri (deskripsi). Disini terdapat perbedaan lagi pengertian deskriptif dalam
penelitian dan dalam statistik. Seperti telah dikemukakan, deskriptif dalam statistik adalah penelitian yang
didasarkan pada populasi (tidak ada sampel), sedangkan deskriptif dalam penelitian menunjukkan tingkat
eksplanasi yaitu menanyakan tentang variabel mandiri (tidak dihubungkan dan dibandingkan).
Dalam statistik dan penelitian terdapat dua macam hipotesis, yaitu hipotesis nol dan alternatif. Pada
statistik, hipotesis nol diartikan sebagai tidak adanya perbedaan antara parameter dengan statistik, atau tidak
adanya perbedaan antara parameter dengan statistik, atau tidak adanya perbedaan antara ukuran populasi
dan ukuran sampel. Dengan demikian hipotesis yang diuji adalah hipotesis nol, karena memang peneliti tidak
mengharapkan adanya perbedaan data populasi dengan data sampel. Selanjutnya hipotesis alternatif adalah
lawannya hipotesis nol, yang berbunyi adanya perbedaan antara data populasi dengan data sampel.
Hipotesis deskriptif adalah dugaan tentang nilai suatu variabel mandiri, tidak membuat perbandingan atau
hubungan. Sebagai contoh, bila rumusan masalah penelitian sebagai berikut ini, maka hipotesis (jawaban
sementara) yang dirumuskan adalah hipotesis deskriptif.
c) Daya tahan lampu merk A = 450 jam dan merk B = 600 jam. Dalam perumusan hipotesis statistik, antara
hipotesis nol (Ho) dan hipotesis alternatif (Ha) selalu berpasangan, bila salah satu ditolak, maka yang lain
pasti diterima sehingga dapat dibuat keputusan yang tegas, yaitu kalau Ho ditolak pasti Ha diterima.
Hipotesis statistik dirumuskan dengan simbol-simbol statistic. Berikut ini diberikan contoh berbagai
pernyataan yang dapat dirumuskan hipotesis deskriptif statistiknya:
1) Suatu perusahaan minuman harus mengikuti ketentuan, bahwa salah satu unsur kimia hanya boleh
dicampurkan paling banyak 1% (paling banyak berarti lebih kecil atau sama dengan) Dengan demikian
rumusan hipotesis
statistik adalah:
Ho:μ ≤0.01
Ha:μ>0.01
Dapat dibaca: Hipotesis nol untuk parameter populasi berbentuk proporsi (1%: proporsi) lebih kecil atau
sama dengan 1%, dan hipotesis alternatifnya, untuk populasi yang berbentuk proporsi lebih besar 1%
2) Suatu bimbingan tes menyatakan murid yang dibimbing di lembaga itu, paling sedikit 90% dapat diterima di
Ho:μ≥0.90
Ha:μ<0.90
BAB I
PENDAHULUAN
A. Latar Belakang
Hipotesis dapat diartikan sebagai pernyataan statistik tentang parameter populasi. Statistik adalah ukuran
yang dikenakan pada sampel ( x= rata-rata; s = simpangan baku; s2 = varians; r = koefisien korelasi), dan
parameter adalah ukuran-ukuran yang dikenakan pada populasi (µ= rata-rata;σ=simpangan baku, σ2=
varians; ρ= koefisien korelasi). Dengan kata lain, hipotesis adalah taksiran terhadap parameter populasi,
melalui data-data sampel.
Hipotesis diartikan sebagai jawaban sementara terhadap rumusan masalah penelitian, bisa berupa
pernyataan tentang hubungan dua variabel atau lebih, perbandingan (komparasi), atau variabel mandiri
(deskripsi). Deskriptif dalam statistik adalah penelitian yang didasarkan pada populasi (tidak ada sampel),
sedangkan deskriptif dalam penelitian menunjukkan tingkat ekplanasi yaitu menanyakan tentang variabel
mandiri (tidak dihubungkan dan dibandingkan).
Dalam statistik terdapat dua macam hipotesis, yaitu hipotesis nol dan hipotesis alternatif. Hipotesis nol
diartikan sebagai tidak adanya perbedaan antara parameter dengan statistik, atau tidak adanya perbedaan
antara ukuran populasi dan ukuran sampel. Hipotesis alternatif adalah lawannya hipotesis nol, yang berbunyi
adanya perbedaan antara data populasi dengan data sampel. Secara ringkas hipotesis dalam statistik
merupakan pernyataan statistik tentang parameter populasi sedangkan hipotesis dalam penelitian merupakan
jawaban sementara terhadap rumusan masalah pada suatu penelitian.
Terdapat bermacam-macam teknik statistik yang dapat digunakan dalam suatu penelitian khususnya dalam
pengujian statistik. Teknik statistik yang akan digunakan tergantung pada interaksi dua hal, yaitu macam
data yang akan dianalisis dan bentuk hipotesisnya (untuk lebih jelasnya perhatikan tabel 1.1. Bentuk hipotesis
ada tiga macam,yaitu:
1. Hipotesis deskriptif
Hipotesis deskriptif adalah dugaan tentang nilai suatu variabel mandiri, tidak membuat perbandingan atau
hubungan.
2. Hipotesis Komparatif
Hipotesis komparatif adalah pernyataan yang menunjukkan dugaan nilai dalam satu variabel atau lebih pada
sampel yang berbeda.
3. Hipotesis Asosiatif
Hipotesis asosiatif adalah suatu pernyataan yang menunjukkan dugaan tentang hubungan antara dua
variabel atau lebih.
TABEL 1.1 PENGGUNAAN STATISTIK PARAMETRIS DAN
NONPARAMETRIS UNTUK MENGUJI HIPOTESIS
Bentuk Hipotesis
Macam Deskriptif Komparatif 2 sampel Komparatif (lebih dari 2 Asosiatif
data (satu sampel) (hubunga
variable) related independen related idependen n)
Nominal - Binominal -Mc Fisher X2 k X2 k Coefisient
Nemar Exact sampel sampel contingen
Probability cy
___-X2 1 -x2 2 sampel Cochran(Q) (C)
sampel
NONPARAMETRIS UNTUK MENGUJI HIPOTESIS
B. Permasalahan
Berdasarkan latar belakang diatas, maka permasalahan dalam makalah ini adalah sebagai berikut:
1. Bagaimanakah hipotesis dalam statistik penelitian?
C. Tujuan
Berdasarkan permasalahan tersebut diatas, maka dapat dirumuskan tujuan makalah ini adalah sebagai
berikut:
Berikut ini dikemukakan dua macam statistik nonparametris yang digunakan untuk menguji hipotesis
asosiatif, yaitu koefisien Kontingensi dan korelasi Spearman Rank.
1. Koefisien Kontingensi
Seperti telah ditunjukkan pada tabel, bahwa koefisien kontingensi digunakan untuk menghitung hubungan
antar variabel bila datanya berbentuk nominal. Teknik ini mempunyai kaitan erat dengan Chi Kuadrat yang
digunakan untuk menguji hipotesis komparatif k sampel independen. Oleh karena itu, rumus yang digunakan
mengandung nilai Chi Kuadrat. Rumusnya adalah:
C=
BAB II
PEMBAHASAN
2. Korelasi Ganda
Korelasi ganda (multiple correlation) merupakan angka yang menunjukkan angka yang menunjukkan arah
dan kuatnya hubungan antara dua variabel independen secara bersama-sama atau lebih dengan satu variabel
dependen. Simbol korelasi ganda adalah R. korelasi ganda (R) untuk dua variabel independen dan satu
dependen. Rumus korelasi ganda dua variabel adalah:
Ry.x1x2 =
Dimana:
Ry.x1x2
ryx1 = Korelasi antara variabel X1 dengan X2 secara bersama-sama dengan variabel Y = Korelasi
Product Moment antara X1 dengan Y = Korelasi Product Moment antara X2 dengan Y =
ryx2 Korelasi Product Moment antara X1 dengan X2
rx1x2
Jadi untuk dapat menghitung korelasi ganda, maka harus dihitung terlebih dahulu korelasi sederhananya
dulu melalui korelasi Product Moment dari Pearson.
3. Korelasi Parsial
Korelasi Parsial digunakan untuk menganalisis bila peneliti bermaksud mengetahui pengaruh atau
mengetahui pengaruh atau mengetahui hubungan antara variabel independen dan dependen, dimana salah
satu variabel independennya dibuat tetap/dikendalikan. Jadi korelasi parsial merupakan angka yang
menunjukkan arah dan kuatnya hubungan antara dua variabel atau lebih, setelah satu variabel yang diduga
dapat memengaruhi hubungan variabel tersebut tetap/dikendalikan.
Ryx1x2 =
t=
X2 =
Untuk memudahkan perhitungan, maka data-data hasil penelitian perlu disusun ke dalam tabel penolong,
seperti berikut:
Kalau pada Product Moment, sumber data untuk variabel yang akan dikorelasikan adalah sama, data yang
dikorelasikan adalah data interval atau rasio, serta data dari kedua variabel masing-masing membentuk
distribusi normal, maka dalam korelasi Spearman Rank, sumber data untuk kedua variabel yang akan
dikonservasikan dapat berasal dari sumber yang tidak sama, jenis data yang dikorelasikan adalah data
ordinal, serta data dari kedua variabel tidak harus membentuk distribusi normal. Jadi korelasi Spearman
Rank adalah bekerja dengan data ordinal atau berjenjang atau rangking, dan bebas distribusi.
Jika sumber datanya berbeda maka untuk menganalisisnya digunakan Spearman Rank yang rumusnya
adalah:
ρ = 1-
dimana:
karena korelasi Spearman Rank bekerja dengan data ordinal, maka data tersebut terlebih dahulu harus
diubah menjadi data ordinal dalam bentuk rangking
STATISTIK INFERENSIAL
A. Pengertian
Statistik inferensial adalah teknik analisis data yang digunakan untuk menentukan sejauh mana kesamaan
antara hasil yang diperoleh dari suatu sampel dengan hasil yang akan didapat pada populasi secara
keseluruhan. Jadi statistik inferensial membantu peneliti untuk mencari tahu apakah hasil yang diperoleh
dari suatu sampel dapat digeneralisasi pada populasi .[1] Sejalan dengan pengertian statistik inferensial
menurut Creswell, Muhammad Nisfiannoor berpendapat bahwa statistik inferensial adalah metode yang
berhubungan dengan analisis data pada sampel untuk digunakan untuk penggeneralisasian pada populasi.
Penggunaan statistic inferensial didasarkan pada peluang (probability) dan sampel yang dipilih secara acak
(random). [2]
1. Standard Error
Peluang setiap sampel sangat identik dengan populasinya sangat kecil ( nill) meskipun inferensi populasi
didapat dari informasi sampel.Penerapan random sampling tidak menjamin karakteristik sampel sama persis
dengan populasi. Variasi prediksi antara mean disebut sampling error. Sampling error ini tidak bisa dihindari
dan ini bukan kesalahan peneliti. Yang menjadi persoalah adalah apakah error tersebut semata-mata hasil
sampling error atau merupakan perbedaan yang bermakna yang akan pula ditemukan pada papulasi yang
lebih besar.
Ciri standard error adalah bahwa error yang terjadi bisaanya berdistribusi normal yang besarnya berbeda-
bedadan error tersebut cenderung membentuk kurva normal yang menyerupai lonceng.
Faktor utama yang mempengaruhi standard error adalah jumlah sampel. Semakin banyak sampelnya,
semakin kecil standard errornya. Ini menunjukkan bahwasampel penelitian semakin akurat bila banyak
sampelnya.
Faktor utama yang mempengaruhi standard error adalah jumlah sampel. Semakin banyak sampelnya,
semakin kecil standard error meannya yang berarti bahwa semakin kecil standard error-nya, semakin akurat
mean sampel untuk dijadikan estimator untuk mean populasinya .[3]
2. Pengujian Hipotesis
Pengujian hipotesis adalah proses pengambilan keputusan dimana peneliti mengevaluasi hasil penelitian
terhadap apa yang ingin dicapai sebelumnya. Misalnya, kita ingin menerapkan program baru dalam
pelajaran membaca. Pada rencana penelitian dikemukanan hipotesis penelitian yang memprediksi perbedaan
skor siswa yang menjalni program baru tadi dengan proglam lama, dan hipotesis nol (0), yang
memprediksikan skor kedua kelompok tidak akan berbeda. Setelah data dihitung mean dan standar
deviasinya dan hasilnya menunjukkan skor siswa dengan program baru lebih tinggi (berbeda secara
signifikan) daripada siswa yang mengikuti program lama, maka hipotesis penelitian diterima dan hipotesis nol
ditolak. Yang berarti bahwa program baru tersebut efektif untuk diterapkan pada program membaca.
Intinya, pengujian hipotesis adalah proses evaluasi hipotesis nol, apakah diterima tau ditolak.[4]
3. Uji Signifikansi
Uji signifikasi adalah cara mengetahui adanya perbedaan antara dua skor. Signifikansi merujuk pada tingkat
statistik dari probabilitas dimana dengannya kita bisa menolak hipotesis nol. Uji signifikansi dilakukan
dengan menentukan tingkat probabilitas praseleksi yang dikenal dengan tingkat signifikansi
(α). Tingkat probailitas ini dijadikan dasar untuk menolak atau tidak menolak hipotesis nol. Standar yang
digunakan umumnya 0,05 kesempatan (5 dari 100). Adapula yang menggunakan 0.01. Semakin kecil nilai
probabilitasnya, semakin kecil pula kemungkinan temuan tersebut diperoleh karena disebabkan oleh
peluang.[5]
1. Statistik Parametrik; yaitu teknik yang didasarkan pada asumsi bahwa data yang diambil mempunyai
distribusi normal dan menggunakan data interval dan rasio .[6]
a. Uji-t
Uji-t digunakan untuk menentukan apakah 2 kelompok skor memiliki perbedaan yang signifikan di tingkat
probabilitas pilihan. Contohnya, Uji- t dapat digunakan untuk membandingkan skor membaca pada laki-laki
dan skor membaca pada perempuan di sekolah A.
Strategi dasar Uji-t adalah membandingkan perbedaan nyata antara mean kelompok (X1-X2)
menentukan apakah ada perbedaan yang diharapkan berdasarkan peluang. Uji-t terdiridari:
Uji-t untuk
uji-t. sampel
independen.
untuk Sampelindependen
independendigunakan
ditentukanuntuk
tanpamenentukan apakah ada
adanya pemadanan jenisperbedaan yang signifikan
apapun. Software antara
SPSS dapat dua sampel
digunakan
Uji-t untuk sampel non-independen digunakan untuk membandingkan dua kelompok terpilih berdasarkan
beberapa kesamaan. Uji ini juga digunakan untuk membandingkan performansi kelompok tunggal dengan
pretest dan posttest atau dengan dua perlakuan berbeda.[7]
Dalam Educational Research (2008), Cresswell mengartikan ANOVA sebagai teknik statistik yang digunakan
untuk perbedaan yang ada pada lebih dari dua kelompok data. Adapun jenis analisis varians, yakni:
1. ANOVA sederhana (satu arah) digunakan untuk menentukan apakah skor dari dua kelompok atau lebih
memiliki perbedaan secara signifikan pada tingkat probabilitasnya. Misalnya, pengukuran prestasi siswa
berdasarkan tingkat ekonominya (tinggi, sedang, dan rendah), dimana tingkat ekonomi sebagai variabel
kelompok dan tingkat ekonomi sebagai variabel dependennya.
2. Multi comparison adalah pengujian yang melibatkan perhitungan bentuk istimewa dari uji- t. Setiap kali uji
signifikansi dilakukan, tingkat probabilitasnya kita terima. Misalnya, kita setuju kalau hasil yang akan
didapatakan muncul hanya 5 kali kesempatan pada setiap 100 sampel. Hasil tersebut dikatakan bermakna
dan bukan sekedar karena peluang semata.
3. ANOVA Multifaktor
Seperti pembahasan kelompok sebelumnya, desain factorial digunakan untuk meneliti dua variabel bebas atau
lebih serta hubungan di antara variabel tersebut, maka ANOVA multifaktor adalah jenis analisis statistik
yang paling sesuai. Hasilan alisisnya adalah rasio F terpisah untuk setiap variabel bebas dan satu rasio F
untuk interaksi. Misalnya, kita ingin mengetahui apakah gender dan tingkat ekonomi (tinggi, sedang, dan
rendah) mempengaruhi prestasi mahasiswa. ANOVA multifaktor memungkinkan kita untuk menghitung
kedua variabel bebas (gender dan tingkat ekonomi) dan variabel terikat (prestasi; IPK, skor bahasa, skor
matematika, dsb)
Analisis ini model ANOVA yang digunakan dengan cara berbeda dimana variabel bebas dihitung dengan
memperhatikan rancangan penelitian. Bila penelitian memiliki 2 variabel bebas atau lebih, maka uji jenis
inilah yang cocok digunakan melalui dua cara yakni: (1) sebagai teknik pengendalian variabel luar
(extraneous variable) serta sebagai alat untuk meningkatkan kekuatan uji statistik. ANCOVA bisa digunakan
pada penelitian kausal komparatif maupun penelitian ekperimental yang melibatkan kelompok yang sudah
ada dan kelompok yang dibentuk secara acak, dan (2) ANCOVA digunakan untuk memperkuat uji statistic
dengan memperkecil varians dalam kelompok (error). Kekuatan yang dimaksudkan adalah kemampuan uji
signifikansi untuk mengenali temuan riset sebenarnya, yang memungkinkan penguji menolak hipotesis 0 (nol)
yang salah .[8]7
c. Regresi Jamak
Regresi jamak digunakan pada data berbentuk rasio dan interval. Regresi jamak menggabungkan variabel
yang diketahui secara terpisah untuk memprediksi (misalnya, hubungan antara) criteria dalam persamaan
(rumus) prediksi atau dikenal dengan Multiple Regression Equation. Regresi jamak merupakan prosedur
analisis untuk penelitian eksperimental, kausal komparatif, dan korelasional karena teknik ini tidak hanya
untuk menentukan apakah ada hubungan antar variable tetapi juga untuk mengetahui besar (kuatnya)
hubungan tersebut. Salah satu jenis regresi jamak adalah step-wise analysis yang memungkinakn kita
memasukkan atau mengeluarkan variabel utama (predicator) ke dalam persamaan regresi tahap demi tahap.
Regresi jamak juda menjadi dasar analisis jalur yang bertujuan untuk mengidentifikasi tingkat interaksi
variabel utama satu sama lain dan berkontribusi pada variabel terikat.[9]
Sementara dalam Emzir (2011) dikatakan bahwa regresi jamak merupakan perluasan dari regresi dan
prediksi sederhana dengan penambahan beberapa variabel. Kekuatan prediksi akan semakin terdukung
dengan penambahan variabel.[10]
d. Korelasi
Menurut Cohen, dkk., Teknik korelasi digunakan untuk mengetahui tiga hal pada dua variabel atau dua set
data. Pertama, “Apakah ada hubungan antara dua variabel atau set data”. Bila jawabannya “ya”, maka dua
hal berikutnya perlu kita cari yakni; “Bagaimana arah hubugan tersebut”; dan “Apa yang menjadi
ukurannya?” Hubungan yang dimaksudkan adalah kencenderungan dua variabel atau set data berbeda
secara konsisten.[11] Dalam Solusi Mudah dan Cepat Menguasai SPSS 17.0 unruk Pengolahan Data Statistik
(Wahana Komputer, 2009) dikatakan analisis korelasi dilakukan untuk
menunjukkan keeratan hubungan kausal antara variabel-variabel. Jenis-jenis analisis korelasi, yaitu:
2. Statistik Non-parametrik
Statistik nonparametrik adalah jenis statistic inferensial yang tidak mengharuskan data berdistribusi normal
dan jenis data yang digunakan adalah data nominal dan ordinal .[13]
a. Chi Square
Sampel adalah sebagian dari anggota populasi yang dipilih dengan cara tertentu yang akan
diteliti sifat-sifatnya dalam penelitian. Nilai-nilai yang berasal dari data sampel dinamakan
dengan Statistik.
distribution tergantung dari ukuran populasi, ukuran sampel, metode memililih sampel.
Distribusi sampling dari X dengan dengan ukuran sampel n adalah suatu distribusi yang bila
percobaan dilakukan secara berulang (selalu dengan jumlah sampel n) akan menghasilkan
Random Sampling atau sampling secara acak adalah suatu proses populasi
pengambilan sampel dimana setiap anggota sama memiliki kesempatan yang
Manfaat Sampling :
untuk membantu memahami distribusi dari suatu karakteristik populasi yang tidak
diketahui, ilmuwan dan insinyur sering menggunakan data sampel
teknik sampling berguna dalam penarikan kesimpulan (inference) yg valid dan dapat
dipercaya
teknik pengambilan sampling yang baik dan benar dapat menghemat biaya
Page | 1
Populasi Terhingga dan Tak Hingga :
Populasi terhingga (finite population) adalah populasi yang jumlah seluruh anggotanya
tetap dan dapat didaftar. Contoh: pengukuran berat badan mahasiswa ITS jurusan
Teknik Kelautan angkatan 2007.
Populasi tak terhingga (infinite population) adalah populasi yang memiliki anggota yang
banyaknya tak terhingga. Contoh: pengamatan kejadian kecelakaan yang terjadi di
bundaran ITS selama kurun waktu yang tidak dibatasi.
Penelitian sensus adalah penelitian yang dilakukan dengan cara mengumpulkan data dari
semua anggota populasi.
Penelitian sampling adalah penelitian yang dilakukan dengan cara mengumpulkan data
dari anggota sample.
Rata-Rata µ : myu x
1 2 1 2
mutlak mutlak
Standar Deviasi = σ : sigma S
Simpangan Baku
Varians = Ragam σ² s²
Page | 2
Selisih 2 proporsi π−π : nilai p −p : nilai
1 2 1 2
mutlak mutlak
a keacakannya (randomness)
b ukuran
c teknik penarikan sampel (sampling) yang sesuai dengan kondisi atau sifat populasi
Contoh :
Ditetapkan interval = 20
Secara acak terpilih : Anggota populasi ke-7 sebagai anggota ke-1 dalam sampel
maka :
Page | 3
c) Penarikan Sampel Acak Berlapis (Stratified Random Sampling)
Populasi terdiri dari beberapa kelas/kelompok. Dari setiap kelas diambil sampel
secara acak.
Perhatikan !!!!
Contoh :
Dari 1500 penumpang KA (setiap kelas memiliki ukuran yang sama) akan
diambil 150 orang sebagai sampel, dilakukan pendataan tentang tingkat
kepuasan, maka sampel acak dapat diambil dari :
Perhatikan !!!!
Page | 4
Antar Kelas bersifat (cenderung) sama (homogen). Anggota dalam suatu kelas
akan (cenderung) berbeda (heterogen).
Contoh :
Terdapat 40 kelas untuk tingkat II Jurusan Ekonomi-GD, setiap kelas terdiri dari 100
orang. Populasi mahasiswa kelas 2, Ekonomi-UGD = 40 × 100 = 4000.
Jika suatu penelitian dilakukan pada populasi tersebut dan sampel yang diperlukan = 600
orang, dilakukan pendataan mengenai lama waktu belajar per hari maka sampel dapat
diambil dari 6 kelas.... Dari 40 kelas, ambil secara acak 6 kelas.
Contoh :
Page | 5
b) Penarikan sampel dengan pemulihan : bila setelah didata, anggota sampel
dikembalikan ke dalam ruang sampel.
3) Jumlah Sampel Acak yang dapat ditarik dari suatu populasi adalah sangat banyak.
5) Suatu statistik dapat dianggap sebagai peubah acak yang besarnya sangat tergantung dari
sampel yang kita ambil.
6) Karena statistik sampel adalah peubah acak maka ia mempunyai distribusi yang kita
sebut sebagai : Distribusi peluang statistik sampel atau Distribusi Sampling atau Distribusi Penarikan Sampel.
Beberapa notasi :
n : ukuran sampel N : ukuran populasi
Page | 6
2.1 Distribusi Sampling Rata-Rata Sampel Besar
Dalil 1
JIKA
Sampel:
rata-rata = x
Populasi berukuran = N
Terdistribusi NORMAL
MAKA
σ x−µ
n σ n
Page | 7
Dalil 2
JIKA
Sampel:
rata-rata = x
Populasi berukuran = N
Terdistribusi NORMAL
Rata-rata = µ ; simpangan baku = σ
MAKA
x−µ
σ N−n z=
n N −1 (σ / n)
N −1
Page | 8
4. N−n disebut sebagai FAKTOR KOREKSI populasi terhingga.
−1
4. Faktor Koreksi (FK) akan menjadi penting jika sampel berukuran n diambil dari
populasi berukuran N yang terhingga/ terbatas besarnya
5. Jika sampel berukuran n diambil dari populasi berukuran N yang sangat besar
maka FK akan mendekati 1 → N−n ≈ 1, hal ini mengantar kita pada dalil
N−1
ke-3 yaitu
DALIL LIMIT PUSAT = DALIL BATAS TENGAH = THE CENTRAL LIMIT THEOREM
JIKA
Sampel:
berukuran = n diambil dari
rata-rata = x
BESAR
distribusi : SEMBARANG
Page | 9
MAKA
σ x−µ
n σ n
B. Dalil Limit Pusat berlaku untuk : - penarikan sampel dari populasi yang sangat besar,
C. Beberapa buku mencatat hal berikut : Populasi dianggap BESAR jika ukuran sampel
n
KURANG DARI 5 % ukuran populasi atau < 5%
N
Dalam pengerjaan soal DISTRIBUSI SAMPLING RATA-RATA perhatikan asumsi-asumsi dalam
soal sehingga anda dapat dengan mudah dan tepat menggunakan dalil-dalil tersebut!
Contoh :
PT AKUA sebuah perusahaan air mineral rata-rata setiap hari memproduksi 100 juta gelas air
mineral. Perusahaan ini menyatakan bahwa rata-rata isi segelas AKUA
Page | 10
adalah 250 ml dengan standar deviasi = 15 ml. Rata-rata populasi dianggap menyebar normal.
1. Jika setiap hari diambil 100 gelas AKUA sebagai sampel acak DENGAN
PEMULIHAN, hitunglah :
σ 15 15
GALAT BAKU = σx = = == 1.5
n 100 10
15. 15.
Page | 11
2. Diselesaikan dengan DALIL 3 →karena POPULASI SANGAT BESAR
σ 15 15
GALAT BAKU = σx = = = = 3.0
n 25 5
255 − 250 5
Contoh :
Dari 500 mahasiswa FE-GD diketahui rata-rata tinggi badan = 165 cm dengan standar deviasi = 12
cm, diambil 36 orang sebagai sampel acak. Jika penarikan sampel dilakukan TANPA
PEMULIHAN dan rata-rata tinggi mahasiswa diasumsikan menyebar normal, hitunglah :
b. peluang sampel akan memiliki rata-rata tinggi badan kurang dari 160 cm?
Page | 12
N = 500 µx = µ = 165 σ = 12 n = 36
n 36
Catatan N = 500 = 0.072 = 7.2% > 5% → Dalil Limit Pusat tidak dapat
digunakan
FK =
N−1 = 500 − 1 = 499 = 0.929... = 0.964...
σ 12
n 36
160 −165
z= 1928.... = −2.59...
Page | 13
nilai α
n : ukuran sampel.
• Nilai α adalah luas daerah kurva di kanan nilai t atau luas daerah kurva di
kiri nilai –t
kurva
-2.306 0 2.306
Page | 14
Arti Gambar di atas nilai t sampel berukuran n = 9, berpeluang 95% jatuh dalam selang
Dalam banyak kasus nilai simpangan baku populasi (σ) tidak diketahui, karenanya nilai σ diduga
dari nilai simpangan baku sampel (s)
Dalil 4
JIKA
Sampel:
Populasi berukuran = N
terdistribusi : NORMAL
Rata-rata = µ
MAKA
Page | 15
Distribusi Rata-rata akan mendekati distribusi-t dengan :
s x−µ
n s n
Contoh :
b. = 2.5 % = 0.025
n = 9 →db = n - 1 = 8
s n 0.24 9 0.08
Page | 16
Nilai t hitung = 1.875 berada dalam selang -2.306 < t < 2.306
jadi hasil penelitian Yayasan Konsumen masih sesuai dengan pernyataan manajemen PT JURAM.
Dalil 5
JIKA
Rata-rata µ1 dan µ2
Ragam σ12 dan σ22
MAKA
n1 n2
1 2 1 2
Page | 17
x1 − x2 − µ1 − µ2
z=
2 2
nilai z
σ2
σ1 +
n1 n2
d. Sampel-sampel yang diambil dalam banyak kasus (atau jika dilihat secara akumulatif)
adalah sampel BESAR
Contoh :
Diketahui rata-rata IQ mahasiswa Eropa = 125 dengan ragam = 119 sedangkan rata-rata IQ
mahasiswa Asia = 128 dengan ragam 181. diasumsikan kedua populasi berukuran besar
Jika diambil 100 mahasiswa Eropa dan 100 mahasiswa Asia sebagai sampel, berapa peluang
terdapat perbedaan IQ kedua kelompok akan kurang dari 2?
Jawab :
Populasi
Page | 18
Beda 2 Rata-rata = µx1 − x2 = µ1 − µ2 = 125− 128 = − 3 = 3
2 2
119 181 3
σ1 σ2
+
+
100 100
n1 n2
P(z<-0.58) = 0.5 - 0.2190 = 0.2810
Bila suatu sampel acak dari suatu n pengamatan diambil dari suatu populasi normal
dengan rata-rata μ dan varians σ2. Maka, setiap pengamatan Xi, i =1,2,3, ..., n dari sampel acak
tersebut akan mempunyai distribusi normal yang
Page | 19
dengan rata-rata :
dan varians :
Bila sampel yang diambil dari suatu populasi yang tidak diketahui distribuisnya,
distribusi sampling dari X akan tetap mendekati nomal dengan rata-rata μ dan varians σ2
asalkan sampel yang diambil dalam jumlah yang besar. Hasil ini merupakan konsekeuesi
berikut:
Teorema: Central Limit Theorem. Bila X adalah rata-rata suatu sampel acak yang
diambil dari suatu populasi dengan ukuran n, rata-rata μ dan varians σ2, maka bentuk
batas distribusi :
bila n ∞, distribusinya adalah distribusi normal standar n(z;0,1)
Teorema: Bila dua sampel yang saling bebas, n1 dan n2, diambil dari dua populasi, diskrit
atau menerus, dengan rata-rata μ1 dan μ2 dan varians σ12 dan σ22 ,
Page | 20
normal dengan rata-rata dan varians sebagai berikut:
Sehingga:
Nilai statistik (sampel) dari proporsi adalah , sedangkan nilai parameter (populasi) adalah P.
= x/n
di mana :
x : jumlah / anggota sampel
n : jumlah sampel
Proporsi sampel merupakan variabel acak dan distribusi probabilitas sehingga disebut distribusi
sampling p.
Untuk menentukan hubungan proporsi sampel perlu p dengan proporsi populasi P, kita : nilai
memahami sifat-sifat distribusi sampling standar , dan yang diharapkan , deviasi
Page | 21
Nilai yang diharapkan p, seluruh nilai kemungkinan p, sama dengan proporsi populasi P.
E( )=P
di mana :
P : proporsi populasi
N–1 n
σ p= P ( 1-P )
Dapat kita lihat bahwa perbedaan kesalahan baku proporsi terbatas dan tidak terbatas
Page | 22
Seperti rata-rata sampel x , perbedaan antara kesalahan baku populasi terbatas dan
populasi tak terbatas menjadi diabaikan jika ukuran populasi terbatas lebih besar dibandingkan
dengan ukuran sampel. Jika populasi terbatas dengan n/N <= 0.05 , kita tidak perlu menggunakan
faktor koreksi . Sedangkan jika populasi terbatas dengan n/N > 0.05 maka kita menggunakan
faktor koreksi. Kita menggunakan kesalahan baku proporsi mengacu pada standar deviasi .
Z= -P
σp
sampel = x/n. Sampel acak sederhana dari populasi besar, nilai x adalah variabel
acak binomial . Karena n merupakan konstan, probabilitas dari x/n sama dengan
probabilitas dan probabilitas untuk tiap nilai x/n sama dengan probabilitas x.
Distribusi sampling diperkirakan oleh distribusi normal di mana ukuran sampelnya besar
dan terdapat dua kondisi :
np >= 5 dan n(1-P) >=5
,standar deviasi sampel s, dan proposi sampel dapat digunakan sebagai titik
Page | 23
menggunakan titik penduga , statistik harus memeriksa apakah statistik sampel menunjukan sifat
yang berkaitan dengan titik penduga yang baik.
Karena beberapa sampel statistik yang berbeda dapat digunakan sebagai poin estimasi
untuk beberapa parameter populasi, kita menggunakan notasi umum berikut dalam bagian ini:
Notasi adalah surat yunani theta, dan notasi disebut “theta-hat”. Umumnya,
mewakili setiap populasi parameter seperti populasi mean, populasi standar deviasi , populasi
proporsi, dan lainnya.
5.1 Unbiased
Unbiased Estimators : jika nilai yang diharapkan dari statistik sampel adalah sama dengan
parameter populasi yang diperkirakan.
Dimana
Gambar 7.1 menunjukkan unbiased dan biased titik penduga. Di dalam ilustrasi tersebut
menunjukkan objektif penduga, mean dari distribusi sampling adalah sama dengan nilai
Page | 24
hal ini, karena kadang-kadang nilai estimator titik mungkin kurang dari dan
lainnya kali itu mungkin lebih besar daripada . dalam hal ini dari penduga bias,
mean dari distribusi sampling kurang dari atau lebih daripada nilai parameter populasi. Ilustrasi
di Panel B 7.10 , E ( ) lebih besar daripada .statistik sampel memiliki probabilitas hugh dari
melebih-lebihkan nilai dari parameter populasi. jumlah bias ditunjukkan dalam gambar
Dalam membahas distribusi sampling dari mean sampel dan proporsi sampel, kami
menyatakan bahwa E ( ) = dan E ( )=p. Dengan demikian, keduanya estimators objektif tentang
parameter populasi yang berhubungan.
Dalam hal ini standar deviasi sampel s dan varians sampel , dapat
sampel , adalah penduga yang tidak bias dari varians populasi . Pada kenyataannya, ketika kita
pertama kali presenteed rumus untuk varians sampel dan standar deviasi sampel,n-1 daripada n
Page | 25
menggunakan n-1 daripada n adalah untuk membuat sampel varians estimator bias dari varians
populasi.
Gambar 7.11 menunjukkan distribusi sampling dari dua penduga titik bias, 1 dan 2 .
Perhatikan bahwa kesalahan baku, 1 kurang dari kesalahan baku 2. dengan demikian, nilai dari 1
titik 1 kurang dari kesalahan baku estimator titik 2, 1 relatif lebih efisien
konsistensi.Estimator titik konsisten jika estimator titik cenderung menjadi lebih dekat dengan
parameter populasi sebagai ukuran sampel menjadi lebih besar. Dengan kata lain, ukuran sampel
baik daripada ukuran sampel yang kecil. Perhatikan bahwa untuk rata-rata sampel ,
Page | 26
Karena berkaitan dengan ukuran sampel sehingga ukuran sampel besar
cenderung untuk memberikan estimasi titik lebih dekat dengan populasi berarti .
Dalam hal ini, kita dapat mengatakan bahwa rata-rata sampel adalah estimator
konsisten dari mean populasi . Menggunakan alasan serupa, kita juga dapat
menyimpulkan bahwa propotion sampel adalah estimator konsisten dari proporsi populasi p.
6. Metode Sampling
Page | 27
Di dalam Stratified Random Sampling, elemen dalam populasi yang pertama dipisahkan
menjadi kelompok yang disebut strata sehingga setiap elemen di populasi milik satu dan hanya
satu stratum. Dasar membentuk strata seperti departemen, lokasi, umur, tipe industry, dll adalah
kebijaksanaan pembuat sample. Hasil yang terbaik diperoleh ketika elemen-elemen dalam setiap
stratum hampir sama. Berikut adalah diagram populasi yang memisahkan ke dalam H strata.
Populasi
Populasi
Setelah strata terbentuk, simple random sampel diambil dari setiap stratum. Rumusnya
adalah dengan mengkombinasi hasil individu stratum sampel ke satu elemen yang diestimasi dari
kepentingan populasi parameter. Nilai dari stratified random sampling bergantung pada
bagaimana homogennya elemen dalam starata. Jika elemen dalam starata menyerupai, starata
akan memiliki selisih yang rendah/ sedikit. Jika staratanya homogen, stratified random sampling
akan memberikan hasil yang tepat seperti simple random sampling dengan menggunakan total
ukuran sample yang kecil.
Jika kondisi populasi mengandung sejumlah katagori yang berbeda, maka kerangka
sampel dapat diorganisasikan dengan menggunakan katagori ini ke dalam strata yang terpisah.
Sampel kemudian dipilih masing-masing stratum secara terpisah untuk membuat stratum
berstrata. Ukuran sampel biasanya proporsional dengan ukuran relatif strata. Sekalipun demikian
semua varian berbeda secara signifikan diantara strata. Semua ukuran sampel harus dibuat seara
proporsional terhadap
Page | 28
standar deviasi stratum. Stratifikasi yang tidak proporsional dapat saja menghasilkan presisi yang
Di dalam cluster sampling, elemen dalam populasi adalah yang pertama dipisahkan
kedalam grup yang disebut cluster. Setiap elemen dalam sample cluster membentuk sebuah
sampel. Cluster sampling cenderung memberikan hasil yang baik ketika elemen dalam cluster
tidak menyerupai. Nilai dari cluster sampling bergantung pada bagaimana perwakilan setiap
cluster dalam seluruh populasi. Jika semua cluster sesuai, sampling cluster yang kecil akan
memberikan estimasi yang baik bagi populasi parameter. Umumnya cluster sampling
membutuhkan ukuran sampel yang besar daripada simple random sampling/stratified random
sampling tetapi hal tersebut dapat menghasilkan penghematan biaya karena pada faktanya ketika
interviewer dikirimkan ke sample cluster, banyak observasi sample yang dapat diperoleh dalam
waktu singkat. Tujuan pokok menggunakan metode ini ialah untuk mengurangi biaya dengan cara
Populasi
Dalam beberapa situasi sampling terutama dengan populasi besar akan memakan waktu
untuk memilih sebuah simple random sampel dengan mencari
Page | 29
nomor secara acak dan menghitungnya atau mencari sepanjang daftar populasi sampai elemen
yang sesuai ditemukan. Alternatif untuk simple random sampling adalah systematic sampling.
Contoh jika sampel ukuran 50 yang diinginkan dari populasi yang terdiri dari 5000 elemen, kita
akan membuat sampel 1 elemen untuk setiap 5000/50=100 elemen dalam populasi. Systematic
sample untuk masalah ini melibatkan pemilihan acak salah satu dari 100 elemen pertama dari
daftar populasi. Elemen sampel yang lain akan di identifikasikan dengan memulai elemen sampel
pertama dan memilih setiap 100 elemen yang ada di daftar populasi. Sebenarnya, sampel dari 50 di
identifikasi dengan memindahkan secara sistematik ke populasi dan mengindentifikasi setiap 100
elemen setelah pertama kali pemilihan acak elemen. Sampel dari 50 akan lebih mudah untuk di
identifikasi dengan cara ini daripada jika simple random sampling digunakan. Karena elemen
pertama dipilih secara acak, sample systematic seringkali diasumsikan memiliki sifat dari simple
random sampling. Asumsi ini terutama berlaku ketika daftar elemen di populasi adalah urutan
acak elemen.
Metode Sampling dibahas sejauh ini disebut dengan teknik probability sampling. Elemen
yang dipilih dari populasi yang diketahui sebagai probabilitas dalam sample. Keuntungan dari
sample probabilitas adalah distribusi sampelnya sesuai dengan stastik sampel yang dapat di
identifikasi. Formulanya dengan salah satu sampel random sampling yang disajikan dapat
digunakan untuk menentukan sifat dari distribusi sample sehingga dapat digunakan untuk
membuat probabilitas tentang kesalahan yang terkait dengan penggunaan hasil sampel untuk
membuat kesimpulan populasi.
menggunakan teknik inidilakukan dengan cara memilih unit-unit analisis yang dianggap sesuai
keseluruhan, metode ini merupakan cara mudah dalam pemilihan sampel. Contoh seorang
reporter ingin mengambil sampel dari 2/3 anggota dewan untuk mendapatkan opini umum yang
mewakili semua anggota dewan. Tetapi kualitas hasil sampel tersebut tergantung pada penilaian
orang-orang yang dipilih menjadi sampel sehingga diperlukan kehati-hatian dalam menarik
kesimpulan yang didasarkan pada penilaian sampel untuk digunakan dalam membuat kesimpulan
populasi.
Teknik judgement/ penelitian atau dikenal juga sebagai teknik penarikan sampel purposif
ini dilakukan dengan cara memilih sampel dari suatu populasi didasarkan pada informasi yang
tersedia serta sesuai dengan penelitian yang sedang berjalan, sehingga perwakilannya terhadap
populasi dapat dipertanggungjawabkan. Teknik ini digunakan terutama apabila hanya ada sedikit
orang yang mempunyai keahlian (expertise) di bidang yang sedang diteliti.
Keuntungannya ialah unit-unit yang terakhir dipilih dapat dipilih sehingga mereka
mempunyai banyak kemiripan. Kerugiannya ialah memunculkan keanekaragaman dan estimasi
terhadap populasi dan sampel yang dipilihnya.
Page | 31
Istilah-Istilah
Parameter karakteristik numerik dari populasi, seperti rata-rata populasi µ, standar deviasi
populasi σ, proporsi populasi p.
Sampel acak sederhana Populasi terbatas: sampel yang dipilih dimana tiap ukuran sampel n
memiliki kemungkinan yang sama untuk terpilih. Populasi tidak terbatas: sampel yang dipilih
dimana tiap bagian berasal dari populasi yang sama dan element tersebut dipilih secara bebas.
Sampling dengan penggantian element yang sudah terpilih dari suatu sampel, tidak bisa dipilih
kembali saat pengambilan berikutnya.
Sampling dengan penggantian element yang sudah terpilih dari suatu sampel, bisa dipilih kembali
pada pengambilan berikutnya.
Sampel statistik sebuah karakteristik sampel, seperti sampel rata-rata, sampel standar deviasi,
sampel proporsi. Nilai dari sampel statistic digunakan untuk mengestimasi nilai parameter
populasi.
Titik estimator sampel statistic seperti x bar, standar deviasi, atau p topi, menyediakan titik
estimasi dari parameter populasi.
Titik estimasi nilai dari titik estimator yang digunakan sebagai contoh tertentu dalam perkiraan
parameter populasi.
Distribusi sampling distribusi kemungkinan yang terdiri dari seluruh nilai sampel statistic.
P
a
g
e
3
2