DISTRIBUSI SAMPLING
µp= p
𝑃(1 − 𝑃)
−
αp= √
𝑛
Dalam membuat estimasi harga parameter populasi, seyogianya variable random harga
statistik sampel tidak bervariasi terlalu jauh dari harga parameter populasi yang konstan.
Statistik penduga sedemikian itu umumnya dinilai sebagai penduga yang baik jika memiliki 3
ketentuan yakni :
2. Efisien
Distribusi penduga harga statistik sebaiknya terpusat atau mempunyai deviasi standar
yang kecil sekali.
3. Konsisten
Secara kasar penduga yang kosisten merupakan penduga yang bekonsentrasi secara
sempurana pada parameter jika besarnya sampel bertambah secara tak terhingga3
Jika besarnya sampel menjadi tak terhingga, penduga harga statitistik yang
konsisten harus dapat memberi suatu pendugaan titik secara sempurna terhadap harga
parameter. Secara matematis, harga statistik dapat merupakan penduga yang konsisten
bila dan hanya bila E (harga statistik –harga parameter) sama dengan nol.
4
Ad 2 Dalam pendugaan titik , harga parameter hanya diduga dengan satu harga yakni
harga statistik sampelnya.
Untuk menduga harga mean populasi akan kita dasarkan pada pengertian kita tentang
adanya distribusi sampling harga mean (sampling distribution of the means) dengan sifat-
sifatnya yakni : mempunyai mean sama dengan mean populasinya, mempunyai deviasi
standar ( standard error of the means) sama dengan dan mendekati distribution normal n
> 30.
Bila sampelnya besar ( n> 30), pendugaan dapat dilakukan sebagai berikut :
Kalau kita ingin menduga harga proporsi populasi , maka perlu dipikirkan adanya
distribusi sampling harga proporsi. Apabila populasinya sangat besar dan proporsi P
tidak terlalu dekat dengan 0 ataupun 1 , maka distribusi sampling harga proporsi ( p atau
𝑥
) akan mendekati distribusi normal dan mempunyai mean sama dengan proporsi
𝑛
populasinya ( p = P) daj mempunyai deviasi standar .
Apabila diambil daerah 95% di tengah , batas luas daerah ini adalah Z1 = -1,96 dan Z2=
1,96
Dua mean populasi yang tidak diketahi tersebut dapat dibandingkan dengan menduga
perbedaan 1 - 2 . dimana bila sampel-sampelnya besar distribusi tersebut dianggap
𝛼 𝛼
mendekati distribusi normal dengan mean = 1 - 2 dan deviasi standar = √𝑛 + 𝑛
Untuk menduga besarnya kita harus memhami adanya distribusi sampling harga
deviasi standar dengan sifat-sifatnta . pabila populasinya normal dan sampel besar ,
distribusi sampling harga S diabggap mendekati distribusi normal dengan mean =
𝛼
Deviasi standar =
√2𝑛
Tetapi bila populasinya relatif kecil dibandingkan dengan sampelnya atau bila sampel
random dipiliih populasi yang terbatas tanpa pengembalian.
√𝑁−𝑛
Faktor koreksi Harus diperhtaikan dalam hal pendugaan harga parameter 6
√𝑁−1
BAB VII
UJI HIPOTESIS
A. PENDAHULUAN
Cara yang demiklian dengan sednirinya tidakk dapat memberikan kepastian tentang
hakikat benar atau tidaknya hipotesis tersebut. Sehingga pengambilan keputusn dengan prosedir
yang demikian kita menghahaspi dua kemungkinan membuat kesalhan yakni :
Kesalahan yang kita perbuat apabila kita menolaj hipoteis yang pada hakikatnyab benar
Kesalahan yang kita perbuat apabila kita menerima hipotesis yang pada hakikatnya salah.
B. KESALAHAN TIPE I
Kesalahan tipe 1 adalah kesalahan yang terjadi karena kita menyalahkan hipotesis yang
benar. Hal ini dapat terjadi antara lain karena terdapat kesaalahan didalam mengumpulkan data .
probabilitas kesalahan tipe I sering disebut alpha . biasnya alpha ini yang sebagai pedoman
menguji hipoteis. Bila probabilitas terjadi dalam mengambil sampel yang benar = 5% maka
alpha = 0,05 dan probabilitas memperoleh sampel yangbenar = 0,95
C. KESALAHAN TIPE II
Kesalahan tipe II karena kita menerima hipotesis yang salah, hipotesinya salah tetapi
masih ada peluang untuk tidak menolak hipotesiitu dengan probabilitas sebesar .
Untuk harga n tertntu apabila aplha ditentukan harganya mka bisa ditetukan. Apabila
aplhadiperkecil harganya , maka menjadi besar. Untuk memperkecil harga kedua-duanya (
dan ) maka n (ukuran sampel) harus diperbesar.
Hipotesis statistik yang akan diuji dinamakan hipotesis nihil . karena formulasinya ini
akan memperngaruhi perhitungan-perhitungan yang dilakukan dalam uji hipotesis. Maka
hipotesis nihil harus dinformasikan sedemikian rupa sehingga probabilitas ajan berbuat
kesalahan bisa dihitung dan memungkinkan pula melakukan perhitungan-perhitungan dalam
uji hippotesis tersebut.
1. H1 yang mengatakan bahwa harga paraneter tidak sama dengan harga harga yang
dihipotesiskan
2. H1 yang mengatakan bahwa harga parameter lebih besar dari harga yang dhipotesiskan
3. H1 yang mengatakan bahwa harga parameter lebih kecil dari yang dihipotesiskan.
1. formulasi H0 dan H1 .
3,rule of test
4. perhitungan nilai Z
1. formulasi H0 dan H1 .
3,rule of test
4. perhitungan nilai t
Apabila dua sampel yang digunakan untuk menguji hipotesis nihil bahwa 1 = 2,
menunjukan hasil hasil observasi yang berpasangan , adalah observasi pertama dari sampel
pertama , observasi dari sampel kedua dan seterusnya maka hipotesis ini bisa diuji dengan
menggunakan perbedaan anatra harga-hgarga yang berpasangan itu.9
Langkah-langkah dalam pengujian hipoteis ini hampir sama saja dengan yang telah
dijelashkan di muka. Perbedaannya ahnya pada langkah 4 dari hasil observasi dohitung ilai t
𝐷
dengan rumus : t=
𝑆𝑑 / √𝑛
BAB VIII
UJI CHI-SQUARE
A. Pengujian Hipotesis Mengenai Proporsi (k > 2)
(nij−en)
X2 = ∑2𝑖−1 ∑𝑘𝑗−1
𝑒11
10
X20,05 X2
B.ANALISIS TABEL r x k
C. UJI INDEPENDENSASI
Apabila individu suatu populasi dapat diklarifikasikan dalam dua variabel
(kategori) , tiap-tiap kategori dapat terdiri dari beberapa alternatif.Kemudian kita ingin
menguji H0 apakah kedua variabel tersebut independen.Untuk menguji H0 tersebut
kemudian diambil suatu sampel , individu-individu dalam sampel tersebut
diklarifikasikan dalam ‘two way classification”
TABEL KONTIGENGSI
VARIABEL 1
A1 A2 A3 AK Jumlah
: : : :
: ..................... :
:
: : : ..................... : :
11
11
4. Perhitungan
X2 = ∑r𝑖=𝑗 ∑𝑘𝑖=𝑘
(nij – eij)2
eij
dimana eij = (nij – eij)
n
5. Kesimpulan : Apakah H0 diterima atau H0 ditolak
BAB IX
Persoalan yang kita hadapi adalah pengujian hipotesis berdasarkan hasil penyelidikan
lebih dari dua buah sampel. Sebagai gambaran misalnya akan kilta selidiki apakah perbedaan
mean dari sampel pertama, dengan yang dari sampel kedua , ketiga dan seterusnya itu
disebabkan oleh faktor yang kebetulan saja (chance) ataukah oleh faktor lain yang benar-benar
berarti (significant).
Hipotesis nihil yang akan diuji mengatakan bahwa mean dari lebih dari dua populasi
normal adalah sama. Asumsinya bahwa variance (deviasi standar kuadrat) dari populasi-populasi
itu sama.
Prinsip yang digunakan sebagai dasar dalam melakukan pengujian hipotesis ini adalah
apabila mean dari kelompok bagian sangat berbeda satu dengan yang lain, maka variance
kombinasi dari seluruh kelompok akan jauh lebih besar dari variance masing-masing kelompok
bagian.
k = banyaknya sampel
X= over all mean , atau grand mean yakni mean dari semua observasi.12
Apabila mean populasi tersebut tidak sama maka variance between means akan jauh lebih besar
daripada variance within group. Distribusi sampling harga statistik F yang didefinisikan sebagai
: F = variance between means
1. hipotesis : Ho : 1=2=...............=1
12
Djarwanto, Pangestu . Edisi 5. Statistika Induktif. Yogyakarta
H1 : 1=2=................=k
1. H0 1=2=3 = 0
HO Tidak ada perbedaan hasil kerja antara mesin-mesin dapat diterima pada =0,05 (2,51<4,26)
HO Tidak ada perbedaan hasil kerja antara pekerja-pekerja ditolak pada = 0,05 (4,34 >4,26)
Ho bahwa tidak ada efek interaksi anatar mesin dan pekerja, dapat diterima pada =0,05
(1,95<3,63)
13
Djarwanto, Pangestu . Edisi 5. Statistika Induktif. Yogyakarta
Kita ingin menguji bahwa variance dua populasi adalah sama, untuk menguji dari masing-
masing populasi diambil sampel dan kemudian dihitung variance-nya:
2
S1 = variance dari sampel 1 dengan n1 individu
2
S2 = variance dari sampel 2 dengan n2 individu
Langkah-langkah pengujiannya :
1. Menentukan komposisi Ho dan H1
2.dipilih level of significance tertentu (0,05 atau 0,01)
3. kriteria pengujian
4.Perhitungan nilai F
5.Kesimpulan :
a. Ho tidak ada perbedaan hasil kerja anatara mesin-mesin , dapat diterima pada = 0,05
(2,51<4,26)
b.Ho tidak ada perbedan hasil kerja antara pekerja-pekerja ditolak pada = 0,05 (4,34>4,26)
c.Ho bahwa tidak ada efek interaksi antara mesin dan pekerja , dapat diterima pada = 0,50
(1,95<3,63)
BAB X
REGRESI LINEAR
A.PENDAHULUAN
Tujuan utama dari kebanyakan penyelidikan statistik dalam dunia bisnis dan ekonomi
adalah mengadakan prediksi(ramalan). Misalnya ramalan tentang pasar potensil dari produk
baru.Berdasarkan prediksi yang didasarkan pada keterangan statistik pengusaha dan ahli
ekonomi dapat mewujudkan ramalannya dengan probabilitas dan ahli ekonomi dapat
mewujudkan ramlannya ratanya mendekati kenyataan.apabila mungkin para ahli bermaksud
untuk menyatakan hubungan antara variabel-variabel yakni hubungan antara variabel yang telah
diketahui dengan variabel yang akan diramlkan, dalam bentuk persamaan matematis.14
Pendekatan yang demikian telah berhasil baik dalam ilmun pengetahuan alam. Misalnya
temperatur yang konstan, hubungan anatara volume suatu gas (Y) dan tekanan/desakannya (X)
𝒌
dapat dinyatakan dengan formula. Y =𝑿
Dimana k adalah bilangan konstan . Dalam ilmu ekonomi misalnya persamaan yang sederhana
dan luas penggunaannya untuk menunjukan hubungan variabel-variabel adalah persamaan
linear. Y= a+bX diturunkan dari model Y= +X + . a dan b bilangan konstan.
Di dalam persamaan linear , hubungan anatara dua variabel bila digambarkan secara
grafis (dengan scatter diagram) semua nilai X dan Y yang sesuai dengan persamaan Y =a+bX
akan jatuh pada suatu garis lurus . garis tersebut yang dinamakan regression line (garis regresi).
Sebenarnya hubungan antara dua variabel itu ada dua tipe yakni :
1. hubungan functional
2. hubungan regressional
Dikatakan ada hubungan functional bila ada true value of Y untuk tiap-tiap kemungkinan
nilai X dan sebaliknya. Hubungan ini kebanyakan dijumpai di dalam ilmu pengetahuan alam.
𝑘
Misalnya Y = 𝑥 k
k= bilangan konstan
X= tekanan/desakan
Dikatakan ada hubungan regressional bila tidak ada true value of Y untuk tiap nilai X
dan sebaliknya. Untuk tiap nilai X ada banyak nilai Y selama Y tersebut tidak sepenuhnya
ditentukan oleh X. Begitu pula sebaliknya.
Persamaan linear banyak kegunaannya dan penting, tidak hanya karena terdapatnya
banyak hubungan dalam bentuk tersebut,tetapi juga karena sering digunakan dalam pendekatan
untuk hubungan-hubungan yang kompleks dan sukar digambarkan.
Untuk memberi gambaran persoalan membuat garis lurus (straight line) dari sekumpulan
data hasil observasi dari variabel X dan Y .
14
Djarwanto, Pangestu . Edisi 5. Statistika Induktif. Yogyakarta
1. metode Free Hand
Pada cara ini garis regresi yang berupa garis lurus dibuat dengan dikira-kira berdasarkan
perasaan saja. Tentu saja garis regresi yang dihasilkan terpengaruh oleh unsur subjektif dari
pembuatnya oleh karena itu kurang cermat.
Metode least squares berusaha membuat garis yang mempunyai jumlah selisih (jarak
vertikal) kuadrat antara data dengan garis regresi yang terkecil. Metode ini ditemukan oleh
Adrien Legendre seorang ahlimatemataika Perancis pada awal aba 19 .
pada contoh yang disebut jarak vertikal adalah selisih antara penjualan yang sebenarnya
dengan ramlan penjualan berdasar garis regresi. Adapun langkah-langkah untuk menyusun garis
regresi linear dengan metode least square ini sebagai berikut :
a. susunlah nilai-nilai dependent variabel (Y) dan independent variabel (X) yang kita miliki
sepasang-sepasang pada tabel.
a= bilangan konstan, yang merupakan titik potong dengan sumbu vertikal pada gambar kalau
niali X=0
C. REGRESI LINEAR
Kurva yang dibentuk oleh means dari distribusi yang digambarkan di muka, disebut
curve of means dan umurnya dinyatakan sebagai regression curve. Khusunya bila berbentuk
garis lurus disebut regression line, untuk menyatakan bahwa garis itu merupakan rata-rata Y
untuk nilai X tertntu maka lebih khususnya dinyatakan sebagai rgressiion line of Y on X
Oleh karena itu garis regresi ini merupakan ramalan, maka kota mengenal garis regresi
yang senyatanya , yakni yang terdiri dari rata-rata yang senyatanya dari Y untuk nilai-nilai X.
Dinyatakan dengan persamaan Y = +X sedangkan estimated regression line dinyatakan
’
dengan persamaan : Y = a + bX
Pendugaan tersebut hanya didasarkan pada sampel , oleh karenanya ada pengaruh faktor
kebetulan (chance variation) .
Konstanta a dan b yang diperoleh dengan metode least squares merupakan estimated
regression cofficents untuk dan (dinamakan true regression cofficients). Oleh karena itu
persamaan Y’ = 23,2 + 6,88X merupakan pendugaan dari garis yang menunjukan rata-rata first
year sales yang senatanya untuk nilainuji tertentu.
D.LIMITS OF PREDICTION
Untuk mengevaluasi ketelitian dari suatu pendugaan atau goodness dari suatu keputusan
kita harus mengetahui sesuatu tentang variabilitas dari populasi dari mana sampel kita ambil.
Variabilitas ini biasanya diukur dengan deviasi standar dari condition distribution dari Y untuk
nilai-nilai X tertentu.
Selama data yang dipergunakan semacam persoalan tersebut hanya terdiri dari nilai-nilai
Y yang sangat sedikit untuk nilai x tertentu kita akan menemui kesulitan untuk menduga deviasi
standar ini. Oleh karena itu kita beranggapan bahwa condituonal distributuion dayi Y untuk
nilai-nilai X tertentu, semuanya mempunyai deviasi standar yang sama.
∁𝑌𝑖 − 𝑌𝑖)
SYX = √∑𝑛𝑖=1 −
𝑛−2
Dari rumus tersebut di muka Y.X digunakan untuk nenyatakan bahwa kita menduga deviasi
standar senuatanya dari Y untuk nilai-nilai X tertentu. Sedangkan Syx dinamakan standartd error
of estimate. Jumlah kuadrat dibagi dengan-2 , oleh karena dua konstanta a dan b dihitung
berdasarkan data asli.
E. UJI HIPOTESIS
Pengujian hipotesis bukan mengenai garis regresinya tetapi mengenai nilai yaitu slope
dari garis regresi populasinya. Nilai statistik b ini akan bervariasi pada sampel-sampel yang
berbedaa (berbeda anatara sampel yang satu dengan sampel yang lain).15
Sepuluh salesmen seperti contoh dimuka hanyalah merupakan suatu sampel random yang
diambil dari suatu populasi tertentu. Dengan demikian garis regresi yang didapat adalah garis
regresi untuk sampel tersebut yang bisa dipandang sebagai estimate dari garis regresi
populasinya. Oleh karena estimate tersebut hanya didasarkan pada sampel, berarti mengandung
faktor kebetulan. Distribusi sampling nilai b tesebut dianggap berdistribusi normal dengan mean
= dan deviasi standar.
Hipotesis nihil yang akan diuji b=0 ,artinya tidak ada hubungan antara dua variabel.
Apabila n<30 maka distribusi sampling nilai b mengikuti distibusi nilai t dengan degres of
freedom n-2 sebaliknya untuk sampel distribusi nilai b akan mendkeati distribusi normal.
𝑏−𝛽
Sampel kecil : t =
𝑆𝑏
𝑏−𝛽
Sampel besar : z =
𝑆𝑏
Dimuka telah dijelaskan , berdasarkan huubungan dua variabel yang dinyatakan dengan
persamaan linear Y= a+bX kita dapat membuat prediksi tentang besarnya nilai Y (variabel
dependen_ berdasarkan nilai X (variabel independen).tidak hanya memperlihatkan satu variabel
yang mempengaruhi variabel independen. Yang lebih realitis adalah hubungan lebih dari dua
variabel karena sebenarnya hubungan antara variabe;-variabel kebanyakan merupakan hubungan
regresional artinya bahwa tidak ada nilai Y tertentu untuk nilai X trentu karena nilai Y tersebut
dipengaruhi oleh banyak variabel X. Analisis regresi linear untuk lebih dua variabel disebut
analisis regresi llinear beragnda (multipe linear regrsission) yang dinyatakan persamaan linear.
Dalam analisis regresi linear kadang-kadang terjasi bahwa variabel dependen tidak hanya
dipengaruhi oleh variabel yang dapat dinyatakan secara kuantitatif (seperti modal usaha,
pengalaman berusaha ,hasil usaha) tetapi juga dipengaruhi oleh variabel yang pada dasarnya
15
Djarwanto, Pangestu . Edisi 5. Statistika Induktif. Yogyakarta
bersifat/berbentuk kualitatif , atribut ataupun kategori(variabel dengan skala nominal seperti
jenis kelmin, agama,warna kulit , suku bangsa , jenis pekerjaan). 16
Analisis regresi sederhana atau berganda seperti yang telah dijelaskan di muka dapat
digunakan apabila salah satu, bebrapa atau semua variabel independennya berupa variabel
kualitatif atribut atau kategori (variabel dengan skala nominal).
Untuk variabel kulitatif , atribut atau kategori tersebut digunakan nomor kode 0 untuk
pengamatan yang masuk satu kategori dan nomer kode 0 untuk pengamatan yang masuk
kategori lainnya. Misalnya nilai 1 menunjukkan bahwa seseorang adalah laki-laki dan –
menunjukan perempuaannya atau 1 menunjukkan bahwa seseorang menganut agama islam dan 0
menunjujjkan bahwa seseorng non islam ; atau 1 menunjukkan bahwa seseorang petani menjadi
anggota KUD dan 0 menunjukkan bukan anggota KUD dan seterusnya.
Variabel yang mengambil nilai seperti 0 atau 1 tesebut disebut variabel dummy. Nama
lainnya ialah variabel binary atau variabel dichotomous.
Y= a+b1X1+b2X2+........+bkXk
Atau misalnya bahwa gaji seseorang karyawanan di perusahaan asing itu dipengaruhi oleh tahun
penglaman bekerja jenis kelamin dan warna kulit dapat digunakan model :
Y= a+b1X1+b2X2+...........+b3X3
16
Djarwanto, Pangestu . Edisi 5. Statistika Induktif. Yogyakarta