Anda di halaman 1dari 12

Two Sample Test of Hypothesis

Langkah-langkah menyusun (tes) hipotesis :


1. Rumusin null hipotesis (Hipotesis 0) => terima / tidak terima kondisi
2. Pilih level significance => 0.1, 0.05, 0.025, 0.01, 0.005, 0.0005
3. Tentukan tes statistic = Z-Test (Untuk std.deviasi diketahui) & t-test (Untuk
std.deviasi tidak diketahui) => *Jumlah sampel harus >= 30
4. Tentukan ukuran keputusan (decision rule) = One Tailed (Untuk klasifikasi
lebih besar atau kecil “< / >” atau bisa Termasuk atau tidak) DAN Two
tailed (Untuk klasifikasi range tertentu)
5. Untuk nilai critical value ada di appendix buku

Variance=
∑ ( x−x ' )2
n−1
σ (std .dev )=√ Variance

Simple linear regression


Koefisien korelasi => Ukuran kekuatan hubungan linier antara 2 (dua) variable.
*Nilai 1.00 (Baik +1.00 atau -1.00) merupakan korelasi sempurna (perfect
correlation)
*Analsis korelasi digunakan untuk mengukur hubungan antar variabel (Variabel Y
dengan Variabel X)
Gambaran hubungan korelasi

Nilai koefisien Nilai koefisien

Karakteristik korelasi koefisien:


1. Menunjukan arah dan kekuatan hubungan linear diantara dua variabel berskala
interval atau rasio
2. Bernilai dari -1 sampai +1
3. Kalau nilai 0 artinya tidak ada hubungan dari variable
4. Nilai mendekati “+1” artinya punya Hubungan Positif dari variable-variabelnya
5. Nilai mendekati “-1” artinya punya Hubungan Negatif dari variable-variabelnya

r = Koefisien korelasi
x-x’ = Setiap data populasi kelompok 1 – rata” kelompok 2
y-y’ = Setiap data populasi kelompok 2 – rata” kelompok 2
n (df) = jumlah populasi
Sx = Standar dev. Populasi kelompok 1
Sy = Standar dev. Populasi kelompok 2

APABILA NILAI KOEFISIEN KORELASI KURANG SIGNIFIKAN (di bawah 0,5) = umum di
akalin variablenya entah di LOG, PANGKAT, AKAR, dst… => tujuannya biar korelasinya
kuat

*Konsep regresi = Konsep persamaan garis lurus


Di mana nilai Variabel dependen (Y) ditentukan oleh besar nilai sumbu X (Variabel
independent di koordinat kartesius => Y=Mx +C
*Ini rumus mencari a

Standard Error Of Estimates => Melihat sebaran titik-titik di sepanjang garis lurus regresi

 semakin MENCAR di garis regresi maka nilai standar error makin besar =>
dampaknya persamaan garis lurus regresi tidak bisa dipakai
 semakin RAPAT di garis regresi maka nilai standar error makin kecil =>
dampaknya persamaan garis lurus regresi sangat mencerminkan (bisa dipakai)
 Nilai korelasi dengan Standard Error Of Estimates BERBANDING TERBALIK
o Semakin mendekati 1, maka korelasi semakin kuat dimana Standar error
semakin kecil atau mendekati nol

Koefisien Determinasi (R2 )

*Seberapa besar (dalam persen) Variabel Independen (X) menyumbang anasir


ke dalam variable Dependen (Y) SEHINGGA bisa merubah nilai Y Head (di
persamaan regresi)
* Dinotasikan dengan persentase => 57,6 persen(%) variasi jumlah mesin fotokopi
yang terjual telah dijelaskan, atau diperhitungkan oleh variasi dalam jumlah
panggilan penjualan

*Rumus koefisien determinasi:


2 2
R =Standard error estimates

Analisis regresi yang di ANOVA-kan (Analysis Of Variance) => ANOVA Sum square

Gambar.1 Nama lain korelasi-regresi yang di ANOVA-kan

Gambar.2 Tabel ANOVA

Sum Square Regression (SSR) = SS kolom 1

Sum Square Error Estimates (SSE) = SS kolom 2


Sum Square total = SSR + SSE
Multiple Linear Regresion

* Varians-nya dihitung dihitung beda tipis (Sum Square) tapi ditambah partial
differentiation
* Biasanya merujuk langsung ke table hasil analisis ANOVA-nya

K : Number of degree of freedom (Jumlah


Variabel Independen)
Residual or : Banyaknya variasi yang tidak dapat
error dijelaskan oleh variabel dependen (Y)
=> Dihitung dari selisih hasil regresi
(Y Head) dengan nilai Y sebenarnya
(actual)
Total (n-1) : Banyaknya sampel => dihitungnya
n+1

Daftar rumus yang sama dengan simple linear regression:

*Seberapa besar (dalam persen) Variabel Independen (X) menyumbang anasir ke dalam
variable Dependen (Y) SEHINGGA bisa merubah nilai Y Head (di persamaan regresi)
*Seberapa KUAT (dalam persen) Variabel Independen (X) berhubungan dengan variable
Dependen (Y)

Mengetes apakah kelompok Variable Independent (X) dapat menjadi bahan


penelitian / menjelaskan Variabel Dependen (Y) => (Global Testing);

 Menguji apakah variabel independent (k) benar-benar dapat memberi


perhitungan ke variabel dependen => Dilakukan dengan F-test statistics
 F-test statistics => menguji apakah koefisien variabel independent (korelasi
koefisien dari variable independent) tidak bernilai “0” => Jika variabel
independent = “0” berarti variabel independen tertentu ini tidak ada
nilainya dalam menjelaskan variasi apa pun dalam nilai dependen
 F-statistik menguji hipotesis nol dasar bahwa dua varian atau dua kuadrat
rata-rata sama.

 Sifat-sifat F-stat sama dengan hypothesis testing “T-Stat” untuk two tailed
dan “Z Score” untuk one tailed, yang bedakan :

Simple linear;
Meng-uji signifikansi gradien
persamaan regresi => biasa dipake
kalau hasilnya < 0,5 => dipake
untuk mengukur masih relevan
kah? persamaan regresi ini

Hypothesis testing

Multiple linear;
Menguji validitas pilihan Variabel
Independen => harus dipastikan
variabel independent (Y)
MENGUBAH (entah nambah atau
ngurang) nilai Variabel Dependen
 Nilai critical value bisa dilihat sesuai banyaknya degree of freedom (df) di
sebaran tabel-t (t-distribution)

Mengevaluasi koefisien regresi masing-masing variable independent (X) =>


Individual testing

 Digunakan untuk mengetahui sifat hubungannya dengan nilai Y head di


persamaan regresi apakah minus (berbanding terbalik) atau positif
(berbanding lurus)
 Kalau “0” ya ngga perlu dimasukan
 Sama dengan uji barengan (Global test) nilai critical bisa dilihat dari degree
of freedom (df)

t (Nilai ciritical)
Bi / Coeff : Koefisien di tabel analisis regresi
Sbi / SE Coeff : Standar deviasi koefisien di di tabel analisis regresi

Asumsi multiple linear regression:


I. Ada hubungan linier antara variabel dependen dengan variabel
independent
II. Beda residual (Y Aktual dengan Y head) tidak berpengaruh =>
Apapun varians dari nilai hasil variabel dependen (Y) dari persamaan
regresi (Y Head) harus KONSTAN / SAMA mau besar atau kecil
(Kondisi HOMOKEDASTISITAS).
III. Residual mengikuti persebaran distribusi normal => Minimal harus
30 pengamatan (jumlah sample)
IV. Salah satu variabel independent (X) tidak boleh berkorelasi
(memiliki hubungan) => Kalau antar variabel independent (X)
mempunyai hubungan baik positif maupun negatif karena berkorelasi
dengan variabel dependen (Y) ini disebut kondisi Multikolinearitas
=> Dampaknya salah satu variabel X akan “boros” dalam
menjelaskan variasi variabel Y

*Aturan umum untuk menghindari mulitikolinearitas adalah dengan


hati-hati memilih variabel independent yang ditandai dengan nilai
korelasi antar variabel independent harus diantara -0,7 sampai
+0,7 (jangan mendekati -1 atau +1) atau menggunakan tes Variance
Inflation factor (VIF);

*Contoh VIF :
Berikut matriks korelasi (table nilai koefisien korlasi antar variabel
{Dependen dan Independen});

Area yang disorot menunjukkan korelasi antara variabel independent


(Temp, insul, age). Tak satu pun dari korelasi antara variabel
independen melebihi -0,70 atau +0,70, jadi tidak ada dugaan masalah
dengan multikolinearitas. Korelasi terbesar di antara variabel bebas
adalah 0,486 antara umur dan suhu, untuk memastikan diperlukan
perthitungan VIF di masing-masing variabel independent ((Temp,
insul, age)=> Dimisalkan Temp jadi variabel Dependen dan insul
dan age jadi variabel Independen, berikut hasil table korelasi :
Masukan ke persamaan rumus VIF:
1 1
VIF= = =1,32
1−R 1−0,241
2

*1,32 kurang dari 10, sehingga tidak ada masalah variabel “temp”
dijadikan variabel independent => berikutnya tinggal diulangin buat
insul danage

V. Nilai Residual independent


Ini berarti bahwa tidak ada pola untuk residu, residu tidak berkorelasi
tinggi, dan tidak ada jangka panjang residu positif atau negatif. Ketika
residu berturut-turut berkorelasi atau autokorelasi => sering terjadi
ketika data dikumpulkan selama periode tertentu waktu => tes
untuk mengetahui autokorelasi pakai Durbin-Watson test

Variabel dummy => Digunakan untuk memasukan data kualitatif


dimana hanya akan direkam dalam 2 (dua) nomor, yaitu 1 dan 0;

KESIMPULAN:
Langkah-langkah untuk memulai multiple linier regression;
I. Tentukan matriks korelasi antar variable independent
a. Tes multikolinieritas
II. Analisis output analisis regresi dan ANOVA
a. Kembangkan persamaan regresi
b. Lihat korelasi koefisien (Multiple R)
i. Positif atau negatif
c. Lihat koefisien determinasi (R-square)
i. Seberapa persen (%) variable-variabel independent
menyumbang nilai variable dependen (Y head)
d. Lihat koefisien determinasi yang di-adjust (R-Square adj)
i. Seberapa kuat hubungan variable independent dengan
variable dependent (Y Head)
III. Tes global untuk cek komponen persamaan regresi dan tes
koefisien individu;
Urgensi tes global
a. Menghindari nilai “+0 atau – 0” di persamaan regresi karena
tidak mempengaruhi nilai variable dependen (Y Head)
b. Melihat signifikansi variable independent apa diperlukan atau
tidak
Urgensi tes koefisien individu
a. Mengetahui besaran koefisien (baik nambah atau ngurang)
IV. Tes-tes asumsi regresi linier
a. Plot linier (persamaan linier)
b. Homokedastisitas
c. Multikolinieritas
d. Autokorelasi

Pengantar Ekonometrik

*Metode untuk menyusun persamaan regresi berganda (multiple linier) tanpa output
hasil mesin di table analisis ANOVA (Melihat koefisien)

1. Metode OLS (Ordinary Least Square) => Kuadrat terkecil


*OLS digunakan dengan menurunkan masing-masing variabel independent
dan Intersep persamaan (a)

2. Metode MLE (Maximum Likelihood Estimation)

Anda mungkin juga menyukai