Nama Anggota :
2021
UJI REGRESI DAN UJI CHI SQUARE
A. UJI REGRESI
Pengertian Uji Regresi
Analisis regresi dalam statistika adalah salah satu metode untuk menentukan
hubungan sebab-akibat antara satu variabel dengan variabel yang lain. Variabel
"penyebab" disebut dengan bermacam-macam istilah, seperti variabel penjelas,
variabel eksplanatorik, variabel independen, atau secara bebas, variabel X (karena
seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel terkena
akibat dikenal sebagai variabel yang dipengaruhi, variabel dependen, variabel terikat,
atau variabel Y. Kedua variabel ini dapat merupakan variabel acak (random), namun
variabel yang dipengaruhi harus selalu variabel acak.
Analisis regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya.
Analisis regresi dipakai secara luas untuk melakukan prediksi dan ramalan, dengan
penggunaan yang saling melengkapi dengan bidang pembelajaran mesin. Analisis ini
juga digunakan untuk memahami variabel bebas mana saja yang berhubungan
dengan variabel terikat, dan untuk mengetahui bentuk-bentuk hubungan tersebut.
Definisi Regresi
Analisis Regresi
1. Pengertian Regresi
Persamaan regresi adalah sebuah persamaan yang menunjukkan hubungan linear
antara dua variabel. Regresi sederhana didasarkan pada hubungan fungsional
ataupun kausal antara satu variabel independen dengan satu variabel dependen.
Persamaan umum regresi linier sederhana adalah :
Y = a + bX
Dimana :
Y = Variabel terikat (variabel yang diprediksi)
X = Variabel bebas (variabel yang mempengaruhi variabel terikat)
a = Konstanta, secara grafik menunjukkan intercept.
b = Koefisien regresi yang menunjukkan besarnya pengaruh X terhadap Y, secara
grafik menunjukkan slope (kemiringan garis regresi)
2. Metode Pengukuran Regresi Sederhana
a. Least Square Method
Persamaan Normal :
Y =a+bX
Rumus :
ΣY =an+ b Σ X Σ XY =a Σ X +b Σ X 2
Atau
( Σ X 2) ( Σ Y )−( Σ X ) ( Σ XY )
a=
n Σ X 2−¿ ¿
b. Product Moment Method
Persamaan Normal :
Y =a+bX
2 Σ xy
Σ xy =b Σ X +b Σ X ataub= 2
Σx
Σ X ΣY
Σ xy =Σ XY − Σ x 2=Σ X 2−¿ ¿
n
ΣY ΣX
a= −b
n n
taraf nyata (α) dan nilai F tabel ditentukan dengan derajat kebebasan
v1 =k−1dan v 2=n−k
3. Menentukan nilai F statistic
SSR SSE
MSR= MSE=
df 1 df 2
2
SST =Σ Y −nY ²
SSR=b 1 Σ X 1 Y + b2 Σ X 2 Y
SSE=SST −SSR
4. Menetukan kriteria pengujian
2 b1 ∑ x 1 y +b 2 ∑ x 2 y
R=
∑ y2
Koefisien Korelasi Berganda (R)
b 1 ∑ x 1 y +b 2 ∑ x 2 y
R y .12=
∑ y2
Koefisien Korelasi Parsial (r)
Koefisien korelasi parsial merupakan koefisien korelasi antara dua variabel jikavariabel
lainnya konstan, pada hubungan yang melibatkan lebih dari duavariabel. Sebelum
koefisien korelasi parsial, dilakukan terlebih dahulu perhitungan koefisien korelasi
sederhana, yaitu:
n ∑ Y X 1− ∑ Y ∑ X 1
r y1=
√¿ ¿¿
n ∑ Y X 2−∑ Y ∑ X 2
r y2=
√¿¿¿
n ∑ X 1 X 2−∑ X 1 ∑ X 2
r y12=
√ ¿ ¿¿
r y 1−r y 2 r y 12
r y1.2 =
√(1−r y 2 ²)(1−r 12 ²)
Koefisien korelasi parsial antara Y dan X 2 apabila X 1 konstan
r y2−r y 1 r y12
r y2.1 =
√(1−r y 1 ²)(1−r y 2 ²)
Koefisien korelasi parsial antara X 1 dan X 2 apabila Y konstan
r 12−r y 1 r y 2
r 12. y =
√(1−r y 1 ²)( 1−r y 2 ²)
B. UJI CHI SQUARE
Pengertian Chi Kuadrat
Chi Kuadrat (dibaca kai kuadrat) merupakan suatu teknik statistik yang
memungkinkan peneliti menilai probabilitas memperoleh perbedaan
frekuensi yang nyata (dapat diobservasi), dengan frekuensi yang diharapkan
dalam kategori-kategori tertentu sebagai akibat dari kesalahan sampling.
Pengertian chi-quare atau chi kuadrat lainya adalah sebuah uji hipotesis
tentang perbandingan Antara frekuensi observasi dengan frekuensi harapan
yang didasarkan oleh hipotesis tertentu pada setiap kasus atau data yang
ambil untuk diamati. Uji ini sangat bermanfaat dalam melakukan analisis
statistic jika kita tidak memiliki informasi tantang populasi atau jika asumsiasumsi
yang dipersyaratkan untuk penggunaan statistic parametric tidak
terpenuhi. Chi kuadrat biasanya di dalam frekuensi observasi
berlambangkan dengan frekuensi harapan yang didasarkan atas hipotesis
yang hanya tergantung pada suatu parameter, yaitu derajat kebebasan (df).
Bila kita mempunyai dua macam proporsi dan kita ingin menguji apakah perbedaan
antar kedua proporsi itu signifikan atau tidak, maka disini kita menggunakan
pengujian hipotesa mengenai beda dua proporsi. Perluasan dari pada pengujian
selisih proporsi (beda antara dua proporsi) adalah pengujian chi kuadrat, karena
didalam pengujian ini kita mengadakan pengujian hipotesa tentang perbedaan
proporsi dan proporsi yang banyaknya lebih dari dua. Dengan perkataan lain,
pengujian χ 2 adalah pengujian hipotesa mengenai perbedaan k proporsi dimana k >
2 proporsi.
Chi square merupakan suatu ukuran yang menyangkut perbedaan yang terdapat di
antara frekuensi pengamatan dengan frekuensi teoritis/frekuensi harapan
(Schum’s). maksud dari pengujian chi square adalah untuk membandingkan fakta
yang diperoleh berdasarkan hasil observasi dan fakta yang didasarkan secara teoritis
(Drs. Andi Supangat, M.Si.). Dalam statistic, distribusi chi square (dilambangkan
dengan χ 2 BUKAN X 2 ) termasuk dalam statistic non parametrik. Distribusi non
parametrik adalah distribusi dimana besaran-besaran populasi tidak diketahui.
Distribusi ini sangat bermanfaat dalam melakukan analisis statistic jika kita tidak
memiliki informasi tentang populasi atau jika asumsi-asumsi yang dipersyaratkan
untuk penggunaan statistic parametrik tidak terpenuhi.
Kegunaan Chi Kuadrat
Adapum kegunaan dari uji chi square, adalah untuk mengetahui :
Ada tidaknya asosiasi antara 2 variabel (Independent test)
Apakah suatu kelompok homogen atau tidak (Homogenity test)
Uji kenormalan data dengan melihat distribusi data (Goodness of fit test)
Digunakan untuk menganalisis data yang berbentuk frekuensi.
Digunakan untuk menentukan besar atau kecilnya korelasi dari variabel-variabel
yang dianalisis
Cocok digunakan untuk data kategorik, data diskrit atau data nominal
Berikut beberapa hal yang berhubungan dengan chi square :
a. Adanya derajat kebebasan/degree of freedom (df). Besarnya df menunjukkan
banyak observasi yang bebas untuk bervariasi sesudah Batasan-batasan tertentu
dikenakan pada data.
b. Chi square tidak pernah bernilai negative. Hal ini dikarenakan selisih antara
frekuensi data observasi ( f ¿¿ ∘) ¿ dengan frekuensi data yang diharapkan (f ¿¿ e) ¿
dikuadratkan, yaitu (f ¿ ¿ ∘−f e )² ¿
c. Jika χ 2=0 maka frekuensi-frekuensi teoritis sama dengan frekuensi pengamatan.
Jika χ 2 >0 maka frekuensi-frekuensi teoritis tidak tepat sama dengan frekuensi
pengamatan. Semakin besar nilai χ 2 semakin besar pula perbedaan antara frekuensi
yang diobservasi dan frekuensi teoritis.
d. Distribusi chi square adalah menceng kanan. Jika n nya sangat besar maka distribusi
χ 2 ini mendekati distribusi normal.
χ > χ a ² → H 0 ditolak
2
5. Buat kesimpulan
Tabel kontingensi merupakan tabel klasifikasi dua arah yang terdiri dari banyak kolom
dan banyak baris yang merupakan pengembangan konsepr dari uji chi square data
multinomial yang menggunakan tabel klasifikasi satu arah atau hanya sebuah variabel
saja. Langkah-langkahnya :
Ho : π 11=π 12 =π 13=…=π 1 r
χ > χ a ² → H 0 ditolak
2
5. Buat kesimpulan
Rumus : C=
√ χ2
2
χ +n
dengan nilai maksimum C max=
m−1
m √
Dimana :
n = banyaknya data
Keterangan :
Jawab :
ej=
∑ o = 200 =50
e 4
( o−e )2 ( 90−50 )2 ( 55−50 )2 ( 25−50 )2 ( 30−50 )2
χ =∑
2
= + + + =53
e 50 50 50 50
Uji Kriteria ;
χ 2 ≤ χ a ² → H 0 tidak dapat ditolak
χ > χ a ² → H 0 ditolak
2
Jawab :
No X1 X2 Y X1 Y X2 Y X1 ² X2 ² Y²
1 8 125 37 296 4625 64 15625 1369
2 10 127 41 410 5617 100 18769 1681
3 7 100 34 238 3400 49 10000 1156
4 12 122 39 468 4758 144 14884 1521
5 9 129 40 360 5160 81 16641 1600
6 10 128 42 420 5376 100 16384 1764
7 7 98 38 266 3724 49 9604 1444
8 8 103 42 336 4326 64 10609 1764
9 11 130 40 440 5200 121 16900 1600
10 8 95 36 288 3420 64 9025 1296
11 10 115 41 410 4715 100 13225 1681
12 8 105 38 304 3990 64 11025 1444
Jumlah 108 1287 468 4236 54311 1000 162691 18320
2
2 2 ( Σ X1) ( 108 )2
Σ X =Σ X .
1 1 =1000. =28
n 12
2
2 2 ( Σ X2) ( 1287 )2
Σ X =Σ X .
2 2 =162691. =2376,92
n 12
( Σ Y )2 ( 468 )2
ΣY ²=Σ Y ². =18320. =68
n 12
( Σ X 1 ) ( ΣY ) ( 108 ) . ( 468 )
Σ X 1 Y =Σ X 1 Y . =4236. =24
n 12
( Σ X 2 ) ( ΣY ) (1287 ) . ( 468 )
Σ X 2 Y =Σ X 2 Y . =54311. =218
n 12
( Σ X1) ( Σ X2) ( 108 ) . ( 1287 )
Σ X 1 X 2=Σ X 1 X 2 . =12665. =182
n 12
57046,08−39676
¿
66553,76−33124
17370,08
¿ =0,519 →0,52
33429,76
a=
ΣY
n
−b 1 .
Σ X1
n ( ) ( )
−b 2 .
Σ X2
n
a=
18320
12
−0,52.
108
12 ( )
−0,17.
1287
12 ( )
a=152,5−4,68−19,64
Jadi persamaan regresi gandanyaY =128,2 – 0,52 X 1−0,17 X 2
R X1 . X2. Y =
√ b1 . Σ X 1 Y +b2 . Σ X 2 Y
ΣY ²
¿
√( 0,52 ) . ( 24 ) + ( 0,17 ) .(218)
68
¿ √ 0,728=0,85
2 2
R ( n−m−1 ) 0,85 ( 12−2−1 )
F hitung = = =11,74
m . ( 1−R ) 2. ( 1−0,85 )
2 2
Iklan Profit Apakah semakin besar biaya iklan yang dikeluarkan akan
31 553 semakin besar pula profit yang diperoleh?
38 590
Diamati contoh acak 10 perusahaan yang memproduksi
48 608
Laptop, kemudian dicatat pengeluaran iklan (dalam milyar) dan
52 682 profit (dalam milyar) selama tahun 2015.
63 752
a. Buat scatter plotnya dan jelaskan.
67 725
75 834 b. Tentukan persamaan model regresinya.
84 754
c. Tentukan penduga bagi parameter model regresi tersebut.
89 845
99 960
Penyelesaian : Dengan model
Y i=β 0 + β 1 X i+ ε i ; i=1,2 , … ,n
No x y x² y² xy
1 31 553 961 305,809 17,143
2 38 590 1,444 348,100 22,420
3 48 608 2,304 369,664 29,184
4 52 682 2,704 465,124 45,464
5 63 752 3,969 565,504 47,376
6 67 725 4,489 525,625 48,75
7 75 834 5,625 695,556 62,550
8 84 754 7,056 569,504 63,168
Sxy 24,480.4
Sxx 4,542.4
Syy 146,050.9
b1 5.39
b0 381.95
(Ʃ¿¿ x )(Ʃ y )
S xy n
b 1= =Ʃxy − ¿
S xx (Ʃ x )²
Ʃ x ²−
n
b 0= y−b1 x̅
Suatu survei dilakukan di Kota Depok terhadap bayi baru lahir dari 300 bayi yang dipilih
secara acak. Tentukan 40 bayi Berat Bayi Lahir Rendah (BBLR) dari 30 bayi yang lahir
normal (tidak BBLR) sebanyak 40 bayi dilahirkan oleh ibu yang anemia.
Lahir
Ibu Anemia Jumlah
BBLR Normal
Ya 40 40 80
Tidak 20 200 220
Jumlah 60 240 300
a. Jika Dinas Kesehatan Depok melaporkan bahwa kejadian BBLR di daerahnya hanya 17%
Buktikanlah secara statistik apakah laporan Dinkes tersebut dapat dipercaya pada Alpha 0,05
b. Jika dicurigai anemia dapat menyebabkan BBLR buktikanlah secara statistik apakah
kecurigaan tersebut benar atau tidak. Tuliskan hipotesis yang sesuai untuk menjawab
kecurigaan tersebut lakukan perhitungan uji hipotesis tersebut dan Apa kesimpulan pada
Alpha 0,05
Penyelesaian :
a.
17% x 300 = 51
Hipotesis
H₀ : Persentase sesuai
Mencari Rumus E
300 x 111
E1= =55,5
600
300 x 489
E 2= =244,5
600
Rumus X2
Ʃ= ( (O−E )2
E )
( 51−55,5 ) ² ( 249−244,5 ) ² ( 60−55,5 ) ² ( 240−244,5 ) ²
X² hitung = + + +
55,5 244,5 55,5 244,5
df = (kolom – 1) (baris – 1)
= (2 – 1) (2 – 1)
= 1.1
=1
Tingkat signifikan
α = 0,05
x² tabel = 3,841
Kesimpulan
Karena x² hitung < x² tabel maka H₀ diterima. Jadi kejadian BBLR di Depok hanya 17% itu
benar.
b.
Lahir
Ibu Anemia Jumlah
BBLR Normal
Ya 40 40 80
Tidak 20 200 220
Jumlah 60 240 300
Hipotesis
H₀ : Tidak ada pengaruh anemia dengan BBLR
80 x 60
Q₁ = 40 → E₁ = =16
300
80 x 240
Q2 = 40 → E2 = =64
300
220 x 60
Q3 = 20 → E3 = =44
300
220 x 240
Q4 = 200 → E4 = =176
300
( 24 ) ² (−24 ) ² (−24 ) ² ( 24 ) ²
= + + +
16 64 44 176
= 36 + 9 + 14 + 3,27 = 62,27
df = (kolom – 1) (baris – 1)
= (2 – 1) (2 – 1)
=1.1
=1
Tingkat signifikan
α = 0,05
x² tabel = 3,841
Kesimpulan
Karena x² hitung > x² tabel maka H₀ ditolak atau dapat diterima. Jadi, adanya pengaruh
apabila ibu mengalami anemia dapat menyebabkan BBLR.
DAFTAR PUSTAKA
Modul Statistika II Tim penyusun asisten dosen statistika FEB UNDAP
https://www.academia.edu/35761265/Modul_statistika_ii (Diakses 09 Desember 2021)
https://www.kursiguru.com/contoh-soal-regresi-linier-berganda/
https://www.statistikian.com/2012/11/rumus-chi-square.html