Anda di halaman 1dari 5

Uji Asumsi 1 : Uji Normalitas

Setelah cukup lama bingung pilih-pilih tema yang mau diangkat perdana, saya akhirnya mencoba
memilih satu tema ini : Uji Asumsi Statistik Parametrik. Uji Asumsi yang pertama akan saya
bahas adalah Uji Normalitas.

Apa itu ?
Kita mulai dulu dari apa itu uji normalitas. Uji normalitas adalah uji yang dilakukan untuk
mengecek apakah data penelitian kita berasal dari populasi yang sebarannya normal. Uji ini perlu
dilakukan karena semua perhitungan statistik parametrik memiliki asumsi normalitas sebaran.
Formula/rumus yang digunakan untuk melakukan suatu uji (t-test misalnya) dibuat dengan
mengasumsikan bahwa data yang akan dianalisis berasal dari populasi yang sebarannya normal.
Ya bisa ditebak bahwa data yang normal memiliki kekhasan seperti mean, median dan modusnya
memiliki nilai yang sama. Selain itu juga data normal memiliki bentuk kurva yang sama, bell
curve. Nah dengan mengasumsikan bahwa data dalam bentuk normal ini, analisis statistik baru
bisa dilakukan.

Bagaimana Caranya?
Ada beberapa cara melakukan uji asumsi normalitas ini yaitu menggunakan analisis Chi Square
dan Kolmogorov-Smirnov. Bagaimana analisisnya untuk sementara kita serahkan pada program
analisis statistik seperti SPSS dulu ya. Tapi pada dasarnya kedua analisis ini dapat diibaratkan
seperti ini :

1. pertama komputer memeriksa data kita, kemudian membuat sebuah data virtual yang sudah
dibuat normal.

2. kemudian komputer seolah-olah melakukan uji beda antara data yang kita miliki dengan data
virtual yang dibuat normal tadi.

3. dari hasil uji beda tersebut, dapat disimpulkan dua hal :

o jika p lebih kecil daripada 0,05 maka dapat disimpulkan bahwa data yang kita
miliki berbeda secara signifikan dengan data virtual yang normal tadi. Ini berarti
data yang kita miliki sebaran datanya tidak normal.
o jika p lebih besar daripada 0,05 maka dapat disimpulkan bahwa data yang kita
miliki tidak berbeda secara signifikan dengan data virtual yang normal. Ini
berarti data yang kita miliki sebaran datanya normal juga.

Ukuran inilah yang digunakan untuk menentukan apakah data kita berasal dari populasi yang
normal atau tidak.

Bagaimana Jika Tidak Normal?


Tenang...tenang... data yang tidak normal tidak selalu berasal dari penelitian yang buruk. Data ini
mungkin saja terjadi karena ada kejadian yang di luar kebiasaan. Atau memang kondisi datanya
memang nggak normal. Misal data inteligensi di sekolah anak-anak berbakat (gifted) jelas tidak
akan normal, besar kemungkinannya akan juling positif.
Lalu apa yang bisa kita lakukan?

1. Kita perlu ngecek apakah ketidaknormalannya parah nggak. Memang sih nggak ada patokan
pasti tentang keparahan ini. Tapi kita bisa mengira-ira jika misalnya nilai p yang didapatkan
sebesar 0,049 maka ketidaknormalannya tidak terlalu parah (nilai tersebut hanya sedikit di
bawah 0,05). Jika ketidaknormalannya tidak terlalu parah lalu kenapa? Ada beberapa
analisis statistik yang agak kebal dengan kondisi ketidaknormalan ini (disebut memiliki sifat
robust), misalnya F-test dan t-test. Jadi kita bisa tetap menggunakan analisis ini jika
ketidaknormalannya tidak parah.

2. Kita bisa membuang nilai-nilai yang ekstrem, baik atas atau bawah. Nilai ekstrem ini disebut
outliers. Pertama kita perlu membuat grafik, dengan sumbu x sebagai frekuensi dan y sebagai
semua nilai yang ada dalam data kita (ini tentunya bisa dikerjakan oleh komputer). Nah dari sini
kita akan bisa melihat nilai mana yang sangat jauh dari kelompoknya (tampak sebagai sebuah
titik yang nun jauh di sana dan nampak terasing...sendiri...). Nilai inilah yang kemudian perlu
dibuang dari data kita, dengan asumsi nilai ini muncul akibat situasi yang tidak biasanya. Misal
responden yang mengisi skala kita dengan sembarang yang membuat nilainya jadi sangat tinggi
atau sangat rendah.

3. Tindakan ketiga yang bisa kita lakukan adalah dengan mentransform data kita. Ada banyak
cara untuk mentransform data kita, misalnya dengan mencari akar kuadrat dari data kita, dll.

4. Bagaimana jika semua usaha di atas tidak membuahkan hasil dan hanya membuahkan
penyesalan (wah..wah.. nggak segitunya kali ya?) . Maka langkah terakhir yang bisa kita lakukan
adalah dengan menggunakan analisis non-parametrik. Analisis ini disebut juga sebagai analisis
yang distribution free. Sayangnya analisis ini seringkali mengubah data kita menjadi data yang
lebih rendah tingkatannya. Misal kalo sebelumnya data kita termasuk data interval dengan
analisis ini akan diubah menjadi data ordinal.
Well, demikian kiranya paparan atau sharing tentang normalitas. Semoga dalam waktu dekat
saya bisa tahu gimana caranya meng-upload gambar ke dalam blog ini dalam posisi yang manis
jadi penjelasan saya bisa jadi lebih visualized gitu deh. Semoga juga saya juga bisa segera
mengubah tampilan SPSS menjadi JPG, jadi kita bisa belajar baca hasil analisis di blog ini, OK?
Semoga..... (kayak lagunya katon nih)

Chi Square dan Goodness-Of-Fit Test  


Salah seorang pengunjung blog kita ini bertanya tentang apa sebenarnya yang dimaksud dengan
chi square? 

Dalam statistik, distribusi chi square (dilambangkan dengan χ2) termasuk dalam statistik
nonparametrik. Distribusi nonparametrik adalah distribusi dimana besaran-besaran populasi tidak
diketahui. Distribusi ini sangat bermanfaat dalam melakukan analisis statistik jika kita tidak
memiliki informasi tentang populasi atau jika asumsi-asumsi yang dipersyaratkan untuk
penggunaan statistik parametrik tidak terpenuhi.

Beberapa hal yang perlu diketahui berkenaan dengan distribusi chi square adalah :

a. Distribusi chi square memiliki satu parameter yaitu derajad bebas (db)

b. Nilai-nilai chi square di mulai dari 0 disebelah kiri, sampai nilai-nilai positif tak terhingga di sebelah
kanan

c. Probabilitas nilai chi square di mulai dari sisi sebelah kanan

d. Luas daerah di bawah kurva normal adalah 1. Nilai dari chi square bisa dicari jika kita
memiliki informasi luas daerah disebelah kanan kurva serta derajad bebas. Misalnya jika luas
daerah disebelah kanan adalah 0,1 dan derajad bebas sebanyak 7, maka nilai chi square adalah
12, 017.

Dalam statistic, distribusi chi square digunakan dalam banyak hal. Mulai dari pengujian proporsi
data multinom, menguji kesamaan rata-rata Poisson serta pengujian hipotesis. Pengujian
hipotesis yang menggunakan dasar distribusi chi square misalnya Goodness-of-fit test, pengujian
indepensi, pengujian homogenitas serta pengujian varians dan standar deviasi populasi tunggal.

Pada postingan kali ini, kita saya akan menunjukkan penggunaan distribusi chi square untuk
menguji Goodness-of-fit. Dalam Goodness-of-fit test ada hal-hal yang harus diperhatikan yaitu: 

a. Adanya frekuensi observasi atau frekuensi yang benar-benar terjadi dalam eksperimen dan
dilambangkan dengan O.

b. Adanya frekuensi yang diharapkan terjadi yang dilambangkan dengan

E = np

c. Derajad bebas adalah k – 1 dimana k adalah jumlah kategori. Misalnya jika kita melempar
dadu, maka aka nada 6 kategori kejadian sehingga k = 6. Dengan demikian db = 6 – 1 = 5.

d. Nilai chi square hitung diperoleh dari rumus:

X^2 = E [ (E-O)^2/E]

e. Jumlah sampel yang digunakan harus mencukupi nilai harapan paling sedikit 5 (E > 5)

Baiklah, kita akan melihat contoh penggunaan chi square dalam Goodness-of-fit Test. Contoh
soal ini saya ambil dari buku Statistik Induktif karangan Abdul Hakim. Sebuah mall di Yogya
memiliki 5 buah toko. Seorang analis ingin mengetahui apakah konsumen sama senangnya
berbelanja di kelima toko tersebut. Dia mengumpulkan 1000 konsumen yang paling sering
berbelanja ke mall tersebut. Datanya dirangkam dalam tabel berikut ini
Toko                 a          b        c        d          e
Frekuensi     214       231   182    154      219

Langkah pertama yang dilakukan untuk menjawab masalah di atas adalah menentukan rumusan
hipotesis terlebih dahulu. Rumusan hipotesis adalah

H0 : proporsi konsumen yang berkunjung kelima toko itu sama. (jika proporsinya dianggap sama, maka
proporsi untuk setiap toko adalah 1/5 = 0,2
H1 : paling tidak dua diantara toko tersebut memiliki proposi yang tidak sama
dengan 0,2.

Langkah kedua adalah menentukan rumus/distribusi yang akan digunakan. Dalam kasus ini,
dikarenakan terdapat 5 kategori, maka kita akan menggunakan distribusi chi square. 

Langkah ketiga adalah menentukan daerah penolakan hipotesis. Dengan alpha sebesar 0,01 dan df = 5 –
1 = 4 maka nilai chi square tabel atau nilai kritis penolakan hipotesis adalah 13,227.
Artinya bahwa jika statistic hitung di atas statistic tabel, maka hipotesis nol ditolak.
Langkah keempat adalah menentukan nilai statistic hitung (uji) dengan cara kita
membuat tabel seperti dibawah ini untuk mempermudah perhitungan.

langkah terakhir adalah menarik kesimpulan. Dengan nilai statistic hitung sebesar 19,79 berarti
lebih besar dari nilai statistic tabel sebesar 13,227. Dengan demikian, hipotesis nol kita tolak.
Sehingga kita dapat mengatakan bahwa proporsi orang yang datang kelima toko tersebut tidaklah
sama.

Jika kita menggunakan program SPSS, maka pengujian hipotesis dapat kita lakukan sebagai
berikut:
Masukkan data dari kelima toko tersebut ke dalam program SPSS sebagai berikut : 
Setelah itu kita beri bobot data dengan cara klik: Data > Weight Case sehingga kotak dialog
weight case muncul. Pilih Weight Case By dan masukkan variable frekuensi ke dalam kotak
Frequency Variable. Dan klik OK

Selanjutnya klik Analyze > Nonparametric Test > Chi Square sehingga kotak dialog analisis chi
square muncul.

Masukkan varabel toko pada kotak Test variable


list, pilih get from data pada kotak Expected Range dan All Categories equal pada kotak
Expected Values. Kemudian klik OK sehingga hasil analisis SPSS akan muncul. Bandingkan
dengan hasil perhitungan manual. 

Anda mungkin juga menyukai