Pemeriksaan Data
Pemeriksaan Data
Kenormalan
Asumsi tentang distribusi seringkali dibutuhkan kalau kita menggunakan
Statistika parametrik, asumsi terutama dibutuhkan jika diadakan pengujian
hipotesis. Asumsi ini dapat diperiksa dengan beberapa cara diantaranya melalui
histogram dan normal probability plot. Contoh histogram dan npp dari data yang
berdistribusi uniform, eksponensial dan normal adalah sebagai berikut : (Gambar
1.)
Dari contoh gambar ini, dapat disimpulkan bahwa data yang berdistribusi
uniform mempunyai normal probability-plot-nya berbentuk huruf S, sedangan
data yang berdistribusi eksponensial mempunyai normal probability plot
berbentuk huruf u, serta data yang berdistribusi normal mempunyai normal
probability plot garis lurus.
70 Normal P-P Plot of U
1.00
60
50
.75
40
E x p e c te d C u m P ro b
.50
30
20
.25
10
0.00
0 0.00 .25 .50 .75 1.00
100.0 120.0 140.0 160.0 180.0 200.0
110.0 130.0 150.0 170.0 190.0 Observed Cum Prob
300
Normal P-P Plot of E
1.00
200 .75
.50
Expected Cum Prob
100
.25
0
0.00
0.00 .25 .50 .75 1.00
100
.75
80
60 .50
Expected Cum Prob
40
.25
20
0.00
0 0.00 .25 .50 .75 1.00
.75
E x p e c te d C u m P r o b
.50
.25
0.00
0.00 .25 .50 .75 1.00
.75
E x p e c te d C u m P r o b
.50
.25
0.00
0.00 .25 .50 .75 1.00
a. Goodness of fit
Statistik uji ini mengukur jumlah kuadrat perbedaan frekuensi sesungguh-
nya dengan frekuensi yang diharapkan kalau data berdistribusi normal. Secara
rinci statistik uji ini dapat dinyatakan dalam formula berikut :
( o i ei ) 2
k
2
i 1 ei
b. Kolmogorov Smirnov
Statistik uji KS ditentukan berdasarkan nilai terbesar dari selisih antara
nilai fungsi distribusi dengan nilai fungsi distribusi empiris.
D= max|F(x)-i/n|
Tolak H0 (data berdistribusi normal) jika D>D . Statistik uji ini hanya dapat
dipergunakan untuk data yang kontinyu dan jika nilai dugaan parameter dihitung
dari sampel maka hasil pengujian ini cenderung tidak valid mengingat dari hasil
simulasi ditunjukkan nilai taksiran cenderung lebih kecil dari . Statistik uji ini
tersedia di program paket SPSS dan MINITAB. Hasil pengujian kenormalan
untuk data harapan hidup perempuan untuk Negara-negara di Asia adalah
sebagai berikut : [klik statistics+nonparamterics test+1 sample KS]
One-Sample Kolmogorov-Smirnov Test
Average
female life
expectancy
N 17
Normal Parameters a,b Mean 67.41
Std. Deviation 10.886
Most Extreme Absolute .169
Differences Positive .090
Negative -.169
Kolmogorov-Smirnov Z .695
Asymp. Sig. (2-tailed) .719
a. Test distribution is Normal.
b. Calculated from data.
d. Anderson Darling
Statistik uji ini dikembangkan untuk mengatasi kelemahan statistik uji
Kolmogorov Smirnov yang hasil pengujiannya bisa tidak valid jika nilai dugaan
parameternya dihitung dari sampel. Nilai statistik uji ini dihitung dengan cara :
n
(2i 1)
A 2 n [ln F (Yi ) ln( F (Yi ) ln(1 F (Yn 1i ))]
i 1 n
Statistik uji ini tidak tersedia di SPSS tetapi di MINITAB ada. Hasil pengujian
kenormalan dengan statistik uji Anderson Darling adalah : [klik stat+basic
statistics+normality test]
e. Shapiro-Wilk
Statistik uji Shapiro-Wilk dihitung berdasarkan urutan data yang dinyatakan
dalam :
n
( a i x (i ) ) 2
W n
i 1
(x
i 1
i x)2
90 16000
14000
80
12000
10000
70
8000
Gross domestic product / capita
Average female life expectancy
Barbados
6000
60
Gabon
4000
South Africa
Botswana
2000 Somalia
50
Haiti
0
40 -2000
N= 19 17 21 N= 19 17 21
Africa Middle East Latn America Africa Middle East Latn America
k v s 2
i i k
( vi ) ln i 1
k
vi ln(si2 )
i 1
v i
i 1
B k
i 1
1 1
1 ( k ) /[3(k 1)]
vi
i 1
vi i 1
k = banyaknya kelompok
s2i = varians data pada kelompok ke-i
vi = ni – 1
ni = banyaknya data pada kelompok ke-i
k
(n k ) ni (mi m.. ) 2
L i 1
k ni
(k 1) ( xij mi ) 2
i 1 j 1
Levene
Statistic df1 df2 Sig.
Average female
1.850 2 54 .167
life expectancy
Gross domestic
13.739 2 54 .000
product / capita
Transformasi
Transformasi data di dalam analisis Statistika mempunyai beberapa tujuan
diantaranya yaitu :
a. Menormalkan data dan menghomogenkan varians
b. Melinearkan hubungan antar variabel
a. Menormalkan data dan menghomogenkan varians
Transformasi yang dipilih untuk menghomogenkan varians, biasanya dapat
juga dipakai untuk menormalkan data, salah satu transformasi yang dapat
dipakai untuk tujuan ini adalah transformasi Box-Cox yang dinyatakan dalam
persamaan :
x 1
y atau y ln(x ) untuk =0
Nilai biasanya dicoba-coba antara -2 sampai dengan 2 sedemikian hingga
hasil transformasi memenuhi syarat normal dan varians homogen. Dengan
menggunakan tranformasi ln untuk data pendapatan per-kapita untuk region
Afrika, Timur Tengah dan Amerika Latin diperoleh hasil pengujian kenormalan
dan kehomogenan varians sebagai berikut :
Levene
Statistic df1 df2 Sig.
Gross domestic
13.739 2 54 .000
product / capita
ln_gdp 1.768 2 54 .180
Gross
domestic
product /
capita ln_gdp
N 57 57
Normal Parameters a,b Mean 2547.40 7.2783
Std. Deviation 2936.793 1.11394
Most Extreme Absolute .204 .078
Differences Positive .196 .078
Negative -.204 -.069
Kolmogorov-Smirnov Z 1.543 .588
Asymp. Sig. (2-tailed) .017 .880
a. Test distribution is Normal.
b. Calculated from data.
90
Japan
Hong Kong
80 Singapore
Taiwan
S. Korea
N. Korea
Thailand
Malaysia
Average female life expectancy
70 China
Vietnam
Philippines
Indonesia
60 India
Pakistan
Bangladesh
Cambodia
50
Afghanistan
40
-10000 0 10000 20000 30000
Japan
Hong Kong
80 Singapore
Taiwan
S. Korea
N. Korea
ThailandMalaysia
China
Average female life expectancy
70 Vietnam Philippines
Indonesia
60 India
Pakistan
Bangladesh
Cambodia
50
Afghanistan
40
5 6 7 8 9 10
Ln of GDP/Capita