Anda di halaman 1dari 13

PEMERIKSAAN DATA

Statistika dapat didefinisikan sebagai ilmu yang dipergunakan untuk


menyimpulkan kondisi sampel berdasarkan kondisi sampel, untuk melakukan
hal ini biasanya dilakukan tahapan yang disebut pengujian hipotesis, hasil dari
pengujian hipotesis ini dapat dikatakan valid jika beberapa syarat terpenuhi,
syarat-syarat itu diantaranya, kenormalan, kehomogenan varians dan kelinearan.
Diharapkan setelah mempelajari modul ini mahasiswa mempunyai kemampuan
untuk :
a. Melakukan pemeriksaan dan pengujian kenormalan
b. Melakukan pemeriksaan dan pengujian kehomogenan varians
c. Melakukan transformasi untuk menormalkan, menghomogenkan varians
dan melinearkan

Kenormalan
Asumsi tentang distribusi seringkali dibutuhkan kalau kita menggunakan
Statistika parametrik, asumsi terutama dibutuhkan jika diadakan pengujian
hipotesis. Asumsi ini dapat diperiksa dengan beberapa cara diantaranya melalui
histogram dan normal probability plot. Contoh histogram dan npp dari data yang
berdistribusi uniform, eksponensial dan normal adalah sebagai berikut : (Gambar
1.)
Dari contoh gambar ini, dapat disimpulkan bahwa data yang berdistribusi
uniform mempunyai normal probability-plot-nya berbentuk huruf S, sedangan
data yang berdistribusi eksponensial mempunyai normal probability plot
berbentuk huruf u, serta data yang berdistribusi normal mempunyai normal
probability plot garis lurus.
70 Normal P-P Plot of U
1.00
60

50
.75

40

E x p e c te d C u m P ro b
.50
30

20
.25

10

0.00
0 0.00 .25 .50 .75 1.00
100.0 120.0 140.0 160.0 180.0 200.0
110.0 130.0 150.0 170.0 190.0 Observed Cum Prob

300
Normal P-P Plot of E
1.00

200 .75

.50
Expected Cum Prob

100

.25

0
0.00
0.00 .25 .50 .75 1.00

E Observed Cum Prob

120 Normal P-P Plot of N


1.00

100

.75
80

60 .50
Expected Cum Prob

40
.25

20

0.00
0 0.00 .25 .50 .75 1.00

Observed Cum Prob

Gambar 1. Histogram dan normal probability plot dari data yang


berdistribusi uniform, eksponensial dan normal
Variabel harapan hidup perempuan untuk Negara-negara Asia cenderung
berdistribusi normal, Karena normal probability plot-nya cenderung membentuk
garis lurus, sedangkan pendapatan perkapita cenderung berdistribusi eksponen-
sial, karena normal probability plot-nya membentuk huruf U.

Normal P-P Plot of Average female life expectanc


1.00

.75
E x p e c te d C u m P r o b

.50

.25

0.00
0.00 .25 .50 .75 1.00

Observed Cum Prob

Normal P-P Plot of Gross domestic product / cap


1.00

.75
E x p e c te d C u m P r o b

.50

.25

0.00
0.00 .25 .50 .75 1.00

Observed Cum Prob


Selain dengan menggunakan normal probability plot, kenormalan data
dapat juga diuji dengan menggunakan beberapa statistic uji berikut :
a. Goodness of fit 
b. Kolmogorov Smirnov
c. Anderson Darling
d. Shapiro Wilk

a. Goodness of fit 
Statistik uji ini mengukur jumlah kuadrat perbedaan frekuensi sesungguh-
nya dengan frekuensi yang diharapkan kalau data berdistribusi normal. Secara
rinci statistik uji ini dapat dinyatakan dalam formula berikut :
( o i  ei ) 2
k
 
2

i 1 ei

Tolak H0 (Data berdistribusi normal) jika nilai k-2


Statistik uji ini diharapkan dipergunakan untuk data yang berukuran besar.
Statistik uji ini tidak tersedia di dalam paket SPSS ataupun MINITAB, program
paket yang menyediakan statistik uji ini adalah STATGRAPHICS.

b. Kolmogorov Smirnov
Statistik uji KS ditentukan berdasarkan nilai terbesar dari selisih antara
nilai fungsi distribusi dengan nilai fungsi distribusi empiris.
D= max|F(x)-i/n|
Tolak H0 (data berdistribusi normal) jika D>D . Statistik uji ini hanya dapat
dipergunakan untuk data yang kontinyu dan jika nilai dugaan parameter dihitung
dari sampel maka hasil pengujian ini cenderung tidak valid mengingat dari hasil
simulasi ditunjukkan nilai  taksiran cenderung lebih kecil dari . Statistik uji ini
tersedia di program paket SPSS dan MINITAB. Hasil pengujian kenormalan
untuk data harapan hidup perempuan untuk Negara-negara di Asia adalah
sebagai berikut : [klik statistics+nonparamterics test+1 sample KS]
One-Sample Kolmogorov-Smirnov Test

Average
female life
expectancy
N 17
Normal Parameters a,b Mean 67.41
Std. Deviation 10.886
Most Extreme Absolute .169
Differences Positive .090
Negative -.169
Kolmogorov-Smirnov Z .695
Asymp. Sig. (2-tailed) .719
a. Test distribution is Normal.
b. Calculated from data.

d. Anderson Darling
Statistik uji ini dikembangkan untuk mengatasi kelemahan statistik uji
Kolmogorov Smirnov yang hasil pengujiannya bisa tidak valid jika nilai dugaan
parameternya dihitung dari sampel. Nilai statistik uji ini dihitung dengan cara :
n
(2i  1)
A 2  n   [ln F (Yi )  ln( F (Yi )  ln(1  F (Yn 1i ))]
i 1 n
Statistik uji ini tidak tersedia di SPSS tetapi di MINITAB ada. Hasil pengujian
kenormalan dengan statistik uji Anderson Darling adalah : [klik stat+basic
statistics+normality test]
e. Shapiro-Wilk
Statistik uji Shapiro-Wilk dihitung berdasarkan urutan data yang dinyatakan
dalam :
n
( a i x (i ) ) 2
W n
i 1

 (x
i 1
i  x)2

Statistik Shapiro-Wilk telah dibandingkan dengan statistik uji kenormalan


yang lain melalui simulasi dan hasilnya lebih baik terutama untuk sampel kecil.
Hasil pengujian Shapiro-Wilk untuk data pendapatan per-kapita adalah :
[klik stat+basic statistics+normality test]
Kehomogenan varians
Kehomogenan varian untuk beberapa kelompok data dapat diperiksa
melalui box-plot. Box-plot dari harapan hidup perempuan dan pendapatan per-
kapita untuk beberapa region Afrika, Timur Tengah dan Amerika Latin adalah
sebagai berikut : [klik graphs+box-plot+defines]

90 16000

14000

80
12000

10000
70
8000
Gross domestic product / capita
Average female life expectancy

Barbados

6000
60
Gabon
4000
South Africa
Botswana
2000 Somalia
50
Haiti
0

40 -2000
N= 19 17 21 N= 19 17 21

Africa Middle East Latn America Africa Middle East Latn America

Region or economic group Region or economic group

Varians harapan hidup perempuan diregion Afrika, Timur Tengah dan


Amerika Latin relatif cenderung lebih homogen daripada pendapatan perkapita,
karena besar kotak harapan hidup perempuan cenderung sama besar daripada
besar kotak pendapatan per-kapita.
Selain dengan melihat box-plot, kehomogenan varians dapat diuji dengan
statistik uji Bartlett dan Levene. Statistik uji Bartlett dapat dipergunakan jika data
berdistribusi normal, sedangkan statistik uji Levene tidak membutuhkan syarat
kenormalan data. Statistik uji Bartlett dan Levene dapat ditentukan dengan cara :
k

k v s 2
i i k
( vi ) ln i 1
k
  vi ln(si2 )
i 1
v i
i 1

B k
i 1
1 1
1  (  k ) /[3(k  1)]
vi
i 1
 vi i 1

k = banyaknya kelompok
s2i = varians data pada kelompok ke-i
vi = ni – 1
ni = banyaknya data pada kelompok ke-i

k
(n  k ) ni (mi  m.. ) 2
L i 1
k ni
(k  1) ( xij  mi ) 2
i 1 j 1

mi = median data pada pelompok ke-i


m.. = median untuk keseluruhan data
Hasil pengujian kehomogenan varians dengan menggunakan statistik uji
Levene untuk data pendapatan perkapita di region Afrika, Timur Tengah dan
Amerika Latin adalah : [klik statistics+compare means+oneway anova]
Test of Homogeneity of Variances

Levene
Statistic df1 df2 Sig.
Average female
1.850 2 54 .167
life expectancy
Gross domestic
13.739 2 54 .000
product / capita

Sesuai dengan hasil pemeriksaan box-plot, dapat disimpulkan varians


harapan hidup perempuan adalah homogen (sig.>) sedangkan varians
pendapatan perkapita adalah tidak homogen (sig.<) di region Afrika, Timur
Tengah dan Amerika Latin.

Transformasi
Transformasi data di dalam analisis Statistika mempunyai beberapa tujuan
diantaranya yaitu :
a. Menormalkan data dan menghomogenkan varians
b. Melinearkan hubungan antar variabel
a. Menormalkan data dan menghomogenkan varians
Transformasi yang dipilih untuk menghomogenkan varians, biasanya dapat
juga dipakai untuk menormalkan data, salah satu transformasi yang dapat
dipakai untuk tujuan ini adalah transformasi Box-Cox yang dinyatakan dalam
persamaan :
x 1
y atau y  ln(x ) untuk =0

Nilai  biasanya dicoba-coba antara -2 sampai dengan 2 sedemikian hingga
hasil transformasi memenuhi syarat normal dan varians homogen. Dengan
menggunakan tranformasi ln untuk data pendapatan per-kapita untuk region
Afrika, Timur Tengah dan Amerika Latin diperoleh hasil pengujian kenormalan
dan kehomogenan varians sebagai berikut :

Test of Homogeneity of Variances

Levene
Statistic df1 df2 Sig.
Gross domestic
13.739 2 54 .000
product / capita
ln_gdp 1.768 2 54 .180

One-Sample Kolmogorov-Smirnov Test

Gross
domestic
product /
capita ln_gdp
N 57 57
Normal Parameters a,b Mean 2547.40 7.2783
Std. Deviation 2936.793 1.11394
Most Extreme Absolute .204 .078
Differences Positive .196 .078
Negative -.204 -.069
Kolmogorov-Smirnov Z 1.543 .588
Asymp. Sig. (2-tailed) .017 .880
a. Test distribution is Normal.
b. Calculated from data.

Dari hasil transformasi logaritma dengan bilangan dasar e, variabel yang


pendapatan per kapita yang tadinya variansnya tidak homogen dan tidak normal
menjadi normal dan variansnya homogen.
b. Melinearkan hubungan antar variabel
Dengan menggunakan transformasi, hubungan antar variabel yang tadinya
nampaknya tidak linear dapat dijadikan linear, sebagai contoh hubungan antara
variabel pendapatan perkapita dengan harapan hidup di region Asia :

90

Japan
Hong Kong
80 Singapore
Taiwan

S. Korea
N. Korea
Thailand
Malaysia
Average female life expectancy

70 China
Vietnam
Philippines
Indonesia

60 India
Pakistan

Bangladesh
Cambodia

50

Afghanistan

40
-10000 0 10000 20000 30000

Gross domestic product / capita

Hubungan antar variabel pendapatan per-kapita (x) dengan harapan hidup


perempuan (y) tidak membentuk haris lurus, Fungsi yang sesuai dengan gambar
di atas adalah y = a+b ln(x), sehiingga supaya scatter-plot antar dua variabel
tersebut membentuk garis lurus dilakukan transformasi ln untuk variabel
pendapatan perkapita. Hasil scatter-plot untuk harapan hidup perempuan
dengan ln dari pendapatan per-kapita adalah :
90

Japan
Hong Kong
80 Singapore
Taiwan

S. Korea
N. Korea
ThailandMalaysia
China
Average female life expectancy

70 Vietnam Philippines
Indonesia

60 India
Pakistan

Bangladesh
Cambodia
50

Afghanistan

40
5 6 7 8 9 10

Ln of GDP/Capita

Anda mungkin juga menyukai