Memilih Transformasi Data Dengan STATA
Memilih Transformasi Data Dengan STATA
Kita mempunyai 1 variabel yang berdistrubusi tidak normal. Contoh seperti pada
data dalam file kerja tutorial ini yang menggunakan 100 sampel.
Sebaiknya untuk mempermudah anda, kami anjurkan download file kerja STATA
ini:
Non Normalitas.dta
Kita cek apakah data memang tidak berdistribusi normal. Berikut hasilnya
dengan menggunakan uji skewness-kurtosis:
. sktest var1
Skewness/Kurtosis tests for Normality
------- joint -----Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2)
-------------+--------------------------------------------------------------var1 |
100
0.0000
0.0030
24.08
Prob>chi2
0.0000
Nilai Prob>chi2 di atas sebesar 0,0000 di mana kurang dari 0,05 berarti
data berdistribusi tidak normal.
Untuk
menentukan model
transformasi apa
yang
tepat,
maka
pada Menu klik Statistics, klik (Summaries, tables and test), klik Distributional
plots and test, klik Ladder of powers. Kemudian isi Combobox Variable dengan
variabel yang akan dideteksi. Kemudian klik OK. Lihat hasilnya!
. ladder var1
Transformation
formula
chi2(2)
P(chi2)
-----------------------------------------------------------------cubic
var1^3
66.67
0.000
square
var1^2
46.01
0.000
identity
var1
24.08
0.000
square root
sqrt(var1)
14.30
0.001
log
log(var1)
6.83
0.033
1/(square root)
inverse
1/square
1/cubic
1/sqrt(var1)
1/var1
1/(var1^2)
1/(var1^3)
2.35
1.20
4.45
13.82
0.309
0.550
0.108
0.001
Berdasarkan hasil di atas, lihat nilai P(chi2), nilai > 0,05 menunjukkan model
transformasi tersebut dapat membuat variabel berdistribusi normal. Maka model
yang tepat antara lain: 1/(square root) atau inverse square root, inverse dan
1/square atau inverse square.
Dari ketiga model transformasi yang tepat, model inverse memberikan nilai
terbesar (0,550), maka model inverse selayaknya dipilih sebagai model
transformasi pada data anda.
Untuk memperkuat penilaian anda, dapat menggunakan deteksi histogram.
Caranya sebagai berikut:
Pada Menu klik Statistics, klik (Summaries, tables and test), klik Distributional
plots and test, klik Ladder of powers histogram. Kemudian isi Combobox
Variable dengan variabel yang akan dideteksi. Kemudian klik OK. Lihat hasilnya!
Dari beberapa histogram di atas, model inverse, inverse square root (1/sqrt) dan
inverse square (1/square) memberikan bentuk histogram yang paling mendekati
kurve normal. Dan model inverse adalah yang terbaik.
Selanjutnya kita bisa kuatkan lagi dengan deteksi Normal Quantile Plots dengan
cara:
Pada Menu klik Statistics, klik (Summaries, tables and test), klik Distributional
plots and test, klik Ladder of powers quantile-normal plots. Kemudian
isi Combobox Variable dengan variabel yang akan dideteksi. Kemudian klik OK.
Lihat hasilnya!
Dari beberapa normal quantile plots di atas, model inverse, inverse square root
(1/sqrt) dan inverse square (1/square) memberikan bentuk di mana plot-plot
mengikuti garis lurus fit line. Dan model inverse adalah yang terbaik.
Untuk membuktikan, mari kita coba melakukan transformasi dengan metode
inverse kemudian dilakukan uji skewness-kurtosis. Dan ternyata hasilnya sesuai
dengan deteksi di atas. Lihat di bawah ini:
Nilai Prob>chi2 sebesar 0,5498 yang apabila dibulatkan menjadi 0,550 dimana
sama persis dengan deteksi di atas