Anda di halaman 1dari 5

Memilih Transformasi Data dengan STATA

Memilih jenis transformasi data merupakan kegiatan yang kadang sangat


membosankan, sebab memaksa kita untuk melakukan percobaan berkali-kali
untuk menentukan transformasi apa yang tepat pada data yang tidak
berdistribusi normal. Namun dengan adanya aplikasi Statistik, kebosanan itu
sedikit berkurang. Apalagi dengan aplikasi STATA, sebab aplikasi statistik yang
satu ini telah dibekali dengan satu fitur, yaitu mendeteksi kenormalan data
secara otomatis. Deteksi tersebut dapat dilakukan dengan beberapa metode,
antara lain: Metode Deteksi Histogram, QQ Plots dan Skewness-Kurtosis.

Apa maksud keterangan di atas? tentunya anda bertanya-tanya. Baiklah, kami


berikan sebuah ilustrasi: Anda akan melakukan sebuah uji parametris yang
mengharuskan data anda pada variabel berdistribusi normal. Ciri-ciri data
berdistribusi normal antara lain: berdasarkan nilai uji normalitas skewnesskurtosis menunjukkan p value > 0,05, histogram berbentuk kurve normal dan
dalam Normal QQ Plots, plots yang ada mengikuti garis fit line. Ada saatnya data
anda ternyata tidak berdistribusi normal dan anda menginginkan untuk
melakukan transformasi. Kemudian anda pusing untuk memilih transformasi apa
yang dapat membuat data anda berubah menjadi normal. Nah, disinilah STATA
memberikan kemudahan karena hanya dengan satu kali klik, kita sudah dapat
menentukan metode transformasi apa yang tepat.
Agar anda mudah memahami tutorial ini, sebaiknya anda pelajari artikel kami:
1. Transformasi Data
2. Normalitas Pada STATA
3. Normalitas Pada SPSS
4. Normalitas Pada Minitab

Langsung saja kita masuk pada bahasan tutorial.

Kita mempunyai 1 variabel yang berdistrubusi tidak normal. Contoh seperti pada
data dalam file kerja tutorial ini yang menggunakan 100 sampel.
Sebaiknya untuk mempermudah anda, kami anjurkan download file kerja STATA
ini:
Non Normalitas.dta
Kita cek apakah data memang tidak berdistribusi normal. Berikut hasilnya
dengan menggunakan uji skewness-kurtosis:

. sktest var1
Skewness/Kurtosis tests for Normality
------- joint -----Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2)
-------------+--------------------------------------------------------------var1 |
100
0.0000
0.0030
24.08

Prob>chi2
0.0000

Nilai Prob>chi2 di atas sebesar 0,0000 di mana kurang dari 0,05 berarti
data berdistribusi tidak normal.
Untuk
menentukan model
transformasi apa
yang
tepat,
maka
pada Menu klik Statistics, klik (Summaries, tables and test), klik Distributional
plots and test, klik Ladder of powers. Kemudian isi Combobox Variable dengan
variabel yang akan dideteksi. Kemudian klik OK. Lihat hasilnya!
. ladder var1
Transformation
formula
chi2(2)
P(chi2)
-----------------------------------------------------------------cubic
var1^3
66.67
0.000
square
var1^2
46.01
0.000
identity
var1
24.08
0.000
square root
sqrt(var1)
14.30
0.001
log
log(var1)
6.83
0.033

1/(square root)
inverse
1/square
1/cubic

1/sqrt(var1)
1/var1
1/(var1^2)
1/(var1^3)

2.35
1.20
4.45
13.82

0.309
0.550
0.108
0.001

Berdasarkan hasil di atas, lihat nilai P(chi2), nilai > 0,05 menunjukkan model
transformasi tersebut dapat membuat variabel berdistribusi normal. Maka model
yang tepat antara lain: 1/(square root) atau inverse square root, inverse dan
1/square atau inverse square.
Dari ketiga model transformasi yang tepat, model inverse memberikan nilai
terbesar (0,550), maka model inverse selayaknya dipilih sebagai model
transformasi pada data anda.
Untuk memperkuat penilaian anda, dapat menggunakan deteksi histogram.
Caranya sebagai berikut:
Pada Menu klik Statistics, klik (Summaries, tables and test), klik Distributional
plots and test, klik Ladder of powers histogram. Kemudian isi Combobox
Variable dengan variabel yang akan dideteksi. Kemudian klik OK. Lihat hasilnya!

Dari beberapa histogram di atas, model inverse, inverse square root (1/sqrt) dan
inverse square (1/square) memberikan bentuk histogram yang paling mendekati
kurve normal. Dan model inverse adalah yang terbaik.
Selanjutnya kita bisa kuatkan lagi dengan deteksi Normal Quantile Plots dengan
cara:
Pada Menu klik Statistics, klik (Summaries, tables and test), klik Distributional
plots and test, klik Ladder of powers quantile-normal plots. Kemudian
isi Combobox Variable dengan variabel yang akan dideteksi. Kemudian klik OK.
Lihat hasilnya!

Dari beberapa normal quantile plots di atas, model inverse, inverse square root
(1/sqrt) dan inverse square (1/square) memberikan bentuk di mana plot-plot
mengikuti garis lurus fit line. Dan model inverse adalah yang terbaik.
Untuk membuktikan, mari kita coba melakukan transformasi dengan metode
inverse kemudian dilakukan uji skewness-kurtosis. Dan ternyata hasilnya sesuai
dengan deteksi di atas. Lihat di bawah ini:

Skewness/Kurtosis tests for Normality


------- joint -----Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2
-------------+--------------------------------------------------------------var1 | 100
0.8613
0.2856
1.20
0.5498

Nilai Prob>chi2 sebesar 0,5498 yang apabila dibulatkan menjadi 0,550 dimana
sama persis dengan deteksi di atas

Anda mungkin juga menyukai