Anda di halaman 1dari 4

Memilih Transformasi Data dengan STATA

Memilih jenis transformasi data merupakan kegiatan yang kadang sangat


membosankan, sebab memaksa kita untuk melakukan percobaan berkali-kali
untuk menentukan transformasi apa yang tepat pada data yang tidak
berdistribusi normal. Namun dengan adanya aplikasi Statistik, kebosanan itu
sedikit berkurang. Apalagi dengan aplikasi STATA, sebab aplikasi statistik
yang satu ini telah dibekali dengan satu fitur, yaitu mendeteksi kenormalan
data secara otomatis. Deteksi tersebut dapat dilakukan dengan beberapa
metode, antara lain: Metode Deteksi Histogram, QQ Plots dan SkewnessKurtosis.
Apa maksud keterangan di atas? tentunya anda bertanya-tanya. Baiklah,
kami berikan sebuah ilustrasi: Anda akan melakukan sebuah uji parametris
yang mengharuskan data anda pada variabel berdistribusi normal. Ciri-ciri
data berdistribusi normal antara lain: berdasarkan nilai uji normalitas
skewness-kurtosis menunjukkan p value > 0,05, histogram berbentuk kurve
normal dan dalam Normal QQ Plots, plots yang ada mengikuti garis fit line.
Ada saatnya data anda ternyata tidak berdistribusi normal dan anda
menginginkan untuk melakukan transformasi. Kemudian anda pusing untuk
memilih transformasi apa yang dapat membuat data anda berubah menjadi
normal. Nah, disinilah STATA memberikan kemudahan karena hanya dengan
satu kali klik, kita sudah dapat menentukan metode transformasi apa yang
tepat.
Agar anda mudah memahami tutorial ini, sebaiknya anda pelajari artikel
kami:
1. Transformasi Data
2. Normalitas Pada STATA
3. Normalitas Pada SPSS
4. Normalitas Pada Minitab

Langsung saja kita masuk pada bahasan tutorial.


Kita mempunyai 1 variabel yang berdistrubusi tidak normal. Contoh seperti
pada data dalam file kerja tutorial ini yang menggunakan 100 sampel.

Sebaiknya untuk mempermudah anda, kami anjurkan download file kerja


STATA ini:
Non Normalitas.dta
Kita cek apakah data memang tidak berdistribusi normal. Berikut hasilnya
dengan menggunakan uji skewness-kurtosis:
. sktest var1
Skewness/Kurtosis tests for Normality
------- joint -----Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2)
-------------+--------------------------------------------------------------var1 |
100
0.0000
0.0030
24.08

Prob>chi2
0.0000

Nilai Prob>chi2 di atas sebesar 0,0000 di mana kurang dari 0,05 berarti
data berdistribusi tidak normal.
Untuk menentukan model transformasi apa yang tepat, maka pada Menu
klik Statistics, klik (Summaries, tables and test), klik Distributional plots and
test, klik Ladder of powers. Kemudian isi Combobox Variable dengan variabel
yang akan dideteksi. Kemudian klik OK. Lihat hasilnya!
. ladder var1
Transformation
formula
chi2(2)
-----------------------------------------------------------------cubic
var1^3
66.67
square
var1^2
46.01
identity
var1
24.08
square root
sqrt(var1)
14.30
log
log(var1)
6.83
1/(square root)
1/sqrt(var1)
2.35
inverse
1/var1
1.20
1/square
1/(var1^2)
4.45
1/cubic
1/(var1^3)
13.82

Berdasarkan hasil di atas, lihat


model transformasi tersebut
normal. Maka model yang tepat
square root, inverse dan 1/square

P(chi2)
0.000
0.000
0.000
0.001
0.033
0.309
0.550
0.108
0.001

nilai P(chi2), nilai > 0,05 menunjukkan


dapat membuat variabel berdistribusi
antara lain: 1/(square root) atau inverse
atau inverse square.

Dari ketiga model transformasi yang tepat, model inverse memberikan nilai
terbesar (0,550), maka model inverse selayaknya dipilih sebagai model
transformasi pada data anda.
Untuk memperkuat penilaian anda, dapat menggunakan deteksi histogram.
Caranya sebagai berikut:
Pada Menu klik Statistics,
klik
(Summaries,
tables
and
test),
klik Distributional plots and test, klik Ladder of powers histogram. Kemudian
isi Combobox Variable dengan variabel yang akan dideteksi. Kemudian
klik OK. Lihat hasilnya!

Dari beberapa histogram di atas, model inverse, inverse square root (1/sqrt)
dan inverse square (1/square) memberikan bentuk histogram yang paling
mendekati kurve normal. Dan model inverse adalah yang terbaik.
Selanjutnya kita bisa kuatkan lagi dengan deteksi Normal Quantile Plots
dengan cara:
Pada Menu klik Statistics,
klik
(Summaries,
tables
and
test),
klik Distributional plots and test, klik Ladder of powers quantile-normal plots.
Kemudian isi Combobox Variable dengan variabel yang akan dideteksi.
Kemudian klik OK. Lihat hasilnya!

Dari beberapa normal quantile plots di atas, model inverse, inverse square
root (1/sqrt) dan inverse square (1/square) memberikan bentuk di mana plotplot mengikuti garis lurus fit line. Dan model inverse adalah yang terbaik.
Untuk membuktikan, mari kita coba melakukan transformasi dengan metode
inverse kemudian dilakukan uji skewness-kurtosis. Dan ternyata hasilnya
sesuai dengan deteksi di atas. Lihat di bawah ini:
Skewness/Kurtosis tests for Normality
------- joint -----Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2
-------------+--------------------------------------------------------------var1 | 100
0.8613
0.2856
1.20
0.5498
Nilai Prob>chi2 sebesar 0,5498 yang apabila dibulatkan menjadi 0,550 dimana
sama persis dengan deteksi di atas.