Anda di halaman 1dari 4

Jika data sampel yang dimiliki tidak berasal dari populasi yang berdistribusi normal, salah

satu alternatif yang dapat dilakukan adalah dengan mengabaikan pemeriksaan normalitas dan
melanjutkan analisis seolah-olah data tersebut telah berdistribusi normal. Namun alternatif ini
tidak disarankan, karena dalam banyak kasus, hasil alternatif ini dapat mengarah pada
kesimpulan yang salah. Alternatif kedua adalah membuat data yang awalnya tidak berdistribusi
normal menjadi "tampak lebih normal" dengan melakukan transformasi data. Analisis data
kemudian dapat dilakukan dengan menggunakan data yang telah ditransformasi.
Transformasi sebenarnya tidak lebih dari menyatakan kembali suatu data dalam unit yang
berbeda. Penggunaan transformasi yang tepat dapat didasarkan atas pertimbangan teoritis,
penampilan data, atau bahkan keduanya. Misalkan secara teoritis, dapat ditunjukkan bahwa
data counts dapat dibuat lebih normal dengan menggunakan akar kuadratnya. Demikian pula
dengan transformasi logit dapat diterapkan pada proporsi, serta transformasi Fisher dapat
diterapkan pada koefisien korelasi yang akan menghasilkan distribusi data yang mendekati
normal.
Tipe Skala Transformasi
Data Counts 1
𝑥^( )
2
Proporsi (p) 1 𝑝
𝑙𝑜𝑔𝑖𝑡 (𝑝) = log( )
2 1−𝑝
Koefisien Korelasi 1 1+𝑟
𝐹𝑖𝑠ℎ𝑒𝑟 𝑍 = log( )
2 1−𝑟

Power transformation merupakan salah satu cara yang berguna untuk melakukan
pendekatan data terhadap normalitas. Jika x menyatakan suatu sembarang pengamatan, maka
power transformation dinyatakan dalam suatu parameter λ yang menyatakan suatu
transformasi tertentu. Nilai λ dapat bernilai positif ataupun negatif. Misalnya, dipertimbangkan
1
𝑥 λ dengan λ = −1. Karena 𝑥 −1 = 𝑥 , maka pilihan λ ini akan sesuai dengan transformasi
inverse. Untuk λ = 0, didefinisikan 𝑥 0 = ln 𝑥. Beberapa contoh transformasi yang lain adalah.
𝑥 −1 = 1/𝑥 𝑥 0 = ln 𝑥 𝑥 1/2 𝑥 1/4 𝑥2

Untuk memilih power transformation, peneliti biasanya melihat marginal dot diagram
ataupun histogram, kemudian memutuskan nilai yang dapat meningkatkan kesimetrisan data.
Perhitungan dilakukan secara trial-and-error dengan beberapa pilihan transformasi. Pilihan-
pilihan tersebut kemudian dapat diperiksa dengan Q-Q plot atau dengan pengecekan lainnya
untuk melihat apakah asumsi normalitas telah terpenuhi.
Penjelasan transformasi data di atas didasarkan pada pengertian pilihan transformasi yang
tepat hanya dipengaruhi oleh penampilan data tersebut. Tidak ada pertimbangan eksternal lain
yang terlibat, meskipun transformasi yang sebenarnya digunakan sering ditentukan oleh
beberapa gabungan informasi yang berasal dari data tersebut serta berbagai faktor eksternal
lainnya, seperti kesederhanaan atau kemudahan interpretasi.
Box dan Cox (1964) mengusulkan suatu modifikasi power transformation, yang
didefinisikan dengan.
𝑥λ − 1
(λ)
𝑥 ={ λ ,λ ≠ 0
ln 𝑥, λ = 0

Dengan observasi 𝑥1 , 𝑥2 , … , 𝑥𝑛 , maka solusi Box-Cox untuk pilihan λ yang tepat adalah
solusi yang dapat memaksimumkan persamaan.
𝑛 𝑛
𝑛 1
𝑙(λ) = − ln [ ∑(𝑥𝑗 (λ) − ̅̅̅̅̅
𝑥 (λ) )2 ] + (λ − 1) ∑ 𝑙𝑛 𝑥𝑗
2 𝑛
𝑗=1 𝑗=1
Di mana
𝑛 𝑛
̅̅̅̅̅ 1 1 𝑥𝑗 λ − 1
𝑥 (λ) = ∑ 𝑥𝑗 (λ) = ∑
𝑛 𝑛 λ
𝑗=1 𝑗=1
Merupakan rata-rata pengamatan yang telah ditransformasikan.
Perhitungan 𝑙(λ) untuk banyak nilai λ dapat dilakukan dengan menggunakan bantuan
komputer. Untuk melihat perilaku data di sekitar nilai maksimum λ, dapat dibantu dengan
menggunakan grafik antara grafik 𝑙(λ) dan λ.
Alternatif lain yang equivalen dalam mencari nilai λ adalah dengan membuat variabel baru.
(λ)
𝑥𝑗 λ − 1
𝑦 = , 𝑗 = 1,2, . . , 𝑛
λ[(∏𝑛𝑖=1 𝑥𝑖 )1/𝑛 ]λ−1
Kemudian dilakukan penghitungan varians sampel, minimum varians akan terjadi pada λ
yang sama dengan ketika memaksimumkan fungsi 𝑙(λ).
Berdasarkan penjelasan di atas, perlu dicatat bahwa transformasi yang diperoleh dengan
memaksimumkan fungsi 𝑙(λ) biasanya akan meningkatkan perkiraan normalitas. Namun, hal
tersebut tidak menjamin bahwa dengan λ akan menghasilkan data transformasi yang cukup
sesuai dengan distribusi normal. Sehingga hasil dari transformasi tersebut harus selalu
diperiksa dengan cermat untuk melihat kemungkinan terjadinya pelanggaran asumsi
normalitas.
Pada kasus multivariat, power transformation dilakukan untuk masing-masing variabel.
Misalkan λ1 , λ2 , . . , λ𝑝 adalah power transformation untuk masing-masing variabel. Maka,
setiap λ𝑘 dapat dipilih dengan cara memaksimumkan:
𝑛 𝑛
𝑛 1
𝑙𝑘 (λ) = − ln [ ∑(𝑥𝑗𝑘 (λ𝑘) − ̅̅̅̅̅̅̅̅
𝑥𝑘 (λ)𝑘 )2 ] + (λ𝑘 − 1) ∑ 𝑙𝑛 𝑥𝑗𝑘
2 𝑛
𝑗=1 𝑗=1
Di mana 𝑥𝑛1 , 𝑥𝑛2 , … , 𝑥𝑛𝑘 adalah observasi ke-n pada variabel ke-k, serta
𝑛 𝑛
̅̅̅̅̅̅̅̅
(λ )
1 (λ𝑘 ) 1 𝑥𝑗𝑘 λ𝑗𝑘 − 1
𝑥𝑘 𝑘 = ∑ 𝑥𝑗𝑘 = ∑
𝑛 𝑛 λ𝑘
𝑗=1 𝑗=1
Merupakan rata-rata pengamatan yang telah ditransformasikan. Untuk pengamatan ke-j,
maka hasil transformasinya adalah.
̂
𝑥𝑗1 λ𝑗1 − 1
̂
λ1
̂
𝑥𝑗2 λ𝑗2 − 1
̂
λ
𝒙𝑗 = ̂
λ2

λ̂
𝑥𝑗𝑝 − 1
𝑗𝑝

[ ̂
λ𝑝 ]

Di mana λ̂1 , λ̂2 , . . , λ̂𝑝 merupakan nilai-nilai yang akan memaksimumkan fungsi 𝑙𝑘 (λ).
Prosedur di atas setara dengan membuat setiap distribusi marginal mendekati normal.
Meskipun marginal normal tidak cukup untuk memastikan bahwa distribusi bersama normal,
dalam aplikasi praktis ini mungkin cukup baik.
Selain itu, prosedur bisa dimulai dengan nilai λ̂1 , λ̂2 , . . , λ̂𝑝 yang diperoleh dari transformasi
sebelumnya dan beralih ke himpunan nilai 𝛌′ = [λ̂1 , λ̂2 , . . , λ̂𝑝 ], yang secara bersama-sama akan
memaksimumkan
𝑛
𝑛
𝑙(λ1 , λ2 , . . , λ𝑝 ) = − ln|𝑺(𝛌)| + (λ1 − 1) ∑ 𝑙𝑛 𝑥𝑗1 + (λ2
2
𝑗=1
𝑛 𝑛

− 1) ∑ 𝑙𝑛 𝑥𝑗2 +. . +(λ𝑝 − 1) ∑ 𝑙𝑛 𝑥𝑗𝑝


𝑗=1 𝑗=1
Di mana 𝑺(𝛌) merupakan matriks kovarians sampel yang diperoleh dari
𝑥𝑗1 λ𝑗1 − 1
λ1
λ𝑗2
𝑥𝑗2 − 1
λ
𝒙𝑗 = λ2 , 𝑗 = 1,2, . . , 𝑛

𝑥𝑗𝑝 λ𝑗𝑝 − 1
[ λ𝑝 ]
Memaksimumkan fungsi 𝑙(λ1 , λ2 , . . , λ𝑝 ) mungkin akan jauh lebih sulit daripada
memaksimumkan 𝑙𝑘 (λ) secara individu, tetapi di sisi lain akan menghasilkan transformasi yang
jauh lebih baik. Metode secara bersama-sama tersebut sesuai dengan memaksimumkan
multivariate likelihood atas 𝝁, ∑, dan 𝛌. Sedangkan metode individu sesuai dengan
memaksimumkan univariate likelihood ke-k atas 𝜇𝑘 , 𝜎𝑘𝑘 , dan λ𝑘 .

Anda mungkin juga menyukai