Jurnal Internasional Alat Penilaian Dalam Pendidikan

Jurnal Internasional Alat Penilaian dalam Pendidikan
2020, Vol. 7, No. 2, 255–265

https://doi.org/10.21449/ijate.656077
Diterbitkan di https://dergipark.org.tr/en/pub/ijate Research Article
Parametrik atau Non-parametrik: Kecondongan untuk Menguji Normalitas

untuk Rata-rata
Perumpamaan
1,*
Fatih Orcan
1
Departemen Pengukuran dan Evaluasi Pendidikan, Universitas Trabzon, Turki
SEJARAH ARTIKEL Abstrak: Memeriksa asumsi normalitas diperlukan untuk memutuskan apakah
Diterima: 06 Des 2019 tes parametrik atau non-parametrik perlu digunakan. Berbagai cara disarankan
dalam literatur untuk digunakan untuk memeriksa normalitas. Kecondongan dan
Direvisi: 22 Apr 2020
nilai-nilai kurtosis adalah salah satunya. Namun, tidak ada konsensus nilai mana
Diterima: 24 Mei 2020
yang menunjukkan distribusi normal. Oleh karena itu, pengaruh kriteria yang
berbeda dalam hal nilai kecondongan disimulasikan dalam penelitian ini. Secara
KATA KUNCI khusus, hasil uji-t dan uji-U dibandingkan dengan nilai kecondongan yang
Tes normalitas, berbeda. Hasil penelitian menunjukkan bahwa uji-t dan uji-U memberikan hasil
Kecondongan, yang berbeda ketika data menunjukkan kecondongan. Berdasarkan hasil,
Perbandingan rata-rata, menggunakan nilai kecondongan saja untuk memutuskan tentang normalitas
Non-parametrik, himpunan data mungkin tidak cukup.
Oleh karena itu, penggunaan tes non-parametrik mungkin tidak bisa dihindari.
1. PERKENALAN
Tes perbandingan rata-rata, seperti uji-t, Analisis Varians (ANOVA) atau tes Mann-Whitney
U, sering digunakan teknik statistik dalam ilmu pendidikan. Teknik yang digunakan berbeda
sesuai dengan sifat-sifat kumpulan data seperti normalitas atauequ al varians. Misalnya, jika
data tidak didistribusikan secara normal, uji Mann-Whitney U digunakan sebagai pengganti
uji-t sampel independen. Dalam arti yang lebih luas, mereka dikategorikan sebagai statistik
parametrik dan nonparametrik masing-masing. Statistik parametrik didasarkan pada distribusi
tertentu seperti distribusi normal. Namun, tes non-parametrik tidak mengasumsikan distribusi
tersebut. Oleh karena itu, mereka juga dikenal sebagai teknik bebas distribusi (Boslaung &
Watters, 2008; Rachon, Gondan, & Kieser, 2012).
Uji perbandingan rata-rata arametrik P seperti uji-t dan ANOVA memiliki asumsi seperti
varians dan normalitas yang sama. Asumsi varians yang sama menunjukkan bahwa varians
kelompok yang harus diuji adalah sama. Hipotesis nol untuk assump tion inimenunjukkan
bahwa semua varians kelompok sama satu sama lain. Dengan kata lain, tidak menolak
hipotesis nol menunjukkan kesetaraan varians. Asumsi normalitas, di sisi lain, menunjukkan
bahwa data diambil dari populasi yang biasanya distri. Distribusi normal memiliki beberapa
properti. Misalnya, simetris sehubungan dengan rata-rata distribusi di mana rata-rata, median
dan mode sama. Juga, distribusi normal memiliki asimtot horizontal
(Boslaung & Watters, 2008). Artinya, kurva mendekati tetapi tidak pernah menyentuh sumbu
x. Dengan
255
Orcan
KONTAK: Fatih Orcan  fatihorcan@trabzon.edu.tr  Universitas Trabzon, Kolase Pendidikan Fatih,

Kamar: C-110, Trabzon, Turki
ISSN-e: 2148-7456 / © IJATE 2020
asumsi normalitas, diharapkan distribusi sampel juga normal (Boslaung & Watters, 2008;
Demir, Saatçioğlu & İmrol, 2016; Orçan, 2020). Dalam hal perbandingan dua sampel,
misalnya, asumsi normalitas menunjukkan bahwa setiap sampel independen harus
didistribusikan secara normal. Penyimpangan dari normalitas untuk salah satu sampel
independen menunjukkan bahwa tes parametrik tidak boleh digunakan (Rietveld & van Hout,
2015) karena tingkat kesalahan tipe I terpengaruh (Blanca, Alarcon, Arnua, et al., 2017; Kain,
Zhang, & Yuan, 2017). Artinya, tes parametrik kuat dalam hal tingkat kesalahan tipe I (Demir
et al., 2016) dan karena distribusi grup yang terpisah satu sama lain tingkat kesalahan tipe I
meningkat (Blanca et al., 2017)
Untuk sampelent independ, uji normalitas harus dijalankan secara terpisah untuk setiap
sampel. Memeriksa normalitas variabel dependen untuk seluruh sampel, tanpa
mempertimbangkan variabel pengelompokan (variabel independen), bukanlah cara yang
benar. Misalnya, jika seorang res earcher ingin membandingkan nilai ujian antara siswa laki-
laki dan perempuan, normalitas nilai ujian untuk siswa laki-laki dan perempuan harus diuji
secara terpisah. Jika salah satu kelompok normal dan yang lainnya tidak didistribusikan secara
normal, assumptio normalitasn dilanggar. Hanya jika tes kedua kelompok menunjukkan
distribusi normal maka tes parametrik (yaitu, uji-t sampel independen) harus
dipertimbangkan. Di sisi lain, untuk satu sampel uji-t atau uji-t sampel berpasangan
(perbedaan pengujian antar pasangan), normalities dari variabel dependen diuji untuk seluruh
sampel sekaligus.
Normalitas dapat diuji dengan berbagai cara, beberapa di antaranya adalah tes Kolmogorov-
Smirnov (KS) dan tes Shapiro-Wilk (SW). Ini adalah dua cara paling umum untuk memeriksa
normalitas (Park, 2008; Razali & Wah, 2011). Kedua tes mengasumsikan bahwa datanya
normal, H0. Oleh karena itu, diharapkan untuk tidak menolak null (Miot, 2016). Uji KS
direkomendasikan untuk digunakan ketika ukuran sampel besar sedangkan SW digunakan
dengan ukuran sampel kecil (Büyüközt ürket al., 2014; Demir dkk., 2016; Razali & Wah,
2011). Park (2008) menunjukkan bahwa uji SW tidak dapat diandalkan ketika ukuran sampel
lebih besar dari 2000 sedangkan KS berguna ketika ukuran sampel lebih besar dari 2000.
Namun, juga ditunjukkan bahwa uji SW dapat kuat dengan ukuran sampel yang besar
(Rachon et al., 2012). Selain itu, dinyatakan bahwa tes KS tidak berguna dan kurang akurat
dalam praktiknya (Lapangan, 2009; Ghasemi & Zahediasl, 2012; Schucany & Tong NG,
2006).
Selain itu, tes KS dan SW, cara lain juga tersedia untuk memeriksa normalitas kumpulan data
yang diberikan. Di antara mereka, beberapa metode grafis juga tersedia: Histogram, boxplot
atau plot probability-probability (P-P) (Demir 2016; Miot, 2016; Taman, 2008; Rietveld &
van Hout, 2015). Misalnya, bentuk histogram untuk kumpulan data tertentu diperiksa untuk
melihat apakah terlihat normal atau tidak. Meskipun sering digunakan, keputusan yang dibuat
hanya berdasarkan itu akan bersifat subjektif. Namun demikian, menggunakan histogram
dengan metode lain untuk memeriksa bentuk distribution dapat informatif. Oleh karena itu,
akan berguna untuk menggunakan metode grafis dengan metode lain.
Cara lain untuk memeriksa normalitas data didasarkan pada pemeriksaan nilai skewness dan
kurtosis. Meskipun penggunaan nilai skewness dan kurtosis adalah umum dalam praktiknya,
tidak ada konsensus tentang nilai-nilai yang menunjukkan normalitas. Beberapa menyarankan
256
Int. J. Asst. Tools dalam Educ., Vol. 7, No. 2, (2020) hlm. 255–265
kecondongan dan kurtosis hingga nilai absolut 1 dapat menunjukkan normalitas

(Büyüköztürk, Çokluk, & Köklü, 2014; Demir dkk., 2016; Huck, 2012; Ramos et al., 2018),
sementara beberapa lainnya menyarankan nilai kecondongan dan kurtosis yang jauh lebih
besar untuk normalitas (Iyer, Sharp, & Brush, 2017; Kim, 2013; Perry, Dempster & McKay,
2017; Şirin, Aydın, & Bilir, 2018; Barat dkk., 1996). Lei dan Lomax (2005) mengkategorikan
non normalitas menjadi 3 kelompok s: "Nilai absolut kecondongan dan kurtosis kurang dari
1,0 sebagai sedikit nonnormalitas, nilai antara 1,0 dan sekitar 2,3 sebagai nonnormalitas
sedang, dan nilai di luar 2,3 sebagai nonnormalitas berat" (hlm. 2). Demikian pula, Bulmer
(1979) menunjukkan kecondongan runcing, dalam nilai ab solute, antara 0 dan .5
menunjukkan cukup simetris, antara .5 dan 1 menunjukkan kemiringan sedang dan lebih besar
dari 1 menunjukkan distribusi yang sangat miring.
Kesalahan standar kecondongan dan kurtosis juga digunakan untuk memeriksa normalitas.
Artinya, z-score untuk kecondongan dan kurtosis digunakan sebagai aturan. Jika z-score
kecondongan dan kurtosis lebih kecil dari 1,96 (untuk % 5 tingkat kesalahan tipe I) data
dianggap normal (Field, 2009; Kim, 2013). Selain itu, untuk ukuran sampel yang lebih besar
disarankan untuk meningkatkan z-score dari 1,96 menjadi 3,29 (Kim, 2013).
Ukuran sampel juga merupakan masalah penting mengenai normalitas. Dengan ukuran sampel
yang kecil, normalitas data tidak dapat dikarantina. Dalam sebuah contoh, ditunjukkan bahwa
sampel 50 yang diambil dari distribusi normal tampak tidak normal (Altman, 1991, seperti
dikutip dalam Rachon et al., 2012). Blanca et al. (2013) meneliti 693 set data dengan ukuran
sampel, berkisar antara 10 dan 30, dalam terms kecondongan dan kurtosis. Mereka
menemukan bahwa hanya 5,5% dari distribusi yang mendekati distribusi normal
(kecondongan dan kurtosis antara negatif dan positif .25). Disarankan bahwa bahkan dengan
ukuran sampel yang kecil normalitas harus dikontrol prior untuk analisis.
Karena tes parametrik lebih kuat (Demir et al. 2016), para peneliti mungkin mencoba
menemukan cara untuk menunjukkan bahwa data mereka normal. Terkadang hanya tes SW
atau KS yang digunakan sedangkan terkadang nilai seperti kecondongan dan kurtosis
digunakan. Dalamstudi Fa Ct, berdasarkan studi Demir et al. (2016), 24,8% penelitian yang
menguji normalitas menggunakan nilai skewness dan kurtosis sedangkan 24,1% diantaranya
menggunakan tes KS atau SW. Meskipun perbedaan antara persentasenya kecil, lebih banyak
peneliti menggunakan kecondongan dan kurtosis untuk memeriksa normalitas. Mungkin ada
alasan berbeda mengapa peneliti menggunakan nilai kecondongan dan kurtosis untuk
memeriksa normalitas. Salah satunya mungkin terkait untuk mendapatkan fleksibilitas yang
lebih luas pada nilai referensi kecondongan dan kurtosis. Seperti yang ditunjukkan,titik
referensi yang berbeda tentang kecondongan dan kurtosis tersedia dalam literatur. Oleh karena
itu, tampaknya lebih mudah bagi para peneliti untuk menunjukkan normalitas dengan
menggunakan nilai skewness dan kurtosis.
Berdasarkan kriteria yang dipilih untuk memeriksa normalitas diputuskand untuk
menggunakan tes parametrik atau nonparametrik. Jika kriteria diubah, tes yang akan dipilih
mungkin juga berubah. Misalnya, jika seseorang menggunakan kriteria "skewness smaller
than 1" alih-alih "z-score of skewness" t-test alih-alih U-test mungkin perlu digunakan.
Bahkan, hasil normality test dapat berubah sehubungan dengan tes yang digunakan untuk
digunakan (Razali & Wah, 2011). Oleh karena itu, tujuan dari penelitian ini adalah untuk
melihat seberapa besar perbedaan yang mungkin terjadi pada keputusan yang dibuat pada
penggunaan uji-t dan uji-U dengankriteria differe nt skewness. Itu tidak bertujuan untuk
menunjukkan apakah tes parametrik atau non-parametrik lebih atau kurang berguna daripada
yang lain. Untuk tujuan ini, studi simulasi dilakukan dengan faktor desain yang berbeda.
257
Orcan
2. METODE
2.1. Faktor Desain Studi
Tigafaktor desain iferen d digunakan untuk mensimulasikan proses pengujian sampel
independen. Faktor desain pertama adalah ukuran sampel. Untuk mensimulasikan data dari
sampel kecil hingga besar, empat nilai berbeda dipertimbangkan (60, 100, 300 dan 1000).
Diindikasikanukuran sampel t hat 30 kecil, sedangkan sekitar 400 besar (Abbott, 2011, seperti
dikutip dalam Demir et al., 2016). Kemudian, persentase kelompok independen (25%, 50%
atau 75%) dalam sampel diubah dan hanya satu dari normalitas kelompok independen yang
dianggap sebagaifaktor desain kedua. Untuk faktor desain ketiga, non-normalitas
ditambahkan ke grup yang dipilih. Untuk non-normalitas, lima kondisi digunakan. Kondisi
tersebut dipilih untuk mewakili distribusi normal ke non-normal. Nilai non-normalitas
dirangkum pada Tabel 1. Misalnya, di bawah Sk=0, nilai kecondongan dibatasi antara .00
dan .10 sedangkan nilai kurtosis antara .00 dan .20. Untuk kelompok SK=2*SE, nilai
maksimum kecondongan dan kurtosis dibatasi menjadi smaller dari 1,96 kali kesalahan
standar mereka. Nilai-nilai ini dianggap mewakili distribusi normal (Sk=0), non-normal
(Sk=1) dan non-normal berat (Sk=1,75).
Prosedur pembuatan data berbeda untuk satu sampel dan tes sampel independen. Pertama,
prosedur untuk uji sampel independen dijelaskan. Yakni, data dihasilkan untuk
mensimulasikan struktur satu faktor yang diperkirakan sebanyak lima item. Nilai pembebanan
faktor diadaptasi dari Demirdağ and Kalafat (2015) dan ditetapkan ke .70, .78, .87, .77
dan .53. Pemuatan mewakili nilai kecil (.53) hingga besar (.87).
2.2. Prosedur Pembuatan Data
Untuk mensimulasikan pengujian sampel independen, pertama, skor faktor yang
didistribusikan secara normal dengan rata-rata 0 dan deklame standar 1 dihasilkan dalam R.
Kemudian, metode transformasi kekuatan Fleishman (Fleishman, 1978) digunakan untuk
mendapatkan skor faktor non-normal. Ini adalah salah satu metode yang diakui untuk
mensimulasikan non-normalitas (Bendayan, Arnau, Blanca & Bono, 2014). Hanya satu dari
dua kelompok independen yang tidak normal.
Tabel 1. Nilai Kecondongan dan Kurtosis yang Digunakan untuk Pembuatan Data
Kecondongan Kurtosis
Keadaan
Min Maks
Min Maks
SK=0 .00 .10 .00 .20
SK=2*SE 1.70 * SES 1.96 * SES 1.50 * 1.96 * KULIT
SEK
SK=1 .90 1.00 .80 1.00
SK=1,5 1.40 1.50 1.50 2.50
SK=1,75 1.60 1.75 5.00 -
Sk: Kecondongan; SES: Kesalahan Standar Kecondongan, SEK: Kesalahan Standar Kurtosis
Misalnya, untuk 25% sampel (kelompok 1) tidak normal dan 75% data (kelompok 2) normal.
Artinya, untuk persentase yang ditentukan dari total sampel tidak normal dansisa sampel
normal. Untuk memastikan struktur ini, pertama-tama kumpulan data terdistribusi normal
dihasilkan untuk ukuran sampel tertentu. Setelah mendapatkan kumpulan data yang
didistribusikan secara normal, kumpulan data lain dengan distribusi non-normal dihasilkan.
Kemudian these dua set data digabungkan untuk mendapatkan satu set data di mana variabel
pengelompokan juga tersedia. Sebelum menyimpan kumpulan data gabungan, asumsi varians
258
yang sama diuji dalam R. Jika asumsi terpenuhi, kumpulan data yang digabungkan disimpan
untuk pengujian sampel ent yang tidak tergantung. Total 500 set data dihasilkan untuk setiap
kondisi. Oleh karena itu, total 30.000 (500*4*3*5) set data dihasilkan untuk pengujian sampel
independen.
Untuk uji sampel dependen (o ne sampel), struktur faktor yang sama digunakan. Metode
transformasi kekuatan Fle ishman digunakan untuk mendapatkan skor faktor non-normal.
Skor yang disimulasikan dianggap seolah-olah merupakan perbedaan skor antara hasil pre-test
dan post-test. Untuk uji sampel dependen, hanya ukuran sampel dan tingkat non-normalitas
yang digunakan sebagai faktor desain. Jumlah replikasinya adalah 500. Yaitu, 500 set data
disimulasikan untuk masing-masing kondisi yang diberikan. Secara total, 10.000 (500*4*5)
set data dihasilkan untuk pengujian sampel dependen.
2.3. Analisis Data
Set d ata yang disimulasikanjuga diuji dalam R. Untuk menjalankan fungsi uji-t dan uji Mann-
Whitney U (Utest) t.test dan wilcox.test. Tingkat kesalahan tipe I untuk kedua pengujian
diatur ke .05. Dengan kata lain, signifikansi uji-U dan uji-t diuji pada tingkat .05 alpaha.
Untuk sampel independen uji-t varians yang sama diasumsikan karena dikontrol dalam proses
pembuatan data. Kumpulan data simulasi dianalisis dalam uji-t dan uji-U. Untuk studi empiris
hanya nilai-p dari tes yang digunakan untuk decide tentang hipotesis nol. Oleh karena itu,
hanya nilai-p untuk uji-t dan uji-U yang diperiksa berdasarkan penelitian ini juga. Akibatnya,
jumlah uji-t dan uji-U yang menunjukkan hasil yang sama berdasarkan nilai p(signifikan atau
tidak signifikan) were dihitung. Dengan kata lain, nilai p lebih besar dari .05 dan lebih kecil
dari .05 untuk uji-t dan uji-U dihitung. Hasil ini menunjukkan seberapa besar kesimpulan
yang dibuat pada hipotesis nol yang sama antara uji-t dan uji-U.
3. HASIL / TEMUAN
3.1. SatuHasil Tes Sampl e
Berdasarkan kondisi simulasi yang diberikan di atas, satu hasil tes sampel diberikan di bawah
ini. Berdasarkan hasil, kecondongan (yaitu, non-normalitas) data berpengaruh pada uji-t dan
uji-U. Gambar 1 menunjukkan perbedaan antara satu uji-t sampel dan uji-U Mann-Whitney.
Ketika kecondongan data meningkat, ketidaksamaan antara tes meningkat. Misalnya, ketika
kecondongan adalah 1, di bawah ukuran sampel 100, uji-t dan uji-U diberikan hasil yang
berbeda untuk 10% dari waktu. However, dalam kondisi yang sama ketika kecondongan
meningkat menjadi 1,5 perbedaannya meningkat menjadi 30%.
Gambar 1. Perbedaan antara uji-t dan uji-U untuk uji Satu Sampel
259
Orcan
Perbedaan juga tergantung pada ukuran sampel. Karena ukuran sampel ditingkatkan,
perbedaan antara uji-t dan uji-U juga meningkat untuk kumpulan data miring. Misalnya, di
bawah kecondongan 1, ketika ukuran sampel ditingkatkan dari 100 menjadi 300,
perbedaannya adalahtween tes ditingkatkan dari 10% menjadi 31%.
Ketika kumpulan data normal, perbedaan antara tes hanya sekitar 1%. Artinya, ketika data
normal, terlepas dari ukuran sampel, uji-t dan uji-U memberikan hasil yang sama untuk 99%
waktu. Gambar 1 juga menunjukkan hasil untuk kecondongan yang sama dengan dua kali dari
kesalahan standarnya (2*SES). Dalam kondisi ini, uji-t dan uji-U diberikan hasil yang sama
rata-rata 95% dari waktu. Tabel 2 memberikan hasil satu sampel tes secara rinci. Misalnya,
ketika ukuran sampel adalah 60 dan skewness adalah 1,75 maka d . Seperti yang terlihat dari
Tabel 2, untuk data miring 2*SES aturan memberikan perbedaan paling sedikit di mana nilainya
antara 3 dan 5 persen.
Tabel 2. Nilai Ketidaksesuaian (%) antara uji-t dan uji-U untuk Satu Uji Sampel
Data Miring
Ukuran Sampel
Biasa
2 * SES 1 1.5 1.75
60 1 5 9 17 19
100 1 3 10 30 34
300 1 5 31 67 71
1000 1 4 74 97 95
3.2. Hasil Uji Sampel Independen

Dua kelompok independen dibandingkan dalam studi simulasi ini. Berdasarkan hasil, ukuran
sampel berpengaruh pada nilai-p untuk data miring saja seperti halnya hasil pengujian satu
sampel. Karena ukuran sampel adalahperbedaan antara nilai-p tes juga meningkat untuk data
miring. Misalnya, di bawah 25% dari non-normal dan kecondongan adalah 1, karena ukuran
sampel ditingkatkan dari 100 menjadi 1000, ketidaksamaan pada nilai-p meningkat dari 4%
menjadi 20%. Kiri panel Gambar 2 menunjukkan hasil untuk 25% data non-normal
sedangkan panel kanan menunjukkan hasil untuk 50% (seimbang) data non-normal.
Berdasarkan hasil, di bawah data yang didistribusikan secara normal nilai-p tidak banyak
berubah dan perbedaannya adalah 2% pada maximum. Jadi, ketika data normal, terlepas dari
ukuran sampel, uji-t dan uji-U memberikan hasil yang sama untuk lebih dari 98% waktu.
Gambar 2 juga menunjukkan hasil untuk kecondongan sama dengan dua kali kesalahan
standar kecondongan (2*SES). Di bawah kondi tion ini, uji-t dan uji-U memberikan hasil
yang sama untuk lebih dari 97% waktu dalam hal nilai-p. Ukuran sampel tidak mempengaruhi
hasil dalam kondisi ini. Misalnya, seperti yang ditunjukkan pada sisi kiri Gambar 2,
perbedaan untuk nilai-p tes adalah sekitar 3% untuk ukuran sampel 100 dan 1000.
260
Gambar 2. Perbedaan antara uji-t dan uji-U untuk 25% dan 50% (seimbang) data non-normal
Di sisi lain, kecondongan juga berpengaruh pada nilai-p. Ketika kecondongan meningkat,
perbedaan antara nilai-p juga meningkat. Misalnya, pada panel kiri Gambar 2, karena
kecondongan meningkat dari 1 menjadi 1,75 perbedaan antara p-values meningkat dari 6%
menjadi 18%, di bawah ukuran sampel 300. Selain itu, karena ukuran sampel ditingkatkan,
rentang nilai-p juga meningkat untuk data miring. Misalnya, kisarannya sekitar 3% untuk
ukuran sampel 100 tetapi 12% untuk 300 dan 28% untuk 1000.
Persentase data miring juga mempengaruhi hasil tes t dan U. Gambar 3 menunjukkan persen
efek untuk ukuran sampel 60 dan 1000. Ketika ukuran sampel kecil (60) hasil data non-
normal 25%, 50% dan 75% tidak banyak berubah. Dalam kondisi ini, perbedaan antara nilai-
p adalah antara 3% dan 9%. Namun, karena ukuran sampel meningkat, efek persentase
menjadi lebih menonjol. Menariknya, perbedaan antara 25% dan 75% non-normalitas serupa.
Namun, 50%ormalitas non-n menunjukkan perbedaan yang berbeda dan lebih besar karena
ukuran sampel meningkat. Di sisi lain, ketika kecondongan sama dengan dua kali kesalahan
standarnya (2*SES), persen data miring tidak mempengaruhi hasil dan perbedaan antara %1
dan 3%. Hasil tesindependen diberikan pada Tabel 3 secara rinci.
Gambar 3. Perbedaan antara uji-t dan uji-U untuk ukuran sampel 60 dan 1000
Berdasarkan hasil tersebut terlihat jelas bahwa di bawah kumpulan data miring t-test dan U-
test memberikan hasil yang berbeda dalam hal p-value. Perbedaannya menjadi jelas karena
ukuran sampel dan kecondongan data meningkat. Namun, di bawah aturan kesalahan standar
1,96, baikukuran sampel maupun persentase kecondongan efektif. Oleh karena itu, hasil dari
kondisi ini diselidiki secara rinci.
Tabel 3. Nilai Ketidaksesuaian (%) antara uji-t dan uji-U untuk Uji Sampel Independen
261
Orcan
Data Miring
% dari
Ukuran Sampel
Kecondongan Biasa
2 * SES 1 1.5 1.75
25 1 3 4 3 5
60 50 2 2 4 4 9
75 2 2 3 6 5
25 1 3 4 5 7
100 50 0 3 5 8 11
75 1 2 2 7 13
25 1 1 6 13 18
300 50 2 2 11 20 22
75 1 3 8 15 15
25 2 3 20 37 48
1000 50 1 2 25 47 58
75 1 2 19 39 42
Tabel 4 menunjukkan nilai rata-rata perbedaan antara uji-t dan uji-U sehubungan dengan uji
SW. Ketika ukuran sampel adalah 60 sekitar 92,8% data normal berdasarkan tes SW. Dalam
kondisi ini, ketika uji-t seharusnya digunakan, 97,5% (90,5/92,8) dari U-test dan ketika uji-U
seharusnya digunakan, 98,6% (7,1/7,2) dari uji-t memberikan hasil yang sama. Meskipun
hasil tes SW berbeda persen kesamaannya sama di seluruh ukuran sampel. Misalnya, di
bawah ukuran sampel 1000, ketika uji-t seharusnya digunakan 97,5% (83,5/85,6) dari uji-U
memberikan hasil yang sama dalam hal nilai-p.
4. PEMBAHASAN dan KESIMPULAN
Memeriksa asumsi normalitas adalah salah satu langkah penting untuk studi persaingan rata-
rata. Berdasarkan hasil tes baik parametrik atau non-parametrik dianggap menguji perbedaan
rata-rata. Literatur menyarankan pendekatan yang berbeda untuk memeriksa asumsi. Beberapa
di antaranya adalah tes Kolmogorov-Smirnov, tes Shapiro-Wilk, memeriksa nilai skewness
dan kurtosis atau pada dasarnya melihat the histogram dari variabel dependen. Berdasarkan
tes yang dipilih hasil uji normalitas mungkin berbeda (Razali & Wah, 2011).
Tabel 4. Perbedaan Nilai Perbedaan Rata-Rata (%) untuk Aturan 2*SE
Ukuran Sampel
Hasil tes SW
60 100 300 1000
Biasa Sama 90.5 92.3 91.7 83.5

Beda 2.3 2.5 2.0 2.1
Sama 7.1 5.0 6.3 14.3
Tidak normal
Beda .1 .1 .0 .1
Total yang sama 97.6 97.3 98.0 97.8

Penggunaan nilai skewness dan kurtosis untuk memeriksa normalitas adalah hal biasa dalam
praktiknya. Beberapa menyarankan bahwa nilainya bisa mencapai 2 dalam nilai absolut. Di
sisi lain, kesalahan standar kecondongan dan kurtosis juga digunakan untuk tes normalitas.
Sayatidak disarankan bahwa nilai skewness dan kurtosis lebih kecil dari 1,96 kali dari
262
kesalahan standar mereka menunjukkan normalitas (Kim, 2013; Lapangan, 2009). Namun,
tidak ada kesepakatan tentang nilai-nilai yang menunjukkan normalitas himpunan data. Oleh
karena itu, stu dy saat inimensimulasikan kondisi yang berbeda untuk memeriksa pengaruh
nilai skewness dan kurtosis pada keputusan yang dibuat untuk tes perbandingan rata-rata
(alias, uji-t dan uji-U).
Berdasarkan hasil uji satu sampel (lihat Tabel 2) ketika data normal atau Sk < 1,96*SES, uji-t
dan uji-U menunjukkan hasil yang sama sehubungan dengan nilai-p. Oleh karena itu, dalam
kondisi ini, uji-t dapat digunakan tanpa khawatir. Hasil untuk data yang didistribusikan secara
normal seperti yang diharapkan. Namun demikian, dalam kondisi Sk < 1,96*SES, p-value uji-
t dan uji-U layak untuk ditunjukkan lagi. Ketika kecondongan lebih kecil dari kesalahan
standar 1,96, uji-t dan Utests menunjukkan hasil yang sama. Oleh karena itu, jika Sk < 1,96 *
SES, uji-t dapat digunakan untuk menguji perbedaan rata-rata. Namun, ketika
kemiringansekitar 1 atau lebih besar, uji-t dan uji-U menunjukkan kesimpulan yang berbeda.
Oleh karena itu, tes normalitas harus dipertimbangkan dengan cermat. Perlu ada bukti lain
untuk menunjukkan normalitas data. Jika tidak ada bukti yang ditemukan untuk normalitas
dan kecondongan sekitar atau lebih besar dari 1, mengingat keterbatasan penelitian ini, uji-U
harus digunakan untuk menguji perbedaan rata-rata.
Hasil serupa juga diperoleh untuk tes dua sampel. Artinya, ketika data normal atau Sk <
1,96*SES, uji-t dan uji-U menunjukkanhasil yang sama sehubungan dengan nilai-p. Oleh
karena itu, jika Sk < 1,96 * SES, uji-t dapat digunakan untuk menguji perbedaan rata-rata.
Namun, jika tidak ada bukti lain yang ditemukan dan kecondongan sekitar atau lebih besar
dari 1, uji-U harus digunakan untuk menguji perbedaan rata-rata. Sugge stion inisangat
penting untuk ukuran sampel yang lebih besar. Ketika ukuran sampel ditingkatkan, efek
kecondongan menjadi jelas dan perbedaan antara uji-t dan Utest meningkat.
Di sisi lain, hasil yang lebih rinci untuk aturan 1,96 * SE diberikan pada Tabel 4. Berdasarkan
tabel tersebut, ketika uji SW menunjukkan bahwa data normal, rata-rata 97,6% dari uji-t dan
uji-U sama dalam hal nilai-p. Demikian pula, ketika SW test menunjukkan bahwa data itu
tidak normal, rata-rata 99,0% dari tes adalah sama dalam hal nilai-p. Oleh karena itu, untuk
menggunakan uji-t untuk perbandingan rata-rata, aturan 1,96 * SE dapat digunakan. Terlepas
dari hasil tes SW, jika kecondongan dan kurtosis dari himpunan data gi ven lebih kecil dari
1,96 kesalahan standar mereka (sekitar 2 kesalahan standar), uji-t dapat lebih disukai daripada
uji-U. Namun, berdasarkan hasil simulasi, ketika kecondongan dan kurtosis dari kumpulan
data yang diberikan lebih besar dari 1 bukti lain untuk menunjukkan normalitas (misalnya,
Shapiro-Wilk) diperlukan. Oleh karena itu, jika tidak ada bukti lain yang diberikan uji-U
nonparametrik harus digunakan untuk perbandingan rata-rata. Dengan kata lain, aturan
"kecondongan dan lebih besar dari 1" tidak boleh digunakan untuk memutuskan antara uji-t
dan uji-U.
Sebagaicontoh, katakanlah that, seorang peneliti ingin menguji apakah ada perbedaan nilai
prestasi matematika antara siswa laki-laki dan perempuan. Untuk tujuan ini, sekitar 300 skor
siswa dikumpulkan dalam satu set data. Peneliti menguji normalitas scores untuk setiap jenis
kelamin groups dengan tes Shapiro Wilk. Katakanlah, tes menunjukkan bahwa datanya tidak
normal. Setelah tes, peneliti memeriksa nilai kecondongan dan kurtosis. Nilainya sekitar 1,5.
Karena nilainya lebih kecil dari 2, peneliti memutuskan untuk menggunakan tes parametrik
(misalnya, uji-t). Dalam hal ini, terdapat 16% kemungkinan (rata-rata 13%, 20%, 15%) bahwa
hasil uji-t berbeda dengan uji-U. Oleh karena itu, hanya menggunakan nilai skewness dan
kurtosis untuk memutuskan tentang normalitas kumpulan data terlalu berisiko. Itu berarti
bahwa jika hanya nilai kecondongan dan kurtosis yang digunakan untuk normalitas, ada
kemungkinan bahwa para peneliti dapat memutuskan untuk menggunakan metode yang salah
untuk menguji hipotesis mereka. Misalnya, mereka mungkin memutuskan untuk
263
Orcan
menggunakan uji-t when U-test seharusnya digunakan. Mengenai hal itu, sejauh penelitian ini
menunjukkan, karena kecondongan dan ukuran sampel meningkat uji-t dan uji-U memberikan
kesimpulan yang berbeda dalam hal menolak H 0. Oleh karena itu, dapat disimpulkan bahwa
nilai skewness dan kurtosis alone tidak boleh digunakan.
Literatur juga mengatakan bahwa pelanggaran asumsi normal mungkin tidak memiliki efek
serius pada hasil (Glass, Peckham, & Sanders, 1972, Blanca, Alarcon, Arnua, et al., 2017).
Namun, penggunaan tes non-parametrik masih sangat umum dalam praktiknya. Oleh karena
itu, tes normal masih diperiksa sebelum tes perbandingan rata-rata. Studi saat ini
menunjukkan bahwa hasil berubah berdasarkan tes yang dipilih. Hasil penelitian ini dibatasi
dengan perbandingan dua cara dankondisi sim ulasi yang telah ditentukan. Oleh karena itu,
hasilnya terbatas pada kondisi yang digunakan dalam penelitian. Misalnya, Ghasemi dan
Zahediasl (2012) dan Kim (2013) dan menyarankan penggunaan aturan 2,58*SE atau
3,29*SE di bawah ukuran sampel besar. Studi lain yang mensimulasikankondisi ini mungkin
juga berguna. Berdasarkan penelitian ini hanya asumsi normalitas yang diperiksa. Selain itu,
studi simulasi di mana data normal tetapi asumsi varians yang sama dilanggar juga dapat
informatif.
Deklarasi Bertentangan Interests dan Etika
Penulis menyatakan tidak ada konflik kepentingan. Penelitian ini sesuai dengan etika
penerbitan penelitian. Tanggung jawab ilmiah dan hukum atas manuskrip yang diterbitkan di
IJATE adalah milik penulis.
ORCID
Fatih Orcan http://orcid.org/0000-0003-1727-0456
5. REFERENSI
Abbott, M.L. (2011). Memahami statistik pendidikan menggunakan Microsoft Excel dan
SPSS. Amerika Serikat: Wiley & Sons, Inc.
Altman, D.G. (1991). Statistik praktis untuk penelitian medis. London: Chapman dan Hall
Bendayan, R., Arnau, J., Blanca, M.J. & Bono, R. (2014). Comparison dari prosedur
Fleishman dan Ramberg et al. untuk menghasilkan data non-normal dalam studi
simulasi.
Anales de Psicología, 30(1), 364-371. https://dx.doi.org/ 10.6018/analesps.30.1.135911
Bulmer, M. G. (1979). Prinsip statistik. Mineola, New York: Dover Publikasi Inc.
Büyüköztürk, Ş., Çokluk, Ö. & Köklü, N. (2014). Sosyal bilimler için istatistik (Edisi ke-15).
Ankara: Pegem Akademik.
Blanca, M.J., Arnau, J., Lopez-Montiel, D., Bono, R. & Bendayan, R. (2013). Kecondongan
dan kurtosis dalam sampel data nyata. Metodologi, 9(2), 78–84. https://dx.doi.org/
10.1027/16142241/000057
Blanca, M.J., Alarcon, R., Arnua, J., Bono, R. & Bendayan, R. (2017) Data non-normal:
Apakah ANOVA masih merupakan pilihan yang valid? Psicothema, 29(4), 552-557.
https://dx.doi.org/10.7334/psi cothema2016.383
Boslaugh, S. & Watters, P.A. (2008). Statistik singkatnya. Sebastopol, CA: O'REILLY.
Kain, M.K., Zhang, Z. & Yuan, K. (2017) Kecondongan dan kurtosis univariat dan multivariat
untuk mengukur nonnormalitas: Prevalensi, pengaruh dan estimasi. Behav Res, 49,
1716–
1735. https://dx.doi.org/0.3758/s13428-016-0814-1
Demir, E., Saatcioğlu, Ö. & İmrol, F. (2016). Uluslararası dergilerde yayımlanan eğitim
araştırmalarının normallik varsayımları açısından incelenmesi, Current Research in
264
Education, 2(3), 130-148. Diperoleh dari https://dergipark.org.tr/tr/pub/crd/issue/28292

/300531
Demirdağ, S., & Kalafat, S. (2015). Arti dalam kuesioner kehidupan (MLQ): Studi tentang
adaptasi terhadap bahasa Turki, validity, dan keandalan. İnönü üniversitesi eğitim
fakültesi dergisi, 16(2), 83-95. https://dx.doi.org/10.17679/iuefd.16250801
Lapangan, A. (2009). Menemukan Statistik Menggunakan SPSS (Edisi ke-3). London: SAGE
Publikasi Ltd
Fleishman, AI (1978). Metode untuk mensimulasikan distribusi non-normal. Psikometrika,
43, 521-532. https://dx.doi.org/10.1007/BF02293811
Ghasemi, A. & Zahediasl, S. (2012). Tes normalitas untuk analisis statistik: Panduan untuk
nonstatistik. Int J Endokrinologi & Metabolisme, 10(2), 486-489. https://dx.doi.org/
10,5 812/ijem.3505
Kaca, G., Peckham, P. & Sanders, J. (1972). Konsekuensi dari kegagalan untuk memenuhi
asumsi yang mendasari analisis efek tetap dari varians dan kovarians. Tinjauan
Pengukuran Pendidikan, 42, 237-288.
Huck, S.W. (2012). Membaca statistik dan penelitian (Edisi ke-6). Boston, MA: Pearson
Iyer, D.N., Tajam, B.M. & Sikat, T.H. (2017). Penciptaan pengetahuan dan kinerja inovasi:
Eksplorasi perspektif yang bersaing tentang sistem organisasi. Jurnal Manajemen
Universal, 5(6), 261-270. https://dx.doi.org/10.13189/ujm.2017 .050601
Kim, H. (2013). Catatan statistik untuk peneliti klinis: menilai distribusi normal (2)
menggunakan kecondongan dankurt osis. Kuliah terbuka tentang statistik (NA), 52-54.
https://dx.doi.org/ 10.539 5/rde.2013.38.1.52
Lei, M. & Lomax, RG (2005). Efek dari berbagai tingkat nonnormalitas dalampemodelan
persamaan st ructural. Pemodelan Persamaan Struktural, 12(1), 1-27.
https://dx.doi.org/ 10.12 07/s15328007sem1201_1
Miot, H.A. (2016). Menilai normalitas data dalam uji klinis dan eksperimental. Jornal
Vaskular Brasileiro 16(2) 88-91. https://dx.doi.org/ 10.1590/1677-5449.041117
Orçan, F. (2020). Sosyal bilimlerde istatistik SPSS ve Excel uygulamaları (1 st Edition).
Ankara: Anı Yayıncılık.
Taman, H.M. (2008). Analisis univariat dan uji normalitas menggunakan sas, stata, dan spss.
Bekerja
Kertas. Pusat Layanan Teknologi Informasi Universitas (UITS) untuk Komputasi
Statistik dan Matematika, Universitas Indiana
Perry, J.L., Dempster, M. & McKay, M.T. (2017) Efikasi diri akademik sebagian memediasi
hubungan antara index skotlandia dari perampasan berganda dan skor pencapaian
komposit. Perbatasan dalam Psikologi, (8), NA.
https://dx.doi.org/10.3389/fpsyg.2017.01899
Razali N.M. & Wah, Y.B. (2011). Perbandingan kekuatan tes Shapiro-Wilk, Kolmogorov-
Smirnov, Lilliefors dan Anderson-Darling, Jurnal Pemodelan Statistik dan
Analisis, 2(1), 21-33. Diperoleh dari: https://www.researchgate.net/publication/26720
5556
Rachon, J., Gordan, M. & Kieser, M. (2012). Untuk menguji atau tidak menguji: Penilaian
awal normalitas ketika membandingkan dua sampel independen, BMC Medical
Research
Metodologi, (12),81. https://dx.doi.org/10.1186/1471-2288-12-81
Ramos, C., Costa, P.A., Rudnicki, T., dkk. (2018). Efektivitas intervensi kelompok untuk
memfasilitasi pertumbuhan pascatrauma di antara wanita dengan cance payudarar.
Psiko‐Onkologi, (27), 258–264. https://dx.doi.org/10.1002/pon.4501
265
Orcan
Rietveld, T. & van Hout, R. (2015). Tes t dan seterusnya: Rekomendasi untuk menguji
kecenderungan sentral dari dua sampel independen dalam penelitian tentang patologi
bicara, bahasa dan pendengaran. Jurnal Gangguan Komunikasi, (58), 158-168.
https://dx.doi.o RG/10.1016/j.jcomdis.2015.08.002
Schucany, W.R. & Tony N.G., H.K. (2006). Tes goodness-of-fit awal untuk normalitas tidak
memvalidasi siswa satu sampel t. Komunikasi dalam Statistik – Teori dan Metode, 35,
2275-2286. https://dx.doi.org/10.1080/03610920600853308
Şirin, Y.E., Aydın, Ö. & Bilir, F.P. (2018). Kepemimpinan transformasional-transaksional dan
persepsi sinisme organisasi: pendidikan jasmani dan guru olahraga sampel.
Universal Jurnal Penelitian Pendidikan, 6(9), 2008-2018. https://dx.doi.org/ 10.131
89/ujer.2018.060920
Barat, S.G., Finch, J.F. & Curran, P.J. (1995). Model persamaan struktural dengan variabel
nonnormal: masalah dan solusi. Dalam RH Hoyle (Ed.). Pemodelan persamaan
struktural: Konsep, masalah, dan aplikasi. Taman Newbery, CA: SAGE.
266

Jurnal Internasional Alat Penilaian Dalam Pendidikan

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Jurnal Internasional Alat Penilaian Dalam Pendidikan

Diunggah oleh

Hak Cipta:

Format Tersedia

Jurnal Internasional Alat Penilaian dalam Pendidikan

2020, Vol. 7, No. 2, 255–265

Diterbitkan di https://dergipark.org.tr/en/pub/ijate Research Article

Parametrik atau Non-parametrik: Kecondongan untuk Menguji Normalitas

KONTAK: Fatih Orcan  fatihorcan@trabzon.edu.tr  Universitas Trabzon, Kolase Pendidikan Fatih,

kecondongan dan kurtosis hingga nilai absolut 1 dapat menunjukkan normalitas

3.2. Hasil Uji Sampel Independen

Biasa Sama 90.5 92.3 91.7 83.5

Total yang sama 97.6 97.3 98.0 97.8

Education, 2(3), 130-148. Diperoleh dari https://dergipark.org.tr/tr/pub/crd/issue/28292

Anda mungkin juga menyukai