ABSTRAK
Wonderlic Personnel Test (WPT) yang dirancang pada tahun 1936 dan terakhir kali direvisi pada tahun 1937, kebocoran soal dan kunci jawaban
telah beredar di internet, sehingga dapat mempengaruhi terhadap kualitas aitem dan karakteristik psikometri. Penelitian ini bertujuan untuk
menganalisis karakteristik psikometri pada WPT, yaitu analisis indeks kesukaran aitem, indeks diskriminasi aitem, validitas konstrak dan
reliabilitas. Subjek dalam penelitian ini sebanyak 1.372 orang siswa SMA dan 652 orang siswa SMK. Hasil analisis indeks kesukaran aitem pada
WPT tidak sesuai dengan urutan tingkat kesukaran aitem. Hasil analisis indeks diskriminasi aitem pada WPT terdapat 3 aitem cukup bagus, dan
10 aitem belum memuaskan. Hasil analisis validitas konstrak pada WPT masing-masing aitem menunjukkan bahwa tidak terdapat aitem valid
karena nilai loading faktor dibawah 0,3 dan tidak memenuhi kriteria goodness of fit. Hasil reliabilitas tidak dapat dihitung dikarenakan pada
pengujian validitas menunjukkan hasil yang tidak signifikan, sehingga alat ukur WPT tidak hanya mengukur satu konstrak tetapi mengukur hal
lain. Manfaat dalam penelitian ini yaitu sebagai bahan pertimbangan saat menggunakan alat ukur dalam memberikan pelayanan tes psikologi.
Kata Kunci: Indeks diskriminasi, indeks kesukaran, validitas, wonderlic personnel test
ABSTRACT
Wonderlic Personnel Test (WPT), designed in 1936 and last revised in 1937, has leaked questions and answer keys circulating on the internet, so
that it can affect the quality of items and psychometric characteristics. This study aims to analyze the psychometric characteristics of WPT, namely
the item difficulty index analysis, item discrimination index, construct validity and reliability. The subjects in this study were 1,372 high school
students and 652 vocational students. The results of the item difficulty index analysis at WPT were not in accordance with the order of the item
difficulty level. The results of the analysis of the item discrimination index at WPT, there are 3 items that are quite good, and 10 items are not
satisfactory. The results of the analysis of the construct validity at the WPT of each item show that there is no valid item because the factor loading
value is below 0.3 and does not meet the goodness of fit criteria. Reliability results cannot be calculated because the validity test shows insignificant
results, so the WPT measuring instrument does not only measure one construct but measures another. The benefit in this research is that it is
taken into consideration when using measuring instruments in providing psychological testing services.
110
PINISI JOURNAL OF ART, HUMANITY AND SOCIAL STUDIES
111
PINISI JOURNAL OF ART, HUMANITY AND SOCIAL STUDIES
Periantalo (2015) mengemukakan bahwa validitas berpotensi untuk mengalami kebocoran jawaban soal,
merupakan keakuratan tes yang hendak diukur. sehingga tingkat validitas dan reliabilitasnya
Validitas mengukur isi atau komponen yang terdapat diragukan. Peneliti juga menemukan kebocoran soal
pada alat ukur sesuai dengan tujuan pengukuran. melalui situs internet yang sangat mudah diakses dan
Azwar (2013) mengemukakan bahwa validitas terbagi diunduh, yaitu: https://yukdapatkerja.blogspot.com,
menjadi tiga, yaitu validitas isi, validitas konstrak, dan https://www.jagel.id,
validitas berdasar kriteria. Validitas yang digunakan https://kisikisisoaldanmateripelajaran368.blogspot.co
pada Wonderlic Personnel Test adalah validitas faktorial m, https://www.coursehero.com,
dengan menggunakan teknik analisis faktor CFA https://kuncijawaban-ku.blogspot.com.
(Confirmatory Factory Analysis) untuk menghasilkan
muatan loading faktor dalam setiap aitem tes. Permasalahan ini juga dapat memberi dampak pada
Natalya dan Purwanto (2018) mengemukakan kemampuan tes termasuk pada perhitungan
bahwa asumsi dasar dari metode CFA yaitu jika karakteristik psikometri seperti indeks kesukaran
memiliki nilai muatan loading factor yang cukup dalam aitem, indeks diskriminasi aitem, validitas dan
memenuhi beberapa kriteria dari goodness of fit (GOF). reliabilitas, sehingga dibutuhkan usaha sehingga
Hair, Black, Babin, dan Anderson (2014) menjelaskan dapat menunjukkan kualitas tes yang baik. Upaya
bahwa loading factor adalah korelasi yang untuk dapat menganalisis kualitas dari tes inteligensi
menghubungkan antara indikator dan konstrak. Hair, dapat dilihat melalui analisis karakteristik psikometri.
Black, Babin, dan Anderson (2014) menjelaskan bahwa
muatan loading faktor p > 0,3 menunjukkan bahwa Berdasarkan dari latar belakang diatas, peneliti tertarik
aitem dinyatakan memenuhi tingkat minimal, nilai p > untuk mengambil tema penelitian mengenai
0,50 menunjukkan bahwa aitem dapat dinyatakan karakteristik psikometri pada tes Wonderlic Personnel
signifikan dan nilai p > 1,70 menunjukkan bahwa lebih Test yang dapat dipercaya pada validitas dan
baik dari analisis faktor. reliabilitas hasil individu yang berada pada siswa SMA
sederajat di Kota Makassar. Analisis karakteristik
Goodness of fit (GOF) digunakan untuk membuktikan psikometri yang efektif pada Wonderlic Personnel Test
kesesuain pengelompokan aitem dengan model toritis akan dibutuhkan agar dapat menjalankan fungsi
yang telah dibuat. Natalya dan Purwanto (2008) ukurnya. Supratiknya (2014) mengemukakan bahwa
mengemukakan bahwa Goodness of fit dikatakan baik segi psikometri tes dapat dilihat melalui kualitas
apabila telah memenuhi lebih dari tiga kategori yang kinerja tes yang menilai atribut psikologis tertentu
telah ditetapkan yaitu chi-square, RMSEA, NFI, CFI, yang dianalisis menggunakan teknik statistik. Aspek
dan GFI. Chi-square atau p-value of X2 > 0,05 bertujuan esensial dari kualitas tes adalah validitas, reliabilitas,
untuk menguji dan mengembangkan sebuah model dan daya diskriminasi tes
yang sesuai atau fit dengan data. RMSEA (The Root
Mean Square Error Approximation) < 0,08 bertujuan 2. METODE PENELITIAN
untuk mengkompensasi nilai statistik dari chi-square
dalam jumlah sampel besar. NFI (Normed fit index) > Dalam penelitian ini, peneliti berfokus pada nilai
0,90 bertujuan untuk penerimaan model. CFI angka sehingga dapat diartikan bahwa penelitian ini
(Comparative Fit Index) > 0,90 bertujuan untuk adalah jenis penelitian kuantitatif. Karakteristik dalam
mengindikasikan tingkat penerimaan model. GFI penelitian ini yaitu, adalah individu berusia 15 tahun
(Goodness of Fit Index) > 0,90 bertujuan untuk sampai 18 yang merupakan siswa SMA sederajat di
menunjukkan penerimaan atau penolakan suatu Kota. Berdasarkan data populasi jumlah siswa
model. Periantalo (2015) mengemukakan bahwa uji menengah mengah atas negeri dan swasta dari seluruh
reliabilitas mengacu pada kosistensi alat ukur. Uji tingkatan berjumlah 65.570 dan peneliti melakukan
reliabilitas dilakukan melalui konsistensi internal yaitu dengan teknik cluster random sampling. Teknik ini
melalui pengujian atas diri sendiri dengan satukali dilaksanakan dengan menjadikan sekolah sebagai
pengukuran, kemudian akan ditampilkan hasil ukur kelompok-kelompok kelas yang diundi untuk
korelasi. menemukan sekolah mana yang dijadikan kelompok
subjek.
Penggunaan tes yang diberikan berulang kali dapat
memberikan efek pembelajaran yang dimiliki
112
PINISI JOURNAL OF ART, HUMANITY AND SOCIAL STUDIES
113
PINISI JOURNAL OF ART, HUMANITY AND SOCIAL STUDIES
kategori sulit. Indeks kesukaran aitem pada tes WPT 1 0, Jelek dan aitem 3 0, Jelek dan aitem
tersusun secara acak. Anastasi dan Urbina (2007) 0 0 harus dibuang 5 0 harus dibuang
menjelaskan bahwa penyusunan aitem yang dikatakan 3 1
baik yaitu memilih aitem dengan tingkat kesulitan 6 7
yang dimulai dari kesulitan termudah, sedang, dan 1 0, Jelek dan aitem 3 0, Jelek dan aitem
sulit. 1 1 harus dibuang 6 0 harus dibuang
2 5
7 6
Tabel 5. Hasil analisis indeks diskriminasi WPT 1 0, Cukup bagus 3 0, Jelek dan aitem
2 3 tapi masih perlu 7 0 harus dibuang
N R Indeks N R Indeks 4 peningkatan 7
o p Diskriminasi o p Diskriminasi 1 8
bi bi 1 0, Jelek dan aitem 3 0, Jelek dan aitem
s/ s/ 3 0 harus dibuang 8 0 harus dibuang
R R 6 0
1 0, Jelek dan aitem 2 0, Jelek dan aitem 8 0
1 harus dibuang 6 0 harus dibuang 1 0, Jelek dan aitem 3 0, Jelek dan aitem
7 9 4 1 harus dibuang 9 1 harus dibuang
3 9 1 1
2 0, Jelek dan aitem 2 0, Belum 7 2
1 harus dibuang 7 2 memuaskan, 1 0, Cukup bagus 4 0, Jelek dan aitem
2 1 perlu perbaikan 5 3 tapi masih perlu 0 0 harus dibuang
6 2 2 peningkatan 7
3 0, Jelek dan aitem 2 0, Jelek dan aitem 8 8
0 harus dibuang 8 1 harus dibuang 1 0, Jelek dan aitem 4 0, Jelek dan aitem
6 3 6 1 harus dibuang 1 0 harus dibuang
8 8 6 6
4 0, Jelek dan aitem 2 0, Belum 7 7
1 harus dibuang 9 2 memuaskan, 1 0, Belum 4 0, Jelek dan aitem
5 1 perlu perbaikan 7 2 memuaskan, 2 0 harus dibuang
1 6 4 perlu perbaikan 0
5 0, Jelek dan aitem 3 0, Jelek dan aitem 1 1
1 harus dibuang 0 1 harus dibuang 1 0, Belum 4 0, Jelek dan aitem
6 5 8 2 memuaskan, 3 0 harus dibuang
1 2 4 perlu perbaikan 5
6 0, Jelek dan aitem 3 0, Belum 1 9
1 harus dibuang 1 2 memuaskan, 1 0, Jelek dan aitem 4 - Jelek dan aitem
8 3 perlu perbaikan 9 0 harus dibuang 4 0, harus dibuang
0 6 0 0
7 - Jelek dan aitem 3 0, Jelek dan aitem 2 1
0, harus dibuang 2 1 harus dibuang 8
0 5 2 0, Belum 4 0, Jelek dan aitem
6 0 0 2 memuaskan, 5 0 harus dibuang
7 2 perlu perbaikan 0
8 0, Belum 3 0, Jelek dan aitem 2 3
2 memuaskan, 3 1 harus dibuang 2 0, Belum 4 0, Jelek dan aitem
6 perlu perbaikan 1 1 2 memuaskan, 6 1 harus dibuang
0 0 2 perlu perbaikan 3
9 0, Jelek dan aitem 3 0, Jelek dan aitem 2 1
1 harus dibuang 4 1 harus dibuang
9 0
6 3
114
PINISI JOURNAL OF ART, HUMANITY AND SOCIAL STUDIES
115
PINISI JOURNAL OF ART, HUMANITY AND SOCIAL STUDIES
yang akurat, valid, dan reliabel. Lord dan Novick aitem kategori belum memuaskan, sebanyak 37
(Umar, 2020) mengemukakan bahwa jika alat ukur aitem dalam kategori jelek dan harus dibuang.
yang berbasis truescore dimana hasil yang diperoleh Sehingga tersisa 13 aitem yang masih bertahan.
tidak valid dan paralel maka hasil reliabilitas tidak 3. Hasil analisis validitas konstrak WPT
dapat dilaporkan. menunjukkan bahwa kategori tidak valid terjadi
karena nilai loading factor dibawah 0,3 dan tidak
Hasil analisis validitas dan reliabilitas pada tes WPT memenuhi goodness of fit. Alat ukur tidak dapat
perlu dilakukan peninjauan kembali dan dilakukan berfungsi dengan baik, namun masih butuh
revisi aitem. Sukardi (2015) menjelaskan bahwa perbaikan dan peningkatan aitem cukup bagus
terdapat tiga faktor yang mampu mempengaruhi dan masih belum memuaskan
validitas suatu alat ukur yaitu faktor internal, faktor 4. Hasil analisis reliabilitas konstrak menunjukkan
eksternal tes, dan faktor yang juga berasal dari siswa bahwa WPT memiliki reliabilitas yang tidak baik
saat mengerjakan alat tes. Faktor internal tes yang sehingga keakuratan sebagai alat tes masih
pertama yaitu instruksi tes yang disusun dengan diragukan.
makna yang sulit dipahami sehingga dapat
mempengaruhi validitas tes, kedua yaitu kata yang Berdasarkan hasil penelitian saran yang dapat
digunakan di dalam alat ukur terlalu sukar, ketiga dimasukkan sebagai berikut.
yaitu aitem tes yang dikonstruksi kurang baik dan 1. Bagi biro psikologi, penelitian ini dapat menjadi
waktu dalam pengerjaan dialokasikan kurang tepat. pertimbangan dalam menggunakan alat tes WPT.
2. Penelitian ini selanjutnya dapat dijadikan sebagai
Sukardi (2015) mengemukakan bahwa faktor eksternal referensi untuk pengembangan penelitian
yang dapat mempengaruhi tes yang pertama, yaitu berikutnnya.
waktu pada saat pengerjaan tidak cukup sehingga 3. Untuk peneliti selanjutnya diharapkan dapat
dalam memberikan jawaban siswa berada pada situasi ditindaklanjuti dengan melakukan revisi aitem
yang terburu-buru, seperti yang terjadi pada saat pada WPT yang memiliki kualitas aitem yang
pengambilan data waktu yang diberikan oleh sekolah tergolong buruk.
pada saat jam istirahat, sehingga dapat mengganggu 4. Peneliti selanjutnya yang memiliki revisi terhadap
waktu istirahat siswa atau pada saat jam pembelajaran aitem WPT diharapkan untuk membuat aitem
pertama dimulai. Faktor eksternal yang kedua yaitu berdasarkan dari tingkat kesukaran dari mudah,
adanya kecurangan pada saat pengerjaan tes sehingga sedang, hingga sukar.
tidak dapat membedakan antara siswa yang belajar 5. Untuk peneliti selanjutnya diharapkan untuk
dengan yang melakukan kecurangan. Faktor eksternal membuat norma baru dari tes WPT untuk wilayah
yang ketiga yaitu pemberian petunjuk dari pengawas Kota Makassar.
yang tidak dapat dilakukan pada semua siswa, seperti Peneliti selanjutnya perlu mempertimbangkan waktu
instruksi yang diberikan tidak cepat diserap oleh siswa dalam melakukan pengambilan data, sehingga tidak
dan masih ada siswa yang masih bertanya pada saat mengganggu waktu proses pembelajaran dan ujian
pengerjaan soal dimulai. Faktor yang berasal dari sekolah.
siswa seperti sebelum pelaksanaan tes, akibatnya
siswa merasa tegang karena situasi tes. DAFTAR PUSTAKA
Anastasi, A. & Urbina, S. (2016). Tes psikologi (edisi ke-
4. KESIMPULAN
7). Terjemahan: Robertus
Berdasarkan dari hasil analisis karakteristik psikometri Hariono. Jakarta: Indeks.
yang telah dilakukan maka peneliti menyimpulkan Azwar, S. (2013). Konstruksi tes kemampuan kognitif.
bahwa: Yogyakarta: Pustaka pelajar.
1. Hasil dari analisis indeks kesukaran aitem WPT Azwar, S. (2015a). Pengantar psikologi inteligensi.
secara keseluruhan mempunyai tingkat variasi Yogyakarta:Pustaka Belajar.
kesukaran aitem yang tidak berurut sesuai dengan Azwar, S. (2015b). Tes prestasi: Fungsi dan pengembangan
tingkat kesukaran dari mudah, sedang, hingga pengukuran prestasi belajar. Yogyakarta. Pustaka
sukar. Belajar.
2. Hasil dari analisis indeks diskriminasi aitem WPT Dodrill, C.B. (1981). An economical method for the
menunjukkan bahwa 3 aitem lumayan baik, 10 evaluation of general intelligence
116
PINISI JOURNAL OF ART, HUMANITY AND SOCIAL STUDIES
in adults. Journal of Consulting and Clinical Sukardi, M. (2015). Evaluasi pendidikan: Prinsip &
Psychologhy. 49(5), 668-673 operasionalnya edisi 1 cetakan VIII. Jakarta: PT. Bumi
Hair, J.F., Black, W.C., Babin, B.J., & Anderson, R.E. Aksara.
(2014). Multivariate data Supratiknya, A. (2014). Pengukuran psikologis.
analysis (7th ed). London: Pearson Education Yogyakarta: Sanata Dharma
Limited. University Press Anggota APPTI.
Kaplan, R. M., & Sacuzzo, D. P. (2012). Pengukuran Umar, J., & Nisa, Y. F. (2020). Uji validitas konstruk
psikologi: Prinsip, penerapan, dan isu (edisi 7). dengan dengan CFA dan
Jakarta: Salemba Humanika. pelaporannya. Jurnal pengukuran psikologi dan
Kusdiyati, S. (2010). Studi korelasi WPT (Wonderlic pendidikan Indonesia, 9(2), 1-
Personnel Test) dan IST 11.
(Intelligen Structur Test). Jurnal Ilmiah Psikologi, https://kisikisisoaldanmateripelajaran368.blogspot.co
3(1), 59-76. m/2019/07/contoh-soal-psikotes-wpt.html,
McCanns, M.A. (2006). The wonderlic test for the NFL diakses pada 4 September 2019.
draft: Lingking stereotype https://kuncijawaban-ku.blogspot.com/2019/10/kunci-
threat and the law. jawaban-soal-wpt.html, diakses pada 4 September
Natalya, L. & Purwanto, C. V. (2018). Exploratory and 2019.
confirmatory factor analysis https://www.coursehero.com/file/32531128/soal-
of the academic motivation scale (AMS)-bahasa wptdoc/, diakses pada 4 September 2019.
Indonesia. Jurnal Makara HubsAsia, 22(1), 29-42. https://www.jagel.id/list/soal-wpt-128473, diakses
Periantalo, J. (2015). Validitas alat ukur psikologi: Aplikasi pada 4 September 2019.
paraktis. Yogyakarta: https://yukdapatkerja.blogspot.com/2018/12/soal-dan-
Pustaka Pelajar. pembahasan-tes-seleksi-kerja.html, diakses pada 4
September 2019.
117