Pembahasan
Pembahasan
CTT menunjukkan bahwa tingkat kesulitan CFIT-scale-2 tidak sesuai dengan tingkat kesulitan
yang disarankan, sedangkan IRT menunjukkan bahwa item CFIT-scale-2 berada di antara
tingkat sedang dan sulit tanpa ada item yang mudah.
Analisis diskriminasi item menunjukkan perbedaan antara CTT dan IRT. CTT menunjukkan
hanya 39% item yang memiliki diskriminasi baik, sedangkan IRT menunjukkan 69% item
dengan diskriminasi baik.
2. Analisis Distraktor:
Distraktor pada pertanyaan pilihan ganda dirancang untuk mengandung jawaban yang
masuk akal tetapi salah berdasarkan kesalahan umum. Hasil menunjukkan bahwa 25% dari
distraktor CFIT-scale-2 tidak efektif, yang dapat mempengaruhi diskriminasi item.
Penggunaan DIF untuk menguji apakah item berperilaku berbeda di antara subkelompok
menunjukkan bahwa CFIT-scale-2 berfungsi baik dan hasilnya tidak dipengaruhi oleh jenis
kelamin.
4. Analisis Validitas:
5. Analisis Reliabilitas:
Hasil menunjukkan bahwa CFIT-scale-2 memiliki tingkat konsistensi internal yang baik dan
tingkat reliabilitas yang tinggi, sesuai dengan studi sebelumnya.
Kesimpulan:
Meskipun CFIT-scale-2 memiliki tingkat kesulitan yang bervariasi, tidak mengikuti pola yang
seimbang dari mudah, sedang, hingga sulit. Diskriminasi item CFIT-scale-2 tidak optimal, dan distraktor juga
tidak secara umum efektif IRT menunjukkan bahwa penempatan item dalam CFIT-scale-2 tidak sesuai
dengan tingkat kesulitan yang diinginkan, dan diskriminasi item juga tidak optimal. CFIT-scale-2 terbukti
bebas dari diskriminasi yang tidak diinginkan terhadap jenis kelamin, menegaskan bahwa skor hanya
mencerminkan kemampuan pengujian dan tidak dipengaruhi oleh perbedaan subkelompok. Validitas
konstruk CFIT-scale-2 terbukti baik, dan alat pengukur ini memiliki tingkat reliabilitas yang tinggi.