Puji syukur kehadiran tuhan YME yang telah memberikan rahmat dan hidayah
sehingga kelompok kami dapat menyelesaikan makalah yang berjudul analisi aitem ini
dengan tepat waktu
Adapun tujuan dari penulis makalah ini adalah untuk memenuhi tugas dan dosen
pengampu mata kuliah kontruksi dan pengukuran bimbingan dan konseling selain itu, makah
ini juga bertujuan untuk memenuhi wawasan bagi para pembaca dan juga bagi penyusun
tentang analisis aitem uji daya deskriminasi, analisis aitem uji validitas istrumen, analisis
aitem uji reabilitas instrument.
Kami mengucapkan terimakasih kepada ibu tati indriani, S., M.M., MA., selaku dosen
pengampu yang telah memberikan tugas ini, sehingga dapat menambah ilmu yang sesuai
dengan bidang studi yang kami tempuh.
Kami juga mengucapkan terimaksaih kepada semua pihak yang telah memudahkan
kami dalam menyelesaikan makalah ini.
Kami menyadari, bahwa makalah ini jauh dari kata sempurna, oleh karena itu,kami
meminta kritik,saran,untuk membangun makalah ini.
PENDAHULUAN
Dalam dunia pendidikan, penilaian merupakan bagian yang tidak terpisahkan dari
proses belajar mengajar. Sistem penilaian yang baik akan mendorong guru menggunakan
strategi mengajar yang lebih baik dan memotivasi anak untuk belajar lebih giat. Penilaian
biasanya dimulai dengan kegiatan pengukuran. Pengukuran (measurement) merupakan
cabang ilmu statistika terapan yang bertujuan untuk membangun dasar-dasar pengembangan
tes yang lebih baik sehingga menghasilkan tes yang berfungsi secara optimal, valid, dan
reliabel.
Proses belajar mengajar dilaksanakan tidak hanya untuk kesenangan atau bersifat mekanis
saja tetapi mempunyai misi atau tujuan bersama. Dalam usaha untuk mencapai misi dan
tujuan itu perlu diketahui apakah usaha yang dilakukan sudah sesuai dengan tujuan? Untuk
mengetahui apakah tujuan pendidikan sudah tercapai perlu diadakan tes. Sebuah tes yang
dapat baik sebagai alat pengukur harus dianalisis terlebih dahulu. Dalam menganalisis butir
soal dalam tes harus memperhatikan daya serap, tingkat kesukaran, daya beda, fungsi
pengecoh, validitas dan reabilitas. Hal tersebut dilakukan agar tes yang diberikan kepada
siswa sesuai dengan daya serap siswa, tingkat kesukarannya, dan soal yang diberikan pun
harus valid. Sehingga, tujuan dari pembelajaran dapat tercapai.
BAB II
PEMBAHASAN
Setelah perumusan indikator perilaku jelas, maka penulisan item baru dapat
dilakukan. Setiap item mengacu pada satu indikator perilaku tertentu (Azwar, 2009). Tes
yang baik adalah tes yang reliabel dan valid. Jika demikian maka item-item dalam tes itu
pun harus baik. Item yang baik adalah item yang reliabel dan valid, di mana item dapat
berfungsi membedakan kemampuan antar individu penempuh tes (Cohen & Swerdlik,
2005). Untuk mengetahui karakteristik item yang baik tersebut maka dilakukanlah proses
analisis terhadap item.
Teknik untuk melakukan analisis item dapat dilakukan secara kualitatif dan
kuantitatif. Secara garis besar analisis kualitatif dilakukan terkait dengan validitas isi dan
prosedur penulisan yang baik, sedangkan analisis kuantitatif terkait dengan pengukuran
tingkat kesulitan item dan daya beda (Anastasi & Urbina, 1997). Analisis secara
kualitatif dilakukan untuk mengetahui apakah item telah mewakili domain atau ranah
perilaku sesuai dengan konstruk yang hendak diukur dan apakah dari segi prosedur
penulisan, item tersebut sudah dibuat dengan baik (Anastasi & Urbina, 1997). Untuk
melihat apakah item telah ditulis sesuai dengan indikator perilaku yang hendak diungkap
sebaiknya melibatkan pakar yang memang ahli dalam masalah atribut yang hendak diukur
(Azwar, 2009). Sedangkan, terkait dengan penulisan item, Azwar (2009) memaparkan
beberapa kaidah penulisan item yang baik, diantaranya menggunakan kalimat yang
sederhana, jelas dan mudah dimengerti oleh responden, namun tetap harus mengikuti tata
tulis dan bahasa yang baku, hindari penafsiran ganda pada kalimat item, penulisan item
mengacu pada indikator perilaku atau pada komponen atribut, oleh karena itu sebaiknya
jangan menulis item yang secara langsung menanyakan atribut yang hendak diungkap,
perhatikan indikator perilaku yang hendak diungkap sehingga stimulus dan pilihan
jawaban tetap relevan dengan tujuan pengukuran, isi item tidak boleh mengandung social
desirability atau item yang sesuai dengan keinginan sosial pada umumnya atau dianggap
baik dari sudut pandang norma sosial karena item yang mengandung social desirability
akan cenderung disetujui oleh semua orang karena orang akan berpikir normatif dan
bukan karena sesuai dengan keadaan dirinya, hindari stereotip jawaban, maka sebaiknya
sebagian dari item-item dibuat dalam arah favorable dan sebagian lagi unfavorable.
Setelah tahap analisis kualitatif selesai, yaitu termasuk setelah terkumpul jumlah item
yang dinilai cukup, di mana menurut Cohen dan Swerdlik (2005) sebaiknya jumlah item
yang dibuat sebanyak 2 kali lipat item akhir yang direncakaan, sedangkan menurut Azwar
(2009) jumlahnya biasanya tiga kali lipat dari jumlah item akhir yang direncanakan, maka
setelah itu item-item tersebut disusun dalam format semi-final dan siap dilakukan uji coba
secara empiris kepada subjek tes (Azwar, 2009). Setelah dilakukan pengujian empiris
(field-tested) maka hasil uji coba terebut dianalisis dengan teknik analisis kuantitatif,
seperti yang telah dikemukakan sebelumnya, dengan melihat bagaimana tingkat kesulitan
item dan daya bedanya, serta daya pengecoh jika item tersebut dalam format pilihan
ganda.
Teknik selanjutnya, selain analisis tingkat kesulitan item, adalah analisis terhadap
daya beda item. Menurut Anastasi dan Urbina (1997), daya beda item mengacu pada
sejauh mana item dapat membedakan dengan tepat antara peserta tes yang memiliki
kemampuan dengan yang tidak terhadap perilaku yang menjadi objek pengukuran.
Teknik analisis ini dapat dilakukan dengan perhitungan indeks diskriminasi dengan
menggunakan metode kelompok-kelompok ekstrem dan indeks korelasi (Crocker &
Algina, 1986).
Teknik analisis item berikutnya berlaku pada item yang bersifat pilihan ganda.
Menurut Cohen dan Swerdlik (2005), meski tidak menyebutkan istilah ‘Daya Pengecoh’
namun analisis alternatif pilihan jawaban yang dimaksudkan serupa dengan makna
analisis daya pengecoh ini digunakan untuk melihat apakah alternatif pilihan jawaban
yang salah bekerja dengan baik pada subjek yang berada pada upper group dan lower
group. Teknik ini dilakukan dengan cara membandingkan berapa subjek pada upper
group dengan lower group yang memilih masing-masing alternatif jawaban pada item
tertentu. Alternatif jawaban terdiri dari satu jawaban yang benar dan yang dimaksud
dengan jawaban pengecoh adalah beberapa pilihan jawaban lainnya yang salah. Pada
prinsipnya, untuk mengetahui apakah pengecoh berfungsi baik pada suatu item atau tidak
adalah dengan melihat apakah jawaban yang benar (kunci jawaban) banyak dipilih oleh
kelompok subjek yang tergolong dalam upper group dibanding lower group (Cohen &
Swerdlik, 2005).
Seperti yang telah dikemukakan sebelumnya, tes yang baik adalah tes yang reliabel
dan valid, dan dengan begitu sama pula artinya bahwa item tes yang baik pun yang
reliabel dan valid (Cohen & Swerdlik, 2005). Baik-tidaknya suatu tes tidak dapat
mengacu pada berapa jumlah item-item yang ada di dalamnya. Meski banyaknya item
dalam tes dapat saja berpotensi meningkatkan reliabilitas hasil pengukuran (Azwar,
2009), namun tidak dapat dipastikan berapa batas jumlah item yang dapat dikatakan
membuat tes menjadi tes yang baik.
Selain itu, meski tes yang dikatakan baik adalah tes yang reliabel dan valid, namun tes
yang baik tidak cukup jika hanya reliabel dan valid saja, tergantung pula dari kualitas
item-item yang membangunnya, apakah item-item tersebut memiliki fungsi yang sama
dengan fungsi pengukuran yaitu dapat membedakan subjek berkemampuan tinggi dengan
yang berkemampuan rendah. Dengan kata lain, tidak cukup hanya dikatakan bahwa
semakin banyak item pada suatu tes maka tes dapat semakin baik, yang lebih tepat adalah
semakin banyak item-item tes yang baik (secara kualitatif dan kuantitatif seperti yang
telah dipaparkan pada sub-bab sebelumnya) maka semakin baik tes tersebut (Lababa,
2008). Bisa saja apabila tes dengan jumlah item yang banyak (atau bahkan jumlahnya
sedikit) tetapi hasil analisis terhadap item-item tersebut menunjukkan bahwa banyak
item-item yang tidak berfungsi dengan baik sesuai dengan tujuan pengukuran, maka tes
tersebut tidak dapat dikatakan sebagai tes yang baik.
Adaptasi tes sama dengan mengadaptasi pada sejumlah item yang membangun tes
tersebut. Ada beberapa hal yang perlu diperhatikan ketika ingin melakukan adaptasi tes.
International Test Commision (ITC) menyarankan langkah-langkah yang dianggap cukup
baik untuk dapat menjadi panduan peneliti atau pengembang tes ketika melakukan
adaptasi pada sebuah tes (Hambleton & Patsula, 1999).
Yakinkan bahwa terdapat konstruk yang setara dengan konstruk yang ingin diukur
pada budaya dan sesuai bahasa kelompok subjek target tes. Untuk itu perlu dilakukan
konsultasi atau diskusi dengan psikolog atau pakar dalam konstruk yang dimaksud.
Putuskan apakah mengadaptasi tes yang sudah ada atau mengembangkan tes baru.
Perhatikan tujuan mengadaptasi tes, keuntungan dan kerugian jika mengadaptasi
dibanding membuat tes baru.
Pilihlah pakar alih bahasa yang baik atau kredibel. Sebaiknya libatkan lebih dari
seorang pakar ahli bahasa. Selain itu libatkan pula pakar yang ahli dalam konstruk
yang akan diukur.
Ulas kembali tes yang telah diadaptasi dan lakukan revisi bila perlu.
Lakukan uji coba terhadap tes yang telah diadaptasi tersebut. Upaya melakukan uji
coba dengan pilot test perlu dilakukan terhadap sejumlah kecil orang-orang yang
memiliki karakteristik serupa dengan subjek yang sebenarnya.
Catat seluruh proses konstruksi dalam mengadaptasi hingga pengujian validitas (tahap
1 hingga 10) dan buatlah manual/ pedoman administrasi tes yang telah diadaptasi
tersebut.
Latihlah para pengguna tes secara langsung, meskipun telah disediakan manual
administrasi tes.
1. Spearman-Brown
2. Flanagan
3. Rulon
4. Kuder-Richardson (K-R) 20
5. K-R 21
6. Hoyt
7. Alpha.