Anda di halaman 1dari 12

KATA PENGANTAR

Puji syukur kehadiran tuhan YME yang telah memberikan rahmat dan hidayah
sehingga kelompok kami dapat menyelesaikan makalah yang berjudul analisi aitem ini
dengan tepat waktu

Adapun tujuan dari penulis makalah ini adalah untuk memenuhi tugas dan dosen
pengampu mata kuliah kontruksi dan pengukuran bimbingan dan konseling selain itu, makah
ini juga bertujuan untuk memenuhi wawasan bagi para pembaca dan juga bagi penyusun
tentang analisis aitem uji daya deskriminasi, analisis aitem uji validitas istrumen, analisis
aitem uji reabilitas instrument.

Kami mengucapkan terimakasih kepada ibu tati indriani, S., M.M., MA., selaku dosen
pengampu yang telah memberikan tugas ini, sehingga dapat menambah ilmu yang sesuai
dengan bidang studi yang kami tempuh.

Kami juga mengucapkan terimaksaih kepada semua pihak yang telah memudahkan
kami dalam menyelesaikan makalah ini.

Kami menyadari, bahwa makalah ini jauh dari kata sempurna, oleh karena itu,kami
meminta kritik,saran,untuk membangun makalah ini.

Jakarata, 6 oktober 2021

Tim penyusun kelompok 7


DAFTAR ISI
BAB I

PENDAHULUAN

1.1 Latar Belakang

Dalam dunia pendidikan, penilaian merupakan bagian yang tidak terpisahkan dari
proses belajar mengajar. Sistem penilaian yang baik akan mendorong guru menggunakan
strategi mengajar yang lebih baik dan memotivasi anak untuk belajar lebih giat. Penilaian
biasanya dimulai dengan kegiatan pengukuran. Pengukuran (measurement) merupakan
cabang ilmu statistika terapan yang bertujuan untuk membangun dasar-dasar pengembangan
tes yang lebih baik sehingga menghasilkan tes yang berfungsi secara optimal, valid, dan
reliabel.

Proses belajar mengajar dilaksanakan tidak hanya untuk kesenangan atau bersifat mekanis
saja tetapi mempunyai misi atau tujuan bersama. Dalam usaha untuk mencapai misi dan
tujuan itu perlu diketahui apakah usaha yang dilakukan sudah sesuai dengan tujuan? Untuk
mengetahui apakah tujuan pendidikan sudah tercapai perlu diadakan tes. Sebuah tes yang
dapat baik sebagai alat pengukur harus dianalisis terlebih dahulu. Dalam menganalisis butir
soal dalam tes harus memperhatikan daya serap, tingkat kesukaran, daya beda, fungsi
pengecoh, validitas dan reabilitas. Hal tersebut dilakukan agar tes yang diberikan kepada
siswa sesuai dengan daya serap siswa, tingkat kesukarannya, dan soal yang diberikan pun
harus valid. Sehingga, tujuan dari pembelajaran dapat tercapai.
BAB II
PEMBAHASAN

2.1 Pengertian Analisis Item

Setelah perumusan indikator perilaku jelas, maka penulisan item baru dapat
dilakukan. Setiap item mengacu pada satu indikator perilaku tertentu (Azwar, 2009). Tes
yang baik adalah tes yang reliabel dan valid. Jika demikian maka item-item dalam tes itu
pun harus baik. Item yang baik adalah item yang reliabel dan valid, di mana item dapat
berfungsi membedakan kemampuan antar individu penempuh tes (Cohen & Swerdlik,
2005). Untuk mengetahui karakteristik item yang baik tersebut maka dilakukanlah proses
analisis terhadap item.

Analisis item merupakan prosedur statistika yang digunakan untuk membantu


membuat keputusan tentang item-item mana yang baik, mana item yang perlu direvisi dan
mana item yang harus dibuang (Cohen & Swerdlik, 2005). Azwar (2009) juga
berpendapat serupa di mana menurutnya analisis item merupakan proses pengujian
parameter item (daya beda dan tingkat kesulitan item) guna mengetahui apakah item
memenuhi persyaratan psikometris untuk disertakan sebagai bagian dari tes. Lebih lanjut
lagi, Azwar (2009) mengatakan bahwa hasil analisis item menjadi dasar dalam seleksi
item, di mana item-item yang tidak memenuhi syarat psikometris akan disingkirkan atau
direvisi terlebih dahulu.

Teknik untuk melakukan analisis item dapat dilakukan secara kualitatif dan
kuantitatif. Secara garis besar analisis kualitatif dilakukan terkait dengan validitas isi dan
prosedur penulisan yang baik, sedangkan analisis kuantitatif terkait dengan pengukuran
tingkat kesulitan item dan daya beda (Anastasi & Urbina, 1997). Analisis secara
kualitatif  dilakukan untuk mengetahui apakah item telah mewakili domain atau ranah
perilaku sesuai dengan konstruk yang hendak diukur dan apakah dari segi prosedur
penulisan, item tersebut sudah dibuat dengan baik (Anastasi & Urbina, 1997). Untuk
melihat apakah item telah ditulis sesuai dengan indikator perilaku yang hendak diungkap
sebaiknya melibatkan pakar yang memang ahli dalam masalah atribut yang hendak diukur
(Azwar, 2009). Sedangkan, terkait dengan penulisan item, Azwar (2009) memaparkan
beberapa kaidah penulisan item yang baik, diantaranya menggunakan kalimat yang
sederhana, jelas dan mudah dimengerti oleh responden, namun tetap harus mengikuti tata
tulis dan bahasa yang baku, hindari penafsiran ganda pada kalimat item, penulisan item
mengacu pada indikator perilaku atau pada komponen atribut, oleh karena itu sebaiknya
jangan menulis item yang secara langsung menanyakan atribut yang hendak diungkap,
perhatikan indikator perilaku yang hendak diungkap sehingga stimulus dan pilihan
jawaban tetap relevan dengan tujuan pengukuran, isi item tidak boleh mengandung social
desirability atau item yang sesuai dengan keinginan sosial pada umumnya atau dianggap
baik dari sudut pandang norma sosial karena item yang mengandung social desirability
akan cenderung disetujui oleh semua orang karena orang akan berpikir normatif dan
bukan karena sesuai dengan keadaan dirinya, hindari stereotip jawaban, maka sebaiknya
sebagian dari item-item dibuat dalam arah favorable dan sebagian lagi unfavorable.

Setelah tahap analisis kualitatif selesai, yaitu termasuk setelah terkumpul jumlah item
yang dinilai cukup, di mana menurut Cohen dan Swerdlik (2005) sebaiknya jumlah item
yang dibuat sebanyak 2 kali lipat item akhir yang direncakaan, sedangkan menurut Azwar
(2009) jumlahnya biasanya tiga kali lipat dari jumlah item akhir yang direncanakan, maka
setelah itu item-item tersebut disusun dalam format semi-final dan siap dilakukan uji coba
secara empiris kepada subjek tes (Azwar, 2009). Setelah dilakukan pengujian empiris
(field-tested) maka hasil uji coba terebut dianalisis dengan teknik analisis kuantitatif,
seperti yang telah dikemukakan sebelumnya, dengan melihat bagaimana tingkat kesulitan
item dan daya bedanya, serta daya pengecoh jika item tersebut dalam format pilihan
ganda.

Pengertian tingkat kesulitan item terkait dengan persentase (proporsi) orang/subjek


yang menjawab benar pada item tertentu. Semakin besar persentasenya maka berarti
semakin banyak orang yang bisa menjawab atau semakin mudahnya item tersebut
(Anastasi & Urbina, 1997).

Teknik selanjutnya, selain analisis tingkat kesulitan item, adalah analisis terhadap
daya beda item. Menurut Anastasi dan Urbina (1997), daya beda item mengacu pada
sejauh mana item dapat membedakan dengan tepat antara peserta tes yang memiliki
kemampuan dengan yang tidak terhadap perilaku yang menjadi objek pengukuran.
Teknik analisis ini dapat dilakukan dengan perhitungan indeks diskriminasi dengan
menggunakan metode kelompok-kelompok ekstrem dan indeks korelasi (Crocker &
Algina, 1986).

Teknik analisis item berikutnya berlaku pada item yang bersifat pilihan ganda.
Menurut Cohen dan Swerdlik (2005), meski tidak menyebutkan istilah ‘Daya Pengecoh’
namun analisis alternatif pilihan jawaban yang dimaksudkan serupa dengan makna
analisis daya pengecoh ini digunakan untuk melihat apakah alternatif pilihan jawaban
yang salah bekerja dengan baik pada subjek yang berada pada upper group dan lower
group. Teknik ini dilakukan dengan cara membandingkan berapa subjek pada upper
group dengan lower group yang memilih masing-masing alternatif jawaban pada item
tertentu. Alternatif jawaban terdiri dari satu jawaban yang benar dan yang dimaksud
dengan jawaban  pengecoh adalah beberapa pilihan jawaban lainnya yang salah. Pada
prinsipnya, untuk mengetahui apakah pengecoh berfungsi baik pada suatu item atau tidak
adalah dengan melihat apakah jawaban yang benar (kunci jawaban) banyak dipilih oleh
kelompok subjek yang tergolong dalam upper group dibanding lower group (Cohen &
Swerdlik, 2005).

Seperti yang telah dikemukakan sebelumnya, tes yang baik adalah tes yang reliabel
dan valid, dan dengan begitu sama pula artinya bahwa item tes yang baik pun yang
reliabel dan valid (Cohen & Swerdlik, 2005). Baik-tidaknya suatu tes tidak dapat
mengacu pada berapa jumlah item-item yang ada di dalamnya. Meski banyaknya item
dalam tes dapat saja berpotensi meningkatkan reliabilitas hasil pengukuran (Azwar,
2009), namun tidak dapat dipastikan berapa batas jumlah item yang dapat dikatakan
membuat tes menjadi tes yang baik.

Selain itu, meski tes yang dikatakan baik adalah tes yang reliabel dan valid, namun tes
yang baik  tidak cukup jika hanya reliabel dan valid saja, tergantung pula dari kualitas
item-item yang membangunnya, apakah item-item tersebut memiliki fungsi yang sama
dengan fungsi pengukuran yaitu dapat membedakan subjek berkemampuan tinggi dengan
yang berkemampuan rendah. Dengan kata lain,  tidak cukup hanya dikatakan bahwa
semakin banyak item pada suatu tes maka tes dapat semakin baik, yang lebih tepat adalah
semakin banyak item-item tes yang baik (secara kualitatif dan kuantitatif seperti yang
telah dipaparkan pada sub-bab sebelumnya) maka semakin baik tes tersebut (Lababa,
2008). Bisa saja apabila tes dengan jumlah item yang banyak (atau bahkan jumlahnya
sedikit) tetapi hasil analisis terhadap item-item tersebut menunjukkan bahwa banyak
item-item yang tidak berfungsi dengan baik sesuai dengan tujuan pengukuran, maka tes
tersebut tidak dapat dikatakan sebagai tes yang baik.

Adaptasi tes sama dengan mengadaptasi pada sejumlah item yang membangun tes
tersebut. Ada beberapa hal yang perlu diperhatikan ketika ingin melakukan adaptasi tes.
International Test Commision (ITC) menyarankan langkah-langkah yang dianggap cukup
baik untuk dapat menjadi panduan peneliti atau pengembang tes ketika melakukan
adaptasi pada sebuah tes (Hambleton & Patsula, 1999).

Tahapan itu antara lain:

 Yakinkan bahwa terdapat konstruk yang setara dengan konstruk yang ingin diukur
pada budaya dan sesuai bahasa kelompok subjek target tes. Untuk itu perlu dilakukan
konsultasi atau diskusi dengan psikolog atau pakar dalam konstruk yang dimaksud.

 Putuskan apakah mengadaptasi tes yang sudah ada atau mengembangkan tes baru.
Perhatikan tujuan mengadaptasi tes, keuntungan dan kerugian jika mengadaptasi
dibanding membuat tes baru.

 Pilihlah pakar alih bahasa yang baik atau kredibel. Sebaiknya libatkan lebih dari
seorang pakar ahli bahasa. Selain itu libatkan pula pakar yang ahli dalam konstruk
yang akan diukur.

 Menerjemahkan dan mengadaptasi tes. Gunakan metode forward-backward


translation pada item-item tes, dimana setelah menerjemahkan bahasa asli tes ke
dalam bahasa target adaptasi, lalu terjemahkan kembali bahasa target adaptasi tersebut
ke bahasa asli tes untuk melihat apakah makna dari maksud item tersebut tidak
berbeda.

 Ulas kembali tes yang telah diadaptasi dan lakukan revisi bila perlu.

 Lakukan uji coba terhadap tes yang telah diadaptasi tersebut. Upaya melakukan uji
coba dengan pilot test perlu dilakukan terhadap sejumlah kecil orang-orang yang
memiliki karakteristik serupa dengan subjek yang sebenarnya.

 Lakukan field-test dengan melibatkan subjek yang lebih besar.


 Pilih desain statistika yang tepat untuk mengkaitkan skor hasil tes yang telah
diadaptasi dengan tes aslinya.

 Jika pengembang tes menekankan pada perbandingan antar-budaya, yakinkan bahwa


bahasa pada tes asli dan tes adaptasi adalah setara.

 Lakukan uji validitas pada tes yang diadaptasi.

 Catat seluruh proses konstruksi dalam mengadaptasi hingga pengujian validitas (tahap
1 hingga 10) dan buatlah manual/ pedoman administrasi tes yang telah diadaptasi
tersebut.

 Latihlah para pengguna tes secara langsung, meskipun telah disediakan manual
administrasi tes.

 Lakukan pemantauan dan evaluasi terhadap tes yang diadaptasi.

2.1.1 Analisis aitem Uji daya Deskriminasi

Uji daya diskriminasi aitem dilakukan untuk melihat sejauh mana


aitem mampu membedakan antara individu atau kelompok individu yang
memiliki dan yang tidak memiliki atribut yang diukur. Indeks daya
diskriminasi aitem merupakan pola indikator keselarasan atau konsistensi
antara fungsi aitem dengan fungsi skala secara keseluruhan yang dikenal
dengan istilah konsistensi aitem- total. Prinsip kerja yang dijadikan dasar
untuk melakukan seleksi aitem dalam hal ini, adalah memilih aitem-aitem
yang fungsi ukurnya selaras atau sesuai dengan fungsi ukur skala sebagaimana
dikehendaki oleh peneliti Azwar, 2005. Pengujian daya diskriminasi aitem
menghendaki dilakukannya komputasi koefisien korelasi antara distribusi skor
aitem dengan suatu kriteria yang relevan, Universitas Sumatera Utara 52 yaitu
distribusi skor skala itu sendiri. Komputasi ini akan menghasilkan koefisien
korelasi aitem-total r ix yang dikenal pula dengan sebutan parameter daya
beda aitem. Besarnya koefisien korelasi aitem-total bergerak dari 0 sampai
dengan 1 dengan tanda positif atau negatif. Semakin baik daya diskriminasi
aitem maka koefisien korelasinya semakin mendekati angka 1. Koefisien yang
mendekati angka 0 atau yang memiliki tanda negatif mengindikasikan daya
diskriminasi aitem yang tidak baik. Dalam penelitian ini, kriteria pemilihan
aitem berdasar korelasi aitem-total menggunakan batasan r ix  0,3 untuk
skala religiusitas bagian I dan r ix  0,275 untuk skala religiusitas bagian II.
Batasan yang berbeda antara bagian I dan II karena ketika r ix  0,3 digunakan
pada skala religiusitas bagian II, karena nilai reliabilitasnya menjadi turun.
Azwar, 2005. Untuk skala religiusitas bagian III digunakan batasan r ix  0,14,
karena bila digunakan batasan r ix  0,275 banyak aitem yang gugur dan nilai
reliabilitasnya menjadi turun. Untuk meningkatkan reliabilitas alat ukur, yang
perlu diperhatikan tidak hanya batasan nilai korelasi aitem-total, tapi juga
seberapa besar nilai Cronbach’s Alpha jika aitem tersebut dibuang.
Probabilitas pendeteksian suatu variabel yang hendak diukur dapat meningkat
dengan cara ditingkatkannya reliabilitas pengukuran Devellis, 2003.
Universitas Sumatera Utara 53.
2.1.2 Uji Validitas Instrumen
2.1.2.1 Uji validitas isi/konten
Validitas isi yang akan dilakukan dalam penelitian ini adalah validitas isi
yang diberikan pada ahli. Validitas isi menunjukkan bahwa instrumen
yang disusun sesuai dengan kurikulum, materi dan tujuan pembelajaran
yang diharapkan (Cohen dkk. 2007). Item soal dalam instrumen
dapat digunakan untuk mengukur pengetahuan yang diharapkan.
Indikator validitas isi yang ditimbang adalah: 1) kesesuaian indikator
dengan butir soal, 2) kesesuaian butir soal dengan aspek diteliti, 3)
kejelasan Bahasa atau gambar dalam soal, 4) kelayakan butir soal
untuk sampel, dan 5) kesesuaian materi atau konsep yang diuji.
Pemeriksaan validitas dapat dilakukan oleh beberapa orang validator yang
berkompeten di bidangnya. Pertimbangan atas dipilihnya validator karena
mengetahui ranah, isi, dan tujuan kajian penelitian. Misalkan dalam
penelitian pendidikan dipilih validator ahli/dosen yang mengetahui
kebenaran konsep, pedagogik, dan paradigman pengajaran yang akan
dilakukan. Berikut ini contoh validasi yang diberikan pada 6 validator.
Analisis pertimbangan validator terhadap instrumen dianalisis
menggunakan Uji Kendall dengan bantuan SPSS.
2.1.2.2. Validitas Kontruk

Validitas konstruk dan validitas empiris dilakukan dengan uji


coba pada responden yang serupa. Peneliti dapat meminta enam
responden untuk membaca instrumen apakah dapat dibaca dan dipahami
secara jelas. Hasil dari uji coba terbatas tersebut digunakan untuk
memperbaiki instrumen yang ada

2.1.2.3 Validitas empiris


Validitas empiris yang dilakukan pada responden di luar sampel
penelitian dilakukan untuk tujuan uji coba instrumen.Uji coba tersebut
dikenakan (i) uji reliabilitas, (ii) validitas (Sudjana, 2005).

2.1.3 Uji Reabilitas Instrumentasi

Reliabilitas merujuk pada satu pengertian bahwa suatu instrumen


cukup dapat dipercaya untuk digunakan sebagai alat pengumpul data karena
instrumen tersebut sudah baik.Reliabilitas juga merujuk pada tingkat
keterandalan sesuatu dan dapat dipercaya (Arikunto, 2006, hlm. 178).
Untuk melihat reliabilitas tes, diawali dengan membuat sebaran jawaban uji
coba tes yang berbentuk tes uraian. mengenai reliabilitas internal. Pada
dasarnya, reliabilitas ini diperoleh dengan cara menganalisis data dari satu kali
hasil pengetesan.

Terdapat bermacam-macam cara yang dapat kita gunakan untuk


mengetahui dan menghitung reliabilitas internal. Pemilihan teknik mana yang
digunakan biasanya didasarkan atas bentuk instrumen maupun selera kita
sebagai peneliti. Penggunaan teknik yang berbeda tentunya akan
menghasilkan indeks reliabilitas yang berbeda pula. Hal ini secara sederhana
dapat kita pahami karena wajar saja pengaruh sifat atau karakteristik data
menyebabkan perhitungan menghasilkan angka yang berbeda, salah satunya
akibat pembulatan angka.

Secara khusus, beberapa teknik memerlukan persyaratan tertentu


sehingga peneliti tidak dapat begitu saja memilih teknik tersebut. Beberapa
teknik mencari reliabilitas yang akan digunakan adalah:

1. Spearman-Brown
2. Flanagan
3. Rulon
4. Kuder-Richardson (K-R) 20
5. K-R 21
6. Hoyt
7. Alpha.

Reliabilitas adalah tingkat ketetapan suatu instrumen mengukur apa yang


harus diukur. Ada tiga cara pelaksanaan untuk menguji reliabilitas suatu tes, yaitu: (1)
tes tunggal (single test), (2) tes ulang (test retest), dan (3) tes ekuivalen (alternate
test).
BAB III
PENUTUP

Anda mungkin juga menyukai