TINJAUAN PUSTAKA
Dewasa ini ada dua macam teori tentang pengukuran, yakni Teori Tes Klasik
dan Teori Tes Modern (Suryabrata, 2005) di dalam buku Azwar (2007)
menambahakan Teori Skor Murni Kuat, teori ini mirip dengan Teori Tes Klasik
mengenai nilai harapan skor tampak yang merupakan skor murni, akan tetapi dalam
Teori Skor Murni Kuat terdapat asumsi-asumsi tambahan mengenai probabilitas skor
tampak yang diperoleh seorang subjek yang merupakan skor murni tertentu sehingga
kelayakkan Teori Skor Murni Kuat dapat diuji.
(1)
Asumsi ini menjelaskan bahwa sifat aditif berlaku pada hubungan antara skor
tampak, skor muni, dan eror. Skor tampak (X) merupakan jumlah skor murni (T) dan
eror (E), jadi besar skor tampak akan tergantung oleh besarnya eror pengukuran,
sedangkan besarnya skor murni individu pada setiap pengukuran yang sama
diasumsikan selalu tetap.
b. Asumsi 2:
(X) = T
(2)
Asumsi ini menyatakan bahwa skor murni merupakan nilai harapan dari skor
tampaknya, jadi T merupakan harga rata-rata distribusi teoretik skor tampak apabila
orang yang sama dikenai tes yang sama berulang kali dengan asumsi pengulangan tes
itu dilakukan tidak terbatas banyaknya dan setiap pengulangan tes adalah tidak
bergantung satu sama lain.
c. Asumsi 3:
=0
(3)
Asumsi ini menyatakan bahwa bagi populasi subjek yang dikenai tes,
distribusi eror pengukuran dan distribusi skor murni tidak berkorelasi. Implikasinya,
skor murni yang tinggi tidak selalu berarti mengandung eror yang selalu positif
ataupun selalu negatif.
d. Asumsi 4:
=0
(4)
(5)
Asumsi ini menyatakan bahwa eror pada suatu tes (E 1) tidak berkorelasi
dengan skor murni pada tes lain (T2). Asumsi ini tidak dapat bertahan apabila tes
yang kedua mengukur aspek yang mempengaruhi eror pada pengukuran yang
pertama.
Selain dua asumsi yang telah disebutkan, dalam buku Suryabrata (2005)
menuliskan dua asumsi sebagai berikut:
f. Asumsi 6
Asumsi ini menyatakan jika ada dua tes yang dimaksudkan untuk mengukur
atribut yang sama mempunyai skor tampak X dan X yang memenuhi asumsi 1
sampai 5, dan jika untuk setiap populasi subjek T = T serta varians eror kedua tes
tersebut sama, kedua tes tersebut disebut sebagai tes yang paralel.
g. Asumsi 7
Asumsi ini menyatakan jika ada dua tes yang dimaksudkan untuk mengukur
atribut yang sama mempunyai skor tampak X dan X yang memenuhi asumsi 1
sampai 5, dan jika untuk setiap populasi subjek T1 = T2 + C, dengan C sebagai suatu
bilangan konstan, maka kedua tes tersebut dapat disebut sebagai tes yang setara
(equivalent test).
Asumsi-asumsi teori klasik sebagaimana disebutkan di atas memungkinkan
untuk dikembangkan dalam rangka pengembangan berbagai formula yang berguna
dalam melakukan pengukuran psikologis. Indeks daya beda, indeks kesukaran,
efektivitas distraktor, reliabilitas dan validitas adalah formula penting yang disarikan
dari teori tes klasik.
semakin mudah aitem tersebut. Begitu juga sebaliknya semakin sedikit peserta
menjawab dengan benar, maka semakin sulit aitem tersebut. Indeks kesukaran aitem
disimbolkan dengan p. Rumusan ini dituangkan dalam formula.
p=
(6)
P
P<0,3
0.3<P<0,7
P>0,7
Kategori
Sulit
Sedang
Mudah
Jumlah Pilihan
Jawaban
2
3
4
5
P
0,85
0,77
0,74
0,60
Jawaban terbuka
0,50
Keterangan:
(7)
Karena
(8)
Menurut Murphy dan Davidshofer (2003) ada tiga cara statsistik yang dapat
digunakan untuk mengestimasi daya beda aitem, yaitu:
1. Metode Kelompok Ekstrim
Metode kelompok ekstrim dapat digunakan untuk mengukur daya beda aitem
pada kelompok yang besar. Daya beda aitem dapat dihitung dengan cara membagi
kelompok menjadi dua, kelompok tinggi yakni kelompok yang memiliki skor yang
tinggi (25-35 % nilai tertinggi didalam kelompok) dan kelompok rendah yakni
kelompok yang memiliki nilai yang rendah (25-35 % nilai terendah dalam
kelompok). Aitem yang memiliki indeks daya beda aitem yang baik akan dijawab
benar oleh kelompok tinggi dan dijawab salah oleh kelompok rendah.
2. Korelasi aitem-total
Korelasi aitem-total memberikan informasi tentang apakah aitem mengukur
hal yang sama dengan tes, korelasi aitem-total dapat dihitung menggunakan korelasi
point biserial. Korelasi point biserial digunakan jika variabel kontinu dihubungkan
dengan
variabel
dikotomi
yang
sesungguhnya.
menunjukkan bahwa aitem tidak mengukur hal yang sama dengan alat tes. Korelasi
poin biserial diformulasikan sebagai berikut:
(9)
Keterangan:
bis
= 1-P
3. Korelasi inter-aitem
Korelasi inter-aitem digunakan untuk memahami pengukuran daya beda
aitem. Korelasi inter-aitem tidak menjelaskan mengapa beberapa aitem menunjukkan
nilai yang tinggi ataupun rendah karena sangat jelas bahwa aitem yang memiliki nilai
korelasi aitem-total yang positif akan menunjukkan nilai yang positif juga pada
kebanyakan aitemnya, namun korelasi aitem-total tidak dapat menjelaskan mengapa
korelasi aitem total dapat bernilai negatif dan dalam hal ini dapat dijelaskan dengan
menggunakan korelasi inter-aitem.
Korelasi inter-aitem dapat membantu dalam memahami mengapa beberapa
aitem gagal dalam membedakan subjek yang memiliki kemampuan dengan subjek
yang tidak memiliki kemampuan, dalam artian kelompok tinggi dapat menjawab
dengan salah dan subjek dari kelompok rendah dapat menjawab dengan benar.
Korelasi inter-aitem yang bernilai rendah dapat memiliki dua arti,
kemungkinan pertama adalah aitem tidak mengukur hal yang sama dengan tes,
sehingga aitem harus dibuang atau dibuat ulang, kemungkinan kedua adalah aitem
memang mengukur atribut yang berbeda dengan tes dikarenakan tes memang disusun
untuk mengukur dua atribut yang berbeda.
Daya beda aitem dalam penelitian dapat diestimasi dengan korelasi aitem total
dengan menggunakan korelasi point biserial.
b. Analisis Indeks Daya Beda Aitem
Indeks daya beda aitem secara matematis akan berkisar mulai dari -1 sampai
dengan +1, namun demikian hanya harga d yang bernilai positif saja yang memiliki
arti dalam analisis aitem.
Harga d yang berada disekitar 0 menunjukkan bahwa aitem yang
bersangkutan mempunyai daya beda yang rendah sedangkan harga d yang negatif
menunjukkan bahwa aitem yang bersangkutan tidak berguna sama sekali bahkan bisa
menyesatkan.
Indeks daya beda aitem yang ideal adalah yang mendekati angka 1, semakin
besar indeks daya beda (semakin mendekati 1) berarti aitem tersebut mampu
membedakan antara individu yang menguasai materi yang diujikan dan mereka yang
tidak menguasainya, semakin kecil daya beda aitem (semakin mendekati 0) berarti
semakin tidak jelaslah fungsi aitem yang bersangkutan dalam membedakan mana
subjek yang menguasai materi yang diujikan dan subjek yang tidak tahu apa-apa
(Azwar, 2007).
Ebel (dalam dalam Azwar, 2007) terdapat suatu panduan dalam evaluasi
indeks daya beda aitem, yaitu :
Evaluasi
Bagus sekali
Lumayan bagus, tidak membutuhkan revisi
Belum memuaskan, perlu revisi
Jelek dan harus dibuang
Thorndike (dalam Azwar, 2007) bahwa dalam proses seleksi aitem, aitemaitem yang memiliki nilai daya beda aitem di atas 0,50 akan langsung dianggap baik
sedangkan aitem-aitem dengan indeks daya beda di bawah 0,20 dapat langsung
dibuang dan dianggap jelek.
3. Efektivitas Distraktor
a. Pengertian Efektivitas Distraktor
Aitem yang baik harus memiliki dua karakteristik yaitu: pertama individu
yang mengetahui jawaban dari pertanyaan yang diajukan haruslah menjawab
pertanyaan tersebut dengan benar, kedua individu yang tidak mengetahui jawaban
dari pertanyaan yang diajukan haruslah memilih pilihan jawaban secara acak
(Murphy & Davidshofer, 2003), jadi dapat disimpulkan karakteristik kedua adalah
efektivitas distraktor.
Efektivitas distraktor diperiksa untuk melihat apakah semua distraktor atau
semua pilihan jawaban yang bukan kunci jawaban telah berfungsi sebagaimana
mestinya, yaitu apakah distraktor-distraktor tersebut telah dipilih lebih banyak (atau
semua) individu dari kelompok rendah sedangkan individu dari kelompok tinggi
hanya sedikit (atau tidak ada) yang memilihnya. Pengaruh yang jelas ketika distraktor
yang digunakan tidak popular adalah tingkat kesukaran aitem menjadi rendah.
b. Analisis Efektivitas Distraktor
Terdapat dua kemungkinan jika jumlah orang yang menjawab suatu distraktor
melebihi jumlah yang diharapkan. Pertama, kemungkinannya bahwa pilihan subjek
tersebut menunjukkan pengetahuan parsial. Artinya subjek mengetahui bahwa
distraktor yang dipilihnya tersebut juga berkaitan dengan pengetahuan yang
dipertanyakan. Kedua, kemungkinan yang ditakutkan adalah aitem tersebut
merupakan aitem buruk yang menjebak. Artinya, jika salah satu distraktor lebih
dikenal oleh subjek yang memiliki pengetahuan baik mengenai domain ukur dan jika
identifikasi dari respon benar merupakan jawaban yang kurang dikenal atau tidak
jelas maka aitem ini tidak valid mengukur kawasan ukurnya. Kehadiran aitem dengan
distraktor yang sangat tidak asing bagi subjek memiliki reliabilitas dan validitas tes
yang rendah (Murphy & Davidshofer, 2003). Jumlah subjek yang diharapkan
menjawab pertanyaan adalah perbandingan anatara subjek yang menjawab salah
dengan jumlah distraktor. Efektivitas distraktor dapat dilihat dari dua kriteria:
Komputasi koefisien korelasi antara kedua distribusi skor kelompok tersebut akan
menghasilkan koefisien reliabilitas.
Mengingat bahwa dalam prakteknya pendekatan ini mengandung kelemahan
yaitu kondisi subjek pada tes kedua tidak lagi sama dengan kondisi subjek pada tes
pertama baik dari proses belajar, perubahan motivasi, pengalaman, sehingga
pendekatan ini lebih baik digunakan bila objek ukur berupa keterampilan, terutama
keterampilan fisik.
2. Pendekatan tes paralel
Pendekatan reliabilitas bentuk paralel dilakukan dengan memberikan
sekaligus dua bentuk tes yang paralel kepada sekelompok subjek, dalam
pelaksanaannya kedua tes yang paralel tersebut dapat digabungkan sehingga seakanakan merupakan satu bentuk tes, setelah dijawab subjek barulah aitem-aitem masingmasing tes semula dipisahkan, sehingga diperoleh dua distribusi skor. Keuntungan
cara ini adalah subjek tidak merasa berat untuk menjawab pertanyaan dalam tes
sehingga dapat mengurangi efek carry-over namun kelemahan pendekatan ini adalah
sulitnya menyusun perangkat tes yang paralel.
3. Pendekatan konsistensi internal
Seperangkat tes diberikan kepada sekelompok subjek satu kali sehingga
diperoleh satu distribusi skor tes dari kelompok subjek tersebut. Prosedur analisis
reliabilitasnya diarahkan pada analisis terhadap aitem-aitem atau terhadap kelompokkelompok aitem dalam tes itu sehingga perlu dilakukan pembelahan tes menjadi
beberapa kelompok aitem yang disebut belahan tes. Membelah tes prinsipnya adalah
mengusahakan agar antar belahan memiliki jumlah aitem sama banyak, taraf
kesukaran seimbang, isi sebanding, dan memenuhi ciri-ciri paralel . Berikut beberapa
pilihan cara untuk membelah tes menjadi lebih dari dua bagian.
1. Pembelahan cara random
Membelah tes menjadi dua bagian secara random dapat dilakukan dengan cara
undian sederhana guna menentukan aitem-aitem nomor berapa sajakah yang
dimasukkan menjadi belahan pertama dan yang mana menjadi belahan kedua.
Pembelahan secara random hanya boleh dilakukan bila tes yang akan dibelah berisi
aitem-aitem yang homogen baik dari segi konten maupun segi taraf kesukaran aitem,
namun jika aitem tersebut heterogen dapat juga menggunakan cara pembelahan ini
asalkan aitem tersebut jumlahnya sangat besar.
2. Pembelahan gasal-genap
Pembelahan gasal-genap dilakukan dengan cara mengelompokkan seluruh
aitem yang bernomor urut gasal menjadi belahan pertama dan seluruh aitem yang
bernomor urut genap dijadikan satu kelompok belahan kedua. Cara pembelahan ini
selain
mudah dilakukan
juga
dapat
berdasarkan harga indeks kesukaran aitem dan korelasi antara aitem yang
bersangkutan dengan skor tes.
Keuntungan menggunakan pendekatan konsistensi internal adalah, dapat
menghindari masalah-masalah yang biasanya ditimbulkan oleh pendekatan tes ulang
dan pendekatan tes paralel.
c. Formula Estimasi Reliabilitas Konsistensi Internal
Formula estimasi yang berbeda, walaupun dikenakan pada data yang sama,
pada umumnya tidak akan menghasilkan koefisien yang serupa. Beberapa hal yang
berpengaruh terhadap hasil komputasi koefisien reliabilitas adalah:
1. Perbedaan konsep dan dasar pikiran yang melandasi ide dasar terbentuknya
suatu formula.
2. Sifat distribusi skor kelompok subjek.
3. Homogenitas aitem-aitem dalam tes.
4. Homogenitas isi dan varians antar belahan tes.
5. Indikasi yang ditunjukkan oleh hasil teknik perhitungan tertentu.
Berikut beberapa formula estimasi yang dapat digunakan untuk menghitung
koefisien reliabilitas:
1. Spearman-Brown
Formula komputasi Spearman-Brown merupakan formula koreksi terhadap
koefisien korelasi antara dua bagian tes dan dirumuskan sebagai berikut (Azwar,
2005):
S-B = rxx=
(10)
rxx = 1- sd2/sx2
Keterangan: sd
(11)
Formula ini dapat digunakan jika aitem dikotomi ataupun politomi, belahan
tes tidak harus paralel, namun harus memenuhi asumsi -equivalent.
3. Koefisien alpha belah dua
Formula koefisien alpha untuk estimasi reliabilitas belah dua dirumuskan
sebagai berikut:
rxx
Keterangan:
=2
(12)
Formula ini dapat digunakan jika aitem dikotomi ataupun politomi, belahan
tes tidak harus paralel, namun harus memenuhi asumsi -equivalent, aitem-aitem
dalam tes haruslah homogen sehingga formula ini tidak bisa digunakan untuk
mengestimasi koefisien reliabilitas alat tes yang mengukur beberapa trait.
4. Koefisien alpha belah lebih dari dua
Pembelahan tes tidak hanya terbatas pada membagi tes ke dalam dua belahan
saja. Cara-cara pembelahan dapat diperluas pemakainnya untuk membagi tes menjadi
beberapa belahan. Bahkan suatu tes yang akan diestimasi reliabilitasnya dapat dibelah
menjadi bagian-bagian sebanyak jumlah aitemnya sehingga setiap bagian hanya berisi
satu aitem saja.
Tes yang dibelah menjadi lebih dari dua belahan yang masing-masing berisi
aitem yang berjumlah sama banyak kita dapat menggunakan formula alpha dengan
rumus:
=
Keterangan :
(13)
= banyaknya belahan tes
=
varians belahan j; j = 1, 2k
Formula ini dapat digunakan jika aitem dikotomi ataupun politomi, setiap
belahan memiliki aitem yang relatif setara, paralel setidaknya memenuhi asumsi equivalent, aitem-aitem dalam tes haruslah homogen sehingga formula ini tidak bisa
digunakan untuk mengestimasi koefisien reliabilitas alat tes yang mengukur beberapa
trait.
5. Kuder-Richardson 20 (KR-20)
KR 20 merupakan rata-rata estimasi reliabilitas dari semua cara belah-dua
yang mungkin dilakukan. Koefisien ini juga mencerminkan sejauhmana kesetaraan isi
aitem-aitem dalam tes. Rumusan formula KR-20 adalah:
(14)
Keterangan :
Formula ini dapat digunakan jika aitem dikotomi, jumlah aitem sedikit dan
membelahan tes sebanyak jumlah aitem, aitem-aitem dalam tes haruslah homogen
sehingga formula ini tidak bisa digunakan untuk mengestimasi koefisien reliabilitas
alat tes yang mengukur beberapa trait, dan tingkat kesukaran aitem haruslah
bervariasi.
6. Kuder-Richardson 21 (KR-21)
Perhitungan KR-21 menggunakan rata-rata harga p dari keseluruhan aitem.
hal inilah yang membedakan antara KR-20 dengan KR-21. Rumusan formula KR-21
adalah:
(15)
Keterangan :
dari performansi subjek terhadap kriteria tertentu, oleh karena skor murni tidak dapat
diperoleh secara langsung, koefisien reliabilitas merupakan salah satu bentuk
pendekatan yang dapat digunakan untuk mengestimasi nilai ini, melalui koefisien ini
dapat diestimasi letak skor murni tersebut dalam suatu wilayah interval tertentu.
Penafsiran terhadap koefisien reliabilitas harus dilakukan melalui penafsiran
standard eror pengukuran, dengan rumusan sebagai berikut:
SEm = Sx
(17)
Estimasi
Reliabilitas
0.95
0.90
0.85
0.80
0.75
0.70
0.65
0.60
0.55
0.50
Bentuk
Tes
Tes Intelegensi
Tes Prestasi
Tes Pilihan
Ganda
Skala
Interpretasi
Reliabilitas sedang-rendah
Reliabilitas rendah
Tes Proyektif
Skor murni dan eror memiliki efek yang sama dalam
pengukuran
Tes yang memiliki waktu yang lebih panjang cenderung akan memiliki indeks
reliabilitas yang lebih tinggi dibandingkan tes yang memiliki waktu yang lebih
pendek.
3. Panjang Tes
Panjang dari suatu tes sangat bergantung dengan seberapa banyaknya aitemaitem yang menyusun tes tersebut. Semakin banyak aitem yang memiliki kualitas
baik dalam suatu tes, maka semakin tinggi pula indeks reliabilitas instrumen tersebut.
5. Validitas
a. Pengertian Validitas
Validitas mempunyai arti sejauhmana ketepatan dan kecermatan suatu alat
ukur dalam melakukan fungsi ukurnya. Suatu alat ukur dapat dikatakan memiliki
validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau
memberikan hasil ukur, yang sesuai dengan maksud dilakukannnya pengukuran
tersebut, sehingga disini tampak bahwa bahwa pengertian validitas juga sangat erat
kaitannya dengan tujuan pengukuran, oleh karena itu, tidak ada validitas yang berlaku
umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan
ukuran yang valid untuk satu tujuan yang spesifik, dengan demikian, pernyataan valid
terhadap suatu pengukuran harus diikuti oleh keterangan yang menunjuk kepada
tujuan awal pengukuran serta kelompok subjek yang mana (Azwar, 2007).
Sisi lain dari pengertian validitas menurut Azwar (2007) adalah aspek
kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu
menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang
cermat mengenai data tersebut. Cermat berarti bahwa pengukuran itu dapat
memberikan gambaran mengenai perbedaan yang sekecil-kecilnya di antara subjek
yang satu dengan yang lain.
b. Jenis-Jenis Validitas
1. Content related validation
Validitas isi menunjukkan sejauhmana tes yang merupakan seperangkat
aitem-aitem dilihat dari isinya memang mengukur apa yang dimaksudkan untuk
diukur (sesuai dengan kawasan ukur). Ukuran sejauhmana ini ditentukan berdasar
indeks representatifnya isi tes tersebut bagi isi hal yang akan diukur. Validitas
berdasarkan estimasi isi merupakan bentuk validitas yang diestimasi lewat pengujian
terhadap isi tes dengan analisis rasional atau lewat professional judgement.
2. Criterion related validation
Validitas berdasar kriteria merupakan validitas yang diperlihatkan oleh
adanya hubungan skor pada tes yang bersangkutan dengan skor suatu criteria, dalam
validasi tes berdasar kriteria, umumnya tes yang akkan diuji validitasnya disebut
sebagai prediktor. Prosedur validasi berdasar kriteria menghasilkan dua macam
validitas, yaitu :
a). Validitas prediktif
Estimasi validitas prediktif sangat penting artinya bila tes yang dimaksud
berfungsi sebagai prediktor bagi performansi diwaktu yang akan datang (Azwar,
2005).
Definisi dan spesifikasi mengenai suatu konsep secara sistematis dan terencana
sehingga memungkinkan dilakukannya observasi an pengukuran terhadapnya.
Dalam hal ini konstrak dapat berupa petunjuk kegiatan-kegiatan atau tindakan
yang diperlukan dalam pengukuran suatu konstrak.
2.
Konstrak tersebut dimasukkan kedalam bagan teori yang dengan berbagai cara
akan dikaitkan dengan konstrak-konstrak lain. Dengan kata lain merumuskan
hipotesis yang mengaitkan konstrak baru tersebut dengan konstrak-konstrak lain
kedalam jalinan teoritis yang kompak.
Prinsipnya, pengujian kedua proposisi inilah yang menjadi fokus kajian dalam
suatu tes mengukur trait atau konstrak teoretik yang hendak diukurnya (Azwar,
2007). Fokus pengujian validitas konstrak tersebut adalah:
1. Apakah data yang dikumpulkan dari alat ukur yang disusun telah mendukung
konstruksi teorinya.
2. Apakah bukti-bukti empiris yang dikumpulkan dari berbagai pengujian relasi
telah mendukung hipotesis dalam bagan teorinya.
Berdasarkan kedua fokus pengujian validitas konstrak tersebut dapat ditarik
kesimpulan bahwa fokus pengujian pertama adalah analisis faktor dan fokus
pengujian yang kedua adalah analisis multitrait multimethode.
1. Analisis faktor
Analisis faktor merupakan kumpulan prosedur matematik yang kompleks guna
menganalisis hubungan diantara variable-variabel dan menjelaskan hubungan tersebut
dalam bentuk kelompok variable yang terbatas yang disebut faktor.
harus berkorelasi tinggi dengan variabel-variabel yang secara teori harus berkorelasi
tinggi inilah yang disebut validitas konvergen dan tidak berkorelasi dengan variablevariabel yang secara teori tidak berkorelasi (validitas diskriminan).
Teknis penerapan pendekatan multitrait multimethode adalah sebagai berikut.
Pada suatu kesempatan dilakukan pengukuran terhadap lebih dari satu konstrak
dengan menggunakan lebih dari satu metode, kemudian diari interkorelasi antara hasil
pengukuran itu. Interkorelasi itu adalah antara hal-hal berikut:
1. Konstrak yang sama diukur dengan alat yang sama (monotrait-monomethode).
2. Konstrak yang sama diukur dengan alat yang berbeda (monotraitheteromethode).
3. Konstrak yang berbeda diukur dengan alat yang sama (heterotraitmonomethode).
4. Konstrak yang berbeda diukur dengan alat yang berbeda (heterotraitheteromethode).
Teori koefisien korelasi untuk keempat hal yang telah dijelaskan adalah:
1. Konstrak yang sama diukur dengan alat yang sama (monotrait-monomethode)
koefisien korelasinya akan tinggi karena menjelaskan tentang unsur
konvergen
2. Konstrak yang berbeda diukur dengan alat yang berbeda (heterotraitheteromethode) koefisien korelasinya akan tinggi karena menjelaskan tentang
unsur diskriminan ( Suryabrata,2005).
sehingga dapat digunakan untuk mengukur sesuatu yang menjadi tujuannya, jadi
dapat dikatakan bahwa alat tes yang berkualitas akan disusun oleh aitem yang
berkualitas juga. Kualitas suatu aitem dapat dilihat dari analisis aitemnya, Menurut
(Murphy & Davidshofer, 2003) analisis aitem dapat memberikan tiga informasi
penting yaitu, informasi tentang distraktor, informasi tentang tingkat kesukaran aitem
dan informasi tentang daya beda aitem. Tiga informasi ini berbeda namun saling
terkait satu dan yang lainnya. Hal ini dapat dilihat dalam keterkaitan antara distraktor
dengan kesukaran aitem, kesukaran aitem dengan diskriminasi dan distraktor dengan
diskriminasi.
Tingkat kesukaran aitem sangat dipengaruhi oleh tingkat keterpercayaan
distraktor, jika semua distraktor tidak masuk akal maka subjek akan dengan mudah
untuk memilih jawaban yang benar tanpa harus memiliki pengetahuan tentang hal
yang ditanyakan, tentu hal ini mempengaruhi tingkat kesukaran aitem, sehingga
tingkat kesukaran aitem menjadi rendah.
Tingkat kesukaran aitem secara langsung mempengaruhi diskriminasi aitem.
Aitem yang sangat susah (p = 0) dan aitem yang sangat mudah (p = 1) tidak dapat
membedakan antara subjek yang memiliki pengetahuan dan subjek yang tidak
memiliki pengetahuan sehingga indeks daya beda bernilai rendah.
Aitem yang memiliki distraktor yang buruk tentu memiliki indeks daya beda
aitem yang buruk juga, karena sebagaimana yang telah dijelaskan tadi, distraktor
yang buruk akan membuat subjek dengan mudah menjawab pertanyaan atau
sebaliknya membuat subjek susah untuk menjawab pertanyaan sehingga juga
berpengaruh terhadap diskriminasi aitem karena tidak dapat membedakan subjek
yang memiliki pengetahuan dengan subjek yang tidak memiliki pengetahun.
Perubahan banyaknya aitem akan menyebabkan perubahan reliabilitas. Bila
aitem dalam tes bertambah banyak, maka sampai batas tertentu reliabilitasnya juga
akan meningkat (Azwar, 2005), namun perlu diingat bahwa hanya penambah aitem
Pandangan Amthauer pada dasarnya didasari oleh teori faktor, baik itu teori
dua faktor, teori bifaktor, teori multifaktor, model struktur intelek Guilford dan teori
hierarki faktor. Berdasarkan teori faktor yang menyatakan bahwa untuk mengukur
inteligensi seseorang diperlukan suatu rangkaian baterai tes yang terdiri dari subtessubtes. Antara subtes satu dengan lainnya, ada yang saling berhubungan karena
mengukur faktor yang sama (general factor atau group factor), tapi ada juga yang
tidak berhubungan karena masing-masingnya mengukur faktor khusus (special
factor). Sedangkan kemampuan seseorang itu merupakan penjumlahan dari seluruh
skor subtes-subtes. Maka Amthauer menyusun IST sebagai baterai tes yang terdiri
dari sembilan subtes.
Karakteristik dari baterai tes Amthauer
menunjukan adanya
suatu
interkorelasi yang rendah antar subtesnya (r = 0.25) dan korelasi antara subtes dengan
jumlah (keseluruhan subtes) yang rendah pula ( r = 0.60). Rendahnya interkorelasi
antara subtes menunjukkan bahwa alat ukur tersebut lebih cenderung mengukur
kemampuan-kemampuan spesifik inteligensi individu.
Tes IST terus dikembangkan oleh Amthauer dengan bantuan dari para
koleganya, berikut adalah perkembangan tes IST dari tahun 1953 hingga tahun 2000an:
a. IST 1953
IST yang pertama ini pada awalnya hanya diperuntukan untuk usia 14 sampai
dengan 60 tahun. Proses penyusunan norma diambil dari 4000 subjek pada
tahun 1953.
b. IST 1955
IST merupakan pengembangan dari IST 1953, pada IST 1955 range untuk
subjek diperluas menjadi berawal dari umur 13 tahun. Subjek dalam
penyusunan norma bertambah menjadi 8642 orang. Pada tes ini sudah ada
pengelompokan jenis kelamin dan kelompok usia
c. IST 70
Permintan dan tuntutan pengguna yang menyarankan pengkoreksian dengan
mesin juga pengembangan tes setelah penggunaan lebih dari 10 tahun, maka
disusunlah IST 70. Dalam IST 70 ini tidak terlalu banyak perubahan, tes ini
memiliki 6 bentuk, setiap pemeriksaan dilakukan 2 tes sebagai bentuk parallel
yaitu A1 dan B2, atau C3 dan D4. Dua bentuk lainnya untuk pemerintah dan
hanya bagi penggunaan khusus. Pada IST 70, rentang kelompok usia diperluas
menjadi berawal dari 12 tahun. Disamping itu telah ditambah tabel kelompok
dan pekerjaan. Namun demikian, pada IST 70 terdapat kekurangan yaitu
penyebaran bidang yang tidak merata dan menggunkan kalimat dalam subtes
RA sehingga jika subjek gagal dalam subtes ini dapat dimungkinkan karena
tidak mampu mengerjakan soal hitungannya atau tidak mengerti kalimatnya.
d. IST 2000
Koreksi dari IST 70, pada IST 2000 tidak terdapat soal kalimat pada soal
hitungan.
e. IST 2000-Revised
juga
penambahan subtes. IST ini terdiri dari 3 modul, yaitu sebagai berikut :
1. Grundmodul-Kurzform (Modul Dasar-Singkatan); terdiri dari subtes : SE,
AN, GE, RE, ZR, RZ, FA, WU, dan MA.
2. Modul ME; terdiri dari subtes ME Verbal dan ME Figural
3. Erweiterungmodul (Modul "menguji pengetahuan"); terdiri dari subtes
Wissentest (tes pengetahuan)
2. Subtes IST
IST adalah tes intelegensi yang dikembangkan oleh Rudolf Amthauer di
Frankfurt, Jerman pada tahun 1953. Tes ini dipandang sebagai gestalt (menyeluruh),
yang terdiri dari bagian-bagian yang saling berhubungan secara makna (struktur).
Struktur intelegensi tertentu meggambarkan pola kerja tertentu, sehingga akan cocok
untuk profesi atau pekerjaan tertentu.
Tes ini dikonstruksikan untuk subjek usia 14-60 tahun setelah melalui uji coba
kurang lebih pada 4000 orang.
Di Indonesia tes ini pertamakali digunakan oleh psikolog angkatan darat
Bandung, Jawa Barat. Intellegenz struktur test (IST) terdiri dari 9 subtes yaitu:
1. SE: melengkapi kalimat
Subtes ini akan melihat bagaimana cara berpikir teoritis dengan hitungan
7. FA: memilih bentuk
Subtes ini akan mengukur kemampuan dalm membayangkan, kemampuan
mengkonstruksi
(sintesa
dan analisa),
berpikir
konkrit
menyeluruh,
Subtes ini mengharuskan subyek untuk memilih salah satu kata yang tepat
untuk mengisi satu kata yang hilang, sehingga susunan kalimat kalimat dalam soal
menjadi sempurna.
Tahap skoring yang digunakan adalah dengan memeriksa setiap jawaban
dengan menggunakan kunci jawaban yang telah disediakan. Untuk semua subtes SE
setiap jawaban benar diberi nilai 1, untuk jawaban salah atau kosong diberi nilai 0.
Total nilai benar yang sesuai dengan kunci jawaban merupakan Raw Score
(RW) nilai ini belum dapat diinterpretasi sesuai dengan norma yang digunakan. Nilai
RW yang sudah dibandingkan dengan norma disebut dengan Standardized Score
(SW). Nilai SW inilah yang dapat menjadi materi untuk tahap selanjutnya yaitu
interpretasi. Adapun norma yang digunakan adalah sesuai dengan kelompok umur
subjek.
a. Interpretasi
Tahap interpretasi dapat dilakukan setelah didapatkan Standardized Score.
Kesembilan subtes saling berkaitan, sehingga harus dilakukan semuanya dan
interpretasinya harus dilakukan secara keseluruhan. Interpretasi yang dapat dilakukan
dari tes IST adalah sebagai berikut :
1. Taraf Kecerdasan
Taraf kecerdasan didapat dari total SW. Nilai ini dapat diterjemahkan menjadi
Intelligent Quotient (IQ). Nilai ini dapat menggambarkan perkembangan individu
melalui pendidikan dan pekerjaan. Nilai ini perlu dihubungkan dengan latar belakang
sosial serta dibandingkan dengan kelompok seusianya.
2. Dimensi Festigung-Flexibilitas
Dimensi Festigung-Flexibilitas menggambarkan corak berpikir yang dimiliki
oleh subjek. Dimensi Festigung-Flexibilitat merupakan dua kutub yang ekstrim,
keduanya menggambarkan corak berpikir yang ekstrim pula. Kutub Festigung
memiliki arti corak berpikir yang eksak, sedangkan kutub Flexibilitt memiliki arti
corak berpikir yang non-eksak. Corak berpikir ini merupakan hasil perkembangan
(pengalaman) individu yang akan semakin mantap ke salah satu kutub seiring
bertambahnya usia.
Menentukan seseorang subjek apakah memiliki kecenderungan Festigung atau
Flexibilitat adalah dengan membandingkan nilai GE+RA dengan nilai AN+ZR. Jika
nila GE+RA lebih besar maka subjek memiliki kecenderungan Festigung, sebaliknya
jika nilai AN+ZR lebih besar maka subjek memiliki kecenderungan Flexibilitas.
Tabel 5. Perbandingan Nilai Festingung &
Flexibilitat
GE+RA
GE+RA
>
<
AN+ZR
AN+ZR
Festigung
Flexibilitat
(SE, WA, AN, GE) yang tampak pada grafik, jika grafik menunjukan bentuk M pada
empat subtes pertama maka profilnya adalah M (verbal-teoritis), jika yang tampak
adalah bentuk huruf W maka profilnya adalah W (praktis-konkrit).
Grafik diatas menunjukan 4 subtes pertama (SE, WA, AN, GE) sebagai bentuk
M, sehingga profil yang dimiliki subjek adalah profil M. Profil M mengandung arti
bahwa subjek memiliki cara berpikir yang verbal-teoritik.
4. Struktur Kecerdasan
Struktur kecerdasan menggambarkan kecerdasan subjek berdasarkan masingmasing subtes.