Instrumen Kita
Instrumen Kita
Menurut Azwar (2005: 11) menunjukkan alur kerja dalam penyusunan skala
psiklogis :Mendasarkan hasil analisis item, maka item-item yang tidak memenuhi
persyaratan psikometris akan disingkirkan atau diperbaiki lebih dahulu sebelum
dapat menjadi bagian dari skala. Di sisi lain, item-item yang memenuhi persyaratan
juga tidak dengan sendirinya disertakan ke dalam skala, sebab proses kompilasi
skala masih harus mempertimbangkan proporsionalitas komponen-komponen
skala sebagaimana dideskripsikan oleh blue-print-nya. Dari sini bisa dipahami,
bahwa dalam mengumpulkan (mengkompilasi) item-item yang memenuhi
persyaratan untuk menjadi bagian dari skala perlu memperhatikan :
B. Analisis Butir
1. Pengertian analisis butir
Aiken dalam Suprananto (2012) berpendapat bahwa kegiatan analisis butir soal
merupakan kegiatan penting dalam penyusunan soal agar diperoleh butir soal yang
bermutu. Tujuan kegiatan ini adalah:
1. Mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu
sebelum digunakan,
2. Meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak
efektif,
3. Mengetahui informasi diagnostik pada siswa apakah mereka telah memahami
materi yang telah diajarkan.
Soal yang bermutu adalah soal yang dapat memberikan informasi
setepat-tepatnya tentang siswa mana yang telah menguasai materi dan siswa mana
yang belum menguasai materi. Selanjutnya menurut Anastasia dan Urbina (1997)
dalam Suprananto (2012), analisis butir soal dapat dilakukan secara kualitatif
(berkaitan dengan isi dan bentuknya) dan kuantitatif (berkaitan dengan ciri-ciri
statistiknya). Analisis kualitatif mencakup pertimbangan validitas isi dan
konstruksi, sedangkan analisis kuantitatif mencakup pengukuran validitas dan
reliabilitas butir soal, kesulitan butir soal serta diskriminasi soal. Kedua teknik ini
masing-masing memiliki keunggulan dan kelemahan, oleh karena itu teknik terbaik
adalah menggunakan atau memadukan keduanya.
2. Manfaat kegiataan butir soal
Berdasarkan pendapat yang diungkapkan oleh Anastasia dan Urbina (1997)
dalam Suprananto (2012), analisis butir soal memiliki banyak manfaat, diantaranya
yakni:
1.Membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan,
relevan bagi penyusunan tes informal seperti tes yang disiapkan guru untuk siswa
dikelas,
2.Mendukung penulisan butir soal yang efektif,secara materi dapat memperbaiki
tes di kelas,
3.Meningkatkan validitas soal dan reliabilitas.
Linn dan Gronlund (1995) dalam Suprananto (2012: 163), menambahkan
bahwa pelaksanaan kegiatan analisis butir soal, biasanya didesain untuk menjawab
pertanyaan-pertanyaan berikut:
1. Apakah fungsi soal sudah tepat?
2. Apakah soal telah memiliki tingkat kesukaran yang tepat?
3. Apakah soal bebas dari hal-hal yang tidak relevan?
4. Apakah pilihan jawabannya efektif?
Berdasarkan uraian di atas menunjukkan bahwa analisis butir soal memberikan
manfaat:
1. Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik,
2. Meningkatkan butir soal melalui tiga komponen analisis yaitu, tingkat
kesukaran, daya pembeda dan pengecoh soal,
3. Merevisi soal yang tidak relevan degan materi yang diajarkan, ditandai dengan
banyaknya anak yang tidak dapat menjawab butir soal tertentu.
3. Macam-macam Analisis Butir Soal
1. Teknik Analisis Secara Kualitatif
Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara
kualitatif, yakni teknik moderator dan panel:
Teknik moderator merupakan teknik berdiskusi yang didalamnya terdapat satu
orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan
secara bersama dengan beberapa ahli, seperti guru yang mengajarkan materi, ahli
materi, penyusun atau pengembang kurikulum, ahli penilaian, ahli bahasa dan
orang yang memiliki latar belakang psikologi. Teknik ini sangat baik, karena
didiskusikan dan ditelaah secara bersama-sama, namun teknik tersebut memiliki
kelemahan karena memerlukan waktu lama untuk mendiskusikan setiap satu butir
soal.
Teknik berikutnya adalah teknik panel. Teknik panel merupakan suatu teknik
yang menelaah butir soal berdasarkan kaidah penulisan butir soal. Kaidah itu
diantaranya materi, kontruksi, bahasa atau budaya, kebenaran kunci jawaban atau
pedoman penskoran. Caranya beberapa penelaah diberikan butir-butir soal yang
akan ditelaah, format penelaahan dan pedoman penilaian atau penelaahan. Tahap
awal, semua orang yang terlibat dalam kegiatan penelaahan disamakan
persepsinya, kemudian mereka bekerja sendiri-sendiri di tempat berbeda. Para
penelaah dipersilahkan memperbaiki langsung pada teks soal dan memberikan nilai
pada setiap butir soal dengan kriteria soal baik, perlu diperbaiki atau diganti
(Suprananto, 2012).
2. Teknik Analisis Secara Kuantitatif
Penelaahan soal secara kuantitatif adalah penelaahan butir soal berdasarkan
pada data empirik. Data empirik ini diperoleh dari soal yang telah diujikan. Ada dua
pendekatan dalam analisis secara kuantitatif, yaitu pendekatan secara klasik dan
modern.
Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui
informasi dari jawaban peserta tes guna meningkatkan mutu butir soal yang
bersangkutan dengan menggunakan teori klasik. Kelebihan dari analisis ini yakni,
murah, sederhana, familiar, dapat dilaksanakan sehari-hari dengan cepat
menggunakan komputer dapat menggunakan data dari beberapa peserta tes atau
sampel kecil. Hal tersebut telah dikemukakan oleh Millman dan Greene (1993)
dalam Suprananto, (2012).
Selanjutnya analisis butir soal secara modern adalah penelaahan butir soal
dengan menggunakan teori respon butir atauItem Response Theory (IRT). Teori ini
merupakan suatu teori yang menggunakan fungsi matematika untuk
menghubungkan antara peluang menjawab benar suatu butir dengan kemampuan
siswa.
Analisis kualitas butir soal dapat dibagi menjadi 2, yaitu;
1. Tingkat Kesukaran Soal (Difficulty Index)
Menurut Arifin (2009) perhitungan tingkat kesukaran soal adalah pengukuran
seberapa besar derajat kesukaran suau soal. Jika suatu soal memiliki tingkat
seimbang (proposional), maka dapat dikatakan bahwa soal tersebut baik. Suatu soal
tes hendaknya tidak terlalu sukar dan tidak pula terlalu mudah.
a) Menghitung Tingkat Kesukaran Soal Bentuk Objektif
Untuk menghitung tingkat kesukaran soal bentuk obyektif dapat digunakan dengan
cara, yaitu: menggunakan rumus tingkat kesukaran (TK):
Keterangan:
WL = jumlah peserta didik yang menjawab salah dari kelompok bawah
WH = jumlah peserta didik yang menjawab salah dari kelompok atas
nL = jumlah kelompok bawah
nH = jumlah kelompok atas
Sebelum menggunakan rumus di atas, harus diitempuh terlebih dahulu
langkah-langkah sebagai berikut:
1) Menyusun lembar jawaban peserta didik dari skor tertinggi sampai dengan
skor terendah,
2) Mengambil 27% lembar jawaban dari atas yang selanjutnya disebut kelompok
atas (higher group), dan 27% lembar jawaban dari bawah yang selanjutnya disebut
kelompok bawah (lower group). Sisa sebanyak 46% disisihkan,
3) Membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap
peserta didik, baik untuk kelompok atas maupun kelopok bawah. Jika jawaban
peserta didik benar diberi tanda plus (+), sebaliknya jika jawaban peserta didik
salah maka diberi simbol minus(-).
B. Pengertian Reliabilitas
Salah satu syarat agar hasil suatu tes dapat dipercaya adalah tes tersebut harus
mempunyai reliabilitas yang memadai. Oleh karena itu Jaali dan Pudji (2008)
membedakan reliabilitas menjadi 2 macam, yaitu :
Reabilitas ini terkait dengan konsistensi antara item-item suatu tes atau
instrument.. Apabila terhadap bagian obyek ukur yang sama, hasil pengukuran
melalui item yang satu kontradiksi atau tidak konsisten dengan hasil ukur melalui
item yang lain maka pengukuran dengan tes (alat ukur) sebagai suatu kesatuan itu
tidak dapat dipercaya. Untuk itu jika terjadi hal demikian maka kita tidak bisa
menyalahkan obyek ukur, melainkan alat ukur (tes) yang dipersalahkan, dengan
mengatakan bahwa tes tersebut tidak reliable atau memiliki reliabilitas yang
rendah.
1. Bentuk Urayan
Jika skor butir instrumen atau soal tes kontinum (misalnya skala sikap atau
soal bentuk uraian dengan skor butir 1-5 atau skor soal 0-10) dan diberi simbol Xi
dan skor total instrumen atau tes diberi simbol Xt, maka rumus yang digunakan
untuk menghitung koefesien korelasi antara skor butir instrumen atau soal dengan
skor total instrumen atau skor total tes adalah sebagai berikut:
Keterangan:
rit = koefisien korelasi antara skor butir soal dengan skor total.
1 5 4 3 5 3 5 3 28
2 5 4 3 4 3 4 3 26
3 4 4 2 4 3 4 3 24
4 4 3 3 3 4 3 4 24
5 5 5 3 4 5 5 4 31
6 3 3 2 3 2 3 1 17
7 3 3 2 3 2 2 2 17
8 3 2 2 3 2 2 2 16
9 2 2 1 2 1 2 1 11
10 2 1 1 1 1 1 1 8
Jumlah 36 31 22 32 26 31 24 202
Penyelesaian:
Untuk n=10 dengan alpha sebesar 0,05 didapat nilai table r=0,631. Karena nilai
koefesien korelasi antara skor butir dengan skor total untuk semua butir lebih
besar dari 0,631, maka semua butir mempunyai korelasi signifikan dengan skor
total tes. Dengan demikian maka semua butir tes dianggap valid atau dapat
digunakan untuk mengukur hasil belajar.
3. Uji reliabilitas
Keterangan:
k = cacah butir
2 1,29
3 0,56
4 1,16
5 1,44
6 1,69
7 1,24
Jumlah 8,62
Jadi koefesien reliabilitas tes (dengan 7 butir) pada contoh diatas adalah 0,97
4. Bentuk Objektif
Jika skor butir soal diskontinum (misalnya soal bentuk objektif dengan skor
butir soal 0 atau 1) maka kita menggunakan koefesien korelasi biserial dan rumus
yang digunakan untuk menghitung koefesien korelasi biserial antara skor butir
soal dengan skor total tes adalah:
Keterangan:
rbis(i) = koefesien korelasi beserial antara skor butir soal nomor i dengan skor
total
X1 = rata-rata skor total responden yang menjawab benar butir soal nomor i
Xt = rata-rata skor total semua responden
st = standar deviasi skor total semua responden
pi = proporsi jawaban yang benar untuk butir soal nomor I
qi = proporsi jawaban yang salah untuk butir soal nomor i
Xt = 3,60
St = 2,107
Ternyata dari tujuh butir soal tes ada 5 butir yang valid dan dua butir tidak
valid. Oleh karena itu perlu dilakukan perhitungan untuk menghitung koefesien
antara skor butir dengan skor total baru (5 butir), sebagai berikut:
Xt = 2,6
St = 1,8
Untuk n = 10 dengan alpha sebesar 0,05 didapat nilai table r = 0,631. Karena
niai koefesien korelasi biserial antara skor butir dengan skor total untuk semua
butir lebih besar dari 0,631, maka semua butir mempunyai korelasi biserial yang
signifikan dengan skor total tes. Dengan demikian maka semua butir tes (5 butir)
dianggap valid atau dapat digunakan untuk mengukur hasil belajar.
5. Uji Reliabilitas
Keterangan:
Jumlah 1,16
= 1,16
St = 3,24
Jadi koefesien reliabilitas tes (dengan 5 butir) pada contoh diatas adalah 0,80.
Dalam kamus besar bahasa Indonesia kepraktisan diartikan sebagai suatu yang
bersifat praktis atau efisien. Arikunto (2010) mengartikan kepraktisan dalam
evaluasi pendidikan merupakan kemudahan-kemudahan yang ada pada instrument
evaluasi baik dalam mempersiapkan, menggunakan, menginterpretasi/
memperoleh hasil, maupun kemudahan dalam menyimpanya.
Kepraktisan sebuah alat evaluasi lebih menekankan pada tingkat efisiensi dan
efektivitas alat evaluai tersebut, beberapa kriteria yang dikemukakan oleh Gerson,
dkk dalam mengukur tingkat kepraktisan, diantaranya adalah:
“Practically refers to the extent that user (or other expert) consider the
intervention as appealing and usable in ‘normal’ conditions”
“Effectiveness refer to the extent that the experiences and outcomes with the
intervention are consistent with the intended aims”
Keefektifan suatu bahan ajar biasanya dilihat dari poitensial efek berupa
kualitas hasil belajar, sikap., dan motivasi peserta didik. Menurut Akker (1999)
(dalam Yazid) ada dua aspek keefektivan yang harus dipenuhi oleh suatu bahan
ajar. Yakni :
Menurut Suryadi (2005) (dalam Yazid), bahan ajar dapat dikatakan efektif
apabila :
1.Pengertian Validitas.
Menurut Azwar (1986) validitas berasal dari kata validity yang mempunyai
arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan
fungsi ukurnya. Menurut Arikunto (1999) validitas adalah suatu ukuran yang
menunjukkan tingkat kesahihan suatu tes. Menurut Nursalam (2003) validitas
adalah suatu ukuran yang menunjukkan tingkat kevalidan atau kesahihan suatu
instrumen. Berdasarkan beberapa pendapat tentang pengertian validitas di atas,
maka dapat diambil kesimpulan bahwa validitas adalah suatu standar ukuran yang
menunjukkan ketepatan dan kesahihan suatu instrumen.
Menurut Arikunto (1999) suatu tes dikatakan valid apabila tes tersebut
mengukur apa yang hendak diukur. Tes memiliki validitas yang tinggi jika
hasilnya sesuai dengan kriteria, dalam arti memiliki kesejajaran antara tes dan
kriteria.
Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu
alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi
juga harus memberikan gambaran yang cermat mengenai data tersebut.
kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh, dalam
bidang pengukuCermat berarti bahwa pengukuran itu dapat memberikan
gambaran mengenai perbedaan yang sekecil- ran aspek fisik, bila kita hendak
mengetahui berat sebuah cincin emas maka kita harus menggunakan alat
penimbang berat emas agar hasil penimbangannnya valid, yaitu tepat dan cermat.
Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah
cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang
sangat kecil pada berat emas itu tidak akan terlihat pada alat ukur berat badan.
Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam
perjalanan dari satu kota ke kota lainnya, maka sebuah jam tangan biasa adalah
cukup cermat dan karenanya akan menghasikan pengukuran waktu yang valid.
Akan tetapi, jam tangan yang sama tentu tidak dapat memberikan hasil ukur yang
valid mengenai waktu yang diperlukan seorang atlit pelari cepat dalam menempuh
jarak 100 meter dikarenakan dalam hal itu diperlukan alat ukur yang dapat
memberikan perbedaan satuan waktu terkecil sampai kepada pecahan detik
yaitu stopwatch.
2. Jenis-jenis Validitas
Menurut Sudijono (2009) terdapat berbagai jenis validitas, antara lain:
Salah satu cara yang di gunakan untuk menentukan validitas adalah dengan
mengkaji isi tes itu. Sebuah tes misalnya terdiri atas 25 soal penjumlahan dan
pengurangan sangat baik di gunakan untuk mengukur kemampuan matematika di
bandingkan dengan tes yang terdiri atas 10 soal tentang olah raga tetapi tidak ada
hal-hal yang berkaitan dengan penjumlahan dan pengurangan. Validitas isi di
tentukan dengan melihat apakah soal-soal yang di gunakan telah menunjukkan
sampel atribut yang di ukur. Dengan demikian menurut Guion (1997), validitas isi
sangat bergantung kepada dua hal yaitu tes itu sendiri dan proses yang
mempengaruhi dalam merespon tes. Sebagi contoh misalnya tes tertulis yang di
persiapkan untuk pekerjaan mungkin tidak menyajikan pengukuran yang valid
untuk kemampuan pegawai melakuka pekerjaan, sekalipun mungkin saja tes itu
sudah merupakan alat yang valid untuk mengukur pengetahuan tentang apa yang
harus di kerjakan.
Salah satu cara untuk memperoleh validitas isi adalah dengan melihat
soal-soal yang membentuk tes itu. Jika keseluruhan soal nampak mengukur apa
yang seharusnya tes itu di gunakan, tidak di ragukan lagi bahwa validitas isi sudah
terpenuhi.
Sebagian ahli tes berpendapat bahwa tidak ada satupun pendekatan statistic
yang dapat digunakan untuk menentukan validitas isi suatu tes. Menurut Guion
(1997), validitas isi hanya dapat ditentukan berdasarkan judgment para ahli.
Validitas konstruk mengandung arti bahwa suatu alat ukur dikatakan valid
apabila tidak cocok dengan konstruksi teoritik dimana tes itu di buat. Dengan kata
lain sebuah tes di katakan memiliki validitas konstruksi apabila soal-soalnya
mengukur setiap aspek berfikir seperti yang di uaraikan dalam standar kompetensi,
kompetensi dasar, maupun indicator yang terdapat dalam kurikulum. Soal yang
dapat di kembangkan dari kisi-kisi seperti Nampak pada table 2.2 haruslah
beruapa soal yang sesuai dengan kemampuan mendeskripsikan berbagai bentuk
pasar menurut struktur, mengidentifikasikan kebaikan dan keburukan
bebtuk-bentuk pasar, serta memberi contoh berbagai bentuk pasar.
Validitas Kriteria
Contoh sederhana misalnya apa yang terjadi pada penerimaan peserta tes
berdasarkan hasil tes seleksi setelah mereka lulus SMA. Peserta tes yang memiliki
nilai yang bagus di tes seleksi tersebut lalu di terima diperguruan tinggi, di
perkirakan akan berhasil ketika mereka belajar di perguruan tinggi. Apabila hal itu
terjadi, maka tes masuk perguruan tinggi tersebut dikatakan memiliki validitas
prediksi bagus. Sebaliknya, apabila hasil di perguruan tinggi kurang baik, maka
tes seleksi di maksud tidak memiliki validitas yang bagus.
Perbandingan Korelasi
Ujian akhir nasional dan kuis di kelas 0.56
Ujian akhir nasional dan tugas 0.20
Soal benar salah dan pilihan ganda 0.31
Soal uraian dan benar salah 0.48
Soal pilihan ganda dan uraian 0.29-0.38
Teori dan praktek 0.35
4 buah soal uraian 0.13-0.32
Ujian dan studi kasus 0.41
Soal uraian dan kasus 0.61
Soal uraian dan tugas 0.54
Soal uraian dan partisipasi di kelas 0.10
Partisipasi di kelas dan studi kasus 0.70
Untuk menguji validitas tipa butir soal maka skor yang ada pada butir yang
dimaksud dikorelasikan dengan skor total. Skor tiap butir soal dinyatakan skor X
dan skor total dinyatakan skor Y, dengan didapatkannya indeks validitas tiap butir
soal, bisa diketahui butir soal mana yang memenuhi syarat dapat dilihat dari
indeks validitasnya.
Tentukan koefisien korelasi antara skor hasil tes yang akan diuji validitasnya
dengan hasil tes yang terstandar yang dimiliki orang yang sama dengan
menggunakan rumus korelasi produk momen. Rumus Korelasi Produk Momen:
Kriterianya yaitu:
Instrumen valid, apabila r-hitung = r-tabel dan Instrumen tidak valid, apabila
r-hitung < r-tabel
Tentukan kategori validitas instrumen yang mengacu pada pengklasifikasian
validitas yang dikemukakan oleh Guilford:
E. Kompilasi II
Menurut Azwar (1986) validitas berasal dari kata validity yang mempunyai
arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan
fungsi ukurnya. Menurut Arikunto (1999) validitas adalah suatu ukuran yang
menunjukkan tingkat kesahihan suatu tes.
Keterangan:
2. Pengetesan dua kali dengan menggunakan suatu tes yang sama pada waktu
yang berbeda adalah pengertian dari teknik ?
3. Istilah blue printdalam skala psikologi adalah skala yang di sajikan dalam
bentuk tabel yang memuat uraian komponen-komponen atribut yang harus
dibuat itemnya,proporsi item dalam masing-masing komponen, dan dalam
kasus yang lebih lengkap memuat juga indikator-indikator.....
a. Kepercayaan.
b. Belajar.
c. Potensi.
d. perilaku.
7. Istilah blue printdalam skala psikologi adalah skala yang di sajikan dalam
bentuk tabel yang memuat uraian komponen-komponen atribut yang harus
dibuat itemnya,proporsi item dalam masing-masing komponen, dan dalam
kasus yang lebih lengkap memuat juga indikator-indikator.....
a. Kepercayaan.
b. Belajar.
c. Potensi.
d. perilaku.
10. Mendasarkan hasil analisis item, maka item-item yang tidak memenuhi
persyaratan psikometris akan disingkirkan atau diperbaiki lebih dahulu sebelum
dapat menjadi bagian dari skala. Maksud “psikometris” dalam kalimat tersebut
adalah...
e. sebuah pernyataan mengenai kesamaan antar individu dan kelompok.
f. sebuah pernyataan mengenai perbedaanantaraindividudankelompok.
g. Sebuah pernyataan mengenai hubungan timbal balik individu dengan
lingkungannya
h. Sebuah pernyataan mengenai penyesuaian diri subjek terhadap
lingkungannya.
11. Istilah blue printdalam skala psikologi adalah skala yang di sajikan dalam
bentuk tabel yang memuat uraian komponen-komponen atribut yang harus dibuat
itemnya,proporsi item dalam masing-masing komponen, dan dalam kasus yang
lebih lengkap memuat juga indikator-indikator.....
e. Kepercayaan.
f. Belajar.
g. Potensi.
h. perilaku.
12. Berikut yang termasuk dalam komponen blue print, kecuali....
e. Aspek.
f. Indikator perilaku.
g. Subjek.
h. Favourable.