Anda di halaman 1dari 7

1.

1 validasi
Validitas berasal dari kata ’’validity’’ yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen
pengukur dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan
fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran
tersebut. Tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan
sebagai tes yang memiliki validitas rendah (Azwar, 1997).
Validitas adalah ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi,
jadi jika data yang dihasilkan dari sebuah instrument valid, maka dapat dikatakan bahwa
istrumen tersebut valid, karena dapat memberikan gambaran tetang data secara benar sesuai
dengan kenyataan atau keadaan sesungguhnya jadi jika data yang dihasilkan oleh instrument
benar atau valid, sesuai kenyataan, maka instrument yang digunakan tersebut juga valid.
2.
Validitas memiliki beberapa karakteristik, antara lain:
Menunjuk kepada hasil dari penggunaan instrumen tersebut bukan pada instrumennya.
Menunjukkan suatu derajat atau tingkatan, validitasnya tinggi, sedang atau rendah, bukan valid
atau tidak valid.
Tidak berlaku umum. Suatu tes matematika menunjukkan validitas tinggi untuk mengukur
keterampilan menghitung, tetapi hanya sedang dalam mengukur kemampuan berpikir
matematis, bahkan rendah dalam memprediksi keberhasilan dalam matematika untuk masa
yang akan datang.
3.
Validitas memiliki empat prinsip dalam melakukan uji validitas, yaitu :

 Interpretasi yang diberikan pada asesmen hanya valid terhadap derajat yang diarahkan
ke suatu bukti yang mendukung kecocokan dan kebenarannya.
 Kegunaan yang dapat dibuat dari hasil asesment hanya valid terhadap derajat yang
diarahkan ke suatu bukti yang mendukung kecocokan dan kebenarannya.
 Interpretasi dan kegunaan dari hasil asesment hanya valid saat nilai (values) yang
dihasilkan sesuai.
 Interpretasi dan kegunaan dari hasil asesment hanya valid saat konsekuensi
(consequences) dari interpretasi dan kegunaan ini konsisten dengan nilai kecocokan.
4.
Fungsi dan kegunaan validitas sendiri adalah untuk mengetahui sejauh mana ketetapan
dan kecermatan suatu instrumen pengukuran dalam melakukan fungsi ukurnya agar data yang
diperolah relevan atau sesuai dengan tujuan diadakanya pengukuran tersebut.

5.
Keunggulan dan kelemahan tes bentuk essai.
1.1 Keunggulan tes bentuk essai, dapat dikemukakan sebagai berikut :
a. Jawabannya berupa uraian yang disusun sendiri oleh siswa (testee);
b. Menurut testi maupun pengajaran mengenal kembali dan mampu mengintegrasikan segala
apa yang telah dipelajari;
c. Kemungkinan testee menebak sangat kecil;
d. Hasil belajar yang kompleks, tidak dapat dievaluasi dengan bentuk tes yang lain;
e. Penyusunan relatif mudah;
f. Proses berfikir testi dapat dialack;
g. Soal tes bentuk essai, lebih menekankan pada pengintegrasian/pengaplikasian berfikir dan
pemecahan masalah;

1.2 Kelemahan tes bentuk essai.


a. Mutu jawaban sangat tergantung pada kemampuan siswa (testee) dalam memilih kata-kata
atau kalimat;
b. Jumlah soal relatif sedikit, namun penyelesaiannya memerlukan waktu dan energi yang
relatif besar;
c. Tingkat kebenaran jawaban relatif subyektif;
d. kemungkinan testi mengemukakan hal-hal tidak relevan dengan pernyataan;
e. Umumnya hanya dapat dikoreksi oleh penyusunan sendiri;
f. Skor soal tes bentuk essai kurang reliabel;
g. Testi lebih mementingkan panjang jawaban dari pada mutu jawaban;

1.
Menurut Sugiono (2005) Reliabilitas adalah serangkaian pengukuran atau serangkaian alat
ukur yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan
secara berulang. Reabilitas tes adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh
mana suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah
walaupun diteskan pada situasi yang berbeda-beda. Sedangkan Sukadji (2000) mengatakan
bahwa reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten
sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien.
Koefisien tinggi berarti reliabilitas tinggi.
2.
Sebuah tes dianggap memiliki reliabilitas yang baik apabila memiliki karakteristik sebagai
berikut:
 Reliabilitas merupakan milik dari satu set nilai tes bukan milik tes itu sendiri, artinya
suatu tes dikatakan baik apabila dapat menghasilkan skor yang cukup akurat, apabila
tes tersebut diberikan pada kelas tertentu, maka bisa juga menghasilkan skor yang
cukup konsisten bila diberikan pada kelas yang berbeda atau ketika diberikan pada
kelas yang sama pada waktu yang berbeda.
 Suatu tes dikatakan reliable jika dua buah tes dilakukan pada jarak waktu yang berbeda
dan menunjukkan skor yang tidak jauh berbeda.
 Reliabilitas dapat dinyatakan untuk dua atau lebih pengukuran independen yang
diperoleh dari tes yang sama untuk setiap anggota kelompok.
3.
Prinsip dasarnya adalah mencoba melakukan pengukuran pada level paling tepat yang
mungkin diperoleh. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indicator
yang spesifik, peneliti dapat melakukan pengukuran dari range yang lebih luas terhadapkonten
definisi konseptual. Gunakan tes pilot, yakni dengan membuat satu atau lebih draftatau dalam
sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan pilot
studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh peneliti
terdahulu dari literature-literatur yag berkaitan.
4.
Kegunaan dari reabilitas data adalah untuk mengetahui atau menunjukkan keajekan suatu tes
dalam mengukur gejala yang sama pada waktu dan kesempatan yang berbeda.
Reliabilitas digunakan sebagai indikator dalam mempercayai nilai dari suatu tes karena
memiliki konsistensi
5.
a. Pemilihan item. Tes merupakan pemilihan aitem-aitem yang digunakan untuk mengukur
suatu konstrak, dengan demikian pemilihan aitem tersebut dapat menjadi sumber kesalahan
dalam pelaksanaan tes. Untuk meningkatkan konsistensi dapat memperbanyak pemilihan aitem
yang digunakan (Jacobs,1991). Dengan demikian akan mengurangi responden untuk asal tebak
dalam menjawab. Namun aitem ini juga harus dipertimbangkan kualitas pertanyaannya, karena
apabila tidak dan aitem yang diberikan banyak dapat membuat responden kelelahan.
b. Penyusunan item. Kalimat yang ambigu atau kurangnya kata dalam suatu kalimat juga
dapat mempengaruhi interpretasi responden sehingga dapat mempengaruhi reliabilitas.
c. Pemberian administrasi tes. Kalimat instruksi yang kurang jelas atau suasana yang
bising dapat mempengaruhi responden ketika menjawab.
d. Penilaian (scoring), pada tes esai memiliki reliabilitas yang lebih rendah dibandingkan
dengan tes pilihan ganda. Karena pada tes esai, penilai memiliki interpretasi yang berbeda-
beda dalam menilai jawaban responden sehingga lebih bersifat subyektif.
e. Tingkat kesulitan dari suatu tes. Nilai dari suatu tes menunjukkan reliabilitas yang baik
apabila nilai tersebut menyebar dari skala yang digunakan dengan demikian dapat terlihat
perbedaan antar siswa. Faktor yang terakhir adalah siswa, dimana kelelahan, kecemasan, dan
siswa sakit dapat menyebabkan reliabilitas yang rendah karena mempengaruhi kinerja mereka
dalam mengerjakan tes (Jacobs,1991).

1.
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu
mudah tidak merangsang siswa untuk mempertinggi usaha pemecahannya. Sebaliknya soal
yang terlalu sulit akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat
untuk mencoba lagi karena diluar jangkauannya.
Seorang akan menjadi hafal akan kebiasaan gurunya dalam pembuatan soal. Dengan
kebiasaaan ini maka siswa akan belajar giat untuk menghadapi ulangan dengan guru yang
terbiasa memberikan soal sulit, sedangkan siswa akan malas belajar bila akan ujian dengan
guru yang terbiasa dengan soal ulangan yang mudah-mudah.
2.
(1) mempengaruhi karakteristik distribusi skor (mempengaruhi bentuk dan penyebaran skor tes
atau jumlah soal dan korelasi antarsoal)
(2) berhubungan dengan reliabilitas. Menurut koefisien alfa clan KR-20, semakin tinggi
korelasi antarsoal, semakin tinggi reliabilitas
3.
Dalam hal ini, item yang baik adalah item yang tingkat kesukarannya dapat diketahui, tidak
terlalu sukar dan tidak terlalu mudah. Sebab, tingkat kesukaran item itu memiliki korelasi
dengan daya pembeda. Bilamana item memiliki tingkat kesukaran yang maksimal, maka daya
pembedanya akan rendah, demikian pula bila item itu terlalu mudah maka tidak akan memiliki
daya pembeda.
4.

Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. Misalnya untuk
keperluan ujian semester digunakan butir soal yang memiliki tingkat kesukaran sedang, untuk
keperluan seleksi digunakan butir soal yang memiliki tingkat kesukaran tinggi/sukar, dan untuk
keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat kesukaran
rendah/mudah.
5.
kelebihan
(1) asumsi banyak soal yang diukur pada trait yang sama, perkiraan tingkat kemampuan peserta
didik adalah independen;
(2) asumsi pada populasi tingkat kesukaran, daya pembeda merupakan independen sampel
yang menggambarkan untuk tujuan kalibrasi soal;
(3) statistik yang digunakan untuk menghitung tingkat kemampuan siswa diperkirakan dapat
terlaksana
kekurangan
(1) Tingkat kemampuan dalam teori klasik adalah “true score”. Jika tes sulit artinya tingkat
kemampuan peserta didik mudah. Jika tes mudah artinya tingkat kemampuan peserta didik
tinggi.
(2) Tingkat kesukaran soal didefinisikan sebagai proporsi peserta didik dalam grup yang
menjawab benar soal. Mudah/sulitnya butir soal tergantung pada kemampuan peserta didik
yang dites dan kemampuan tes yang diberikan.
(3) Daya pembeda, reliabilitas, dan validitas soal/tes didefinisikan berdasarkan grup peserta
didik.

1.
Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara warga
belajar/siswa yang telah menguasai materi yang ditanyakan dan warga belajar/siswa yang
tidak/kurang/belum menguasai materi yang ditanyakan.
2.
Indeks daya pembeda setiap butir soal biasanya juga dinyatakan dalam bentuk proporsi.
Semakin tinggi indeks daya pembeda soal berarti semakin mampu soal yang bersangkutan
membedakan warga belajar/siswa yang telah memahami materi dengan warga belajar/peserta
didik yang belum memahami materi. Indeks daya pembeda berkisar antara -1,00 sampai
dengan +1,00. Semakin tinggi daya pembeda suatu soal, maka semakin kuat/baik soal itu. Jika
daya pembeda negatif (<0) berarti lebih banyak kelompok bawah (warga belajar/peserta didik
yang tidak memahami materi) menjawab benar soal dibanding dengan kelompok atas (warga
belajar/peserta didik yang memahami materi yang diajarkan guru).
3.

4.
1) Untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks
daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi, atau ditolak.
2) Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan
kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami materi yang
diajarkan guru.
5.
Kelebihan
daya pembeda mengkaji butir-butir soal dengan tujuan untuk mengetahui kesanggupan soal
dalam membedakan siswa yang tergolong mampu (tinggi prestasinya) dengan siswa yang
tergolong kurang atau lemah prestasinya
kelemahan
bila diberikan kepada anak yang lemah, hasilnya lebih tinggi. Atau bila diberikan kepada kedua
kategori siswa tersebut, hasilnya sama saja. Dengan demikian, tes yang tidak memiliki daya
pembeda tidak akan menghasilkan gambaran hasil yang sesuai dengan kemampuan siswa yang
sebenarnya. Sungguh aneh bila anak pandai tidak lulus, tetapi anak bodoh lulus dengan baik
tanpa dilakukan manipulasi oleh si penilai atau di luar faktor kebetulan.

1.
Distraktor/pengecoh soal adalah seberapa baik pilihan yang salah tersebut dapat mengecoh
peserta tes yang memang tidak mengetahui kunci jawaban yang tersedia.
2.
1. Ada yang memilih, khususnya dari kelompok bawah
2. Dipilih lebih banyak oleh kelompok rendah daripada kelompok tinggi
3. Jumlah pemilih kelompok tinggi pada pengecoh itu tidak menyamai
jumlah kelompok tinggi yang memilih kunci jawaban
4. Paling sedikit dipilih oleh 5% pengikut tes
3.
Butir soal yang baik pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab
salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih secara tidak merata.
Pengecoh dianggap baik bila jumlah peserta didik yang memilih pengecoh itu sama atau
mendekati jumlah ideal.
4.
Fungsinya sebagai pengecoh atau untuk mengecoh peserta tes. Semakin banyak peserta tes
yang terkecoh, maka distraktor tersebut semakin baik dalam menjalankan fungsinya. Dengan
kata lain, distraktor dapat dikatakan berfungsi dengan baik jika punya daya rangsang. Sebuah
distraktor dikatakan baik jika minimal 5% dari peserta tes memilihnya (terkecoh).
5.
Kelebihan
1. Dapat membantu siswa dalam menganalisis jawaban yang benar.
2. Membuka wawasan siswa, karena siswa di tuntut untuk berpikir dalam menjawab soal
tersebut.
Kekurangan
1. Ketika siswa salah menjawab, tidak akan mendapat nilai partisipasi.
2. Untuk siswa yang tidak belajar, akan kesulitan dalam menjawab jawaban dari soal.

Anda mungkin juga menyukai