Anda di halaman 1dari 9

EVALUASI PEMBELAJARAN DI SD

PDGK4301
TUGAS 2

DISUSUN OLEH :

VINCENTIA NUR SEPTIANI


NIM. 856079531

UPBJJ BATAM
POKJAR BINTAN
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS TERBUKA
TAHUN 2021
SOAL
1. Menjelaskan :
a. Pengertian Validitas dan Reliabilitas
b. Hubungannya
c. Analisis Butir soal
d. Memperbaiki butir soal
e. Memperbaiki NQ Tes

JAWABAN
a. Validitas adalah ketepatan atau kecermatan suatu instrument dalam pengukuran.
Reliabilitas digunakan untuk mengetahui konsistensi alat ukur, apakah alat pengukur yang
digunakan dapat diandalkan dan tetap konsisten jika pengukuran tersebut diulang.
Menurut para ahli, pengertian validitas sebagai berikut :
1. Sudjana (2004:12)
Pengertian validitas menurut Sudjana adalah ketepatan alat penilaian terhadap konsep yang
dinilai sehingga betul-betul menilai apa yang harus dinilai.
2. Suryabrata (2000:41)
Pengertian validitas menurut Suryabrata adalah derajat fungsi pengukuran suatu tes, atau
derajat kecermatan ukurnya sesuatu tes. Validitas suatu tes mempermasalahkan apakah tes
tersebut benar-benar mengukur atap yang hendak diukur.
3. Azwar (1987:173)
Pengertian validitas menurut Azwar adalah sejauh mana ketepatan dan kecermatan suatu
instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Suatu tes dikatakan memiliki
validitas yang tinggi apabila alat tersebut menajalankan fungsi ukur secara tepat atau
memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut.
4. Arikunto (1999:65)
Pengertian validitas menurut Arikunto adalah suatu ukuran yang menunjukkan tingkat
kesalihan suatu tes. Suatu tes dikatakan valid apabila tes tersebut mengukur apa yang hendak
diukur. Tes memiliki validitas yang tinggi jika hasilnya sesuai denga kriteria, dalam arti
memiliki kesejajaran antara tes dan kriteria.
5. Kusaeri (2012:75)
Pengertian validitas menurut Kusaeri adalah ketepatan (appropriateness), kebermaknaan
(meaningfull) dan kemanfaatan (usefulness) dari sebuah kesimpulan yang didapatkan dari
interpretasi skor tes.
6. Nursalam (2003)
Pengertian validitas menurut Nursalam adalah suatu ukuran yang menunjukkan tingkat
kevalidan atau keshalihan suatu instrumen.
7. Neuman (2007)
Pengertian validitas menurut Neuman adalah menunjukkan keadaan yang sebenarnya dan
mengacu pada kesesuaian antara konstruk, atau cara seorang peneliti
mengkonseptualissasikan ide dalam definisi konseptual dan suatu ukuran. Hal ini mengacu
pada seberapa baik ide tentang realitas “sesuai” dengan realitas aktual. Dalam istilah
sederhana, validitas membahas pertanyaan mengenai seberapa baik realitas sosial yang
diukur melalui penelitian sesuai dengan konstruk yang peneliti gunakan untuk
memahaminya.
8. Anastasia dan Urbina (1998)
Pengertian validitas menurut Anastasia dan Urbina adalah mengenai apa dan seberapa baik
suatu alat tes dapat mengukur, sedangkan reliabilitas merujuk pada konsistensi skor yang
dicapai oleh orang yang sama ketika diuji berulang kali dengan tes yang sama pada
kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen (equivalent items)
yang berbeda, atau dibawah kondisi pengujian yang berbeda.
9. Gronlund dan Linn (1990)
Pengertian validitas menurut Gronlund dan Linn adalah ketepatan interpretasi yang dibuat
dari hasil pengukuran atau evaluasi.
10. Sukadji (2000)
Pengertian validitas menurut Sukadji adlaah derajat yang menyatakan suatu tes mengukur
apa yang seharusnya diukur.
11. KBBI (Kamus Besar Bahasa Indonesia)
Pengertian validitas menurut KBBI adalah sifat benar menurut bahan bukti yang ada, logika
berpikir atau kekuatan hukum; sifat valid; kesahihan

Jenis-jenis Validitas
Jenis atau macam macam validitas adalah sebagai berikut:
 Validitas Isi
Validitas isi (Content Validity) menjabarkan sejauh mana pertanyaan, tugas atau butir dalam
suatu tes atau instrumen dapat mewakili secara keseluruhan dan proposional perilaku sampel
yang dikenai tes. Validitas isi mengukur derajat kemampuan tes dalam mengukur yang
mencakup substansi elemen yang ingin diukur. Validitas isi dipakai untuk mengukur
kemampuan belajar, hasil belajar atau prestasi belajar.
 Validitas Konstruk
Validitas konstruk atau Construct Validity merupakan validitas yang mempermasalahkan
seberapa jauh butir tes dapat mengukur apa yang benar-benar hendak diukur yang sesuai
dengan konsep khusus atau definisi konseptual yang telah ditetapkan. Validitas konstruk
berhubungan dengan kejadian dan objek yang abstrak, tetapi gejalanya dapat diamati dan
diukur.
Validitas konstruk dapat dipakai dalam mengukur sikap, minat konsep diri, fokus kontrol,
gaya kepemimpinan, motivasi berprestasi dan lainnya, ataupun yang sifatnya performa
maksimum seperti instrumen untuk mengukur bakat (tes bakat), intelegensi (kecerdasan
intelektual), kecerdasan, emosional dan lainnya.
 Validitas Kriteria
Validitas kriteria atau validitas empiris (Criterion-Related Validity) ditentukan oleh kriteria,
baik kriteria internal ataupun kriteria eksternal. Validitas kriteria didapatkan melalui hasil uji
coba tes kepada responden yang setara dengan responden yang akan dievaluasi atau diteliti.
Validitas kriteria adalah ukuran validitas yang penentuannya dengan cara membandingkan
skor tes dengan kinerja tertentu pada ukuran luar atau yang lain. Contoh pemakaian validitas
kriteria adalah tes intelejensi yang berkorelasi dengan rata-rata nilai akademis. Dengan
asumsi, jika intelejensi seseorang tinggi, maka yang akan terjadi dia mendapatkan nilai
akademis yang bagus.
 Validitas Muka
Validitas muka (Face Validity) merupakan tipe validitas yang paling rendah signifikasinya
karena hanya berdasarkan pada penilaian sepintas tentang isi alat ukur. Apabila isi alat ukur
sudah terlihat sesuai degan apa yang ingin diukur, maka dapat dikatakan validitas muka
sudah terpenuhi. Validitas muka disebut juga dengan validitas rendah dari validitas isi.

Prinsip Validitas
Ada beberapa prinsip ketika melakukan uji validitas, yaitu antara lain:
 Interpretasi yang diberikan pada asesmen hanya valid terhadap derajat yang diarahkan ke
suatu bukti yang mendukung kecocokan dan kebenarannya.
 Penggunaan yang bisa dibuat dari hasil asesment hanya valid terhadap dejarat yang
arahnya ke suatu bukti yang mendorong kecocokan dan kebenarannya.
 Interpretasi dan kegunaan dari hasil asesment hanga valid ketika nilai (values) yang
didapatkan sesuai
 Interpretasi dan kegunaan dari hasil asesment hanya valid ketika konsekuensi
(consequences) dari interpretasi dan kegunaan ini konsisten dengan nilai kecocokan.
Sedangkan pengertian reabilitas menurut para ahli sebagai berikut :
1. Sugiono (2005)
Pengertian reliabilitas menurut Sugiono adlah serangkaian pengukuran atau serangkaian alat
ukur yang memiliki konsistensi jika pengukuran yang dilakukan dengan alat ukur itu
dilakukan secara berulang. Reliabilitas tes, merupakan tingkat konsistensi suatu tes, adalah
sejauh mana tes dapat dipercaya untuk menghasilkan skor yang konsisten, relatif tidak
berubah meskipun diteskan pada situasi yang berbeda.
2. Nursalam (2003)
Pengertian reliabilitas menurut Nursalam adalah kesamaan hasil pengukuran atau
pengamatan jika fakta atau kenyataan hidup tadi diukur atau diamati berulang kali dalam
waktu yang berlainan.
3. Sukadji (2000)
Pengertian reliabilitas suatu tes menurut Sukadji adalah sebarapa besar derajat tes mengukur
secara konsisen sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasana
koefiesien.
4. Gronlund dan Linn (1990)
Pengertian reliabilitas menurut Gronlund dan Linn adalah ketepatan hasil yang diperoleh dari
suatu pengukuran.
5. Sugiono (2005) dalam Suharto (2009)
Pengertian reliabilitas menurut Sugiono adalah serangkaian pengukuran atau serangkaian alat
ukur yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu
dilakukan secara berulang.
6. Anastasia dan Susana (1997)
Pengertian reliabilitas menurut Anastasia dan Susana adalah sesuatu yang merujuk pada
konsistensi skor yang dicapai oleh orang yang sama ketika mereka diuji dengan tes yang
sama pada kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen
(equivalent items) yang berbeda, atau dibawah kondisi pengujian yang berbeda.
7. Suryabrata (2004)
Pengertian reliabilitas menurut Suryabrata adalah sejauh mana hasil pengukuran dengan alat
tersebut dapat dipercaya.
Jenis-jenis Reliabilitas
Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu:
1. Relibilitas stabilitas. Menyangkut usaha memperoleh nilai yang sama atau serupa untuk
setiap orang atau setiap unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini
menyangkut penggunaan indicator yang sama, definisi operasional, dan prosedur
pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk dapat
memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah sama atau hampir
sama.
2. Reliabilitas ekivalen. Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis
ukuran yang berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama tetapi
dengan satu atau lebih indicator yang berbeda, batasan-batasan operasional, paeralatan
pengumpulan data, dan / atau pengamat-pengamat.

b. Hubungan antara validitas dengan reliabilitas dalam pengukuran yaitu pengukuran yang
andal (reliabel) tidak selalu valid, maksudnya hasil pengukuran mungkin dapat
direproduksi, tetapi belum tentu benar. Pengukuran yang valid umumnya dapat
diandalkan (reliable), maksudnya jika suatu pengujian menghasilkan hasil yang akurat,
maka harus dapat direproduksi.
Validitas dan reliabilitas merupakan syarat pokok bagi alat ukur untuk mengukur variabel-
variabel yang ingin diukur penelitian. Validitas digunakan untuk mengetahui ketepatan
dan kecermatan suatu instrumen tes/item pertanyaan yang diberikan. Item yang valid
adalah item yang dapat mengukur apa yang hendak diukur. Sedangkan . Reliabilitas
merujuk pada ketetapan/keajegan alat tersebut dalam menilai apa yang diinginkan, artinya
kemampuan alat tersebut digunakan akan memberikan hasil yang relatif sama.
Validitas suatu tesdapat dilihat melalui penalaran (logis) maupun melalui fakta-fakta
empiris. Validitas logis dapat ditinjau dari isi dan susunan tes, dimana instrumen tes harus
linier dengan isi/pelajaran dan sesuai dengantujuan instruksional khusus yang telah
dirumuskan sebelumnya. Kemudian untuk membuat susunan butir-butir tes yang dikatakan
valid adalah mendasarkannya dengan susunan indikator-indikator yang telah dirumuskan.
Contoh dari validitas logis adalah validitas isi dan validitas konstruk. Kemudian validitas
empiris merupakan validitas yang dapat diuji secara empiris. Instrumen diuji melalui metode
statistika. Validitas empiris dapat dibagi menjadi dua, yaitu validitas internal dan validitas
eksternal. Validitas internal memperlihatkan seberapa jauh hasil ukur setiap butir tes
konsisten dengan hasil ukur instrumen secara keseluruhan. Sedangkan validitas eksternal
adalah hasil ukur instrumen atau tes lain diluar instrumen itu sendiri yang menjadi kriteria.
Contoh dari validitas eksternal adalah validitas konkuren (bandingan) dan validitas
prediktif. Sedangkan reliabilitas dibagi menjadi dua, yaitu: reliabilitas tanggapan(eksternal)
dan reliabilitas konsistensi gabungan item. Reabilitas tanggapan menekankan pada
bagaimana proses penerapan dan penyampaian instrumen sedangkan reabilitas konsistensi
tanggapan item lebih pada pengolahan item bagai mana hasil yang diperoleh instrumen.
Instrumen yang valid dan reliabel merupakan syarat untuk memperoleh data-data yang valid.

c. Analisis butir soal adalah suatu kegiatan analisis untuk menentukan tingkat kebaikan butir-
butir soal yang terdapat dalam suatu tes sehingga informasi yang dihasilkan dapat kita
pergunakan untuk memperbaiki butir soal dan tes tersebut.
Menurut Kamus Besar Bahasa Indonesia (2002) analisis adalah penguraian suatu pokok atas
berbagai bagiannya dan penelaahan bagian itu sendiri serta hubungan antar bagian untuk
memperoleh pengertian yang tepat dan pemahaman arti keseluruhan.
Analisis butir soal yang dalam bahasa inggris disebut item analiysis dilakukan terhadap
empirik. Maksudnya, analisis itu baru dapat dilakukan apabila suatu tes telah dilaksanakan
dan hasil jawaban terhadap butir-butir soal telah kita peroleh. Analisis butir soal adalah
suatu kegiatan analisis untuk menentukan tingkat kebaikan butir-butir soal yang terdapat
dalam suatu tes sehingga informasi yang dihasilkan dapat kita pergunakan untuk
memperbaiki butir soal dan tes tersebut.
Identifikasi terhadap setiap butir item soal dilakukan dengan harapan akan menghasilkan
berbagai informasi berharga, yang pada dasarnya akan merupakan umpan balik (feed back)
guna melakukan perbaikan, pembenahan, dan penyempurnaan kembali terhadap butir-butir
soal, sehingga pada masa-masa yang akan yang akan dating tes hasil belajar yang disusun
atau dirancang oleh guru itu betul-betul dapat menjalankan fungsinya sebagai alat pengukur
hasil belajar yang memiliki kualitas yang tinggi.
Aiken dalam Suprananto (2012) berpendapat bahwa kegiatan analisis butir soal merupakan
kegiatan penting dalam penyusunan soal agar diperoleh butir soal yang bermutu. Tujuan
kegiatan ini adalah:
1) Mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum
digunakan,
2) meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif,
3) mengetahui informasi diagnostik pada siswa apakah mereka telah memahami materi
yang telah diajarkan.
Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya tentang
siswa mana yang telah menguasai materi dan siswa mana yang belum menguasai materi.
Selanjutnya menurut Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir
soal dapat dilakukan secara kualitatif (berkaitan dengan isi dan bentuknya) dan kuantitatif
(berkaitan dengan ciri-ciri statistiknya). Analisis kualitatif mencakup pertimbangan validitas
isi dan konstruksi, sedangkan analisis kuantitatif mencakup pengukuran validitas dan
reliabilitas butir soal, kesulitan butir soal serta diskriminasi soal. Kedua teknik ini masing-
masing memiliki keunggulan dan kelemahan, oleh karena itu teknik terbaik adalah
menggunakan atau memadukan keduanya.

d. Hal yang perlu diperhatikan dalam memperbaiki butir soal, yaitu :


1) Perhatikan tingkat kesukaran butir soal. Butir soal dianggap baik jika mempunyai
indeks tingkat kesukaran (P) antara 0,25 sampai dengan 0,75 atau yang mendekati
angka tersebut.
2) Perhatikan daya pembeda butir soal. Butir soal dianggap baik jika kunci (jawaban soal)
mempunyai indeks daya pembeda positif tinggi dan pengecohnya mempunyai indeks
daya pembeda negatif.
3) Perhatikan stem atau pokok soalnya sebab stem yang ambigius akan membingungkan
peserta ujian untuk menentukan jawabannya.
3 Cara Analisis Butir Soal
1) Berdasarkan Taraf Kesukaran
Tingkat kesukaran (difficulty level) suatu butir soal didefinisikan sebagai proporsi atau
persentase subjek yang menjawab butir tes tertentu dengan benar. Sedangkan angka
yang menunjukkan sukar atau mudahnya suatu butir soal dinamakan indeks kesukaran
yang dilambangkan dengan p, nilai p ini terletak antara 0 dan 1. Berbicara tentang
karakteristik butir soal berdasarkan teori klasik, maka yang perlu kita pahami dan
perhatikan yaitu adanya butir soal dan peserta tes (testee). Bisa saja terjadi bahwa suatu
butir tes dianggap mudah oleh kelompok siswa kelas A misalnya, tetapi pada kelompok
siswa kelas B butir tes tersebut dianggap sulit. Jadi, berdasarkan teori ini, analisis
tingkat kesukaran soal tidak lepas dari butir soal dan testee. Biasanya, testee dapat
digolongkan menjadi beberapa kelompok, misalnya, kelompok testee yang memiliki
skor tinggi, skor sedang, dan skor rendah (jika kita bermaksud membagi mereka dalam
tiga kelompok). Tetapi jika kita bermaksud menbagi mereka dalam dua kelompok,
maka ada kelompok testee yang memiliki skor tinggi dan memiliki skor rendah. Begitu
juga dengan butir soal, ada butir soal yang dapat dijawab oleh semua testee, ada juga
butir soal yang dijawab oleh sebagian, dan ada yang tidak dapat dijawab oleh semua
testee (Mansyur, dkk., 2009).
2) Berdasarkan Daya Pembeda
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa
yang pandai (berkemampuan tinggi) dengan siswa yang bodoh (berkemampuan rendah).
3) Berdasarkan Pola Jawaban Soal (Distractor / Pengecoh)
Dari pola jawaban soal dapat ditentukan apakah pengecoh (distractor) berfungsi sebagai
pengecoh dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh testee
berarti bahwa pengecoh itu jelek. Sebaliknya sebuah distraktor (pengecoh) dapat
dikatakan berfungsi dengan baik apabila distraktor tersebut mempunyai daya tarik yang
besar bagi pengikut-pengikut tes yang kurang memahami konsep atau kurang
menguasai bahan. Sesuatu distraktor dapat diperlakukan dengan 3 cara, yaitu: (1)
diterima, karena sudah baik, (2) ditolak karena tidak baik, (3) ditulis kembali, karena
kurang baik. Kekurangannya mungkin hanya terletak pada rumusan kalimatnya
sehingga hanya perlu ditulis kembali, dengan perubahan seperlunya. Menulis soal
adalah suatu pekerjaan yang sulit, sehingga apabila masih dapat diperbaiki, sebaiknya
diperbaiki saja, tidak dibuang (Arikunto, 2010). Pengecoh dikatakan berfungsi efektif
apabila paling tidak ada siswa yang terkecoh memilih (Purwanto, 2013).

e. Prosedur memperbaiki non-tes sama dengan prosedur memperbaiki tes. Penyempurnaan


butir yang lemah dapat dilaksanakan dengan mengganti butir yang lama dengan yang
baru atau dengan memperbaiki butir yang kurang baik tersebut. Penyebab butir soal kurang
baik antara lain:
1) Penggunaan bahasa kurang komunikatif
2) Kalimat bersifat ambiguous (dapat ditafsir ganda)
3) Pertanyaan yang dibuat menyimpang dari indicator
4) Pertanyaan atau pernyataan tidak mengukur trait (sifat) yang akan diukur

Penilaian non test adalah “penilaian pengamatan perubahan tingkah laku yang berhubungan
dengan apa yang dapat diperbuat atau dikerjakan oleh peserta didik dibandingkan dengan
apa yang diketahui atau dipahaminya”. Dengan kata lain penilaian non test behubungan
dengan penampilan yang dapat diamati dibandingkan dengan pengetahuan dan proses
mental lainnya yang tidak dapat diamati oleh indera.
Adapun menurut Hasyim, ”Penilaian non test adalah penilaian yang mengukur kemampuan
siswa secara langsung dengan tugas-tugas riil dalam proses pembelajaran. Contoh penilaian
non test banyak terdapat pada keterampilan menulis untuk bahasa, percobaan laboratorium
sains, bongkar pasang mesin, teknik dan sebagainya”.
Teknik penilaian nontes berarti melaksanakan penilaian dengan tidak menggunakan tes.
Sedangkan teknik penilaian non tes tulis maksudnya adalah bentuk evaluasi non tes yang
berbentuk tulisan atau non lisan.
Alat atau instrumen merupakan sesuatu yang dapat digunakan untuk mempermudah
seseorang melaksanakan tugas atau mencapai tujuan dengan lebih efektif dan efisien.
Sedangkan istilah evaluasi merupakan suatu proses untuk memperoleh kualitas tertentu
terutama yang berkenaan dengan nilai dan arti, istilah lain yang memiliki maksan yang
hampir sama dengan evaluasi adalah penilaian (assessment) dan pengukuran. Secara
sederhana penilaian dan pengukuran meruapakan komponen yang ada di dalam ruang
lingkup evaluasi, dimana penilaian merupakanproses berkesinambungan untuk
mengumpulkan informasi, sedangkan pengukuran lebih khusus mengumpulkan informasi
yang bersifat kuantitatif atas sesuatu.

Anda mungkin juga menyukai