Anda di halaman 1dari 14

MAKALAH

Evaluasi / Assesmen SD
“Menerapkan Konsep Mutu Alat Evaluasi Hasil Belajar”

DISUSUN OLEH :

KELOMPOK 7
1. DITA AVIRA
2. LESI LENTISA
3. PEBI ARIYANTI
4. SINTA MILA
5. WIWIK DEPANI PUTRI

DOSEN PENGAMPU : RANDI EKA PUTRA, M.Pd

PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR


SEKOLAH TINGGI KEGURUAN DAN ILMU PENDIDIKAN
MUHAMMADIYAH MUARA BUNGO
TAHUN 2021
KATA PENGANTAR
Puji syukur kami panjatkan atas kehadirat Allah SWT yang telah
memberikan kami rahmat, hidayah dan inayahnya kepada kami, sehingga kami
dapat menyelesaikan makalah Evaluasi / Assesmen SD ini. Sholawat dan salam
semoga selalu tercurah kepada junjungan kita Nabi besar Muhammad SAW
beserta keluarga dan para sahabatnya, yang telah membawa kita dari zaman
jahiliyah menuju zaman yang lebih baik. Dalam makalah ini kami akan membahas
tentang Menerapkan Konsep Mutu Alat Evaluasi Hasil Belajar.
Alhamdulillah pada kesempatan ini akhirnya kami dapat menyelesaikan
makalah yang berjudul “Menerapkan Konsep Mutu Alat Evaluasi Hasil Belajar”
dimana makalah ini adalah salah satu tuntutan dalam memenuhi salah satu tugas
yang diberikan dengan mata Evaluasi / Assesmen SD. Adapun harapannya dengan
terselesaikannya makalah ini diharapkan juga dapat meningkatkan pengetahuan
kita khususnya penulis tentang hal-hal yang berkaitan dengan tugas yang
diberikan karena dengan itu kita dapat belajar lebih baik lagi.
Dalam penulisan makalah ini pastinya terdapat kekurangan serta
kesalahan yang tidak disengaja, oleh karena itu kami mengharapkan partisipasinya
serta kritik dan sarannya yang bersifat membangun, agar menjadi makalah yang
lebih baik lagi.

Muara Bungo, 14 November 2021

PENULIS

i
DAFTAR ISI
KATA PENGANTAR .................................................................................... i
DAFTAR ISI ................................................................................................... ii
BAB I PENDAHULUAN
A. Latar Belakang Masalah ......................................................................... 1
B. Rumusan Masalah ................................................................................... 2
C. Tujuan Pembuatan Makalah ................................................................... 2
BAB II PEMBAHASAN
A. Teknik Analisis Validitas ...................................................................... 3
B. Teknik Analisis Reliabilitas .................................................................. 4
C. Teknik Analisis Tingkat Kesukaran ...................................................... 6
D. Teknik Analisis Daya Pembeda ............................................................ 8
E. Teknik Analisis Option (untuk soal pilihan ganda)............................... 8
BAB III PENUTUP
A. Kesimpulan ............................................................................................. 10
B. Saran ....................................................................................................... 10
DAFTAR PUSTAKA

ii
BAB I
PENDAHULUAN
A. Latar Belakang Masalah
Pembelajaran di sekolah merupakan aplikasi pelaksanaan kurikulum dalam
mencapai tujuan pendidikan, yaitu terjadinya perubahan prilaku peserta didik
kearah positif. Guna mengetahui tercapai tidaknya suatu tujuan yang telah
ditetapkan dalam kurikulum, maka dalam kegiatan pembelajaran diperlukan
suatu alat penilaian. Dalam pembelajaran alat penilaian berfungsi sebagai alat
untuk membantu mengungkap kemampuan-kemampuan laten yang berada
dalam diri peserta didik. Hasil pengukuran merupakan input yang memberikan
gambaran mengenai kemampuan peserta didik dan berfungsi sebagai indikator
keberhasilan dalam mencapai tujuan yang telah ditetapkan dalam kurikulum.
Alat penilaian merupakan salah satu komponen penting dalam kegiatan
pembelajaran, yang tujuannya untuk mengetahui sejauh mana pembelajaran
telah dicapai peserta didik dalam bentuk hasil belajar atau dapat dikatakan
sejauh mana ketercapaian kompetensi yang dikuasai peserta didik. Jenis
penilaian yang diberikan pendidik dapat dibuat dalam jenis tes tertulis dan
tindakan. Membuat alat penilaian perlu disusun secara matang dengan
memperhatikan perangkat materi, konstruksi, dan bahasa karena akan sangat
menentukan capaian hasil belajar.
Oleh karena itu seorang pendidik atau guru dituntut memiliki kemampuan
dalam menyusun alat penilaian. ntuk melakukan suatu evaluasi sumatif,
diperlukan adanya alat ukur (instrumen) baik yang berbentuk tes maupun non-
tes dengan tujuan agar tidak salah dalam mengambil keputusan. Instrumen
yang baik adalah instrumen yang memenuhi syarat-syarat atau kaidah-kaidah
tertentu, dapat memberikan data yang akurat sesuai dengan fungsinya dan
hanya mengukur sampel perilaku tertentu. Adapun karakteristik instrumen
evaluasi yang baik adalah valid, reliabel, relevan,representatif, praktis,
deskriminatif, spesifik dan proporsional. Analisis kualitas tes merupakan suatu
tahap yang harus ditempuh, baik tes secara keseluruhan maupun butir soal yang

1
menjadi bagian dari tes tersebut (Arifin, 2009). Analisis soal bertujuan untuk
mengadakan identifikasi soal-soal yang baik, kurang baik dan soal yang jelek.
Hasil dari analisis soal ini adalah diperolehnya informasi tentang kejelekan
sebuah soal dan petunjuk untuk mengadakan perbaikan (Arikunto, 2010:207).
B. Rumusan Masalah
Adapun rumusan makalah ini yaitu :
1. Bagaimana teknik analisis validitas ?
2. Bagaimana teknik analisis reliabilitas ?
3. Bagaimana teknik analisis tingkat kesukaran ?
4. Bagaimana teknik analisis daya pembeda ?
5. Bagaimana teknik Analisis Option (untuk soal pilihan ganda)?
C. Tujuan Pembuatan Makalah
Adapun tujuan pembuatan makalah ini yaitu :
1. Dapat mengetahui teknik analisis validitas.
2. Dapat mengetahui teknik analisis reliabilitas.
3. Dapat mengetahui teknik tingkat kesukaran.
4. Dapat mengetahui teknik analisis daya pembeda.
5. Dapat mengetahui teknik Analisis Option (untuk soal pilihan ganda)

2
BAB II
PEMBAHASAN
A. Teknik Analisis Validitas
Menurut Gronlund dan Linn (1990) menyebutkan bahwa Validitas adalah
ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi. Lain
lagi Menurut Arikunto (1995) Validitas adalah keadaan yang menggambarkan
tingkat instrumen bersangkutan yang mampu mengukur apa yang akan diukur.
Sedangkan Sukadji (2000) mengambil pengertian bahwa Validitas adalah
derajat yang menyatakan suatu tes mengukur apa yang seharusnya diukur.
Azwar (2000) menyebutkan Validitas adalah sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsinya.
Dari pengertian beberapa ahli diatas maka dapat disimpulkan bahwa
Validitas adalah suatu derajad ketepatan instrumen (alat ukur), maksudnya
apakah instrumen yang digunakan betul-betul tepat untuk mengukur apa yang
akan diukur. Validitas suatu instrument menunjukkan tingkat ketepatan suatu
instrumen untuk mengukur apa yang harus diukur. Jadi validitas suatu
instrumen berhubungan dengan tingkat akurasi dari suatu alat ukur mengukur
apa yang akan diukur.
Validitas suatu instrument dapat dikelompokkan menjadi :
1. Validitas teoritik, yaitu validitas yang didasarkan pada pertimbangan para
ahli. Validitas teoritik terdiri dari :
a) Validitas isi / validitas kurikuler (content validity), yaitu ketepatan suatu
instrument ditinjau dari segi materi yang diujikan (untuk tes) atau
ditinjau dari segi dimensi dan indicator yang ditanyakan (untuk angket).
b) Validitas muka/ validitas bentuk soal (pertanyaan/pernyataan) (face
validity), yaitu keabsahan susunan kalimat atau kata-kata dalam
soal/pernyataan/pertanyaan sehingga jelas pengertiannya atau tidak
menimbulkan tafsiran lain. Dalam menguji validitas teoritik suatu
instrument, sebaiknya melibatkan paling sedikit 3 orang ahli di
bidangnya.

3
2. Validitas kriterium, yaitu validitas yang ditinjau berdasarkan hubungannya
dengan kategori tertentu. Tinggi-rendahnya koefisien validitas tes atau
angket ditentukan berdasarkan hasil perhitungan koefisien korelasi.
Validitas kriterium terdiri dari :
a) Validitas banding (validitas bersama atau validitas yang ada sekarang),
yaitu validitas tes yang diperoleh dengan cara menghitung koefisien
korelasi antara nilai-nilai hasil tes yang akan diuji validitasnya dengan
nilai-nilai hasil tes terstandar yang telah mencerminkan kemampuan
siswa. Catatan : Dalam dunia pendidikan, biasanya diasumsikan bahwa
nilai rata-rata ulangan harian sebagai hasil dari tes terstandar.
b) Validitas ramal, yaitu validitas yang berkenaan dengan kemampuan suatu
tes untuk dapat meramalkan keadaan yang akan datang berdasarkan
kondisi yang ada sekarang. Suatu tes seleksi masuk siswa baru haruslah
memiliki tingkat validitas ramal yang tinggi. Untuk menentukan tingkat
validitas kriterium suatu tes dilakukan dengan menghitung koefisien
korelasi antara nilai-nilai hasil tes yang akan diuji validitasnya dengan
nilai-nilai hasil tes yang telah ada dan sudah diketahui atau diasumsikan
memiliki validitas tes yang memadai.
B. Teknik Analisis Reliabilitas
Reliabilaitas adalah tingkat ketetapan suatu instrumen mengukur apa yang
harus diukur. Ada tiga cara pelaksanaan untuk menguji reliabilitas suatu tes,
yaitu: (1) tes tunggal (single test), (2) tes ulang (test retest), dan (3) tes
ekuivalen (alternate test).
a. Reliabilitas Tes Tunggal (Internal Consistency Reliability) Tes tunggal
adalah tes yang terdiri dari satu set yang diberikan terhadap sekelompok
subjek dalam satu kali pengetesan, sehingga dari hasil pengetesan hanya
diperoleh satu kelompok data. Ada dua teknik untuk perhitungan reliabilitas
tes, yaitu :
1. Teknik Belah Dua (Split-Half Technique). Dilakukan dengan cara
membagi tes menjadi dua bagian yang relatif sama (banyaknya soal

4
sama), sehingga masing-masing testi mempunyai dua macam skor, yaitu
skor belahan pertama (awal / soal nomor ganjil) dan skor belahan kedua
(akhir / soal nomor genap). Koefisien reliabilitas belahan tes.
2. Teknik Non Belah Dua (Non Split-Half Technique). Salah satu
kelemahan perhitungan koefisien reliabilitas dengan menggunakan teknik
belah dua adalah (1) banyaknya butir soal harus genap, dan (2) dapat
dilakukan dengan cara yang berbeda sehingga menghasilkan nilai yang
berbeda pula. Untuk mengatasi masalah tersebut dapat dilakukan dengan
menggunakan teknik non belah dua.
b) Tes Ulang (test re-test)

Tes ulang adalah tes yang terdiri dari seperangkat tes yang diberikan
kepada sekelompok subyek dua kali. Reliabilitasnya dihitung dengan cara
mengkorelasikan hasil tes pertama dengan tes kedua. (Metode tes ulang
adalah penggunaan tes yang sama dua kali pada sejumlah peserta tes yang
sama).

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua


seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya
memiliki satu seri tes tetapi dicobakan dua kali. Oleh karena tesnya hanya
satu dan dicobakan dua kali, maka metode ini dapat disebut dengan single-
test-double-trial method. Kemudian hasil dari kedua tes tersebut dihitung
korelasinya.

c) Tes Ekuivalen (alternate test)

Tes ekuivalen adalah tes yang terdiri dari dua perangkat dimana soal –
soal pada perangkat pertama ekuivalen dengan soal – soal pada perangkat
kedua. Pengertian ekuivalen disini adalah soal – soal yang memuat konsep
yang sama, tetapi soal tersebut tidak persis sama. Selain memuat konsep
yang sama, tingkat kesukarannya pun harus sama. Misalkan untuk soal
pemfaktoran suku tiga bentuk ekuivalen dengan bentuk , tetapi tidak

5
ekuivalen dengan bentuk sebab meskipun konsep suku tiga dan
pemfaktoranya sama tetapi tingkat kesukarannya berbeda. Untuk
menentukan reliabilitasnya dihitung dengan cara mengkorelasikan hasil tes
untuk soal perangkat pertama dengan hasil tes dari perangkat kedua.

C. Analisis Tingkat Kesukaran


Menganalisis tingkat kesukaran butir soal artinya mengkaji butir-butir soal
dari segi kesukarannya sehingga dapat diperoleh butir-butir soal yang termasuk
kategori mudah, sedang dan sukar. Tingkat kesukaran butir soal diperoleh dari
kesanggupan atau kemampuan peserta pelatihan dalam menjawab butir soal
tersebut, bukan dilihat dari segi pengajar dalam melakukan analisis pada saat
penyusunan soal. Tingkat kesukaran butir soal evaluasi hasil belajar dapat
diketahui dari besar kecilnya angka yang melambangkan tingkat kesukaran dari
butir soal tersebut, yang dinyatakan dengan istilah angka indeks kesukaran
butir soal (difficulty index), yang umumnya dilambangkan dengan huruf P,
yaitu singkatan dari kata proportion. Angka indeks kesukaran butir soal
tersebut besarnya berkisar antara 0,00 sampai dengan 1,00.
Jika suatu butir soal mempunyai angka indeks kesukaran sebesar 0,00 ( P=
0,00), berarti butir soal tersebut termasuk dalam kategori butir soal yang terlalu
sukar, karena seluruh peserta pelatihan tidak ada yang dapat menjawab butir
soal tersebut dengan benar. Sebaliknya, apabila suatu butir soal mempunyai
angka indeks kesukaran butir 1,00 ( P= 1,00), maka artinya butir soal tersebut
adalah termasuk dalam kategori butir soal yang terlalu mudah, karena seluruh
peserta pelatihan dapat menjawab butir soal tersebut dengan benar. Pada
umumnya suatu butir soal evaluasi hasil belajar dinyatakan baik jika butir soal
tersebut tidak terlalu sukar dan tidak pula terlalu mudah.
Oleh sebab itu, butir soal yang tidak dapat dijawab dengan benar oleh
seluruh peserta pelatihan (karena terlalu sukar) dapat dinyatakan sebagai butir
soal yang tidak baik. Demikian pula sebaliknya, butir soal yang seluruh peserta

6
pelatihan dapat menjawab dengan benar (karena terlalu mudah), juga dapat
dinyatakan sebagai butir soal yang tidak baik. Untuk kedua jenis kategori
tersebut perlu dilakukan perbaikan jika akan digunakan lagi sebagai butir soal
untuk ujian berikutnya.
Asumsi yang digunakan untuk memperoleh kualitas soal yang efektif
untuk mengukur hasil belajar yang baik adalah keseimbangan dari tingkat
kesukaran soal tersebut. Keseimbangan yang dimaksudkan adalah
perbandingan antara butir-butir soal yang termasuk kategori mudah, sedang
dan sukar. Dasar dari penentuan proporsi jumlah soal kategori mudah, sedang
dan sukar adalah tujuan dari pelatihan yang dilaksanakan.
Untuk pelatihan yang menuntut kemampuan peserta yang tinggi, maka
porsi jumlah butir soal dengan kategori sukar harus lebih banyak dari pada
pelatihan yang tidak menuntut kemampuan hasil belajar yang tinggi. Proporsi
perbandingan tersebut tidak ada nilai yang pasti, tetapi tergantung dari desain
dan tujuan dari pelatihan yang diadakan.
Proporsi tersebut biasanyaditentukan berdasarkan kesepakatan yang
diambil pada saat penentuan desain suatu pelatihan. Setelah penentuan proporsi
dan tingkat kesukaran yang dilakukan oleh para pengajar tersebut, maka
kemudian soal tersebut di uji-cobakan dan dianalisis apakah penentuan tersebut
sesuai atau tidak dengan desain awal. Langkah-langkah untuk mencari tingkat
kesukaran butir soal menurut Arifin (2012:266) adalah:
1. Menyusun lembar jawaban peserta didik dari skor tertinggi sampai dengan
skor terendah.
2. Mengambil 27% lembar jawaban dari atas yang selanjutnya disebut
kelompok atas (higher group), dan 27% lembar jawaban dari bawah yang
selanjutnya disebut kelompok bawah (lower group). Sisa 46% disisihkan.
3. Membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap
peserta didik, baik untuk kelompok atas maupun kelompok bawah . Jika
jawaban peserta didik benar, diberi tanda 1 (satu), sebaliknya jika jawaban
peserta didik salah, diberi tanda 0 (nol).

7
D. Teknik Analisis Daya Pembeda
Daryanto (2010:183) menjelaskan bahwa daya pembeda soal adalah
kemampuan sesuatu soal untuk membedakan antara siswa yang pandai
(berkemampuan tinggi) dengan siswa yang bodoh (berkemampuan rendah).
Adapun menurut Sudijono (2009:386), mengetahui daya pembeda item itu
penting sekali, sebab salah satu dasar yang dipegangi untuk menyusun butir-
butir item tes hasil belajar adalah adanya anggapan, bahwa kemampuan antara
testee yang satu dengan testee yang lain itu berbeda-beda, dan bahwa butir-
butir item tes hasil belajar itu haruslah mampu memberikan hasil tes yang
mencerminkan adanya perbedaan-perbedaan kemampuan yang terdapat di
kalangan testee tersebut.
Dari beberapa pendapat di atas dapat disimpulkan bahwa daya pembeda
soal adalah kemampuan suatu soal untuk membedakan siswa yang memiliki
kemampuan tinggi dengan siswa yang memiliki kemampuan rendah, untuk
analisis daya pembeda ini digunakan soal pilihan ganda sebagai alat evaluasi
hasil belajar. Langkah-langkah untuk menghitung daya pembeda soal menurut
Arifin (2012:274) adalah :
1. Membuat tabel persiapan.
2. Menghitung jumlah peserta didik yang gagal pada kelompok bawah (WL)
dan menghitung jumlah peserta didik yang gagal pada kelompok atas
(WH).
3. Mengurangkan hasil WL dengan hasil WH.
4. Menghitung daya pembeda masing-masing soal (soal pilihan ganda).

E. Teknik Analisis Option / Butir Soal (untuk soal pilihan ganda)


Analisis Butir Soal Pilihan Ganda – Analisis butir soal (item analysis)
adalah suatu kegiatan dalam menentukan tingkat kebaikan butir-butir soal

8
sebuah tes, sehingga informasi yang didapatkan dari kegiatan tersebut bisa
digunakan untuk memperbaiki butir soal yang sudah disusun.

Analisis butir soal bisa dilakukan apabila suatu tes sudah selesai
dilaksanakan dan didapatkan jawaban terhadap butir-butir soal yang diteskan.
Identifikasi terhadap setiap butir item soal harus dilakukan untuk
penyempurnaan kembali terhadap butir-butir soal yang dibuat oleh guru,
sehingga akan tersusun soal yang memiliki fungsi sebagai alat pengukur hasil
belajar dengan kualitas tinggi.

Soal yang bermutu adalah soal yang bisa memberikan informasi secara
jelas mengenai peserta didik yang sudah dan yang belum menguasai materi
pembelajaran. Analisis butir soal sendiri bisa dilakukan secara kualitatif dan
kuantitatif. Analisis butir soal secara kualitatif berkaitan dengan isi dan bentuk
soal (validitas isi dan validitas konstruk).

Sementara analisis butir soal kuantitatif berkaitan dengan ciri-ciri


statistiknya (pengukuran validitas, reabilitas, daya beda, dan tingkat kesukaran
butir soal).

 Tujuan Kegiatan Analisis Butir Soal

Adapun tujuan dari kegiatan analisis butir soal adalah sebagai berikut :

 Mengkaji dan menelaah setiap butir soal supaya didapatkan soal yang
bermutu,
 Dapat meningkatkan kualitas butir tes melalui revisi atau membuang soal
yang tidak efektif (tidak valid),
 Mengetahui informasi diagnostik peserta didik mengenai pemahaman
materi yang telah diajarkan

9
BAB III
PENUTUP
A. Kesimpulan
Validitas adalah suatu derajad ketepatan instrumen (alat ukur), maksudnya
apakah instrumen yang digunakan betul-betul tepat untuk mengukur apa yang
akan diukur. Reliabilaitas adalah tingkat ketetapan suatu instrumen mengukur
apa yang harus diukur. Menganalisis tingkat kesukaran butir soal artinya
mengkaji butir-butir soal dari segi kesukarannya sehingga dapat diperoleh
butir-butir soal yang termasuk kategori mudah, sedang dan sukar. Daya
pembeda soal adalah kemampuan suatu soal untuk membedakan siswa yang
memiliki kemampuan tinggi dengan siswa yang memiliki kemampuan rendah.
B. Saran
Hendaknya guru bisa menyampaikan materi yang cukup kepada siswanya
agar nantinya dalam evaluasi tidak ada materi yang tertinggal atau belum
disampaikan dalam kegiatan belajar mengajar dan memeriksa kembali butir-
butir soal dan melakukan perbaikan atau penyempurnaan butir soal yang
dianggap perlu lalu guru hendaknya menindak lanjuti hasil evaluasi.

10
DAFTAR PUSTAKA

Arifin, Zainal. 2011. Penelitian Pendidikan Metode dan Paradigma Baru.


Bandung : PT Remaja Rosdakarya. Bumi Aksara, 2010.
Bungin, Burhan. 2001. Metodologi Penelitian Kualitatif. Jakarta : PT Raja
Grafindo Persada.
N. Nasoetion dan A. Suryanto. 20022. Tes Pengukuran dan Penilaian, Jakarta:
P. A. Atmaja. 2016. Evaluasi Belajar Mengajar, Yogyakarta: Diva Press.
Pusat Penerbitan Universitas Terbuka. Remaja Rosdakarya.
S. Arikunto, Dasar-dasar Evaluasi Pendidikan, Edisi 2 penyunting. Jakarta: PT
Sarwono, Jonathan. 2006. Metode Penelitian Kuantitatif dan Kualitatif.
Sudijono. 2008. Pengantar Evaluasi Pendidikan, Jakarta: Raja Grafindo Persada.
Sukardi. 2008. Evaluasi Pendidikan, Jakarta: Bumi Aksara.
Sukmadinata, Nana S. 2010. Metode Penelitian Pendidikan. Bandung : PT
Yogjakarta : Graha Ilmu.

11

Anda mungkin juga menyukai