Anda di halaman 1dari 25

VALIDITAS TES,REALIBILITAS TES,TES BUATAN GURU,TES

STANDAR

Dosen Pengampu :

Vera Wahyuni, M.pd

Disusun Oleh :

Eka Julianti (2011159)

Fitra Dila (2011158)

Sahroni Akbar (2011150)

Handika Fanzuri (2011129)

Ella Febriani (2011134)

PRODI PENDIDIKAN AGAMA ISLAM

FAKULTAS TARBIYAH

INSTITUT AGAMA ISLAM NEGERI

SYAIKH ABDURRAHMAN SIDDIK

BANGKA BELITUNG

2022

1
KATA PENGANTAR

Bismillahirrahmanirrahiim. Alhamdulillahi rabbil „alamin. Segala puji dan


syukur kami panjatkan kehadirat ALLAH SWT, yang mana telah memberikan rahmat
dan hidayahnya kepada kami berupa kesehatan jasmani dan rohani pada saat ini,
sehingga kami dapat menyelesaikan tugas makalah mata kuliah pengembangan sistem
evaluasi PAI ini.

Sholawat beserta salam semoga senantiasa terlimpah curahkan kepada Nabi


Muhammad SAW, Kepada keluarganya para sahabatnya hingga kepada umatnya yang
senantiasa selalu berpegang teguh terhadap ajaran sunnahnya hingga akhir zaman ini
semoga di yaumil qiyamah nanti mendapatkan syafatul udzma, aamiin. Oleh karena itu
kami menyusun Makalah Pengembangan Sistem Evaluasi PAI ini kami buat yang
berjudul: “Validitas Tes Realibilas Tes, Tes Buatan Guru dan Tes Standar “

Makalah mata kuliah Pengembangan Sistem Evaluasi PAI ini kami buat untuk
membantu mahasiswa lainnya supaya lebih memahami mata kuliah ini, khususnya
mengenai tes yang baik yang bertujuan untuk memberikan pemahaman keperibadahan
pembelajaran pola biografi singkatnya, serta gaya pemahaman yang baik dan benar
terhadap konseling khusus anak jalanan sehari-hari. yang mana harapan kami semoga
dengan makalah yang telah kami buat dapat membantu menambah ilmu pengetahuan
dan pengalaman bagi para pembaca sehingga kami dapat memperbaiki bentuk maupun
isi makalah ini dengan kedepannya lebih baik dan limpahan karuniany

Petaling, 2,Desember,2022

Penulis

2
DAFTAR ISI

Kata Pengantar………………………………………………………………..i

Daftar Isi……………………………………………………………………....ii

BAB I PENDAHULUAN……………………………………………………..1

A. Latar Belakang………………………………………………………….1
B. Rumusan Masalah………………………………………………………2
C. Tujuan…………………………………………………………………..2

BAB II PEMBAHASAN………………………………………………………3

A. Validitas Tes……………………………………………………………3
1. Pengertian Validitas Tes…………………………………………...6
2. Macam-macam Validitas Tes………………………………………6
3. Cara mengetahui Validitas Tes Alat Ukur…………………………7
4. Tes Terstandar Sebagai Kriterium Dalam Menetukan Validitas…..8
5. Validitas Faktor…………………………………………………….9
B. Realibilitas Tes…………………………………………………………10
1. Pengertian Realibilitas Tes…………………………………………11
2. Hal-hal Apa Yang Mempengaruhi Realibilias Tes………………...13
3. Cara-Cara Mencari Besarnya Realibilitas Tes……………………..15
C. Tes Standar dan Tes Buatan Guru……………………………………...16
1. Pengertian Tes Standar……………………………………………..17
2. Perbandingan Antara Tes Standar dan Tes Buatan Guru………….17
3. Kegunaan Tes Standar dan Tes Buatan Guru……………………..18
4. Kelengkapan Tes Standar…………………………………………..19

BAB III PENUTUP……………………………………………………………20

A. Kesimpulan……………………………………………………………..23

DAFTAR PUSTAKA…………………………………………………………25

3
BAB I

PENDAHULUAN

A. Latar Belakang

Kegiatan evaluasi merupakan bagian yang tak terpisahkan dari sesuatu


upaya yang terprogram tidak terkecuali program pembelajaran. Sebagai
bagian dari program pendidikan. Melaksanakan evaluasi program
pembelajaran merupakan tugas pokok seorang evaluator, tetapi bukan
hanya evaluator saja yang harus memahami model-model evaluasi program
pembelajaran. Para pendidik dan calon pendidik serta praktisi lain yang
berkecimpung dalam dunia pendidikan perlu memahaminya.

Tujuan evaluasi pembelajaran adalah untuk mengetahui keefektifan dan


efisiensi sistem pembelajaran, baik menyangkut tujuan, materi, metode,
media, sumber belajar, lingkungan maupun sistem penilaian itu sendiri atau
dengan kata lain evaluasi dilakukan untuk menentukan nilai atau kualitas
dari kegiatan pembelajaran yang dilakukan.

Agar evaluasi pembelajaran mampu mengukur apa yang ingin diukur


atau mampu mengungkap apa yang ingin diungkapkan maka alat ukur atau
alat evaluasi yang digunakan juga harus memenuhi kriteria standar
pengukuran. Oleh karena itu makalah ini menjadi penting karena
membahas ciri-ciri tes yang baik yang patut dijadikan acuan oleh seorang
evaluator dalam menyusun alat ukur (tes) yang meliputi validitas, reliabilias,
objektivitas, praktibilitas dan ekonomis. Dengan mengacu pada ciri-ciri tes
yang baik maka diharapkan mampu mengetahui efektifitas dan efisiensi
sistem pembelajaran. Sehingga dapat meningkatkan kualitas pemebelajaran
dari waktu ke waktu sehingga dapat memberikan kontsribusi dalam
meningkatkan mutu pendidikan.1

B. Rumusan Masalah
1. Apa Pengertian Validitas Tes?
2. Apa Saja Macam-macam Validitas Tes?
3. Bagaimana cara mengetahui Validitas Tes Alat Ukur?
4. Bagaiamana Tes Terstandar Sebagai Kriterium Dalam Menetukan Validitas?
5. Apa Yang Dimaksud Validitas Faktor?

1
Sudijono Anas,Pengantar Evaluasi Pendidikan,(Jakarta : Raja Grafindo Persada, 1996).
Hlm.4

4
6. Apa Pengertian Realibilitas Tes?
7. Hal Apa Saja Yang Dapat Mempengaruhi Hasil Tes?
8. Bagaimana Cara-Cara Mencari Besarnya Reliabilitas?
9. Apa Pengertian Tes Standar?
10. Apa Itu Tes Prestasi Standar?
11. Bagaimana Perbandingan Antara Tes Standar dan Tes Buatan Guru?
12. Bagaimana Kegunaan Tes Standar dan Tes Buatan Guru?
13. Apa Saja Kelengkapan Tes Standar?
C. Tujuan
1. Untuk mengetahui pengertian validitas tes.
2. Untuk mengetahui macam-macam validitas tes.
3. Untuk mengetahui cara validitas tes alat ukur.
4. Untuk mengetahui bagaiamana tes terstandar sebagai kriterium dalam
menetukan validitas.
5. Untuk mengetahui apa itu validitas faktor.
6. Untuk mengetahui pengertian realibilitas tes.
7. Untuk mengetahui hal apa saja yang dapat mempengaruhi hasil tes.
8. Untuk mengetahui cara-cara mencari besarnya reliabilitas.
9. Untuk mengetahui pengertian tes standar dan tes buatan guru.
10. untuk mengetahui apa itu tes prestasi standar.
11. untuk mengetahui perbandingan antara tes standar dan tes buatan guru.
12. Untuk mengetahui kegunaan tes standar dan tes buatan guru.
13. Untuk mengetahui kelengkapan tes.

5
BAB II

PEMBAHASAN

A. Validitas Tes
1. Pengertian Validitas Tes

Menurut arti istilah “validitas” dengan “valid”. Validitas merupakan kata


benda, sedangkan valid merupakan kata sifat. dalam pembicaraan evaluasi pada
umumnya orang hanya mengenal istilah valid untuk alat evaluasi atau instrument
evaluasi. Sebuah tes disebut valid apabila tes itu dapat tepat mengukur apa yang
hendak diukur. Istilah valid sangat sukar dicari gantinya.ada istilah baru yang
mulai diperkenalkan yaitu “sahih”, sehingga validitas diganti “kesasihan”.
Walaupun istilah tepat belum dapat mencakup semua arti yang tersirat dalam
kata valid , dan kata tepat kadang-kadang digunakan dalam konteks yang lain,
akan tetapi tambahan kata tepat dalam menerangkan kata valid dapat
memperjelas apa yang dimaksud. 2

Menurut Para ahli mengatakan validitas tes alat evaluasi sebagai berikut:

a. Azwar (1987: 173)


Menyatakan bahwa validitas berasal dari kata validity yang mempunyai
arti sejauh mana ketepatan dan kecermatan suatu instrumen pengukur
(tes) dalam melakukan fungsi ukurnya. Suatu tes dikatakan memiliki
validitas yang tinggi apabila alat tersebut menjalankan fungsi ukur secara
tepat atau memberikan hasil ukur yang sesuai dengan maksud
dilakukannya pengukuran tersebut. Artinya hasil ukur dari pengukuran
tersebut merupakan besaran yang mencerminkan secara tepat fakta atau
keadaan sesungguhnya dari apa yang diukur.
b. Suryabrata (2000: 41)
Menyatakan bahwa validitas tes pada dasarnya menunjuk kepada derajat
fungsi pengukurnya suatu tes, atau derajat kecermatan ukurnya sesuatu
tes. Validitas suatu tes mempermasalahkan apakah tes tersebut benar-
benar mengukur apa yang hendak diukur. Maksudnya adalah seberapa
jauh suatu tes mampu mengungkapkan dengan tepat ciri atau keadaan
yang sesungguhnya dari obyek ukur akan tergantung dari tingkat
validitas tes yang bersangkutan.
c. Sudjana (2004: 12)

2
Erlinawati, E., & Muslimah, Test Validity and Reliability in Learning Evaluation. Bulletin of
Community Engagement 2021 (1),Hlm.23.

6
Menyatakan bahwa validitas berkenaan dengan ketepatan alat penilaian
terhadap konsep yang dinilai sehingga betul-betul menilai apa yang
seharusnya dinilai.
2. Macam-Macam Validitas Tes

Secara garis besar ada dua macam validitas,yaitu validitas logis dan validitas
empiris.3

a. Validitas Logis

Validitas tes logis menunjuk pada kondisi bagi sebuah instrumenyang


memenuhi persyaratan valid berdasarkan hasil penalaran.

Ada dua macam validitas tes logis yang dapat dicapai oleh sebuah
instrumen yaitu:

1). Validitas Isi yaitu mengukur tujuan khusus tertentu yang sejajar dengan
materi atau isi pelajaran yang diberikan.

2). Validitas Konstruksi yaitu sebuah tes dikatakan memiliki validitas


konstruksi apabila butir-butir soal yang membangun tes tersebut
mengukur setiap aspek berpikir seperti apa yang disebutkan dalam
Tujuan Instruksional Khusus.

b. Validitas Empiris

Validitas tes empiris tidak dapat hanya dengan menyusun instrument


berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan
melalui pengalaman.

Validitas empiris dibagi menjadi dua macam. yaitu:

1) Validitas ada sekarang, pengalaman selalu mengenai hal yang telah


lampau sehingga data pengalaman tersebut sekarang sudah ada.

2) Validitas prediksi,sebuah tes dikatakan memiliki validitas prediksi


apabila mempunyai kemampuan untuk meramalkan apa yang akan
terjadi pada masa yang akan datang.

3. Cara Mengatahui Validitas Tes Alat Ukur

3
Budiastuti, Dyah & Agustinus Bandur,Validitas Dan Reliabilitas Penelitian Dengan Analisis
Dengan Nvivo, Spss Dan Amos,(Jakarta: Mitra Wacana Media,2018).Hlm.112.

7
Teknik yang digunakan untuk mengetahui validitas adalah korelasi product
moment yang dikemukakan oleh Pearson.

Rumus korelasi product moment ada dua macam,yaitu:


a) Korelasi Product Moment dengan Simpangan

b) Korelasi Product Moment dengan Angka Kasar

Catatan :

Ada tiga jenis korelasi yaitu:

 Korelasi positif, menunjukkan adanya hubungan sejajar antara dua hal.

 Korelasi negative, menunjukkan adanya hubungan kebalikan antara dua


hal.

 Korelasi tidak tertentu,menunjukkan besarnya korelasi tidak tentu antara


dua hal.

Interpretasi besarnya koefisien korelasi sebagai berikut:

 Antara 0,800 sampai dengan 1,00 : sangat tinggi

8
 Antara 0,600 sampai dengan 0,800 : tinggi

 Antara 0,400 sampai dengan 0,600 : cukup

 Antara 0,200 sampai dengan 0,400 : rendah

 Antara 0,00 sampai dengan o,200 : sangat rendah

Penafsiran Harga Koefisien Korelasi Ada Dua Cara Yaitu:

1) Dengan melihat harga r dan diinterpretasikan misalnya korelasi tinggi,


cukup, dan sebagainya.

2) Dengan berkonsultasi ke table harga kritik product moment sehingga


dapat diketahui signifikan tidaknya korelasi tersebut. Jika harga r lebih
kecil dari harga kritik dalam table, maka korelasi tersebut tidak
signifikan. Begitu juga arti sebaliknya.

4. Validitas Butir Soal Atau Validitas Item

Sebuah item dikatakan valid apabila mempunyai dukungan yang besar


terhadap skor total.skor item menyebabkan skor total menjadi tinggi atau rendah.
Dengan kata lain, sebuah item memiliki validitas tinggi jika skor pada item
mempunyai kesejajaran dengan skor total. 4

Perhitungan validitas item :

a) Menggunakan Rumus Product Moment


Item yang akan dihitung validitasnya disebut variable X dan skor total
disebut variable Y. Selanjutnya perhitungan dilakukan dengan
menggunakan rumus korelasi product moment,baik dengan rumus
simpangan maupun angka kasar.
b) Menggunakan Rumus  Pbi

4
Yusup, F. Uji Validitas Dan Reliabilitas Instrumen Penelitian Kuantitatif. Tarbiyah: Jurnal
Ilmiah Kependidikan, 7(1),2018)Hlm.71.

9
5. Tes Terstandar Sebagai Kriterium Dalam Menetukan Validitas

Tes terstandar adalah tes yang telah dicobakan berkali-kali sehingga dapat
dijamin kebaikannya. Sebuah tes terstandar memiliki identitas antara lain:sudah
dicobakan berapa kali dan dimana, berapa koefisien validitasnya, realibilitasnya,
taraf kesukarannya, daya pembeda dan lain-lain keterangan yang dianggap perlu.
Cara menentukan validitas soal yang menggunakan tes terstandar sebagai
kriterium dilakukan dengan mengalikan koefisien validitas yang diperoleh
dengan koefisien terstandar tersebut.

6. Validitas Faktor

Butir-butir soal dalam factor dikatakan valid apabila mempunyai dukungan


yang besar terhadap soal-soal secara keseluruhan. Sebagai tanda bahwa butir-
butir factor tersebut mempunyai dukungan yang besar terhadap seluruh soal,
yakni apabila jumlah skor untuk butir-butir factor tersebut menunjukkan adanya
kesejajaran dengan skor total. Cara mengetahui kesejajaran tersebut digunakan
juga rumus korelasi product moment.

B. Realibilitas Tes
1. Pengertian Realibilitas Tes

Kata reliabilitas dari kata reliability (Inggris) yang artinya dapat dipercaya.
Tes yang reliable jika memberikan hasil yang tetap (consistent) apabila
diteskan berkali-kali. Jika kepada siswa diberikan tes yang sama yang pada
waktu yang berlainan, maka setiap siswa akan tetap berada dalam urutan
rangking yang sama tetap (ajeg) dalam kelompoknya. Validitas berhubungan

10
dengan ketepatan sedangkan reliabilitas berhubungan dengan ketetapan atau
keajekan.`

Sebuah tes dikatakan relibel apabila hasil-hasil pengukuran yang


dilakukan dengan menggunakan tes tersebut secara berulang kali terhadap
subyek yang sama hasilnya tetap sama atau sifatnya stabil.Yang dimaksud
Stabil disini yaitu tetap berada pada urutan kelompoknya ketika tes
dilakukan berulang-ulang meskipun terjadi perubahan nilai secara
keseluruhan oleh kelompoknya tetapi pada posisi urutan rangkingnya
tetap atau berubah tetapi perubahannya tidak berarti. Jadi penekannanya
bukan pada tetapnya nilai tetapi pada tetapnya posisi urutan nilai atau
rangking dalam kelompoknya. Walaupun tampaknya hasil tes pada tes kedua
lebih baik karena kenaikannnya dialami oleh semua siswa maka tes yang
digunakan dapat dikatakan memiliki reliabilitas yang tinggi. Kenaikan hasil
yang kedua bisa jadi disebabkan adanya pengalaman yang diperoleh pada
waktu mengerjakan tes pertama.5

Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dikatakan


mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan
hasil yang tetap. Pengertian reliabilitas tes, berhubungan dengan masalah
ketetapan hasil tes. Jadi, reliabilitas adalah ketetapan suatu tes apabila diteskan
kepada subjek yang sama.6

Adapun menurut para ahli pengertian realibilitas tes :

1. Menurut (Azwar, 2011).

Reliabilitas mempunyai nama lain keandalan, keteguhan, terpercaya,


stabilitas, dan konsistensi, tetapi gagasan utama yang termuat dalam
konsep reliabilitas yakni rentang dimana pengukuran dapat diandalkan

2. Menurut (Lubis, 2009).

Keandalan suatu instrument ialah kepastian atau konsistensi alat ukur


dalam mengukur yang diukur.

3. Menurut (Purwanto, 2002)

5
Anas Sudijono, Pengantar Evaluasi Pendidikan,(Jakarta, PT Raja Grafindo Persada,
2003).Hlm.3.
6
Azwar, Saifuddin,Reliabilitas dan Validitas,(Yogyakarta: Pu staka Pelajar,2011).Hlm.99.

11
Hopkins dan Antes dari Purwanto menjelaskan reliabilitas adalah
konsistensi pengamatan yang didapatkan dari rekaman berulang baik
satu maupun serangkaian subjek. Berdasarkan definisi tersebut,
reliabilitas tes adalah keputusan instrumental atau reliabilitas dalam
mengevaluasi apa yang sedang dievaluasi, yang berarti akan
mendapatkan hasil yang relatif sama setiap kali menggunakan
perangkat evaluasi. Tes reliabilitas (keandalan) instrumen bisa
dilakukan eksternal atau internal.

Secara eksternal, pengujian dijalankan pada tes-tes ulang (test-retest),


ekivalensi dan kombinasi (gabungan). Secara internal dapat menguji keandalan
instrument menggunakan teknik khusus untuk menganalisis konsistensi item
instrument (Sugiyono, 2019). Dalam hal ini validitas lebih penting, dan
reliabilitas ini perlu, karena menyokong terbentuknya validitas. Sebuah tes
mungkin reliabel tetapi tidak valid. Sebaliknya, sebuah tes yang valid biasanya
reliabel.

2. Hal Yang Dapat Mempengaruhi Hasil Tes


Ada 3 Hal Yang Dapat Mempengaruhi Hasil Tes diantaranya yaitu:
a) Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan
kualitas butir-butir soalnya.

Tes yang terdiri dari banyak butir tentu saja lebih valid dibandingkan dengan
tes yang hanya terdiri dari beberapa butir soal. Tinggi rendahnya validitas
menunjukkan tinggi rendahnya reliabilitas tes. Dengan demikian maka semakin
panjang tes, maka reliabilitasnya semakin tinggi. Untuk menghitung besarnya
reliabilitas berhubung dengan penambahan banyaknya butir soal dapat
menggunakan rumus Spearman-Brown.

12
Akan tetapi penambahan butir-butir soal tes adakalanya tidak berarti, bahkan
adakalanya merugikan. Hal ini disebabkan karena:

1) Sampai pada suatu batas tertentu, penambahan banyaknya butir soal sudah
tidak menambah tinggi reliabilitas tes.

2) Penambahan tingginya reliabilitas tes tidak sebanding nilainya dengan


waktu, biaya, dan tenaga yang dikeluarkan untuk itu.

Kualitas butir-butir soal ditentukan oleh:

a. Jelas tidaknya rumusan soal.


b. Baik tidaknya pengarahan soal kepada jawaban sehingga tidak
menimbulkan salah jawab.
c. Petunjuknya jelas sehingga mudah dan cepat dikerjakan.

b) Hal yang berhubungan dengan tercoba (testee)

Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa
akan mencerminkan hasil yang menggambarkan besar kecilnya reliabilitas tes.
Tes yang dicobakan pada bukan kelompok terpilih akan menunjukkan
reliabilitas yang lebih besar daripada yang dicobakan pada kelompok tertentu
yang diambil secara dipilih.

c) Hal yang berhubungan dengan penyelenggaraan tes

1. Petunjuk yang diberikan sebelum tes dimulai.

2. Pengawas yang tertib akan mempengaruhi hasil yang diberikan siswa


terhadap tes

13
3. Suasana lingkungan dan tempat tes

3. Cara-Cara Mencari Besarnya Reliabilitas


a) Metode bentuk paralel (equivalent)

Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya
berbeda. Dua buah tes paralel misalnya tes matematika seri A yang akan dicari
reliabilitasnya dan tes seri B diteskan kepada sekelompok siswa yang sama,
kemudian hasilnya dikorelasikan.

Koefisien korelasi dari kedua tes inilah yang menunjukkan koefisien


reliabilitas tes seri A. Jika koefisiennya tinggi maka tes tersebut sudah reliabel
dan dapat digunakan sebagai alat pengetes yang terandalkan. Dalam
menggunakan metode tes paralel ini pengetes harus menyiapkan dua buah tes,
dan masing-masing dicobakan pada kelompok siswa yang sama. Penggunaan
metode ini baik karena siswa dihadapkan kepada dua macam tes sehingga tidak
ada faktor “masih ingat soalnya” yang dalam evaluasi disebut adanya practice-
effect dan carry-over effect, artinya ada faktor yang dibawa oleh pengikut tes
karena sudah mengerjakan soal tersebut. Kelemahan dari metode ini adalah
bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes dan
harus tersedia waktu yang lama untuk mencobakan dua kali tes.

b) Metode tes ulang (test-retest method)

Metode tes ulang adalah sebuah tes yang dicobakan dua kali. Untuk tes yang
banyak mengungkap pengetahuan (ingatan) dan pemahaman, cara ini kurang
mengena karena tercoba akan masih ingat akan butir-butir soalnya. Jika
tenggang waktu terlalu sempit, siswa masih banyak ingat materi. Sebaliknya
kalau tenggang waktu terlalu lama, maka faktor-faktor atau kondisi tes sudah
akan berbeda, dan siswa sendiri barangkali sudah mempelajari sesuatu. Tentu
saja faktor-faktor ini akan berpengaruh pula terhadap reliabilitas. Pada umumnya
hasil tes yang kedua cenderung lebih baik daripada hasil tes pertama. Hal ini
tidak mengapa karena pengetes harus sadar akan adanya practice effect dan
carry over effect.Yang penting adalah adanya kesejajaran hasil atau ketetapan
hasil yang ditunjukkan oleh koefisien korelasi yang tinggi.

c) Metode belah dua atau split-half method


Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes
yang dicobakan satu kali. Berbeda dengan metode pertama dan kedua yang

14
setelah diketemukan koefisien korelasi langsung ditafsirkan itulah koefisien
reliabilitas, maka dengan metode ketiga tidak demikian. Pada waktu membelah
dua dan mengkorelasikan dua belahan, baru reliabilitas separo tes.

Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman


Brown itu ada dua cara yaitu:

1. Cara membelah butir soal (Banyaknya butir soal harus genap) :


 Membelah atas item-item genap dan item-item ganjil yang
selanjutnya disebut belahan ganjil-genap.
 Membalah atas item-item awal dan item-item akhir yaitu separo
jumlah pada nomor-nomor awal dan separo pada nomor-nomor
akhir yang selanjutnya disebut belahan awal-akhir.
2. Cara perhitungan reliabilitas dengan metode belah dua:
 Mengadakan analisis butir soal (analisis item). Item yang dapat
dijawab dengan benar diberi skor dan bagi yang salah diberi skor 0
 Skor-skor untuk seluruh subjek dan seluruh item diterakan dalam
tabel analisis.
 Membuat tabel perhitungan reliabilitas dengan belah dua ganjil-
genap atau awal-akhir.
 Menghitung dengan rumus korelasi product moment.

15
 Untuk mencari reliabilitas seluruh tes digunakan rumus Spearman
Brown
4. Cara Mencari Reliabilitas Tes Bentuk Uraian

Menilai soal bentuk uraian tidak dapat dilakukan dengan menilai hanya
“benar” atau “salah” seperti tes bentuk objektif. Sesuatu butir soal uraian
menghendaki gradualisasi penilaian. Misalnya butir soal nomor 1 penialaian
terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi hanya 5, dan butir
soal nomor 3 sampai 10 dan sebagainya.

Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan


analisis butir soal seperti halnya soal bentuk objektif. Skor untuk masing-masing
butir soal dicantumkan pada kolom item menurut apa adanya. Rumus yang
digunakan adalah rumus alpha sebagai berikut:

C. Tes Standard dan Tes Buatan Guru


1. Pengertian Tes Standar

Pengertian tes standar secara sempit adalah tes yang disusun oleh satu tim
ahli, atau disusun oleh lembaga yang khusus menyelenggarakan secara
professional. Tes tersebut diketahui memenuhi syarat sebagai tes yang baik. Tes
ini dapat digunakan dalam waktu yang relatif lama, dapat diterapkan pada
beberapa obyek mencakup wilayah yang luas. Untuk mengukur validitas dan
reliabilitasnya telah diuji-cobakan beberapa kali sehingga hasilnya dapat
dipertanggungjawabkan.

Tes standar adalah suatu tes dimana semua siswa menjawab pertanyaan-
pertanyaan yang sama dari sebagian besar pertanyaan dikerjakan dengan
mengikuti petunjuk yang sama dan dalam batasan waktu yang sama pula. Tes
standar dilaksanakan secara seragam, diusahakan dalam kondisi yang seragam,

16
baik itu diberikan kepada siswa dalam pelaksanaan perseorangan maupun siswa
sebagai anggota dari suatu kelompok.7

Tes Standar (Standardized Test) dirancang oleh ahli tes yang bekerja
sebagai ahli kurikulum sekaligus sebagai guru. Tes tersebut distandarisasi dalam
arti pengelolaan dan penyekoran yang dilakukan berdasarkan standar dan asumsi
kondisi yang seragam sehingga hasil dari penilaian dapat dibandingkan untuk
kelas atau sekolah yang berbeda.

Tes standar bertujuan untuk mengukur kemampuan peserta didik dalam


tiga aspek, yaitu kedudukan belajar, kemajuan belajar, dan diagnosik.

Tes kemampuan dibedakan menjadi 2:

a. Tes bakat (aptitude test)


b. Tes prestasi (achievement test)

Perbedaan antara kedua tes ini sebenarnya tidak tegas, soal-soal mengenai
kedua tes tersebut seringkali saling melengkapi (overlap). Untuk kedua macam
tes ini biasanya menggunakan hitungan-hitungan dan perbendaharaan kata-kata
dan sekelompok tes dari kedua macam tes ini biasanya juga menguji tentang
keterampilan membaca. Kesamaan yang lain adalah bahwa keduanya telah
digunakan untuk meramalkan hasil untuk masa yang akan datang, walaupun
pada umumnya jika kita menggunakan tes prestasi penilai melihat apa yang telah
diperoleh setelah siswa (tercoba) itu di beri suatu pelajaran.

Prosedur yang digunakan untuk menentukan isi dari tes prestasi juga
sedikit berbeda dengan yang digunakan pada waktu penyusunan tes bakat. Di
dalam penyusunan tes prestasi belajar usaha-usaha digunakan untuk menentukan
pengetahuan dan keterampilan yang sudah di ajarkan di berbagai tingkat
pendidikan dan butir-butir tes di peruntukkan bagi penilaian materi-materi ini.

2. Tes Prestasi Standar

Di antara tes prestasi yang digunakan di sekolah ada yang dinamakan tes
prestasi standar. Dalam salah satu kamus, arti kata “standar” adalah:

7
Dindin. A,Tes Standar (Standardized Test). Pdf Online Http://File.Upi.Edu/Direktori/KD
TASIKMALAYA/DINDIN_ABDUL_MUIZ_LIDINILLAH_%28KD-TASIKMALAYA%29-
197901132005011003/132313548%20%20dindin%20abdul%20muiz%20lidinillah/Standardized%20Test
.Pdf

17
A degree of level of requirement, excellence, or attainment

Standar untuk siswa dapat dimaksudkan sebagai suatu tingkat kemampuan


yang harus dimiliki bagi suatu program tertentu. Mungkin standar bagi suatu
kursus A berbeda dengan kursus B. Jadi standar ini dapat dibuat “keras” maupun
“lunak” tergantung dari yang mempunyai kebijaksanaan. Suatu tes standar
dengan demikian berbeda dengan tes prestasi biasa. Prosedur yang digunakan
untuk menyusun tes standar untuk tes prestasi melalui cara langsung yang
ditumbuhkan dari tes yang digunakan di kelas. Sedangkan spesifikasi yang
digunakan untuk menentukan isi dalam tes bakat biasanya didasarkan atas
analisis job (jabatan) atau analisis tugas yang merupakan tuntutan calon
pekerjaannya. Disamping itu juga mempertimbangkan sifat-sifat yang ada pada
manusia. Analisis jabatan analisis tugas yang dilakukan biasanya tidak
didasarkan atas salah satu kurikulum, tetapi di ambil dari masyarakat.

Istilah “standar” dalam tes di maksudkan bahwa semua siswa menjawab


pertanyaan-pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan
dengan mengikuti petunjuk yang sama dan dalam batasan waktu yang sama
pula. Dengan demikian maka seolah-olah ada suatu standar atau ukuran
sehingga diperoleh satu standar penampilan (performance) dan penampilan
kelompok lain dapat dibandingkan dengan penampilan kelompok standar
tersebut.

Istilah “standar” tidak mengandung arti bahwa tes itu mengukur apa yang
harus dan dapat di ajarkan pada suatu tingkat tertentu atau bahwa tes itu
menyiapkan suatu tingkat tertentu. Sekali lagi, tes standar dipolakan untuk
penampilan prestasi sekarang (yang ada) yang dilaksanakan secara seragam, di
usahakan dalam kondisi yang seragam, baik itu di berikan kepada siswa dalam
pelaksanaan perseorangan maupun siswa sebagai anggota dari suatu kelompok.

Penyusun tes standar selalu mengusahakan agar sistem skoringnya sangat


objektif sehingga dapat diperoleh reliabilitas yang tinggi. Apabila mungkin,
dilakukan dengan mesin, hal ini tidak berarti bahwa bentuk tes standar harus
selalu pilihan berganda. Tetapi untuk skoringnya di usahakan agar tidak kena
bias faktor-faktor lain. Usaha lain adalah penggunaan skala skor dan norma yang
relevan. Skala skor di gunakan untuk menyesuaikan antara bentuk paralel dan
bentuk aslinya. Di samping itu juga diperlukan penjelasan terinci tentang tes itu.
Tentang keterangan ini akan dibicarakan pada bagian kelengkapan tes standar.

3. Perbandingan antara Tes Standar Dengan Tes Buatan Guru

18
Setelah mempelajari uraian terdahulu dapat disimpulkan bahwa tes standar
sebenarnya bukanlah suatu yang istimewa dalam tes prestasi belajar. Tes ini
disusun dalam tipe-tipe soal yang sama dan meliputi bahan atau pengetahuan
yang sama banyak dengan bahan atau pengetahuan yang dicakup oleh tes buatan
guru.8

Tes Standar dapat dibedakan dengan Tes Buatan Guru dengan


perbandingan sebagai berikut :

Tes Standar Tes Buatan Guru


 Didasarkan atas bahan dan tujuan  Didasarkan atas bahan dan tujuan
umum dari sekolah-sekolah diseluruh khusus yang dirumuskan oleh guru
negara. untuk kelasnya sendiri.
 Mencakup aspek yang luas dan  Dapat terjadi hanya mencakup
pengetahuan atau ketrampilan dengan pengetahuan atau ketrampilan yang
hanya sedikit butir tes untuk setiap sempit.
ketrampilan atau topik.  Biasanya disusun sendiri oleh guru
 Disusun dengan kelengkapan staf dengan sedikit atau tanpa bantuan
profesor, pembahas, editor, butir tes. orang lain/tenaga ahli.
 Menggunakan butir-butir tes yang  Jarang-jarang menggunakan butir-
sudah diuji cobakan (try out), butir tes yang sudah diuji cobakan,
dianalisis dan direvisi sebelum dianalisis, dan direvisi.
menjadi sebuah tes.  Mempunyai relabilitas sedang atau
 Mempunyai relabilitas yang tinggi. rendah.
 Dimungkinkan menggunakan norma  Norma kelompok terbatas kelas
untuk seluruh negara. tertentu.

8
Tami, dkk.Tes Standar dan Tes Buatan Guru. Pdf online
http://staffnew.uny.ac.id/upload/131808346/pendidikan/BAB+9+TES+STANDAR+DAN+TES+BUATA
N+GURU.pdf.

19
Agar lebih memahami perbedaan tes standar dengan tes buatan guru,
berikut ini perbandingannya menurut Sax (1980).

Secara umum, ujian yang dilakukan berdasarkan tes buatan guru


lebih fleksibel. Guru dapat mengubah dan memperbaikinya bergantung
pada tujuan dan kondisi yang terjadi di kelas. Akan tetapi, tes ini tidak mampu
membandingkan antar siswa dengan kelas lain di luar sekolah tersebut. Hal
ini berbeda sekali dengan tes standar, diamana tes ini dapat mengetahui
kualitas siswa berdasarkan standar kualitas yang ditetapkan lebih luas, misalnya
suatu Negara atau daerah.

Untuk menyusun tes standar, dibutuhkan waktu yang lama. Seperti


disebutkan bahwa untuk memperoleh sebuah tes standar melalui prosedur :

- Penyusunan
- Uji coba
- Analisis
- Revisit
- Edit,
Kelima kegiatan ini membutuhkan waktu yang lama.
4. Kegunaan Tes Standar

20
Secara singkat dapat dikemukakan bahwa kegunaan tes standar adalah:

a. Jika ingin membuat perbandingan

Banyak situasi pendidikan dimana guru atau pimpinan terpaksa


mengadakan perbandingan. Hal ini termasuk perbandingan antar siswa
untuk setiap bidang studi. Atau perbandingan tentang prestasi belajar yang
mendasarkan diri pada kemampuan dasar, atau perbandingan prestasi
setelan digunakan dua metode yang berbeda. Nilai yang dibuat oleh guru
yang berbeda dari bidang yang berbeda dan situasi belajar yang berbeda,
tidak dapat digunakan untuk alat pembanding. Akan tetapi tugas yang
sifatnya umum, norma-norma, tes yang mempunyai reabilita yang tinggi
dan tes standard, ada kemungkinan boleh digunakan sebagai alat
pembanding.

b. Jika banyak orang yang akan memasuki suatu sekolah tetapi tidak tersedia
data tentang calon ini.
Sebagai ilustrasi dapat dimisalkan sebuah sekolah menengah yang
menerima 5 orang siswa dari sekolah-sekolah dasar yang berbeda.Para
adaministrator di SPM itu diharapkan pada suatu masalah apabila harus
menentukan efektifitas belajar. Kelima anak ini datang dari SD telah
membawa nilai sendiri-sendiri dari guru-guru yang berbeda sehingga sukar
diinterpretasikan. Nilai yang diperoleh dari guru yang berbeda, tidak
diketahui dasar pertimbangan yang diambil untuk menentukanya. Guru
yang satu mungkin dipengaruhi oleh keterampilan bekerja, sedang guru
lain didasarkan atas panjang-pendeknya jawaban.

Walaupun sangat luas, namun secara garis besar, kegunaan tes standar adalah:

1) Membandingkan prestasi belajar dengan pembawaan individu atau


kelompok.
2) Membandingkan tingkat prestasi siswa dalam keterampilan di berbagai
bidang studi untuk individu atau kelompok.
3) Membandingkan prestasi siswa antara berbagai sekolah atau kelas.
4) Mempelajari perkembangan siswa dalam suatu periode waktu tertentu.

21
5. Kegunaan Tes Buatan Guru

Kegunaan tes buatan guru adalah :

a) Untuk menentukan seberapa baik siswa telah menguasai bahan pelajaran


yang di berikan dalam waktu tertentu.
b) Untuk menentukan apakah sesuatu tujuan telah tercapai.
c) Untuk memperoleh suatu nilai.

Selanjutnya baik tes standar dan tes buatan guru di anjurkan dipakai jika
hasilnya akan digunakan untuk:

1) Mengadakan diagnosis terhadap ketidakmampuan siswa.


2) Menentukan tempat siswa dalam suatu kelas atau kelompok.
3) Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan
jurusan.
4) Memilih siswa untuk program-program khusus.

Dari uraian di atas tampak bahwa baik tes standar maupun tes buatan guru
masing-masing mempunyai kegunaan sendiri. Dua macam tipe evaluasi ini
saling mengisi dan saling melengkapi.

6. Kelengkapan Tes Standar

Sebuah tes yang sudah distandarisasikan dan sudah dapat disebut sebagai
tes standard, biasanya dilengkapi dengan sebuah manual. Manual ini memuat
keterangan-keterangan atau petunjuk-petunjuk yang perlu terutama yang
menjelaskan tentang pelaksanaan, menskor dan mengadakan intepretasi.9

Secara garis besar manual tes standard ini memuat:

a. Ciri-ciri tes mengenai tes.


Misalnya menyebutkan tingkat validita, reabilitas dan sebagainya.
b. Tujuan serta keuntungan-keuntungan dari tes.
Misalnya disebutkan untuk siapa tes tersebut diberikan dan tujuan apa.

9
Purwanto, Ngalim,Prinsip-prinsip dan Teknik Evaluasi Pengajaran.(Bandung: PT Remaja
Rosdakarya,2006). Hlm.56

22
c. Proses standarisasi tes.
Misalnya mengenai hal-hal yang berhubungan dengan sampel:
- Besarnya sampel
- Teknik sampling
- Kelompok mana yang diambil sebagai sampel (sifat sampel).
Mengenai staf kepercayaan yang diambil dan bagaimana kaitanya dengan hasil
test.
d. Petunjuk-petunjuk tentang cara melaksanakan tes.
e. Misalnya, dilaksanakan dengan lisan atau tulisan, waktu yang digunakan
untuk mengerjakan setiap bagian, boleh tidaknya tercoba keluar jika sudah
selesai mengerjakan soal itu dan sebagainya.
f. Petunjuk-petunjuk bagaimana cara menskor.
g. Misalnya, untuk beberapa skor tiap-tiap soal/unit, menggunakan sistem
hukuman atau tidak, bagaimana cara memperhitungkan sistem hukuman
atau tidak, bagaiamana cara memperhitungkan nilai akhir dan sebagainya.
h. Petunjuk-prtunjuk untuk menginteprestasikan hasil.

Misalnya:

- Betul nomer sekian sampai sekian cocok untuk jabatan kepala seksi;
- Betul nomer sekian saja, cocok untuk jabatan guru dan sebagainya.
i. Saran-saran lain.
Misalnya: siapa harus menjadi pengawas, bagaimana seandainya tidak ada calon
yang mencapai skor tertentu dan sebagainya.

23
BAB III

PENUTUP

A. Kesimpulan
1. Validitas
Valid apabila alat ukur tersebut dapat dengan tepat mengukur apa yang
hendak diukur atau mengungkap lewat tes tersebut.
2. Reliabilitas
Hasil-hasil pengukuran yang dilakukan dengan menggunakan tes tersebut
secara berulang kali terhadap subyek yang sama hasilnya tetap sama atau
sifatnya stabil dalam kelompoknya.
3. Tes standar
Tes standar adalah suatu tes yang memenuhi suatu persyaratan
validitas,reliabilitas,kepraktisan dan lainnya.Tes standar umunya dibuat oleh
suatu tim (guru,ahli psikologi,ahli bidang studi) yang sebelum diteskan,diuji
dahulu validitas,reabilitas,kepraktisan dan daya bedanya.
4. Istilah “standard” dalam tes dimaksudkan hanya bahwa semua siswa menjawab
pertanyaan-pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan
dengan mengikuti petunjuk yang sama dan dalam batasan waktu yang sama
pula. Dengan demikian maka seolah-olah ada suatu standard atau ukuran
sehingga diperoleh suatu standard penampilan (performance), dan penampilan
kelompok lain dapat dibandingkan dengan penampilan kelompok standard
tersebut.
5. Perbedaan yang terdapat pada tes standar dengan tes buatan guru adalah pada
aspek bahan, tujuan, aspek cakupan, penyusun, pengujian, tingkat reabilitas,
norma, waktu penyususnan, pertanggungjawaban, angaran biaya, dan
kegunaan.
6. Terdapat dua kegunaan utama pada tes standar yaitu Jika ingin membuat
perbandingan; jika banyak orang yang akan memasuki suatu sekolah tetapi
tidak tersedia data tentang calon ini.
7. kegunaan tes buatan guru adalah Untuk menentukan seberapa baik siswa telah
menguasai bahan pelajaran yang diberikan dalam waktu tertentu; Untuk
menentukan apakah sesuatu tujuan telah tercapai; Untuk memperoleh suatu
nilai.
8. Sebuah tes yang sudah distandarisasikan dan sudah dapat disebut sebagai tes
standard, biasanya dilengkapi dengan sebuah manual. Manual ini memuat
keterangan-keterangan atau petunjuk-petunjuk yang perlu terutama yang
menjelaskan tentang pelaksanaan, menskor dan mengadakan intepretasi.

24
DAFTAR PUSTAKA

Anas Sudijono, Pengantar Evaluasi Pendidikan,(Jakarta, PT Raja Grafindo Persada,


2003)
Azwar, Saifuddin,Reliabilitas dan Validitas,(Yogyakarta: Pu staka Pelajar,2011)
Budiastuti, Dyah & Agustinus Bandur,Validitas Dan Reliabilitas Penelitian Dengan
Analisis Dengan Nvivo, Spss Dan Amos,(Jakarta: Mitra Wacana Media,2018)
Dindin. A,Tes Standar (Standardized Test). Pdf Online
Http://File.Upi.Edu/Direktori/KD
Tasikmalaya/Dindin_Abdul_Muiz_Lidinillah_%28kd-Tasikmalaya%29-
197901132005011003/132313548%20%20dindin%20abdul%20muiz%20lidinill
ah/Standardized%20Test.Pdf
Muslimah & Erlinawati, E.,, Test Validity and Reliability in Learning Evaluation.
Bulletin of Community Engagement 2021 (1)
Purwanto, Ngalim,Prinsip-prinsip dan Teknik Evaluasi Pengajaran.(Bandung: PT
Remaja Rosdakarya,2006)
Sudijono Anas,Pengantar Evaluasi Pendidikan,(Jakarta : Raja Grafindo Persada,
1996)
Tami, dkk.Tes Standar dan Tes Buatan Guru. Pdf online
http://staffnew.uny.ac.id/upload/131808346/pendidikan/BAB+9+TES+STAND
AR+DAN+TES+BUATAN+GURU.pdf.
Yusup, F. Uji Validitas Dan Reliabilitas Instrumen Penelitian Kuantitatif. Tarbiyah:
Jurnal Ilmiah Kependidikan, 7(1),2018)

25

Anda mungkin juga menyukai