Anda di halaman 1dari 21

Hari/Tanggal : Kamis/ 30 Januari 2020

Kelompok :2

MAKALAH
PENGEMBANGAN EVALUASI DAN PROSES
PEMBELAJARAN FISIKA

“Validitas dan Realibilitas; Bias dan Standard Error Measurement’’

OLEH :
Hasbi Aziz
Erlina
Rahmi Laila

DOSEN PEMBIMBING :
Prof. Dr. Festiyed, M. S
Dr. Fatni Mufit, M.Pd

PROGRAM STUDI PENDIDIKAN FISIKA


PROGRAM PASCASARJANA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI PADANG
2020
KATA PENGANTAR

Puji dan syukur penulis ucapkan kehadirat Allah SWT yang telah melimpahkan
rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan makalah dengan judul
”Validitas dan Realibilitas;Bias dan Standard Error Measurement’’.Salah satu tujuan
dari penulisan ini adalah untuk memenuhi tugas dari mata kuliah pengembangan evaluasi dan
proses pembelajaran fisika pada program studi Pendidikan Fisika (S2), Pascasarjana
Universitas Negeri Padang.
Dalam penyelesaian makalah ini penulis banyak menemui kendala. Namun berkat
bantuan dari berbagai pihak, penulis dapat menyelesaikan makalah ini dengan baik. Untuk itu
penulis mengucapkan terima kasih kepada semua pihak yang telah membantu khususnya
dosen pembimbing mata kuliah pengembangan evaluasi dan proses pembelajaran fisika, ibuk
Prof. Dr. Festiyed,M.S dan ibuk Dr. Fatni Mufit, M.Pd.
Dalam penulisan makalah ini, penulis menyadari masih banyak terdapat kekurangan.
Untuk itu kritik dan saran dari pembaca sangat diharapkan demi kesempurnaan makalah ini
untuk kedepannya. Semoga makalah ini bisa dimanfaatkan sebaik-baiknya dan diterima
sebagai perwujudan penulis dalam dunia pendidikan dan sebagai amal ibadah disisi-Nya.
Aaamiiiin.

Padang, Januari 2020

Penulis

i
DAFTAR ISI

KATA PENGANTAR ........................................................................................................... i


DAFTAR ISI .........................................................................................................................ii
BAB I PENDAHULUAN ..................................................................................................... 3
A. Latar Belakang .......................................................................................................... 3
B. Rumusan Masalah ..................................................................................................... 5
C. Batasan Masalah ........................................................................................................ 5
D. Tujuan Penulisan ....................................................................................................... 5
E. Manfaat Penulisan ..................................................................................................... 5
BAB II KAJIAN TEORI ....................................................................................................... 5
A. Landasan Teori .......................................................................................................... 6
B. Evaluasi ................................................................... Error! Bookmark not defined.
C. Assesmen/ Penilaian ................................................ Error! Bookmark not defined.
D. Pengukuran .............................................................. Error! Bookmark not defined.
E. Tes ........................................................................... Error! Bookmark not defined.
BAB III PEMBAHASAN ................................................... Error! Bookmark not defined.
A. Persamaan, Tes, Pengukuran, Asesmen Dan EvaluasiError! Bookmark not
defined.
B. Perbedaan Tes, Pengukuran, Asesmen Dan EvaluasiError! Bookmark not
defined.
C. Hubungan Tes, Pengukuran, Asesmen Dan EvaluasiError! Bookmark not
defined.
D. Matriks Perbandingan Penilaian, Asesmen, Pengukuran, Dan Testing ...........Error!
Bookmark not defined.
E. Validitas Dan Reliabilitas .......................................................................................... 8
F. Bias Dan Standard Error Measurement .................................................................. 16
BAB IV PENUTUP ............................................................................................................ 19
A. Kesimpulan.............................................................................................................. 19
B. Saran ........................................................................................................................ 19
DAFTAR PUSTAKA ......................................................................................................... 20

ii
BAB I
PENDAHULUAN

A. Latar Belakang
Pembelajaran merupakan suatu rangkaian proses dan kegiatan untuk memajukan
serta meningkatkan kompetensi dari peserta didik sehingga nantinya peserta didik
memiliki bekal dan skill dalam menghadapi persaingan pada dunia kerja atau setelah
proses pembelajaran berakhir. Proses pembelajaran merupakan tonggak utama dalam
pelaksanaan pendidikan. Dengan kata lain apabila dalam proses pembelajaran terjadi
hambatan atau gangguan akan berdampak pada penurunan kualitas pendidikan.
Pembelajaran sendiri secara sederhana terdiri dari 3 tahap utama yaitu perencanaan,
pelaksanaan dan evaluasi. Pembelajaran tidak akan lengkap apabila tidak diikuti oleh
perencanaan yang matang serta menggunakan teknik dan komponen penilaian yang
tepat. Penyusunan rencana penilaian merupakan rangkaian program pendidikan dan
pembelajaran yang utuh dan merupakan satu kesatuan yang tidak dapat dipisahkan
satu dengan yang lainnya.
Dalam sebuah proses pembelajaran komponen yang turut menentukan
keberhasilan sebuah proses adalah evaluasi. Melalui evaluasi orang akan mengetahui
sampai sejauh mana penyampaian pembelajaran atau tujuan pendidikan atau sebuah
program dapat dicapai sesuai dengan tujuan yang diinginkan. Sesuai dengan PP No. 13
tahun 2015. Evaluasi pendidikan adalah kegiatan pengendalian, penjaminan dan penetapan
mutu pendidikan terhadap berbagai komponen pendidikan pada setiap jalur, jenjang dan jenis
pendidikan sebagai bentuk pertanggungjawaban penyelenggara pendidikan.
Evaluasi merupakan salah satu kegiatan utama yang harus dilakukan dalam
kegiatan pendidikan dan pembelajaran. Melalui Evaluasi, kita akan mengetahui
perkembangan hasil belajar, intelegensi, bakat khusus, minat, hubungan sosial, sikap
dan kepribadian siswa atau peserta didik serta keberhasilan sebuah program.
. Mengacu pada asumsi bahwa pembelajaran merupakan sistem yang terdiri atas
beberapa unsur (yaitu masukan, proses dan hasil), maka terdapat tiga jenis evaluasi
sesuai dengan sasaran evaluasi pembelajaran, yaitu evaluasi masukan, proses dan hasil
pembelajaran.Terkait dengan ketiga jenis evaluasi pembelajaran tersebut, dalam praktek

3
pembelajaran secara umum pelaksanaan evaluasi pembelajaran menekankan pada
evaluasi proses pembelajaran dan evaluasi hasil belajar. Hal ini didasarkan pada
pemikiran bahwa pelaksanaan kedua jenis evaluasi tersebut merupakan komponen
sistem pembelajaran yang sangat penting. Evaluasi kedua jenis komponen yang dapat
dipergunakan untuk mengetahui kekuatan dan kelemahan pelaksanaan dan hasil
pembelajaran. Selanjutnya masukan tersebut pada gilirannya dipergunakan sebagai
bahan dan dasar memperbaiki kualitas proses pembelajaran menuju keperbaikan
kualitas hasil pembelajaran
Kemudian pada Peraturan Pemerintah no 13 tahun 2013 telah dijelaskan
tentang Standar Nasional Pendidikan yaitu berjumlah delapan buah: standar isi, standar
proses, standar kompetensi lulusan, standar pendidik dan tenaga pendidik, standar
sarana dan prasarana, standar pengelolaan, standar pembiayaan, standar penilaian
pendidikan. Dari delapan standar pendidikan nasional, standar pendidikan merupakan
bagian yang tak terpisahkan dengan standar nasional pendidikan. Setiap pendidikan
harus dapat memberikan pelayanan yang prima dan memperlakukan peserta didik secara
adil, objektif, bertanggung jawab, tidak terkecuali dalam penilaian pendidikan.
Berlandaskan landasan yuridis di atas terlihat bahwa guru sebagai salah
seorang pelaksana pendidikan memiliki peran penting dalam proses penilaian. Guru
yang berkualitas akan mampu melakukan penilaian dengan baik, sehingga hasil belajar
yang diukur akan terllihat dengan jelas, apakah pembelajaran yang dilakukan sudah
mencapai standar kompetensi lulusan atau belum. Guru atau pendidik harus menguasai
dan memahami mekanisme, prosedur, maupun instrument penialaian yang harus
digunakan. Guru diharapkan mampu melaksanakan proses penialain secara
berkesinambungan agar dapat memantau proses, kemajuan, dan perbaikan dan
perbaikan hasil dalam bentuk ulangan harian, ulangan tengah semester, ulangan akhir
semester, ulangan kenaikan kelas.
Oleh karena itu, dalam makalah ini penulis akan menjabarkan tentang beberapa
hal yang harus diketahui oleh seorang guru diantaranya penilaian, asesmen, pengukuran
dan testing serta perbandingannya dll.

4
B. Rumusan Masalah
Berdasarkan latar belakang yang teah diungkapkan, maka rumusan masalah pada
makalah ini adalah
1. Bagaimanakah kualitas sebuah instrument yang baik?
2. Bagaimanakah perbedaan validitas dan reliabilitas dari sebuah instrument?
3. Apakah yang dimaksud dari bias?
4. Apakah yang dimaksud dari Standard Error Measurement?

C. Batasan Masalah
Agar penulisan ini lebih terarah, maka penulis membatasi masalah :
menganalisis kualitas instrument yang dinilai dari validitas, reliabilitas, bias dan
Standard Error Measurement.

D. Tujuan Penulisan
Adapun tujuan dalam pembuatan makalah ini adalah
1. Untuk mengetahui kualitas sebuah instrument yang baik.
2. Untuk mengetahui perbedaan validitas dan reliabilitas dari sebuah instrumen.
3. Untuk mengetahui penjelasan tentang bias.
4. Untuk mengetahui penjelasan tentang Standard Error Measurement.

E. Manfaat Penulisan
Adapun manfaat dalam pembuatan makalah ini adalah :
1. Sebagai bahan pertimbangan oleh guru dalam membuat sebuah instrument
evaluasi pembelajaran di sekolah .
2. Dapat dijadikan pengalaman dan bekal ilmu pengetahuan bagi pembaca
khususnya untuk tenaga pendidik kedepannya.
3. Membantu mahasiswa memahami tentang bagaimana pelaksanaan evaluasi dalam
pendidikan.
4. Memenuhi persyaratan untuk mengikuti mata kuliah Pengembangan Evaluasi dan
Proses Pembelajaran Fisika

5
BAB II

KAJIAN TEORI

A. LANDASAN TEORI

1. Landasan Religius

a. Ayat Alquran tentang validitas dan reliabilitas

Allah berfirman dalam Quran surat Maryam ayat 84 dan Al-Hujurat ayat 6 yang

berbunyi :

‫علَى َما فَعَ ۡلت ُ ۡم‬ ِ ُ ‫يََٰٓأَيُّ َها ٱلَّذِينَ َءا َمنُ َٰٓواْ إِن َجا َٰٓ َء ُك ۡم فَا ِس ُۢ ُق بِنَبَ ٖإ فَت َبَيَّنُ َٰٓواْ أَن ت‬
َ ْ‫صيبُواْ قَ ۡو ُۢ َما بِ َج َهلَ ٖة فَت ُصۡ بِ ُحوا‬
َ‫نَد ِِمين‬
Artinya: “maka janganlah kamu tergesa-gesa memintakan siksa terhadap
mereka, karena sesungguhnya Kami hanya menghitung datangnya (hari siksaan)
untuk mereka dengan perhitungan yang teliti”.
Allah berfirman dalam Quran surat An-Naml ayat 32 yang berbunyi :

ِ َ‫قَالَ ۡت يََٰٓأَيُّ َها ۡٱل َملَؤُ اْ أ َ ۡفتُونِي فِ َٰٓي أَمۡ ِري َما ُكنتُ ق‬
ِ ‫اط َعة أَمۡ را َحت َّى ت َۡش َهد‬
‫ُون‬
Artinya: “Berkata dia (Balqis): "Hai para pembesar berilah aku pertimbangan
dalam urusanku (ini) aku tidak pernah memutuskan sesuatu persoalan sebelum
kamu berada dalam majelis(ku)”
Evaluasi dalam pembelajaran harus dihitung reliabilitasnya atau tingkat
kepercayaan. reliabilitas ini penting karena pembelajaran merupakan pedoman
bagi siswa dalam mendapatkan ilmu, sehingga pembelajaran yang dibuat oleh
guru harus sesuai dengan kebenaran. Konsep reliabilitas terdapat dalam surat Ali-
Imran ayat 139 :
َ‫َو ََل ت َ ِهنُواْ َو ََل ت َۡحزَ نُواْ َوأَنت ُ ُم ۡٱۡل َ ۡعلَ ۡونَ إِن ُكنتُم ُّم ۡؤ ِمنِين‬
Artinya : Janganlah kamu bersikap lemah, dan janganlah (pula) kamu bersedih
hati, padahal kamulah orang-orang yang paling tinggi (derajatnya), jika kamu
orang-orang yang beriman.

6
Sejalan dengan ayat diatas, reliabilitas juga terdapat dalam surat Fussilat ayat 30 :

َٰٓ
‫علَ ۡي ِه ُم ۡٱل َملَ ِئ َكةُ أ َ ََّل تَخَافُواْ َو ََل ت َ ۡحزَ نُواْ َوأ َ ۡبش ُِرواْ ِب ۡٱل َجنَّ ِة‬ َّ ‫ِإ َّن ٱلَّذِينَ قَالُواْ َربُّنَا‬
ۡ ‫ٱَّللُ ث ُ َّم‬
َ ‫ٱستَقَ ُمواْ تَتَن ََّز ُل‬
َ‫عدُون‬ َ ‫ٱلَّ ِتي ُكنت ُ ۡم تُو‬
Artinya: Sesungguhnya orang-orang yang mengatakan: "Tuhan kami ialah
Allah" kemudian mereka meneguhkan pendirian mereka, maka malaikat akan
turun kepada mereka dengan mengatakan: "Janganlah kamu takut dan
janganlah merasa sedih; dan gembirakanlah mereka dengan jannah yang telah
dijanjikan Allah kepadamu"

b. Ayat Alquran tentang standard error measurement

Surat Al-Qori’ah; 6-9, Allah berfirman :

(9). ُ‫( َها ِويَةُ َفأ ُ ُّم ُه‬8). ‫( َم َو ِازينُه َخفَّتُ َمنُ َوأ َ َّما‬7). ‫اضيَةُ ةُ ََ ِعيش فِي فَ ُه َُو‬
ِ ‫( َر‬6). ‫َم َُو ِازينُ ُهُ ثَقُلَتُ َمنُ فَأ َ َّما‬

Artinya : Dan adapun orang-orang yang berat timbangan amal (kebaikan)nya,


maka ia berada dalam kehidupan yang memuaskan, adapun orang-orang yang
ringan timbangan (kebaikan)nya maka tempat kembalinya adalah neraka
Hawiyah.

2. Landasan Yuridis
a. PERMENDIKBUD RI No.23 Tahun 2016 tentang Standar Penilaian
Pendidikan
Standar Penilaian Pendidikan adalah kriteria mengenai lingkup, tujuan,
manfaat, prinsip, mekanisme, prosedur, dan instrumen penilaian hasil belajar
peserta didik yang digunakan sebagai dasar dalam penilaian hasil belajar peserta
didik pada pendidikan dasar dan pendidikan menengah.
Penilaian adalah proses pengumpulan dan pengolahan informasi untuk
mengukur pencapaian hasil belajar peserta didik. Pembelajaran adalah proses
interaksi antar peserta didik, antara peserta didik dengan pendidik dan sumber
belajar pada suatu lingkungan belajar. Penilaian hasil pendidikan dasar dan
pendidikan menengah terdiri atas: (1) penilaian hasil belajar oleh pendidik, (2)
penilaian hasil belajar oleh peserta didik, (3) penilaian hasil belajar oleh

7
pemerintah. Penilaian hasil belajar meliputi aspek sikap, pengetahuan dan
keterampilan.

b. UU No.20 tahun 2003 tentang Sistem Pendidikan Nasional


Evaluasi dilakukan terhadap peserta didik, lembaga, dan program
pendidikan pada jalur formal dan nonformal untuk semua jenjang, satuan, dan
jenis pendidikan.
Evaluasi hasil belajar peserta didik dilakukan oleh pendidik untuk
memantau proses, kemajuan, dan perbaikan hasil belajar peserta didik secara
berkesinambungan. Evaluasi peserta didik, satuan pendidikan, dan program
pendidikan dilakukan oleh lembaga mandiri secara berkala, menyeluruh,
transparan, dan sistemik untuk menilai pencapaian standar nasional pendidikan.
c. PP No. 13 tahun 2015 tentang Standar Pendidikan Nasional
Penilaian adalah proses pengumpulan dan pengolahan informasi untuk
mengukur pencapaian hasil belajar Peserta Didik. Evaluasi pendidikan adalah
kegiatan pengendalian, penjaminan, dan penetapan mutu pendidikan terhadap
berbagai komponen pendidikan pada setiap jalur, jenjang, dan jenis pendidikan
sebagai bentuk pertanggungjawaban penyelenggaraan pendidikan.

B. VALIDITAS
1. Pengertian Validitas
a. Azwar (1986), validitas berasal dari kata validity yang mempunyai arti sejauh
mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi
ukurnya.
b. Arikunto (1999), validitas adalah suatu ukuran yang menunjukkan tingkat
kesahihan suatu tes.
c. Nursalam (2003), validitas adalah suatu ukuran yang menunjukkan tingkat
kevalidan atau kesahihan suatu instrumen.
Berdasarkan beberapa pendapat tentang pengertian validitas di atas, maka
dapat diambil kesimpulan bahwa validitas adalah suatu standar ukuran yang
menunjukkan ketepatan dan kesahihan suatu instrumen.

8
Menurut Arikunto (1999) suatu tes dikatakan valid apabila tes tersebut
mengukur apa yang hendak diukur. Tes memiliki validitas yang tinggi jika
hasilnya sesuai dengan kriteria, dalam arti memiliki kesejajaran antara tes dan
kriteria.

2. Jenis-jenis Validitas
Menurut Sudijono (2009) terdapat berbagai jenis validitas, antara lain:
a. Pengujian Validitas Tes Secara Rasional
Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran,
validitas yang diperoleh dengan berpikir secara logis. Validitas tes secara
rasional dikelompokkan sebagai berikut, diantaranya:
1) Validitas Isi (Content Validity)
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh
setelah dilakukan penganalisisan, penelususran atau pengujian terhadap
isi yang terkandung dalam tes hasil belajar tersebut. Validitas isi adalah
yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar
yaitu: sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar
peserta didik, isisnya telah dapat mewakili secara representatif terhadap
keseluruhan materi atau bahkan pelajaran yang seharusnya diteskan
(diujikan).
2) Validitas konstruksi (Construct Validity)
Validitas konstruksi dapat diartikan sebagai validitas yang ditilik dari
segi susunan, kerangka atau rekaannya. Adapun secara terminologis,
suatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki
validitas konstruksi, apabila tes hasil belajar tersebut telalh dapat dengan
secara tepat mencerminkan suatu konstruksi dalam teori psikologis.

b. Pengujian Validitas Tes Secara Empirik


Validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil
analisis yang bersifat empirik. Dengan kata lain, validitas empirik adalah

9
validitas yang bersumber pada atau diperoleh atas dasar pengamatan di
lapangan. Validitas tes secara empirik dikelompokkan sebagai berikut,
1) Validitas ramalan (Predictive validity)
Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah
sebuah tes telah dapat dengan secara tepat menunjukkan kemampuannya
untuk meramalkan apa yang bakal terjadi pada masa mendatang.
2) Validitas bandingan (Concurrent Validity)
Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas
bandingan apabila tes tersebut dalam kurun waktu yang sama dengan secara
tepat mampu menunjukkan adanya hubungan yang searah, antara tes pertama
dengan tes berikutnya.
3. Penilaian Validitas
Untuk mencari tingkat validitas digunakan rumus productmoment metodaPearson
sebagai berikut:
∑𝑥𝑦
𝑟= dimana x = X – Xrata-rata dan y = Y – Yrata-rata(1)
√∑𝑥 2 ∑𝑦 2

Keterangan:
x = Deviasi penilaian akhir
y = Deviasi penilaian awal
r = Korelasi antara x dan y (dua variabel yang akan dikorelasikan)
Dari nilai r yang telah didapatkan maka perlu interpretasi dari nilai tersebut
untuk menunjukkan kevalidan suatu penilaian. Kriteria nilai r yang diguna-
kan untuk menentukan suatu penilaian valid dapat dilihat pada Tabel 1
berikut:
Tabel Kriteria Korelasi Koefisien Validitas
No Nilai r antara Klasifikasi
1. 0,000 – 0,200 Korelasi sangat rendah
2. 0,200 – 0,400 Korelasi rendah
3. 0,400 – 0,600 Korelasi cukup
4. 0,600 – 0,800 Korelasi tinggi
5. 0,800 – 1,000 Korelasi sangat tinggi
Sumber: Suharsimi (2008: 221)

10
C. RELIABILITAS
1. Pengertian Reliabilitas
a. Sugiono (2005), Pengertian Reliabilitas adalah serangkaian pengukuran atau
serangkaian alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan
dengan alat ukur itu dilakukan secara berulang. Reabilitas tes adalah tingkat
keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat dipercaya
untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun diteskan
pada situasi yang berbeda-beda.
b. Sukadji (2000), reliabilitas suatu tes adalah seberapa besar derajat tes mengukur
secara konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk
angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas tinggi.
c. Nursalam (2003), reliabilitas adalah kesamaan hasil pengukuran atau
pengamatan bila fakta atau kenyataan hidup tadi diukur atau diamati berkali –
kali dalam waktu yang berlainan. Alat dan cara mengukur atau mengamati sama
– sama memegang peranan penting dalam waktu yang bersamaan.
Berdasarkan beberapa pendapat tentang pengertian reliabilitas di atas, maka dapat
diambil kesimpulan bahwa reliabilitas adalah suatu keajegan suatu tes untuk
mengukur atau mengamati sesuatu yang menjadi objek ukur.

2. Cara-cara mencari besarnya Reliabilitas


Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada
diluat tes (consistency external) dan pada tes itu sendiri (consistency internal).
a. Metode bentuk paralel
Tes paralel atau tes ekivalen adalah 2 buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran, dan susunan tetapi butir-butir soalnya
berbeda. Dalam menggunakan metode tes paralel ini pengetes harus
menyiapkan dua buah tes, dan masig-masing dicobakan pada kelompok siswa
yang sama. Oleh sebab itu disebut juga double test-double-trial method.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena
harus menyusun dua seri tes. Lagipula harus tersedia waktu yang lama untuk
mencobakan 2 kali tes.

11
b. Metode tes ulang
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua
seri tes. Dalam metode ini pengetes hanya memiliki satu seri tes tetapi
dicobakan 2 kali. Oleh karena itu tes nya hanya satu dan dicobakan 2 kali
disebut juga dengan single test-double –trial method. Kemudian hasil dari
kedua kali tes tersebut dihitung korelasinya.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil
tes yang pertama. Hal ini tidak mengapa karena pengetes harus sadar akan
adanya practice effect dan carry over effect.
c. Metode Belah Dua atau Split-half Method
Dalam menggunakan metode ini pengetes hanya menggunakan sebuah
tes dan dicobakan satu kali. Oleh karena itu, disebut juga single-test-single
trial method.
Pada waktu membelah dua dan mengkorelasikan dua belahan, baru
diketahui reliabilitas separo tes. Untuk mengetahui reliabilitas seluruh tes
harus digunakan rumus Spearman-Brown.
2 𝑟1⁄ 𝑟⁄
2 2
r11 = (1+ 𝑟 r1/2r/2 = korelasi antara skor-skor setiap belahan tes
1⁄ 𝑟⁄ )
2 2

r11 = koefisien reliabilitas yang sudah disesuaikan.

D. BIAS
Bias adalah sebuah penyajian bahan yang dipenuhi prasangka. Ia juga berarti
kesalahan yang konsisten dalam memperkirakan sebuah nilai. Ada dua tipe bias:
bias sampel dan bias pengukuran.
1. Bias sampel

Sampel adalah sekumpulan satuan yang dipilih untuk diukur dari kelompok yang
lebih besar (populasi). Bias sampel terjadi ketika sampel yang digunakan tidak
mewakili populasi atau tidak sesuai dengan pertanyaan yang diajukan.

Faktor-faktor yang menyebabkan bias sampel adalah ukuran sampel dan seleksi
sampel. Ukuran sampel harus cukup besar agar dipeoleh nilai rata-rata yang baik.

12
Sebagai contoh, untuk menentukan tinggi rata-rata mahasiswa di ruang kelas, seberapa
banyak mahasiswa yang harus diukur untuk mendapatkan perkiraan terbaik? Apakah
bisa dikatakan teliti jika kita hanya mengambil sampel dari tiga orang mahasiswa saja?

Sampel juga harus memiliki komposisi yang mencerminkan komposisi populasi.


Faktor seperti lokasi, usia, gender, etnisitas, kebangsaan, dan lingkungan hidup dapat
mempengaruhi data yang dikumpulkan. Contoh bias seleksi sampel adalah sebagai
berikut: seorang peneliti ingin menemukan tinggi rata-rata mahasiswa di ruang kelas.
Ada beberapa mahasiswa yang ikut pertandingan basket sehingga harus pulang lebih
awal. Kelompok mahasiswa ini dijadikan sampel oleh peneliti tersebut. Para pemain
basket umumnya berbadan tinggi sehingga bila mereka dijadikan sampel, akibatnya
muncul rata-rata yang lebih tinggi dari sebenarnya ada bila kita mengukur populasi
secara keseluruhan. Dalam kasus ini tentu akan lebih baik mengukur seluruh mahasiswa
di ruang kelas (populasi). Namun hal ini tidak dapat dilakukan bila kita bicara mengenai
rata-rata tinggi penduduk di suatu negara atau provinsi, karena jumlahnya sangat banyak
dan tidak mungkin dilakukan pengukuran tinggi secara keseluruhan.

Eksperimen yang baik mengendalikan faktor-faktor ini dengan memakai sampel


yang diambil secara acak sehingga setiap individu memiliki kemungkinan yang sama
untuk terpilih. Contohnya dengan melempar dadu atau melempar koin. Cara lain
meminimalkan bias seleksi sampel adalah pembatasan pertanyaan yang diajukan pada
kelompok yang disampel.

2. Bias pengukuran

Bias pengukuran berurusan dengan masalah apakah metode pengumpulan data


yang dipilih telah sesuai sehingga data yang dikumpulkan merupakan yang paling
mewakili kenyataan? Untuk mengevaluasi teknik pengumpulan data, pengukuran harus
dilakukan dengan seteliti mungkin. Tidak boleh ada tambahan pada lingkungan yang
dapat mempengaruhi hasil. Selain itu, eksperimen harus dirancang untuk mengisolasi
pengaruh dari banyak faktor lainnya.

13
Contoh pengukuran yang tidak akurat adalah pengukuran tinggi dimana tinggi
orang diukur tidak dari nol, tapi dari satu. Akibatnya pengukuran menghasilkan nilai
lebih tinggi dari realitas.

Contoh pengaruh lingkungan yang menyebabkan bias pada pengukuran tinggi


adalah mengukur tinggi orang yang memakai sepatu. Sepatu menyebabkan pertambahan
tinggi dan ukuran tinggi sepatu tiap orang berbeda, akibatnya hasil pengukuran juga
tidak sesuai dengan realitas.

Contoh bias yang disebabkan pengaruh dari banyak faktor adalah sebagai berikut.
Seorang peneliti mencoba menguji hipotesis kalau mahasiswa yang tidur lebih dari 7
jam pada malam sebelum ujian akan memberikan hasil yang lebih baik dari yang tidur
kurang dari 7 jam. Peneliti tersebut tidak mempertimbangkan faktor lain seperti apakah
mereka tidur sedikit karena belajar persiapan untuk besok atau apakah mereka sarapan
sebelum berangkat ke kampus. Bagaimana bisa kita menyimpulkan kalau hasil
penelitian, katakanlah ternyata mahasiswa yang tidur lebih dari 7 jam memiliki skor
lebih tinggi, jika ternyata itu bukan karena tidurnya tapi karena faktor-faktor lainnya.

3. Tanda-tanda adanya bias dalam penelitian

Ada tiga tanda yang langsung dapat ditemukan dalam publikasi ilmiah atau
masyarakat yang menunjukkan kalau publikasi tersebut mengalami bias.

a. Penggunaan bahasa

Ada tiga macam penggunaan bahasa yang menunjukkan kalau sebuah publikasi
ilmiah mengalami bias. Pertama, penggunaan frasa “terbukti secara ilmiah”. Sains tidak
berusaha untuk membuktikan. Justru sains berusaha untuk menyangkal. Bila ada yang
mengklaim kalau sesuatu itu “Terbukti secara ilmiah” anda harus curiga.

Kedua, adanya pernyataan-pernyataan emosional. Pernyataan-pernyataan ilmiah


harus berbasis pada data, bukan pada persuasi. Biasanya artikel yang dibumbui alasan-
alasan emosional untuk percaya pada suatu fakta ilmiah merupakan artikel yang
mengalami bias. Sesuatu yang objektif tidak tergantung pada penulisnya. Bukan penulis
yang meyakinkan anda atas fakta ilmiah, tetapi data. Contoh pernyataan emosional

14
“orang akan mati dengan mengenaskan kecuali mereka menggunakan Vacinax
sekarang!”

Ketiga, bahasa yang berlebihan. Kesimpulan ilmiah harusnya hanya melaporkan


apa yang didukung oleh data saja, tidak lebih. Kata-katanya harus dipilih dengan sangat
hati-hati untuk menghindari pelebih-lebihan atau dakuan (klaim) yang tidak didukung
data. Contoh kata-kata yang patut dicurigai misalnya “terbersih”, “termurah”, “paling
efisien”, “di dunia.”

b. Bagian metode dan kesimpulan

Apakah sampel dan pengukurannya telah sesuai untuk kesimpulan yang


disajikan? Sebagai contoh, menentukan tinggi mahasiswa di kelas menggunakan sampel
tim basket atau mengukur tinggi badan mahasiswa yang memakai sepatu. Hal lain yang
harus diperhatikan ada pada contoh penelitian tentang korelasi antara waktu tidur dan
nilai ujian tadi. Apakah faktor-faktor lain telah dipertimbangkan dalam penafsiran data.

c. Referensi dan sumber data

Ada empat jenis sumber data penelitian yaitu universitas, perusahaan, pemerintah,
dan kelompok dengan minat khusus. Semua organisasi menghasilkan data yang tidak
bias. Namun penting untuk memahami motivasi organisasi tersebut agar dapat
menemukan bias yang mungkin. Dalam beberapa situasi, ada kebutuhan untuk
mempromosikan keinginan pihak tertentu atau mengambil keuntungan yang
berakibat pada bias. Walau begitu, bahkan bila seorang ilmuan memiliki keinginan
untuk memperoleh hasil tertentu, tidak berarti kalau penelitiannya pasti bias. Bila
mereka ilmuan yang baik, mereka akan bersungguh-sungguh dalam proses ilmiahnya
dan mereka akan merancang eksperimen yang baik dan melaporkan data dengan
jujur, tidak peduli apakah itu sesuai atau tidak dengan prasangkanya.

15
A. Bias dan Standard Error Measurement
Bias adalah setiap kejadian dalam pengumpulan, analisis dan interpretasi data yang
mengarah kepada suatu kesimpulan yang secara sistematik berbeda dari kebenaran. Bias
merupakan perbedaan antara nilai reference dengan rata-rata pengamatan pengukuran pada
karakteristik dan part yang sama. Bias yang sangat tinggi kemungkinan disebabkan oleh:

Alat ukur perlu dikalibrasi

Penggunaan alat ukur, perlengkapan atau fixture

Kesalahan pemilihan aplikasi alat ukur

Perbedaan metode pengukuran

Kesalahan pengukuran (errors of measurement) adalah perbedaan antara nilai


sesungguhnya dari suatu pekerjaan seseorang dan nilai yang diperoleh oleh orang tersebut.
Kesalahan pengukuran berasal dari beberapa hal, yaitu :
1. Accidental/Chance Errors
Kesalahan-kesalahan ini dapat terjadi kapan saja, misalnya saja, keributan di tempat
tes atau keadaan subjek tes yang tidak begitu sehat, yang merupakan faktor pengganggu
sehingga kemudian menjadikan kesalahan pada hasil tes tersebut. Dikarenakan faktor-
faktor tersebut terjadi secara kebetulan, maka kemungkinan terjadinya kesalahan tersebut
pun menjadi bermacam-macam. Selain itu, hasil yang diakibatkan oleh faktor-faktor
tersebut pun bermacam-macam, terkadang dapat meningkatkan atau juga menurunkan
hasil yang didapat. Terdapat 3 tipe dalam kesalahan ini, yaitu:
 Tipe I : Test-centered Errors
Kesalahan yang terdapat dalam tes atau instrumen yang digunakan. Contoh:
terdapatnya item dalam tes yang bersifat kultural sehingga memunculkan hasil yang
berbeda pada subjek yang berasal dari daerah yang berbeda.
 Tipe II : Subject-centered Errors
Segala macam faktor yang berhubungan dengan subjek tes, apakah itu kesehatan,
motivasi, kemauan, dan lain sebagainya.
 Tipe III : Assessment Errors
Kebanyakan terjadi karena faktor situasi. Misalnya, terlalu banyaknya para
penguji menyebabkan adanya ketidaknyamanan sehingga mempengaruhi hasil yang
diperoleh.

16
2. Systematic/Biased Errors
Kesalahan yang merupakan hasil dari pemikiran yang tercemar, kecenderungan
personal, moral yang tidak pantas, dan lain sebagainya. Terdapat 3 tipe dalam kesalahan
ini, yaitu:
 Tipe I
Kesalahan yang terjadi karena kekeliruan yang diperbuat oleh penguji. Misalnya,
kekeliruan penguji dalam membaca test manual. Kesalahan ini dapat dihilangkan
dengan cara membandingkan hasil yang didapat oleh beberapa orang penguji yang
berbeda.
 Tipe II
Kesalahan yang muncul karena kecerobohan. Misalnya, kekeliruan penguji yang
seharusnya menulis 0,1 malah menulis 0,01 saat menghitung hasil. Kesalahan ini dapat
dihilangkan dengan cara para penguji harus sangat berhati-hati saat mencatat dan
menghitung hasil.
 Tipe III
Kesalahan yang tidak dapat dihindari. Hal ini dikarenakan perilaku manusia di
pengaruhi oleh banyak sekali faktor internal maupun eksternal yang mana meskipun
saat tes banyak faktor yang dikontrol oleh penguji, tetap saja terdapat faktor-faktor
yang tidak terkontrol. Kesalahan ini tidak dapat dihilangkan, tetapi bisa dikurangi
dengan cara pengontrolan lebih banyak lagi faktor-faktor yang ada.
3. Interpretative Errors
Kesalahan ini terjadi berkaitan dengan kesalahan dalam menginterpretasi hasil dari
suatu tes. Kesalahan ini dapat terjadi jika terdapat kesalahpahaman dalam dua hal, yakni,
“dengan kelompok yang bagaimana seseorang telah dibandingkan”, dan “dengan cara apa
pembandingan antara seseorang tersebut dan kelompoknya dibandingkan”. Kesalahan
tersebut dapat dikendalikan dengan cara para penguji harus memperhatikan kelompok dan
cara membandingkan hasil seseorang dengan kelompoknya.
4. Variable Errors
Kesalahan yang disebabkan oleh ketidakmurnian yang muncul berkaitan dengan
adanya perbedaan alasan dan faktor situasi. Contohnya, seseorang yang dites dengan alat

17
tes yang sama pada beberapa kesempatan yang berbeda akan memberikan hasil yang
berbeda. Kesalahan ini dapat diperkirakan melalui test reliability.
5. Personal Errors
Kesalahan yang terjadi berkaitan dengan subjektivitas seseorang. Contohnya, 4
orang yang duduk dalam sebuah mobil akan memberikan jawaban yang berbeda ketika
diminta membaca speedometer.
6. Constant Errors
Kesalahan yang muncul karena perbedaan antara “internal qualities” dan “internal
abilities”. Hal ini jelas sekali membuktikan bahwa nilai tes seseorang dalam sebuah tes
“mental abilities” juga tergantung pada kemampuan orang tersebut dalam membaca.
Bila seseorang mengikuti tes yang sama dua kali, maka jarang mendapatkan skor
yang tepat sama artinya skor jawabannya tidak identik. Hal ini disebabkan oleh beberapa
faktor misalnya perbedaan motivasi, energi, rasa cemas, perbedaan situasi dll. Faktor-faktor
ini menyebabkan error dalam pengukuran. Oleh karena error dalam pengukuran selalu
muncul, maka penelitian berharap ada variasi skor tes (jawaban atau ranting). Suatu
instrumen dapat diberikan kepada yang berbeda, dapat pula digunakan dua bentuk instrumen
yang berbeda, dapat pula digunakan dua berbeda seluruhnya atau berbeda sebagian.
Koefisien reliabilitas juga menggunakan hubungan, antara skor dari individu yang sama
dengan instrumen yang sama pada dua kesempatan yang berbeda. Salah satu cara
memperoleh koefisien reliabilitas adalah dengan metode ‘test retest’ metode bentuk ekivalen
dan metode konsistensi internal. Koefisien reliabilitas emiliki kisaran nilai 0,00-1,00.

Dalam melaksanakan penilaian dalam proses pembelajaran ada beberapa hal yang
harus dilakukan yaitu:

1) Membuat kisi-kisi soal


2) Uji coba soal
3) Analisis jawaban tes uji coba
4) Menyiapkan Kisi-kisi soal akhir
5) Membuat soal tes akhir
6) Analisis jawaban tes akhir
Dalam melakukan penilaian dapat mengukur kompetensi siswa, sehingga guru
mengetahui sejauhmana tingkat kemampuan siswa dalam menguasai pelajaran.

18
BAB IV
PENUTUP

A. Kesimpulan

Testing merupakan alat atau prosedur sistematis dalam evaluasi untuk


mengukur contoh perilaku, tes yangdikembangkan dengan baik merupakan suatu alat
penting dalam peningkatan kompetensi siswa, menilai merupakan suatu proses yang
dilakukan setelah adanya kegiatan pengukuran. Menilai dapat diartikan sebagai
pengambilan suatu keputusan terhadap sesuatu dengan ukuran baik atau buruk, serta
menilai dapat dikategorikan bersifat kualitatif.Sedangkan mengukur adalah
membandingkan sesuatu dengan satu ukuran, dan pengukuran bersifat
kuantitatif.Mengukur dan menilai adalah suatu rangkaian kegiatan evaluasi.
Dalam pembuatan soal sebaiknya hal-hal yang harus diperhatikan guru antara
lain: menetapkan tujuan pembelajaran, memahami tata cara pembuatan soal yang baik
dan benar serta memahami analisis butir soal untuk mengetahui kualitas soal yang
dibuat.
B. Saran

Diharapkan sebelum melakukan penilaian guru sebaiknya memahami


pembuatan tes secara benar sehingga data yang diperoleh valid dan reliable.

19
DAFTAR PUSTAKA

----. Permendikbud No. 23 tahun 2016 tentang Standar Penilaian Pendidikan. Jakarta:
Depdiknas
Arikunto, Suharsimi. 2007. Dasar-Dasar Evaluasi Pendidikan Edisi Revisi. Jakarta: Bumi
Aksara.
Arikunto, Suharsimi. 2009. Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
Eko Putro Widoyoko. 2011. Evaluasi Program Pembelajaran. Yogyakarta: Pustaka Pelajar.
Koyan, Wayan. 2011. Asesmen dalam Pendidikan. Singaraja: Universitas Pendidikan
Ganesha Press.
Purwanto. 2011. Evaluasi Hasil Belajar. Surakarta: Pustaka Pelajar.
Rasyid, Harun dan Mansur. 2007. Penilaian Hasil Belajar.Bandung: CV. Wacana Prima.
Sudijono, Anas. 2006. Pengantar Evalusi Pendidikan. Jakarta: PT RajaGrafindo Persada.
Zainul & Nasution.(2001). Penilaian Hasil belajar. Jakarta: Dirjen Dikti.

Al-Qur`an dan Terjemahan. Depag. PT. Syaamil Cipta Media.


Arikunto, Suharsimi. 2006. Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara
Calongesi, J.S. 1995. Merancang Tes untuk Menilai Prestasi Siswa. Bandung : ITB
Slameto. 1998. Evaluasi Pendidikan. Jakarta: PT Bina Aksara
Sudijono, A. (2009). Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Press.
Sudjana, Nana. 2010. Penilaian Hasil Proses Belajar Mengajar. Bandung: PT Remaja
Rosdakarya
Tayibnapis, F.Y. (2000). Evaluasi Program. Jakarta: Rineka Cipta
Zainul & Nasution. (2001). Penilaian Hasil belajar. Jakarta: Dirjen Dikti.
http://violetatniyamani.blogspot.com/2007/09/teori
validitas.htmlhttp://tutorialkuliah.blogspot.com/2010/01/pengertian-validitas-dan-
reliabilitas.html. http://blog.its.ac.id/suherminstatistikaitsacid/files/2008/09/validitas-
reliabilitas.pdf.
http://lpp.uns.ac.id/download/PANDUAN%20EVALUASI%20PEMBELAJARAN.pdf..
Adil, Maksimus. Penilaian dan Evaluasi Belajar Ditinjau dari Sistem Belajar Student
Centered.Tersedia:http://maxbona.multiply.com/journal/item/45/Penilaian_dan_Evaluasi_Bel
ajar [1Juni 2014]
https://hatta2stat.wordpress.com/2011/05/21/standar-error/
http://www.faktailmiah.com/2011/09/25/bias-dalam-penelitian-ilmiah.html
http://www.referensimakalah.com/2013/02/pengertian-assessment-penilaian.html

20

Anda mungkin juga menyukai