Anda di halaman 1dari 30

Hari/Tanggal : Selasa, 06 Februari 2018

Kelompok : 2 (Dua)
Tugas : 1

MAKALAH INDIVIDU
PENGEMBANGAN EVALUASI DAN PROSES
PEMBELAJARAN FISIKA

“Perbandingan Penilaian/Assessment, Pengukuran Dan Testing; Bentuk Dan


Jenis Asesmen; Fungsi Penilaian; Validitas & Reliabilitas; Bias, Standard
Error Measurement”

OLEH :
SYNTHATRISMA UTAMI (17175029)

DOSEN PEMBIMBING:
Prof. Dr. Hj. Festiyed, M.S.
Dr. Hj. Djusmaini djamas, M.Si

PROGRAM STUDI MAGISTER PENDIDIKAN FISIKA


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI PADANG
2018
KATA PENGANTAR
Segala Puji bagi Allah SWT yang senantiasa melimpahkan rahmat dan
karunia-Nya, sehingga penulis dapat menyelesaikan makalah tentang
“Perbandingan Penilaian/ Assessment, Pengukuran Dan Testing; Bentuk Dan
Jenis Asesmen; Fungsi Penilaian; Validitas & Reliabilitas; Bias, Standard
Error Measurement” yang dibimbing oleh Ibu Prof. Hj. Festiyed, M.S. dan Ibu
Dr. Hj. Djusmaini Djamas, M.Si.
Makalah yang ditulis dari berbagai sumber baik dari buku maupun dari
internet dan membuat gagasan dari beberapa sumber yang ada tersebut. Penulis
berterima kasih kepada semua pihak yang telah membantu penulis dalam
penyelesaian makalah ini, sehingga tersusunlah makalah ini.
Penulis juga menyadari bahwa makalah yang penulis tulis ini masih
terdapat banyak kekurangan. Oleh karena itu sangat diharapkan bagi pembaca
untuk menyampaikan saran atau kritik yang membangun demi tercapainya
makalah yang jauh lebih baik.

Padang, Februari 2018

Penulis

DAFTAR ISI

KATA PENGANTAR...................................................................................... i
DAFTAR ISI.................................................................................................... ii
BAB I PENDAHULUAN
A. Latar Belakang............................................................................. 1
B. Rumusan Masalah....................................................................... 1
C. Tujuan Penulisan......................................................................... 2
BAB II KAJIAN TEORI
A. Landasan Agama......................................................................... 3
B. Landasan Yuridis......................................................................... 5
C. Penilaian/ Assessment, Pengukuran, dan Testing......................... 11
D. Bentuk dan Jenis Assessment.......................................................
.................................................................................................18
E. Fungsi Penilaian.......................................................................... 19
F. Validitas dan Reliabilitas................................................................ 20
G. Bias dan Standard Error Measurement........................................ 23
BAB III PENUTUP
A. Kesimpulan.................................................................................. 26
B. Saran............................................................................................ 26
DAFTAR PUSTAKA
BAB I
PENDAHULUAN

A. Latar Belakang
Penilaian dalam proses pendidikan merupakan komponen yang tidak dapat
dipisahkan dari komponen lainnya khususnya pembelajaran. Penilaian
merupakan proses pengumpulan dan pengolahan informasi untuk mengukur
pencapaian hasil belajar peserta didik. Penilaian hasil belajar oleh pendidik
dilakukan untuk memantau proses, kemajuan belajar, dan perbaikan hasil
belajar peserta didik secara berkesinambungan. Proses penilaian meliputi
penilaian sikap, pengetahuan, dan keterampilan. Proses penilaian dilakukan
melalui banyak cara, baik secara tes maupun non tes.
Seorang pendidik harus bisa menggunakan alat evaluasi yang tepat untuk
menilai dan mengevaluasi pembelajaran peserta didiknya. Alat evaluasi
tersebut haruslah memenuhi kriteria sebagai alat ukur yang sesuai dengan
yang telah ditetapkan pemerintah. Instrumen evaluasi yang baik adalah yang
valid, reliabel, dan mempunyai indeks daya beda yang baik. Guru harus
mampu membuat dan mengembangkan alat evauluasi tersebut sebagai salah
satu kompetensi yang harus dimilikinya. Kompetensi ini sejalan dengan tugas
dan tanggungjawab guru dalam pembelajaran, yaitu mengevaluasi
pembelajaran termasuk di dalamnya melaksanakan penilaian proses dan hasil
belajar. Oleh karena itu, di dalam makalah ini akan dibahas mengenai
penialaian/assessment, evaluasi, pengukuran, tes, validitas dan reliabilitas
instrumen evaluasi serta perbandingannya.

B. Rumusan Masalah
Berdasarkan latar belakang yang telah dikemukakan, maka perumusan
masalah pada makalah ini adalah:
1. Apa yang dimaksud dengan penilaian/ assessment, pengukuran, dan
testing?
2. Apa saja bentuk dan jenis dari assessment ?
3. Apa fungsi dari penilaian?
4. Apa yang dimaksud dengan validitas dan reliabilitas?
5. Apa yang dimaksud dengan bias dan standard error measurement?
C. Tujuan Penulisan
1. Untuk mengetahui penilaian/ assessment, pengukuran dan testing.
2. Untuk mengetahui bentuk dan jenis assessment.

2
3. Untuk mengetahui fungsi penilaian.
4. Untuk mengetahui validitas dan reliabilitas.
5. Untuk mengetahui bias, dan standard error measurement.

2
2
3

BAB II
KAJIAN TEORI

A. Landasan Agama

QS. Al-Qamar ayat 49

Artinya: Sesungguhnya Kami menciptakan segala sesuatu menurut ukuran.


Surat Al-Furqan ayat 2

Artinya: yang kepunyaan-Nya-lah kerajaan langit dan bumi, dan Dia tidak
mempunyai anak, dan tidak ada sekutu bagiNya dalam kekuasaan(Nya), dan
dia telah menciptakan segala sesuatu, dan Dia menetapkan ukuran-ukurannya
dengan serapi-rapinya.
QS. An-Naml ayat 40

Artinya: Berkatalah seorang yang mempunyai ilmu dari AI Kitab: "Aku akan
membawa singgasana itu kepadamu sebelum matamu berkedip." Maka tatkala
Sulaiman melihat singgasana itu terletak di hadapannya, iapun berkata: "Ini
termasuk kurnia Tuhanku untuk mencoba aku apakah aku bersyukur atau
mengingkari (akan nikmat-Nya). Dan barangsiapa yang bersyukur maka
sesungguhnya dia bersyukur untuk (kebaikan) dirinya sendiri dan barangsiapa
yang ingkar, maka sesungguhnya Tuhanku Maha Kaya lagi Maha Mulia."

3
4

QS. Al-Baqarah: 44
﴿َ ‫ب ۚ َ َأبفببل َتبتلعكقللوُبن‬ ‫ك‬ ‫أبتبألمروبن َالننَاَ ك ك‬
‫س َباَل بب َبوتبنَبسلوُبن َأبنَلفبسلكلم َبوأبنَتللم َتب لتتتللوُبن َالكبتاَ ب‬
‫ب‬ ‫لل‬
٢:٤٤﴾َ َ
Mengapa kamu suruh orang lain (mengerjakan) kebaktian, sedang kamu
melupakan diri (kewajiban)mu sendiri, padahal kamu membaca Al Kitab
(Taurat)? Maka tidaklah kamu berpikir?
QS. Al-Ahzaab: 11
١١َ :٣٣﴿َ ‫ َ َ﴾لهبنَاَلكبكاَبلتتللكي َاللملؤكملنَوُبن َبولزلكزلوُا َكزلبزادل َبشكديِددا‬
‫ب‬
Disitulah diuji orang-orang mukmin dan digoncangkan (hatinya) dengan
goncangan yang sangat.
QS. Al-Maidah: 48
َۖ ‫ب َبولمبهليكمدنَاَ َبعلبليكه‬
‫ي َيِبديِلكه َكمن َالككبتاَ ك‬
‫ب‬ ‫ب َكباَللببق َلم ب‬
‫صبددقاَ َلببماَ َببت ل ب ب‬
‫وأبنَزلبنَاَ َإكلبي ب ك‬
‫ك َالكبتاَ ب‬ ‫بب ل‬
‫بفاَلحلكم َببلتيتنَبتلهم َك بباَ َأبنَبزبل َاللنهل ۖ َ َبوبل َتبتتنبكلع َأبلهبوُاءبلهلم َبعنماَ َبجاَءببك َكمبن َاللببق ۚ َ َلكلكلل‬
‫بجبعلبنَاَ َكمنَلكلم َكشلربعدة َبوكملنَتبهاَدجاَ ۚ َ َبولبلوُ َبشاَبء َاللنله َبلببعلبلكلم َألنمدة َبواكحبددة َبوللبككن َلببليبتلبوُلكلم‬
‫جيدعاَ َفبتيلتنَببئللكم َك بباَ َلكنَتللم َكفيكه‬
‫ت ۚ َ َإكبل َاللنكه َمركجعلكم َ بك‬
‫بل ل ل‬
‫كف َماَ َآبتاَلكم ۖ َ َبفاَستببكلقوُا َالليترا ك‬
‫بل ب‬ ‫ل ل‬ ‫ب‬
٤٨َ :٥﴿َ ‫ َ﴾بتلتبلكلفوُبن‬
Dan Kami telah turunkan kepadamu Al Quran dengan membawa kebenaran,
membenarkan apa yang sebelumnya, yaitu kitab-kitab (yang diturunkan
sebelumnya) dan batu ujian terhadap kitab-kitab yang lain itu; maka
putuskanlah perkara mereka menurut apa yang Allah turunkan dan janganlah
kamu mengikuti hawa nafsu mereka dengan meninggalkan kebenaran yang
telah datang kepadamu. Untuk tiap-tiap umat diantara kamu, Kami berikan
aturan dan jalan yang terang. Sekiranya Allah menghendaki, niscaya kamu
dijadikan-Nya satu umat (saja), tetapi Allah hendak menguji kamu terhadap
pemberian-Nya kepadamu, maka berlomba-lombalah berbuat kebajikan.
Hanya kepada Allah-lah kembali kamu semuanya, lalu diberitahukan-Nya
kepadamu apa yang telah kamu perselisihkan itu.

B. Landasan Yuridis
1. Undang-Undang No.20 tahun 2003 tentang Sistem Pendidikan Nasional
5

Dalam bab I pasal 1 dijelaskan bahwa evaluasi pendidikan adalah


kegiatan pengendalian, penjaminan, dan penetapan mutu pendidikan
terhadap berbagai komponen penndidikan, pada setiap jalur, jenjang dan
jenis pendidikan sebagai bentuk pertanggung jawaban penyelenggaraan
pendidikan.
Pasal 57 Ayat (1) evaluasi dilakukan dalam rangka pengendalian mutu
pendidikan secara nasional sebagai bentuk akuntabilitas penyelenggara
pendidikan kepada pihak-pihak yang berkepentingan. Ayat (2) evaluasi
dilakukan terhadap peserta didik, lembaga dan program pendidikan non
formal.
2. Peraturan Pemerintah RI No 19/2005 tentang Standar Nasional Pendidikan
Peraturan Pemerintah R.I. Nomor 19 Tahun 2005 tentang Standar
Nasional Pendidikan dalam Bab I tentang Ketentuan Umum :
a. Pasal 1 ayat (11) : Standar penilaian pendidikan adalah standar nasional
pendidikan yang berkaitan dengan mekanisme, prosedur, dan instrumen
penilaian hasil belajar peserta didik.
b. Pasal 1 ayat (17) : Penilaian adalah proses pengumpulan dan pengolahan
informasi untuk mengukur pencapaian hasil belajar peserta didik.
c. Pasal 1 ayat (18) : Evaluasi pendidikan adalah kegiatan pengendalian,
penjaminan, dan penetapan mutu pendidikan terhadap berbagai
komponen pendidikan pada setiap jalur, jenjang, dan jenis pendidikan
sebagai bentuk pertanggungjawaban penyelenggaraan pendidikan.
d. Pasal 1 ayat (19) : Ulangan adalah proses yang dilakukan untuk
mengukur pencapaian kompetensi peserta didik secara berkelanjutan
dalam proses pembelajaran, untuk memantau kemajuan dan perbaikan
hasil belajar peserta didik .
e. Passal 1 ayat (20) : Ujian adalah kegiatan yang dilakukan untuk
mengukur pencapaian kompetensi peserta didik sebagai pengakuan
prestasi belajar dan/atau penyelesaian dari suatu satuan.
f. Pasal 63 Ayat (1) dinyatakan bahwa penilaian pendidikan khususnya
penilaian hasil belajar peserta didik pada jenjang pendidikan dasar dan
menengah terdiri atas:
1) Penilaian hasil belajar oleh pendidik;
2) Penilaian hasil belajar oleh satuan pendidikan; dan
3) Penilaian hasil belajar oleh pemerintah.
6

g. Pasal 64 ayat (1) bahwa penilaian hasil belajar yang dilakukan oleh
pendidik dilakukan secara berkesinambungan untuk memantau proses,
kemajuan dan perbaikan hasil dalam bentuk ulangan harian, ulangan
tengah semester, ulangan akhir semester dan ulangan kenaikan kelas.

Selanjutnya, dalam Bab IV tentang Standar Proses, Pasal 19 ayat (3),


dijelaskan bahwa setiap satuan pendidikan melakukan perencanaan proses
pembelajaran, pelaksanaan proses pembelajaran, penilaian hasl
pembelajaran, dan pengawasan proses pembelajaran untuk terlaksananya
proses pembelajaran yang efektif dan efisien. Secara teknis, penilaian ini di
atur dalam Bab IV Pasal 22, yaitu :
a. Ayat 1 : Penilaian hasil pembelajaran sebagaimana dimaksud dalam Pasal
19 ayat (3) pada jenjang pendiikan dasar dan menengah menggunakan
berbagai teknik penilaian sesuai dengan kompetensi dasar yang harus
dikuasai.
b. Ayat 2 : Teknik penilaian sebagaimana dimaksud pada ayat (1) dapat
berupa tes tertulis , observasi, tes praktik, dan penugasan perseorangan
atau kelompok.
c. Ayat 3 : Untuk mata pelajaran selain kelompok mata pelajaran ilmu
pengetahuan dan teknologi pada jenjang pendidikan dasar dan menengah,
teknik penilaian observasi secara individual sekurang-kurangnya
dilaksanakan satu kali dalam satu semester.
Pengembangan standar penilaian pendidikan sebagai salah satu upaya
peningkatan mutu pendidikan dilandasi secara khusus oleh PP RI Nomor 19
Tahun 2005 Tentang Standar Nasional Pendidikan pada Bab X, pasal 63
sampai dengan pasal 72.
3. Permendikbud Nomor 65 tahun 2013 tentang standar proses pendidikan
dasar dan menengah menjelaskan bahwa perencanaan pembelajaran
meliputi penyusunan rencana pelaksanaan pembelajaran dan penyiapan
media dan sumber belajar, perangkat penilaian pembelajaran, dan skenario
pembelajaran. Penilaian proses pembelajaran menggunakan pendekatan
penilaian otentik (authentic assesment) yang menilai kesiapan siswa, proses,
dan hasil belajar secara utuh. Evaluasi proses pembelajaran dilakukan saat
proses pembelajaran dengan menggunakan alat: angket, observasi, catatan
anekdot, dan refleksi.
7

4. Permendikbud Nomor 23 Tahun 2016 tentang standar penilaian pendidikan


menyatakan bahwa penilaian adalah proses pengumpulan dan pengolahan
informasi untuk mengukur pencapaian hasil belajar peserta didik. Dalam
BAB II pasal 3 ayat 1 dinyatakan bahwa penilaian hasil peserta didik pada
pendidikan dasar dan pendidikan menengah meliputi aspek: sikap,
pengetahuan dan keterampilan. Selanjutnya tujuan penilaian dinyatakan
pada BAB III pasal 4 ayat 1 yaitu untuk memantau dan mengevaluasi
proses, kemajuan belajar, dan perbaikan hasil belajar peserta didik secara
berkesinambungan. Kemudian pada BAB VII pasal 14 ayat 1 menyatakan
bahwa instrumen penilaian yang digunakan oleh pendidik dalam bentuk
penilaian berupa tes, pengamatan, penugasan perseorangan atau kelompok,
dan bentuk lain yang sesuai dengan karakteristik kompetensi dan tingkat
perkembangan peserta didik.
5. Standar Penilaian Menurut Badan Standar Nasional Pendidikan (BSNP)
Adapun tugas dan wewenang BSNP diatur dalam Pasal 76 Ayat 3 :
Untuk melaksanakan tugas-tugasnya BSNP mempunyai wewenang untuk:
a. Mengembangkan Standar Nasional Pendidikan;
b. Menyelenggarakan ujian nasional;
c. Memberikan rekomendasi kepada pemerintah dan pemerintah daerah
dalam penjaminan dan pengendalian mutu pendidikan;
d. Merumuskan kriteria kelulusan dari satuan pendidikan pada jenjang
pendidikan dasar dan menengah.
Untuk mengatur pelaksanaan Standar Penilaian Pendidikan, BSNP
menyusun Penduan penilaian yang terdiri atas:
a. Naskah Akademik; berisi berbagai kajian teoritis dan hasil-hasil
penelitian yang relevan dengan penilaian, baik yang dilakukan oleh
pendidik, satuan pendidikan ataupun pemerintah.
b. Panduan Umum; panduan umum berisi pedoman, panduan penilaian
yang bersifat umum yang berupa rambu-rambu penilaian yang harus
dilakukan oleh guru pada semua mata pelajaran, panduan ini juga berlaku
untuk semua kelompok mata pelajaran.
c. Panduan khusus; terdiri dari 5 seri, sesuai dengan kelompok mata
pelajaran; disusun untuk memberikan rambu-rambu penilaian yang
seharusnya dilakukan oleh guru pada kelompok mata pelajaran tertentu,
sehingga terdiri dari 5 seri panduan khusus yang terdiri dari:
1) Panduan penilaian kelompok mata pelajaran agama dan akhlak mulia;
8

2) Panduan penilaian kelompok mata pelajaran kewarganegaraan dan


kepribadian,
3) Panduan penilaian kelompok mata pelajaran ilmu pengetahuan dan
teknologi;
4) Panduan penilaian kelompok mata pelajaran estetika;
5) Panduan penilaian kelompok mata pelajaran jasmani, olahraga dan
kesehatan.
Pada setiap seri panduan khusus kelompok mata pelajaran ini
berisikan rambu-rambu penilaian yang harus dilakukan oleh guru kelompok
mata pelajaran dalam menyusun kisi-kisi penilaian yang menyatu dengan
rencana pelaksanaan pembelajaran, kisi-kisi untuk ulangan akhir semester,
cara menentukan skor akhir dan kriteria dari siswa yang dapat
dikualifikasikan “baik” dan dapt dinyatakan lulus pada kelompok mata
pelajaran tertentu.
Menurut BSNP, penilaian adalah prosedur yang digunakan untuk
mendapatkan informasi tentang prestasi atau kinerja peserta didik, hasil
penilaian digunakan untuk melakukan evaluasi yaitu pengambilan
keputusan terhadap ketuntasan belajar siswa dan efektivitas proses
pembelajaran. Informasi tentang prestasi dan kinerja siswa tersebut
merupakan proses pengolahan data yang diperoleh melalui kegiatan
assessment baik dengan pengukuran maupun non pengukuran. Dapat
dikatakan bahwa proses pengukuran dan non pengukuran untuk
memperoleh data karakteristik peserta didik dengan aturan tertentu ini
disebut dengan assessment. Hasil pengukuran akan selalu berupa angka-
angka atau data numerik, sedang hasil non pengukuran akan berupa data
kualitatif. Informasi tersebut dapat digunakan oleh pendidik untuk berbagai
keperluan pembelajaran diantaranya adalah:
a. Menilai kompetensi peserta didik;
b. Bahan penyusunan laporan hasil belajar; dan
c. Landasan memperbaiki proses pembelajaran.
Selanjutnya, BSNP mengemukakan prinsip-prinsip umum penilaian
hasil belajar sebagai berikut :
a. Mendidik, artinya proses penilaian hasil belajar harus mampu
memberikan sumbangan positif pada peningkatan pencapaian hasil
belajar peserta didik, di mana hasil penilaian harus dapat memberikan
umpan balik dan motivasi kepada peserta didik untuk lebih giat belajar.
9

b. Terbuka atau transparan, artinya bahwa prosedur penilaian, kriteria


penilaian ataupun dasar pengambilan keputusan harus disampaikan
secara transparan dan diketahui oleh pihak-pihak terkait secara obyektif.
c. Menyeluruh, artinya penilaian hasil belajar yang dilakukan harus meliputi
berbagai aspek kompetensi yang akan dinilai yang terdiri dari ranah
pengetahuan kognitif, keterampilan psikomotor, sikap, dan nilai afektif
yang direfleksikan dalam kebiasaan berfikir dan bertindak.
d. Terpadu dengan pembelajaran, artinya bahwa dalam melakukan penilaian
kegiatan pembelajaran harus mempertimbangkan kognitif, afektif, dan
psikomotor, sehingga penilaian tidak hanya dilakukan setelah siswa
menyelesaikan pokok bahasan tertentu, tetapi juga dalam proses
pembelajaran.
e. Obyektif, artinya proses penilaian yang dilakukan harus meminimalkan
pengaruh-pengaruh atau pertimbangan subyektif dari penilai.
f. Sistematis, yaitu penilaian harus dilakukan secara terencana dan bertahap
serta berkelanjutan untuk dapat memperoleh gambaran tentang
perkembangan belajar siswa.
g. Berkesinambungan, yaitu evaluasi harus dilakukan secara terus menerus
sepanjang rentang waktu pembelajaran.
h. Adil, mengandung pengertian bahwa dalam proses penilaian tidak ada
siswa yang diuntungkan atau dirugikan berdasarkan latar belakang sosial
ekonomi, agama, budaya, bahasa, suku bangsa, warna kulit, dan gender.
i. Pelaksanaan penilaian menggunakan acuan kriteria, menggunakan kriteria
tertentu dalam menentukan kelulusan yang telah ditetapkan sebelumnya.
Selanjutnya ditegaskan oleh BSNP bahwa proses penilaian perlu
diperhatikam prinsip-prinsip khusus sebagai berikut : Penilaian ditujukan
untuk mengukur pencapaian kompetensi. Untuk itu harus dipahami bahwa
proses penilaian merupakan bagian integral dari kegiatan pembelajaran yang
dilakukan oleh pendidik untuk mengetahui tingkat pencapaian standar
kompetensi lulusan.
Penilaian menggunakan acuan kriteria, yaitu keputusan diambil
berdasarkan apa yang seharusnya dapat dilakukan oleh peserta didik setelah
mengikuti proses pembelajaran. Sesuai dengan penerapan kurikulum
berbasis kompetensi, penilaian yang dilakukan harus didasarkan pada acuan
10

kriterium, yaitu membandingkan hasil yang telah dicapai oleh peserta didik
dengan kriteria yang telah ditetapkan.
Penilaian dilakukan secara keseluruhan dan berkelanjutan. Penilaian
oleh pendidik bukan merupakan bagian terpisah dari proses pembelajaran,
sehingga proses penilaian dilakukan sepanjang rentang proses pembelajaran.
Apabila peserta didik telah mencapai standar, maka dapat dinyatakan lulus
dalam mata pelajaran tertentu, tetapi bila belum mencapai standar, maka
harus mnegikuti pengajaran remidi sampai dapat mencapai standar
kompetensi minimal yang dipersyaratkan.
Hasil penilaian digunakan untuk menentukan tindak lanjut. Tindakan
lanjutan dari penilaian dapat berupa perbaikan proses pembelajaran program
remidi bagi peserta didik yang tingkat pencapaian hasil belajarnya berada di
bawah kriteria ketuntasan, dan program pengayaan bagi peserta didik yang
telah mencapai kriteria ketuntasan. Penilaian harus sesuai dengan
pengalaman belajar yang ditempuh dengan proses pembelajaran. Hal ini
terkait erat dengan pemahaman bahwa penialaian tidak dipisahkan dari
kegiatan pembelajaran secara keseluruhan.

C. Penilaian/ Assessment, Pengukuran, dan Testing


1. Penilaian / Assessment
Penilaian merupakan bagian penting dan tak terpisahkan dalam sistem
pendidikan saat ini. Sistem penilaian yang baik akan mampu memberikan
gambaran tentang kualitas pembelajaran sehingga pada gilirannya akan
mampu membantu guru merencanakan strategi pembelajaran. Untuk dapat
memahaminya berikut ini merupakan beberapa pendapat ahli tentang
definisi penilaian.
a. Putra (2012: 17), mengatakan penilaian ialah suatu usaha untuk
mendapatkan berbagai informasi secara berkala, berkesinambungan,
serta menyeluruh tentang proses dan hasil perkembangan yang telah
dicapai oleh anak didik melalui program kegiatan belajar.
b. Menurut Zainul dan Noehi (2001), mengartikan penilaian adalah suatu
proses untuk mengambil keputusan dengan menggunakan informasi
yang diperoleh melalui pengukuran hasil belajar baik yang
menggunakan tes maupun nontes.
11

c. Menurut Mardapi (2012:12) penilaian (assesment) adalah mencakup


semua cara yang digunakan unutk mengumpulkan data tentang individu.

Berdasarkan pengertian penilaian yang telah dikemukakan, dapat


disimpulkan bahwa penilaian merupakan cara yang digunakan untuk
mengumpulkan data menggunakan tes maupun nontes dan bersifat
kualitatif.
Penilaian memiliki prinsip sehingga dapat digunakan dalam
pembelajaran. Prinsip penilaian menurut Sudjana (2009: 8), yaitu (a)
Dirancang sedemikian rupa; (b) Menjadi bagian internal dari proses belajar
mengajar; (c) Diperoleh dari hasil belajar yang objektif; (d) Diikuti dengan
tindak lanjut. Menurut Permendikbud No. 23 Tahun 2013, prinsip penilaian
yaitu, (a) Sahih; (b) Objektif; (c) Adil; (d) Terpadu; (e) Terbuka; (f)
Menyeluruh; (g) Sistematis; (h) Beracuan kriteria; (i) Akuntabel.

2. Pengukuran
Pengukuran adalah sebagai kegiatan membandingkan suatu hal
dengan satuan ukuran tertentu untuk memperoleh besaran kuantitatif dari
suatu obyek tertentu. Pengukuran dalam bahasa Inggris disebut
measurement merupakan kegiatan yang dilakukan untuk mengukur dalam
arti memberi angka terhadap suatu yang disebut objek pengukuran atau
objek ukur. Berikut ini pengertian lebih rinci dari para ahli mengenai konsep
pengukuran:
a. Menurut Sudijono (2009: 4), mengatakan bahwa pengukuran sebagai
kegiatan yang dilakukan untuk mengukur sesuatu yang pada hakikatnya
membandingkan sesuatu dengan atau atas dasar ukuran tertentu.
b. Menurut Arifin (2012:4) pengukuran adalah suatu proses atau kegiatan
untuk menentukan kuantitas sesuatu.
c. Menurut Zainal dan Nasution menyatakan pengukuran adalah pemberian
angka terhadap suatu atribut atau karakter tertentu yang dimiliki oleh
seseorang, atau suatu obyek tertentu yang mengacu pada aturan dan
formulasi yang jelas.
Berdasarkan pengertian pengukuran yang telah dikemukakan,
disimpulkan bahwa pengukuran merupakan kegiatan yang dilakukan untuk
12

mengukur obyek tertentu yang mengacu pada aturan dan formulasi yang
jelas serta bersifat kuantitatif.
Pengukuran memiliki ciri-ciri atau karakteristik yang membedakannya
dengan penilaian. Karakteristik dari pengukuran, antara lain:
a. Perbandingan antara atribut yang di ukur dengan alat ukurnya,
maksudnya apa yang di ukur adalah atribut atau dimensi dari sesuatu,
bukan sesuatu itu sendiri;
b. Hasilnya dinyatakan secara kuantitatif artinya, hasil pengukuran
berwujud angka;
c. Hasilnya bersifat deskriptif, maksudnya hanya sebatas memberikan
angka yang tidak diinterpretasikan lebih jauh.

Pengukuran memiliki peranan penting dalam bidang pendidikan. Data


hasil pengukuran memiliki arti penting, baik bagi sekolah atau lembaga
pendidikan, guru, peserta didik, maupun orang tua. Data hasil pengukuran
dapat digunakan untuk: (a) memantau kemajuan peserta didik;
(b) membantu peserta didik dengan rencana masa depannya (karir);
(c) mengklasifikasikan dan menempatkan peserta didik berdasarkan
kepentingan, bakat, dan kesiapan; (d) menilai program pendidikan;
(e) memperbaiki kurikulum; dan (f) menentukan pengajaran yang efisien

3. Testing

Tes adalah cara penilaian yang dirancang dan dilaksanakan kepada


peserta didik pada waktu dan tempat tertentu serta dalam kondisi yang
memenuhi syarat-syarat tertentu yang jelas. Untuk lebih jelasnya, berikut ini
pengertian tes menurut para ahli, diantaranya:

a. Menurut Riduwan (2006: 37), tes sebagai instrument pengumpulan data


adalah serangkaian pertanyaan/ latihan yang digunakan untuk mengukur
keterampilan pengetahuan, inteligensi, kemampuan atau bakat yang
dimiliki individu/ kelompok

b. Menurut Putra (2012: 110), tes adalah salah satu jenis instrument atau
alat yang dapat digunakan untuk menilai, mengukur, dan mengetahui
kemampuan siswa dalam menyerap pelajaran yang diajarkan
13

c. Menurut Sudjana (2009: 35) tes adalah pertanyaan-pertannyaan yang


diberikan kepada siswa untuk mendapat jawaban dari siswa dalam
bentuk lisan, dalam bentuk tulisan, atau dalam bentuk perbuatan.

Berdasarkan beberapa pendapat ahli yang telah dikemukakan,


disimpulkan bahwa tes merupakan instrument yang dapat digunakan untuk
mengukur kemampuan yang dimiliki peserta didik baik dalam bentuk
tulisan, lisan, maupun dalam bentuk perbuatan. Tes merupakan alat atau
instrumen yang digunakan untuk mengevaluasi individu maupun kelompok
untuk memperoleh informasi atau karakteristik seseorang atau kelompok
dengan menggunakan cara atau aturan yang telah ditentukan.

Tes sebagai instrument dalam pendidikan memiliki beberapa fungsi.


Menurut Sudijono (2009: 67), fungsi tes adalah:
a. Sebagai alat pengukur terhadap peserta didik. Tes berfungsi untuk
mengukur tingkat perkembangan atau kemajuan yang telah dicapai oleh
peserta didik setelah melakukan pembelajaran
b. Sebagai alat pengukur keberhasilan program pengajaran. Tes berfungsi
untuk mengukur seberapa jauh program pengajaran tercapai.

Tes yang digunakan dalam pembelajaran terdiri dari beberapa jenis.


Jenis-jenis tes Menurut Sudijono (2009: 68-75), terdiri dari beberapa
penggolongan, yaitu:
a. Berdasarkan fungsinya sebagai alat pengukur perkembangan/ kemajuan
belajar peserta didik, tes dibedakan menjadi:
1) Tes seleksi
2) Tes awal
3) Tes akhir
4) Tes diagnostic
5) Tes formatif
6) Tes sumatif
b. Berdasarkan aspek psikis yang ingin diungkapkan, tes dibedakan
menjadi:
1) Tes intelegensi
2) Tes kemampuan
14

3) Tes sikap
4) Tes kepribadian
5) Tes hasil belajar
c. Berdasarkan banyak orang yang mengikuti tes, tes dibedakan menjadi:
1) Tes individual
2) Tes kelompok
d. Berdasarkan waktu yang disediakan, tes dibedakan menjadi:
1) Power test
2) Speed test
e. Berdasarkan bentuk respon, tes dibedakan menjadi:
1) Verbal test
2) Nonverbal test
f. Berdasarkan cara mengajukan pertanyaan dan cara memberikan
jawaban, tes dibedakan menjadi:
1) Tes tertulis
2) Tes lisan
Berdasarkan jenis tes yang telah dikemukakan, disimpulkan bahwa
penggolongan tes yang dapat digunakan dalam pembelajaran terdiri dari
enam penggolongan, yaitu (a) berdasarkan fungsinya sebagai alat pengukur
perkembangan/ kemajuan belajar peserta didik; (b) berdasarkan aspek psikis
yang ingin diungkapkan; (c) berdasarkan banyak orang yang mengikuti tes;
(d) berdasarkan waktu yang disediakan; (e) berdasarkan bentuk responnya;
(f) berdasarkan cara mengajukan pertanyaan dan cara memberikan jawaban.
Tes yang baik digunakan dalam pembelajaran harus sesuai dengan
karakteristik. Karakteristik tes yang baik Menurut ialah:
a. Memiliki validitas
b. Memiliki reliabilitas
c. Memiliki obyektivitas
d. Praktikalitas
e. Ekonomis

Memperoleh tes yang baik harus menggunakan teknik penyusanan


tes yang baik pula. Menurut Mardapi (2012 : 110) menjabarkan ada delapan
15

langkah yang harus ditempuh dalam menyusun tes hasil atau prestasi belajar
yang baku seperti berikut ini :

a. Menyusun spesifikasi tes


Langkah awal dalam mengembangkan tes adalah menetapkan
spesifikasi tes atau blue print test, yaitu yang berisi uraian yang
menunjukkan keseluruhan karakteristik yang harus dimiliki suatu tes.
b. Menulis tes

Tes yang ditulis sesuai dengan karakteristik materi. Tes yang ditulis
dapat berupa tes lisan, salah benar, menjodohkan, pilihan ganda , uraian
objektif, bentuk uraian non objektif, bentuk jawaban singkat, unjuk
kerja dan portofolio.

c. Mentelaah tes
Kinerja yang digunakan untuk melakukan telaah butir tes mengikuti
pedoman penyusan tes. Telaah dilakukan terhadap kebenaran konsep,
teknik penulisan bahasa yang digunakan.
d. Melakukan ujicoba tes
Sebelum soal digunakan dalam tes yang sesungguhnya, uji coba perlu
dilakukan untuk semakin memperbaiki kualitas soal. Uji coba ini dapat
digunakan sebagai sarana memperoleh data empirik tentang tingkat
kebaikan soal yang telah disusun. Melalui uji coba diperoleh data
tentang reliabilitas, validitas, tingkat kesukaran, pola jawaban, efektif
pengecoh, daya beda dan lan-lain.
e. Menganalisis butir tes
Analisis butir soal dilakukan setelah tes digunakan, yaitu dengan
mencakup informasi seperti : tingkat kesulitan, daya beda dan indek
keandalan.
f. Memperbaiki tes
Setelah uji coba dilakukan kemudian dianalisis, maka langkah
berikutnya adalah melakukan perbaikan-perbaikan tentang bagian ssoal
yang masih belum sesuai dengan yang diharapkan.
g. Merakit tes
Setelah semua butir soal dianalisis dan diperbaiki, langkah berikutnya
adalah merakit butir-butir soal tersebut menjadi satu kesatuan.
Keseluruhan butir perlu disusun secara hati-hati menjadi kesatuan soal
tes yang terpadu.
h. Melaksanakan tes
16

Tes yang telah disusun diberikan kepada testee untuk diselesaikan.


Pelaksanaan tes dilakukan sesuai dengan waktu yang telah ditentukan.
Dalam pelaksanaan tes ini memerlukan pemantauan atau pengawasan
agar tes tersebut benar-benar dikerjakan oleh testee dengan jujur dan
sesuai dengan ketentuan yang telah digariskan.
i. Menafsirkan hasil tes
Hasil tes menghasilkan data kuantitatif yang berupa skor. Skor ini
kemudian ditafsirkan sehingga menjadi nilai, yaitu rendah, menengah
atau tinggi. Tinggi rendahnya nilai selalu dikaitkan dengan acuan
penilaian.
Adapun prosedur pengembangan tes menurut Purwanto (2011:84) adalah:

a. Identifikasi hasil belajar


Identifikasi aspek mana yang akan diukur apakah pada ranah kognitif,
afektif, atau psikomotor.
b. Deskripsi materi
Data yang dikumpulkan hasil belajar merupakan data yang
berhubungkan dengan materi yang diajarkan.
c. Pengembangan spesifikasi
1) Menentukan bentuk dan jenis tes
2) Menentukan banyak butir tes
3) Menentukan waktu pengerjaan tes
4) Menentukan peserta uji coba tes
5) Menentukan waktu uji coba tes
6) Menentukan aturan skoring
7) Menentukan kriteria uji coba
8) Menyusun kisi-kisi tes
d. Menuliskan butir-butir tes dan kunci jawaban
Kisi-kisi adalah rancangan sebagai dasar penulisan butir-butir tes. Butir
tes ditulis untuk mengukur variabel dengan berpedoman pada kisi-kisi
e. Mengumpulkan data uji coba
Pengumpulan data uji coba dilakukan dengan mengujikan instrumen uji
coba tes yang ditulis berdasarkan kisi-kisi.
f. Menguji kualitas tes
Untuk memastikan apakah butir tes yang baik secara teori juga baik
secara empiris perlu dilakukan uji coba kualitas. Uji kualitas dilakukan
untuk menjamin bahwa tes layak sebagai sebuah alat ukur.
g. Melakukan kompilasi

Kompilasi tes adalah menyusun kembali butir setelah uji coba dengan
membuang butir yang jelek dan menata butir yang baik. Butir kompilasi
17

adalah butir yang siap digunakan untuk mengumpulkan data hasil


belajar.

D. Bentuk dan Jenis Assessment


1. Bentuk Assessment
Bentuk assesment yang digunakan antara lain sebagai berikut:
a. Assessment Konvensional

Secara konvensional, evaluasi terhadap suatu kemampuan (pengetahuan


atau keterampilan) siswa dilakukan dengan suatu proses pengukuran
terhadap kemampuan tersebut menggunakan teknik tes.

b. Assessment Alternatif

Teknik pengukuran untuk mengevaluasi kemampuan siswa dengan


menggunakan teknik pengukuran non-tes.

c. Assessment Otentik

Salah satu bentuk asesmen alternatif yang teknik pengukurannya meminta


siswa untuk mengaplikasikan pengetahuan atau menunjukkan
keterampilan sebagaimana pengetahuan atau keterampilan itu dipakai
dalam dunia nyata.

d. Assessment Kinerja

Bentuk asesmen alternatif lain yang teknik pengukurannya memberikan


kesempatan kepada siswa untuk menciptakan berbagai situasi untuk siswa
atau menciptakan berbagai situasi agar siswa dapat menunjukkan
kemampuannya dalam mengaplikasikan pengetahuan dan keterampilannya
dalam berbagai situasi (Marzano, 1992).

2. Jenis-jenis Assessment

Jenis-jenis assesment yang digunakan antara lain sebagai berikut:


a. Formatif, yakni penilaian yang dilaksanakan pada setiap akhir pokok
bahasan, tujuannya untuk mengetahui tingkat penguasaan siswa terhadap
pokok bahasan tertentu.
18

b. Sumatif, yaitu penilaian yang dilakukan pada akhir satuan program


tertentu, (catur wulan, semester atau tahun ajaran), tujuannya untuk
melihat prestasi yang dicapai peserta didik selama satu program.
c. Diagnostik, yaitu penilaian yang dilakukan untuk melihat kelemahan siswa
dan faktor-faktor yang diduga menjadi penyebab, dilakukan untuk
keperluan pemberian bimbingan belajar dan pengajaran remidial.
d. Penempatan (placement), yaitu penilaian yang ditujukan untuk
menempatkan siswa sesuai dengan bakat, minat, dan kemampuannya,
misalnya dalam pemilihan jurusan atau menempatkan anak pada kerja
kelompok dan pemilihan kegiatan tambahan.
e. Seleksi, yakni penilaian yang ditujukan untuk menyaring atau memilih
orang yang paling tepat pada kedudukan atau posisi tertentu. Evaluasi ini
dilakukan kapan saja diperlukan.

E. Fungsi Assessment
Ada beberapa fungsi dari dilaksanakannya penilaian diantaranya yaitu:
1. Penilaian Berfungsi Selektif
a. Untuk memilih siswa yang dapat diterima di sekolah tertentu.
b. Untuk memilih siswa yang dapat naik ke kelas atau tingkat berikutnya.
c. Untuk memilih siswa yang seharusnya mendapat beasiswa.
d. Untuk memilih siswa yang sudah berhak meninggalkan sekolah, dan
sebagainya.
2. Penilaian Berfungsi Diagnostik
a. Guru akan mengetahui kelemahan siswa. Jadi dengan mengadakan
penilaian, sebenarnya guru melakukan diagnosis kepada siswa tentang
kebaikan dan kelemahannya.
b. Menemukan kesulitan belajar dan prestasi yang bisa dikembangkan serta
sebagai alat diagnosis perlu tidak siswa mengikuti remedial atau program
pengayaan.
c. Menemukan kelemahan dan kekurangan proses pembelajaran yang telah
dilakukan ataupun yang sedang berlangsung.
3. Penilaian Berfungsi Sebagai Penempatan
a. Penempatan disini lebih bersifat pada pengajaran secara berkelompok.
19

b. Untuk dapat menentukan dengan pasti di kelompok mana seorang siswa


harus ditempatkan.
c. Membantu peserta didik memahami dirinya dan membuat keputusan
tentang langkah pemilihan program, pengembangan kepribadian, dan
penjurusan.

4. Penilaian Berfungsi Sebagai Pengukur Keberhasilan


a. Mengetahui sejauh mana suatu program berhasil diterapkan.
Keberhasilan suatu program ditentukan oleh beberapa faktor yaitu
faktor guru, metode mengajar, kurikulum, sarana, dan system
administrasi.
b. Menggambarkan sejauh mana seorang peserta didik telah menguasai
suatu kompetensi.

F. Validitas dan Reliabilitas


1. Validitas
Validitas adalah tingkat suatu tes mampu mengukur apa yang hendak
diukur. Validitas merupakan penilaian terhadap rancangan suatu produk.
Validitas yang dapat digunakan dalam menyelidiki suatu instrument
terdiri dari beberapa jenis. Siregar (2013: 46) menjelaskan terdapat perbedaan
pengelompokkan jenis-jenis validitas. Jenis-jenis validitas yaitu:
a. Validitas Rupa (Face validity)
Validitas rupa yang menunjukkan apakah alat pengukur/ instrumen
peneliti dari segi rupanya nampak mengukur apa yang ingin diukur,
validitas ini lebih mengacu pada bentuk dan penampilan instrumen.
Menurut Djamaludin Ancok validitas rupa amat penting dalam pengukuran
kemampuan individu seperti pengukuran kejujuran, kecerdasan, bakat dan
keterampilan.
b. Validitas Isi (Content validity)
Validitas isi merupakan validitas yang diperhitungkan melalui
pengujian terhadap isi alat ukur dengan analisis rasional (Putra, 2012:
172). Banyaknya validitas isi yang telah dicapai oleh alat ukur tergantung
pada penilaian subjektif individu. Validitas isi tidak memerlukan uji coba
dan analisis statistic atau dinyatakan dalam bentuk angka-angka (Sudjana,
2009: 14).
20

c. Validitas kriteria (Criterion validity)


Validitas kriteria yaitu validitas suatu instrumen dengan
membandingkan dengan instrumen pengukuran lainnya yang sudah valid
dan reliabel dengan cara mengkorelasikannya.
d. Validitas konstruk (Construct validity)
Validitas konstruk adalah kesanggupan alat penilaian untuk mengukur
pengertian-pengertian/indicator dari suatu variabel yang hendak diukur
(Anwar, 2009: 46). Validitas konstruk terjadi ketika pendidik menyusun
soal berdasarkan teori atau konsep yang ada.

Untuk menentukan validitas suatu instrumen, dapat digunakan analisis


Cohen’s Kappa dengan persamaan:

Keterangan:
k = Kappa menunjukkan validitas produk
P = Proporsi yang terealisasi, dihitung dengan cara jumlah nilai yang
diberikan oleh validator dibagi jumlah nilai maksimal
Pe = Proporsi yang tidak terealisasi, dihitung dengan cara jumlah nilai
maksimal dikurangi dengan jumlah nilai tabel yang diberi validator
dibagi jumlah nilai maksimal

Kategori Validitas produk berdasarkan nilai akhir yang didapatkan


dapat dilihat pada tabel :

Tabel 1. Kategori valid

Interval Kategori
< 0.61 Tidak Valid
0.61 – 1.00 Valid
( Anthony,dkk,2005)

2. Reliabilitas
Reliabilitas adalah konsistensi keajengan alat tersebut dalam menilai apa
yang dinilainya. Pengertian reliabilitas menurut para ahli dapat dikemukakan
sebagai berikut.
a. Azwar (2001: 176) menyatakan bahwa reliabilitas merupakan salah-satu ciri
atau karakter utama instrumen pengukuran yang baik.
21

b. Menurut Sudjana (2009:16) reliabilitas adalah tetapan atau keajengan alat


tersebut dalam menilai apa yang dinilainya.
c. Menurut Suryabrata (2004: 28) reliabilitas menunjukkan sejauh mana hasil
pengukuran dengan alat tersebut dapat dipercaya.

Berdasarkan pengertian yang telah dikemukakan, disimpulkan bahwa


reliabilitas merupakan ketetapan suatu instrumen dapat dipercaya apabila
dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang
sama, diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur
dalam diri subyek memang belum berubah.
Salah satu syarat agar hasil suatu tes dapat dipercaya adalah tes tersebut
harus mempunyai reliabilitas yang memadai. Oleh karena itu reliabilitas dapat
dibedakan menjadi 2 macam, yaitu reliabilitas konsistensi tanggapan dan
reliabilitas konsistensi gabungan item.
a. Reliabilitas konsistensi tanggapan
Reliabilitas ini selalu mempersoalkan mengenai tanggapa responden
atau objek terhadap tes tersebut apakah sudah baik atau konsisten. Dalam
artian apabila tes yang telah di cobakan tersebut dilakukan pengukuran
kembali terhadap obyek yang sama, apakah hasilnya masih tetap sama
dengan pengukuran sebelumnya.
Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan
responden terhadap tes (Jaali: 2008) yaitu :
1) Teknik test-retest ialah pengetesan dua kali dengan menggunakan
suatu tes yang sama pada waktu yang berbeda.
2) Teknik belah dua ialah pengetesan (pengukuran) yang dilakukan
dengan dua kelompok item yang setara pada saat yang sama.
3) Bentuk ekivalen ialah pengetesan (pengukuran) yang dilakukan
dengan menggunakan dua tes yang dibuat setara kemudian diberikan
kepada responden atau obyek tes dalam waktu yang bersamaan.
b. Reliabilitas Konsistensi Gabungan Item
Reabilitas ini terkait dengan konsistensi antara item-item suatu tes
atau instrument. Apabila terhadap bagian obyek ukur yang sama, hasil
pengukuran melalui item yang satu kontradiksi atau tidak konsisten
22

dengan hasil ukur melalui item yang lain maka pengukuran dengan tes
(alat ukur) sebagai suatu kesatuan itu tidak dapat dipercaya.
Koefisien reliabilitas konsistensi gabungan item dapat dihitung
dengan menggunakan 3 rumus (Jaali: 2008), yakni:
1) Rumus Kuder-Richardson, yaitu KR-20 dan KR-21.
2) Rumus koefisien Alpha atau Alpha Cronbach.
3) Rumus reliabilitas Hoyt, yang menggunakan analisis varian.

G. Bias dan Standard Error Measurement


1. Bias
Suatu studi atau penelitian yang tidak valid secara internal disebut bias.
Menurut KBBI bias artinya simpangan. Bias mengukur secara luas
penyimpangan hasil studi dari hasil yang seharusnya. Bias terjadi apabila
perkiraan pengukuran untuk suatu studi populasi secara sistematis berbeda
dari nilai parameter yang diharapkan. Bias adalah sebuah penyajian bahan
yang dipenuhi prasangka.
Bias dalam pengukuran dapat bersumber dari (a) Proses seleksi atau
partisipasi subyek (bias seleksi); (b) Proses pengumpulan data (bias
informasi); (c) Tercampurnya efek pajanan utama dengan efek faktor risiko
eksternal lainnya (kerancuan/ confounding). Ada dua tipe bias, yaitu bias
seleksi dan bias informasi.
a. Bias Seleksi
Yaitu distorsi efek berkaitan dengan cara pemilihan subyek kedalam
populasi studi. Karakteristik bias seleksi yaitu:
1) Terjadi ketika menggunakan kriteria yang berbeda dalam prosedur
seleksi subyek
2) Besar dan arahnya seringkali tidak dapat diperkirakan
3) Bias ini, sekali terjadi tidak dapat dikendalikan, melainkan hanya
dapat dicegah
b. Bias Informasi
Bias informasi (information bias) atau bias observasi (observation
bias) atau bias pengukuran (measurement bias) adalah bias yang terjadi
karena perbedaan sistematik dalam mutu dan cara pengumpulan data.
2. Standar Error Measurement
Standar eror dari mean (SEM) adalah standar deviasi sampel estimasi
mean sebuah populasi mean. Ini juga dapat dilihat sebagai standar deviasi
kesalahan dalam mean sampel relatif terhadap mean sebenarnya, sejak mean
23

sampel merupakan penduga yang tidak bias. Kesalahan pengukuran (errors of


measurement) adalah perbedaan antara nilai sesungguhnya dari suatu
pekerjaan seseorang dan nilai yang diperoleh oleh orang tersebut.
Standar eror memberikan langkah-langkah sederhana ketidakpastian
dalam nilai dan sering digunakan karena:
a. Jika error standar kuantitas dari beberapa individu kemudian dikenal
standard error dari beberapa fungsi dari kuantitas dapat dengan mudah
dihitung dalam banyak kasus;
b. Mana distribusi probabilitas dari nilai yang diketahui, dapat digunakan
untuk menghitung pendekatan yang baik untuk yang tepat.
c. Mana distribusi probabilitas tidak diketahui, hubungan seperti Chebyshev
's atau ketidaksetaraan Vysochanskiï-Petunin dapat digunakan untuk
menghitung interval keyakinan konservatif
d. Sebagai ukuran sampel yang cenderung tak terhingga teorema limit sentral
menjamin bahwa distribusi sampling mean asimtotik normal.

Kesalahan pengukuran (error of measurement) dapat bersumber dari (a)


kesalahan dalam memilih subjek penelitian (bias selection); (b) informasi
yang salah tentang subjek penelitian (bias information); (c) kegagalan
mengontrol variabel luar. Sumber-sumber kesalahan pengukuran yang lain,
yaitu:
a. Accidental/Chance Errors
Contoh: keributan dalam tes atau keadaan subjek tes yang tidak begitu
sehat merupakan faktor pengganggu
b. Systematic/Biased Errors
Kesalahan ini merupakan hasil dari pemikiran yang tercemar,
kecenderungan personal, moral yang tidak pantas, dan sebagainya.
c. Interpretative Error
Kesalahan ini terjadi berkaitan dengan kesalahan dalam menginterpretasi
hasil dari suatu tes.
d. Variable Errors
Kesalahan yang disebabkan oleh ketidakmurnian yang muncul berkaitan
dengan adanya perbedaan alasan dan faktor situasi
24

e. Personal Errors
Kesalahan yang terjadi berkaitan dengan subjektivitas seseorang
f. Constant Errors
Kesalahan yang muncul karena perbedaan antara “internal qualities” dan
“internal abilities”.

Jenis-jenis dari kesalahan pengukuran ialah:


a. Error of measurement
Kesalahan yang terjadi saat merubah skor yang didapat menjadi true score.
b. Error of substitution
Kesalahan yang dibuat ketika menggantikan skor dalam suatu tes kepada
skor dalam tes paralel.
c. Error of estimating observed scores
Kesalahan yang dibuat ketika sebuah persamaan regresi digunakan untuk
memperkirakan skor dalam sebuah tes dari suatu rangkaian tes paralel.
d. Error of estimating true scores
Kesalahan yang terjadi dalam memperkirakan true score dari skor yang
didapat ketika menerapkan persamaan regresi yang paling sesuai.
BAB IV

PENUTUP

A. Kesimpulan
1. Penilaian/ Assessment adalah cara yang digunakan untuk mengumpulkan
data menggunakan tes maupun nontes dan bersifat kualitatif.
2. Pengukuran merupakan kegiatan yang dilakukan untuk mengukur obyek
tertentu yang mengacu pada aturan dan formulasi yang jelas serta bersifat
kuantitatif.
3. Tes merupakan instrument yang dapat digunakan untuk mengukur
kemampuan yang dimiliki peserta didik baik dalam bentuk tulisan, lisan,
maupun dalam bentuk perbuatan.
4. Validitas merupakan kemampuan suatu tes unrtuk mengukur apa yang
seharusnya diukur.
5. Reliabilitas merupakan ketetapan suatu instrumen dapat dipercaya apabila
dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek
yang sama, diperoleh hasil pengukuran yang relatif sama, selama aspek
yang diukur dalam diri subyek memang belum berubah.
6. Bias adalah suatu keadaan dimana perkiraan pengukuran untuk suatu studi
populasi secara sistematis berbeda dari nilai parameter yang diharapkan.
7. Standard error measurement adalah perbedaan antara nilai sesungguhnya
dari suatu pekerjaan seseorang dan nilai yang diperoleh oleh orang
tersebut.
B. Saran
Pendidik sebaiknya dapat membedakan istilah-istilah penilaian/
assessment, pengukuran, tes, validitas dan reliabilitas, serta bias dan standard
error measurement serta menerapkannya dalam pembelajaran di kelas.
Pendidik juga dapat diharapkan dapat mengembangkan tes yang baik

3
DAFTAR PUSTAKA

Anwar, Syafri. 2009. Penilaian Berbasis Kompetensi. Padang: UNP Press.


Arifin, Zainal. 2012. Evaluasi Pembelajaran. Rosda : Bandung.
Arikunto, Suharsimi. 2012. Dasar-Dasar Evaluasi. Jakarta : PT Bumi Aksara.
Azwar, S. 2001. Reliabilitas dan Validitas. Yogyakarta: Pustaka Pelajar.
Mardapi, Djemari. 2012. Pengukuran, Penilaian dan Evaluasi Pendidikan.
Yogyakarta: Nuha Medika.
Peraturan Pemerintah Republik Indonesia Nomor 19 Tahun 2005 Tentang Standar
Nasional Pendidikan
Poerwanti, Endang. dkk. 2008. Konsep Dasar Asesmen Pembelajaran. Jakarta:
Depdiknas.
Purwanto . 2011. Evaluasi Hasil Belajar. Pustaka Pelajar : Yogyakarta.
Riduwan. 2006. Metode dan tekhnik Menyusun Tesis. Bandung : Alfabeta.
Siregar, Syofian.2013. Statistic Parametric untuk Penelitian Kuantitatif. Jakata: PT Bumi
Aksara
Sudijono, Anas. 2009. Pengantar Evaluasi Pendidikan. Jakarta: PT.Raja Grafindo
Persada.
Sudjana, Nana. 2009. Penilaian Proses Belajar Mengajar. Bandung: PT.Remaja
Rosdakarya.
Sutarman, Adi. 2013. Pengertian Pengukuran, Asesmen, Penilaian, dan Evaluasi.
http://melajah-online.blogspot.com/2013/09/pengertian-pengukuran-
asesmen-penilaian.html.
Surapranata, Sumarna. 2005. Analisis validitas, Reliabilitas, dan Interpretasi
Hasil Tes. Bandung: Remaja Rosdakarya.
Sudaryono, 2012. Dasar-dasar Evaluasi Pembelajaran. Yogyakarta: Graha Ilmu.
Walizer, Michael H. 1987. Metode dan Analisis Penelitian: Mencari Hubungan,
Jilid 2. Jakarta: Erlangga
Zainul, Asmawi dan Noehi Nasution. 2001. Penilaian Hasil Belajar. Jakarta:
Departemen Pendidikan Nasional.

Anda mungkin juga menyukai