Anda di halaman 1dari 49

PENGEMBANGAN EVALUASI DAN PROSES PEMBELAJARAN FISIKA

PERBANDINGAN PENILAIAN, ASESMEN, PENGUKURAN, TESTING,


VALIDITAS, DAN RELIABILITAS

Tugas 1

Oleh:
ANNISA ULFAH
15175003

DOSEN PEMBIMBING:
PROF.DR.FESTIYED,M.S
DR. DJUSMAINI DJAMAS, M.Si

JURUSAN FISIKA
PROGRAM PASCASARJANA
UNIVERSITAS NEGERI PADANG
2016

KATA PENGANTAR

Puji syukur kita ucapkan kehadirat Allah SWT karena atas berkat rahmat
dan hidayah-Nya, saya dapat menyusun makalah ini dengan judul Perbandingan
penilaian, asesmen, pengukuran, testing, validitas, dan reliabilitas.
Dalam penyusunan makalah ini penulis banyak mendapat masalah,
namun hal tersebut dapat diatasi dengan bimbingan dan dan dukungan dari
berbagai pihak. Maka penulis mengucapkan terimakasih kepada dosen
pembimbing mata kuliah Pengembangan Evaluasi dan Proses Pembelajaran
Fisika, pengarang buku serta pembuat blog (internet) yang sangat membantu
sebagai pencarian bahan dalam pembuatan makalah ini, dan teman-teman yang
secara langsung atau tidak langsung terlibat dalam pembuatan makalah ini.
Makalah ini telah diusahakan untuk dapat diselesaikan dengan sebaik
mungkin, namun saya sebagai penyusun menyadari bahwa tidak ada karya yang
sempurna. Untuk itu semua kritik dan saran dari pembaca sangat saya harapkan,
sebagai bahan penyempurnaan dimasa yang akan dating. Semoga makalah ini
bermanfaat bagi kita semua serta mendapat Ridha disisi Allah dan dapat menjadi
salah satu referensi dalam ilmu pengetahuan.
Padang, Maret 2016

Penulis

DAFTAR ISI

KATA PENGANTAR.........................................................................................i
DAFTAR ISI......................................................................................................ii
BAB I PENDAHULUAN..................................................................................1
A.
B.
C.
D.

Latar Belakang...................................................................................1
Rumusan Masalah.............................................................................2
Tujuan................................................................................................2
Manfaat..............................................................................................3

BAB II PEMBAHASAN...................................................................................3
A. Matriks Perbandingan Evaluasi, Penilaian (Assesmen), Pengukuran,
B.
C.
D.
E.

dan Testing.......................................................................................3
Bentuk dan Jenis Penilaian Asesmen.............................................12
Fungsi Penilaian.............................................................................25
Validitas dan Reabilitas .................................................................27
Bias, Standard Error Measurement...............................................37

BAB III PENUTUP.........................................................................................38


A. Kesimpulan....................................................................................38
B. Saran..............................................................................................38
DAFTAR PUSTAKA.......................................................................................39

BAB I
PENDAHULUAN

A. LATAR BELAKANG
Kurikulum mempunyai kedudukan yang sangat penting dalam lembaga pendidikan,
yaitu sebagai salah satu penentu keberhasilan pendidikan. Perubahan kurikulum selalu
mengarah pada perbaikan sistem pendidikan dan perubahan tersebut dilakukan dengan
didasari pada permasalahan pelaksanaan kurikulum sebelumnya yang dianggap kurang
maksimal baik secara materi maupun sistem pembelajarannya sehingga perlu adanya
revitalisasi kurikulum. Usaha perbaikan kurikulum tersebut mesti dilakukan demi
menciptakan perubahan yang lebih baik untuk sistem pendidikan di indonesia.Semakin maju
suatu bangsa maka semakin maju pula ilmu pengetahuan. Oleh karena itu kini diperlukan
pendidikan dengan kurikulum yang mampu menghasilkan generasi penerus bangsa yang
berakhlakul karimah, berketerampilan, dan berpengetahuan yang luas agar mampu bersaing
di dunia internasional.
Kurikulum yang ditetrapkan pada saat ini adalah kurikulum 2013 yang merupakan
perangkat mata pelajaran dan program pendidikan berbasia sains yang diberikan oleh suatu
lembaga penyelenggara pendidikan dengan tujuan untuk mempersiapkan lahirnya generasi
emas bangsa indonesia, dengan sistem dimana siswa lebih aktif dalam kegiatan belajar
mengajar. Titik beratnya, kurikulum 2013 ini bertujuan untuk mendorong peserta didik atau
siswa agar lebih baik dalam melakukan observasi, bertanya, bernalar, dan mempresentasikan
apa yang mereka peroleh atau mereka ketahui setelah meneerima materi pembelajaran.
Adapun obyek yang menjadi pembelajaran dalam penataan dan penyempurnaan kurikulum
2013 menekankan pada fenomena alam, sosial, seni, dan budaya. Berbeda dengan kurikulum
sebelumnya, kurikulum 2013 lebih menekankan pada ketiga aspek, yaitu menghasilkan
peserta didik berakhlak mulia (afektif), berketerampilan (psikomotorik), dan berpengetahuan
(kognitif) yang berkesinambungan. Sehingga diharapkan agar siswa lebih kreatif, inovatif dan
lebih produktif.

Untuk melihat keberhasilan peserta didik dapat dilihat dengan penilaian hasil belajar
oleh pendidik. Penilaian ini memiliki peran antara lain untuk membantu peserta didik
mengetahui ketercapaian pembelajaran (learning outcomes). Berdasarkan penilaian hasil
belajar oleh pendidik, pendidik dan peserta didik dapat memperoleh informasi tentang
kelemahan dan kekuatan pembelajaran dan belajar. Dengan mengetahui kelemahan dan
kekuatannya pendidik dan peserta didik memiliki arah yang jelas mengenai apa yang harus
diperbaiki dan dapat melakukan refleksi mengenai apa yang dilakukannya dalam
pembelajaran dan belajar.Selain itu bagi peserta didikmemungkinkan melakukanproses
transfer cara belajar tadi untuk mengatasi kelemahannya (transfer of learning).
Perubahan paradigma pendidikan dalam kurikulum 2013 dari behavioristik ke
konstruktivistik tidak hanya menuntut adanya perubahan dalam proses pembelajaran, tetapi
juga perubahan dalam melaksanakan penilaian. Dalam paradigma lama, penilaian
pembelajaran lebih ditekankan pada hasil yang cenderung menilai kemampuan aspek
kognitif, dan kadang-kadang direduksi sedemikian rupa melalui bentuk tes seperti pilihan
ganda, benar atau salah, menjodohkan yang telah gagal mengetahui kinerja peserta didik yang
sesungguhnya. Tes tersebut belum bisa mengetahui gambaran yang utuh mengenai sikap,
keterampilan, dan pengetahuan peserta didik dikaitkan dengan kehidupan nyata mereka di
luar sekolah atau masyarakat. Aspek afektif dan psikomotorik juga diabaikan.
Dalam pembelajaran berbasis konstruktivisme, penilaian pembelajaran tidak hanya
ditujukan untuk mengukur tingkat kemampuan kognitif semata, tetapi mencakup seluruh
aspek kepribadian siswa, seperti perkembangan moral, perkembangan emosional,
perkembangan sosial dan aspek-aspek kepribadian individu lainnya. Demikian pula, penilaian
tidak hanya bertumpu pada penilaian produk, tetapi juga mempertimbangkan segi proses.
Dalam makalah ini akan kami bahas lebih lanjut mengenai penilaian dalam kurikulum 2013.

B.RUMUSAN MASALAH
Dari penjelasan latar belakang di atas maka dapat dirumuskan masalah sebagai berikut :
1.

Bagaimana matriks perbandingan evaluasi,penilaian (assesmen),pengukuran dan


testing?

2.

Bagaimana bentuk-bentuk penilaian kurikulum 2013?


2

3.

Bagaimana mekanisme penilaian kurikulum 2013?

4.

Apa fungsi penilaian kurikulum 2103?

5.

Bagaiamana matriks perbandingan validitas dan reabilitas?

6.

Apa pengertian bias dan standar error measurement?

C. TUJUAN PENULISAN
Dari perumusan masalah di atas tujuan penulisan makalah ini sebagai berikut :
1.

Untuk memahami matriks perbandingan evaluasi,penilaian (assesmen),pengukuran


dan testing

2.

Untuk memahami bentuk-bentuk penilaian kurikulum 2013

3.

Untuk memahami mekanisme penilaian kurikulum 2013

4.

Untuk mengetahui fungsi penilaian kurikulum 2103

5.

Untuk memahami matriks perbandingan validitas dan reabilitas

6.

Untuk mengetahui pengertian bias dan standar error measurement

D.MANFAAT PENULISAN
Adapun manfaat dalam pembuatan makalah ini adalah :
1

Dapat dijadikan pengalaman dan bekal ilmu pengetahuan bagi pembaca khususnya untuk

tenaga pendidik kedepannya.


Membantu mahasiswa memahami tentang kurikulum 2013.

BAB II
PEMBAHASAN
A. MATRIKS PERBANDINGAN EVALUASI, PENILAIAN (ASSESMEN), PENGUKURAN, DAN TESTING
Tabel 1. Matriks Perbandingan Evaluasi, Penilaian (Assesmen), Pengukuran, dan Testing
PERBANDI EVALUASI
NGAN
PENGERTIA 1. Daniel L. Stufflebeam dan
N
Anthony J. Shinkfield
MENURUT
(1985) secara singkat
AHLI
merumuskan
evaluasi
sebagai
berikut;
evaluation is the systemic
assessment of the worth or
merit of some objects.
Dengan demikian maka
evaluasi
antara
lain
merupakan
kegiatan
membandingkan
tujuan
dengan hasil dan juga
merupakan
studi
mengkombinasikan
penampilan dengan suatu
nilai tertentu.
2. Robert L. Thordike dan
Elizabeth Hagen (1961)
menjelaskan
evaluasi

PENILAIAN (ASSESMEN)

PENGUKURAN

TESTING

1. Adams
(1964)
dalam 1. Richard
H.Linderman 1. Tes menurut Mehrens dan
bukunya measurement and
(1967)
merumuskan
Lehmann (2003) adalah
evaluation in education,
pengukuran sebagai the
menyatakan
pemberian
psychiology, and guidance
asssigment of one or a set
suatu daftar pertanyaan
menjelaskan bahwa kita
of numbers to each of a set
yang
standar
untuk
mengukur
berbagai
of person or objects
dijawab.
kemampuan anak didik.
according
to
certain 2. tes merupakan alat atau
2. Menurut Djemari Mardapi
prosedur yang digunakan
established rules
(
2008:5)
kualitas 2. Norman
E.
Gronlund
untuk mengetahui atau
pembelajaran dapat dilihat
(1971) secara sederhana
mengukur sesuatu dengan
dari penilaiannya.
merumuskan pengukuran
cara dan aturan yang
3. The
Task
Group
on
sebagai
berikut
sudah
ditentukan.
Assessment and Testing
measurement is limited to
(Sudaryono,2012)
(TGAT)
mendeskripsikan
3.
Sudijono
(2006)
quantitative descriptions of
asesmen sebagai semua cara
menjelaskan test adalah
pupil behavior
yang
digunakan
untuk 3. Georgia S. Adams (1964)
alat atau prosedur yang
menilai unjuk kerja individu
merumuskan pengukuran
dipergunakan
dalam
atau kelompok (Griffin &
sebagai nothing more than
rangka pengukuran dan
Nix, 1991 :3)
careful observations of
penilaian;testing
berarti
4. Groundlund
(1971:6)
actual performance under
saat dilaksanakannya atau
mengungkapkan
bahwa
4

tersebut
dengan
mengatakan
bahwa
evaluasi itu berhubungan
dengan pengukuran.(ilyas :
2006)
3. Menurut Stufflebeam, dkk
(1971)
mendefinisikan
evaluasi
sebagai The
process of delineating,
obtaining, and providing
useful information for
judging
decision
alternatives.
Artinya
evaluasi merupakan proses
menggambarkan,
memperoleh,
dan
menyajikan informasi yang
berguna
untuk
merumuskan
suatu
alternatif keputusan.
4. Viviane dan Gilbert de
Lansheere
(1984)
menyatakan
bahwa
evaluasi adalah proses
penentuan apakah materi
dan metode pembelajaran
telah sesuai dengan tujuan
yang diharapkan.

penilaian
merupakan
standar conditions.
peristiwa berlangsungnya
deskripsi kualitatif dari 4. Victor H, Noll (1975)
pengukuran
dan
mengemukakan
dua
tingkah laku siswa baik
penilaian ; tester artinya
karakteristik
utama
yang didasarkan pada hasil
orang yang melaksanakan
pengukuran,
yaitu
pengukuran (tes) maupun
tes, atau pembuat tes, dan
quantitativeness
dan
bukan hasil pengukuran
testee adalah pihak yang
constancy of units. Atas
(nontes: catatan anekdot,
sedang dikenai tes (peserta
dasar dua karakteristik ini
observasi, wawancara dll).
tes atau peserta ujian).
ia menyatakan since 4. Anne Anastasi (1997)
Menurut
Buana
measurement
is
a
yang dimaksud dengan tes
(www.fajar.co.id/news.php).
quantitative process, result
adalah alat pengukur yang
assessment adalah alihof measurement are always
mempunyai standar yang
bahasa dari istilah penilaian.
expressed
in
numbers.
objektif sehingga dapat
Penilaian digunakan dalam
digunakan secara meluas,
konteks yang lebih sempit 5. William A. Mehrens dan
Irven J. Lehmann (1973)
serta dapat betul-betul
daripada
evaluasi
dan
mendefenisikan
digunakan
untuk
biasanya
dilaksanakan
pengukuran sebagai berikut
mengukur
dan
secara internal. Penilaian
using observation, rating
membandingkan keadaan
atau assessment adalah
scales, or any other divice
psikis atau tingkah laku
kegiatan menentukan nilai
that allows us to obtain
individu.
suatu objek, seperti baikinformation
in
a 5. Lee J. Cronbach (1984),
buruk, efektif-tidak efektif,
quantitative
form
a
tes merupakan prosedur
berhasil-tidak berhasil, dan
measurement.
yang sistematis untuk
semacamnya sesuai dengan
6. Robert L. Ebel dan David
membandingkan tingkah
kriteria atau tolak ukur yang
A.
Frisbie
(1986)
laku dua orang atau lebih.
telah
ditetapkan
merumuskan pengukuran 6. Menurut Riduwan ( 2006:
sebelumnya.
sebagai, measurement is
37) tes sebagai instrumen
Process
of
a signing
pengumpulan data adalah
5

5. Menurut Sridadi (2007)


evaluasi : suatu proses
yang dirancang secara
sistematis dan terencana
dalam
rangka
untuk
membuat
alternatifalternatif keputusan atas
dasar pengukuran dan
penilaian
yang
telah
dilakukan sebelumnya.

numbers to the individual


serangkaian pertanyaan /
members of a set of objects
latihan yang digunakan
or person for the purpose of
untuk
mengukur
indicating
differenciss
ketrampilan pengetahuan,
among them in the degree
intelegensi, kemampuan
to which they process the
atau bakat yang dimiliki
characteristic
being
individu / kelompok.
7. Menurut Rusli Lutan
measured.
7. Gilbert
Sax
(1980)
(2000:21)
tes
adalah
menyatakan

sebuah instrument yang


measurement
The
dipakai untuk memperoleh
assignment of numbers to
informasi
tentang
attributes of characteristic
seseorang atau obyek. Tes
of person, event, or objects
adalah cara penilaian yang
accorting
to
explicit
dirancang
dan
formulations or rules.
dilaksanakan
kepada
8. Pengukuran (measurement)
peserta didik pada waktu
merupakan suatu deskripsi
dan
tempat
kuantitatif tentang keadaan
tertentu serta dalam
suatu hal sebagaimana
kondisi yang memenuhi
adanya,
atau
tentang
syarat-syarat tertentu yang
perilaku yang tampak pada
jelas.
seseorang, atau tentang
prestasi yang diberikan
oleh seorang siswa.
9. Popham
(1995)
menyatakan
bahwa
pengukuran
dalam
6

pendidikan
hanyalah
sekedar penemuan derajat
yang
dimiliki
oleh
seseorang mengenai suatu
cirri tertentu.
10. Menurut Guilford (1983)
pengukuran adalah proses
penetapan angka terhadap
suatu gejala menurut aturan
tertentu.(Eko:2009)
evaluasi lebih ditekankan
pada hasil belajar.
evaluasi
menurut
Rustaman
(2003) lebih berpihak
kepada kepentingan
evaluator.
Yulaelawati
(2004)
mengungkapkan
bahwa
terdapat
perbedaan
antara
evaluasi
dengan
asesmen.
Evaluasi
(evaluation)
merupakan penilaian
program pendidikan

1Rustaman
(2003)
mengungkapkan
bahwa
asesmen lebih ditekankan pada
penilaian proses.
menurut
Stiggins
(1993)
2asesmen
lebih
berpihak
kepada kepentingan siswa.
Siswa
dalam
hal
ini
menggunakan hasil asesmen
untuk merefleksikan kekuatan,
kelemahan, dan perbaikan
belajar.
asesmen
merupakan
penilaian
dalam scope yang lebih
sempit (lebih mikro)
bila
dibandingkan
dengan evaluasi. Seperti
7

secara
menyeluruh.
Evaluasi pendidikan
lebih bersifat makro,
meluas,
dan
menyeluruh. Evaluasi
program
menelaah
komponen-komponen
yang saling berkaitan
tentang perencanaan,
pelaksanaan,
dan
pemantauan.
Evaluasi
dinyatakan
menggunakan kriteria
dan metode yang
bervariasi. Asesmen
dalam hal ini hanya
merupakan salah satu
dari metode yang
dipilih untuk evaluasi
tersebut.
subyek
evaluasi lebih luas
dan beragam seperti
siswa, guru, materi,
organisasi
Ruang
lingkup evaluasi yang

dikemukakan
oleh
Kumano
(2001)
asesmen
hanya
menyangkut kompetensi
siswa dan perbaikan
program pembelajaran.
, subyek untuk
asesmen hanya siswa,
Yulaelawati
(2004)
menekankan
kembali bahwa scope
asesmen
hanya
mencakup kompetensi
lulusan dan perbaikan
cara belajar siswa. Jadi
hubungannya lebih pada
peserta didik.

lebih luas ditunjukkan


dengan cakupannya
yang meliputi isi atau
substansi,
proses
pelaksanaan program
pendidikan,
kompetensi lulusan,
pengadaan
dan
peningkatan
tenaga
kependidikan,
manajemen
pendidikan,
sarana
dan prasarana, dan
pembiayaan.

PENGERTIA Kegiatan yang meliputi dua


N
unsur yaitu pengukuran dan
penilaian.
PROSES
Pengambilan
keputusan
terhadap
hasil
penilaian
lulus/tidak
HASIL
Keputusan atau Justifikasi
KRITERIA

. Kriteria Evaluasi
1.
Evaluasi
adalah
suatu proses bukan
suatu hasil ( produk ).

Mengambil keputusan terhadap


sesuatu dengan ukuran baik
atau buruk.
Pemberian atribut terhadap
hasil pengukuran
Deskripsi
Bersifat kualitatif
Kkriteria Penilaian

Proses untuk menentukan Alat ukur untuk mengukur


kuantitas
sesuatu
yang kemampuan seseorang
menghasilkan angka.
Membandingkan hasil tes Testing
dengan standar ukuran tertentu

Angka atau skor


Hasil tes atau lembar kerja
Bersifat kuantitat
2. Kriteria Pengukuran
1. Kriteria Tes yang Baik

Pengukuran harus
Validitas (Ketepatan);
Penilaian dilakuakn
jelas parameternya.
Suatu alat pengukur
selama dan sesudah

Memiliki sasaran
dapat dikatakan alat
9

2.

3.

Hasil yang diperoleh


dari kegiatan evaluasi
adalah
kualitas
sesuatu, baik yang
menyangkut tentang
nilai
atau
arti,
sedangkan kegiatan
untuk sampai pada
pemberian nilai dan
arti
itu
adalah
evaluasi. Membahas
tentang
evaluasi
berarti mempelajari
bagaimana
proses
pemberian
pertimbangan
mengenai
kualitas
sesuatu.
Tujuan
evaluasi
adalah
untuk
menentukan kualitas
sesuatu,
terutama
yang
berkenaan
dengan nilai dan
arti.
Dalam
proses
evaluasi harus ada
pemberian

proses
pembelajaran
berlangsung
Aspek yang diukur
adalah keterampilan dan
performasi,
bukan
mengingat fakta apakah
peserta didik belajar?
Atau apa yang sudah
diketahui peserta didik?
Penilaian dilakukan
secara
berkelanjutan,
yaitudilakukan dalam
beberapa tahapan dan
periodik, sesuai dengan
tahapan waktu dan
bahasanya, baik dalam
bentuk formatif maupun
sumatif.
Penilaian dilakukan
secara integral, yaitu
menilai berbagai aspek
pengetahuan, sikap, dan
keterampilan
peserta
didik
sebagai
satu
kesatuan utuh.

Hasil
penilain
digunakan
sebagai feedback, yaitu
10

yang terukur

Mudah dipahami
cara pengkurannya.

Dapat
diukur
setiap
waktu
dan
simple.

pengukur yang valid


apabila alat pengukur
tersebut
dapat
mengukur apa yang
hendak diukur secara
tepat.
Reliabilitas merujuk
pada konsistensi skor
yang dicapai oleh
orang yang sama
ketika diuji ulang
dengan tes yang sama
pada kesepatan yang
berbeda, atau dengan
seperangkat butir-butir
ekuivalen
yang
berbeda, atau pada
kondisi
pengujian
yang berbeda
Objektivitas;
Suatu
tes dikatakan obyektif
jika
tes
tersebut
diajukan
kepada
beberapa
penilai,
tetapi
memberikan
skor yang sama, untuk
disiapkan
kunci
jawaban
(scorring

pertimbangan
( judgement )
yang
merupakan
konsep
dasar dari evaluasi.
Melalui pertimbangan
inilah ditentukan nilai
dan arti / makna dari
sesuatu
yang
dievaluasi.
4.
Pemberian
pertimbangan tentang
nilai dan arti haruslah
berdasarkan kriteria
tertentu.
Tanpa
kriteria yang jelas,
pertimbangan
nilai
dan
arti
yang
diberikan
bukanlah
suatu proses yang
dapat diklasifikasikan
sebagai
evaluasi.
Kriteria ini penting
dibuat oleh evaluator
dengan pertimbangan:

Hasil
evaluasi
dapat
dipertanggungjawabk
an secara ilmiah.

untuk
keperluan
pengayaan (enrichment)
standart minimal telah
tercapai atau mengulang
(remedial) jika standart
minimal belum tercapai.

11

key).
Memiliki
discrimination power
(daya pembeda); Tes
yang dikatakan baik
apabila
mampu
membedakan
anak
yang pandai dan anak
yang bodoh.
Mencakup
ruang
lingkup (scope) yang
sangat
luas
dan
menyeluruh; Tes yang
baik harus memiliki
komphrehensi veenes,
ini akan menyisihkan
siswa
yang
berspekulasi
dalam
menempuh tes.
Praktis; mencakup :
o Mudah
dipakai/
diperiksa
o Hemat biaya
o Mudah
diadministrasikan
o Tidak
menyulitkan
guru dan sekolah.

Evaluator lebih
percaya diri.

Menghindari
adanya
unsur
subjektivitas.

Memungkinkan
hasil evaluasi akan
sama,
sekalipun
dilakukan pada waktu
dan
orang
yang
berbeda.

Memberikan
kemudahan
bagi
evaluator
dalam
melakukan penafsiran
hasil evaluasi.

1.

Berdasarkan pengertian di atas penulis menyimpulkan bahwa penilaian adalah suatu proses untuk mengambil keputusan dengan
menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes. Pengukuran adalah
membandingkan hasil tes dengan standar yang ditetapkan. Pengukuran bersifat kuantitatif. Sedangkan menilai adalah kegiatan mengukur
dan mengadakan estimasi terhadap hasil pengukuran atau membanding-bandingkan dan tidak sampai ke taraf pengambilan
keputusan.Penilaian bersifat kualitatif.
Agar lebih jelas perbedaannya maka perlu dispesifikasi lagi untuk pengertian masing-masing :
Evaluasi pembelajaran adalah suatu proses atau kegiatan untuk menentukan nilai, kriteria-judgment atau tindakan dalam pembelajaran.

12

2.

Penilaian dalam pembelajaran adalah suatu usaha untuk mendapatkan berbagai informasi secara berkala, berkesinambungan, dan
menyeluruh tentang proses dan hasil dari pertumbuhan dan perkembangan yang telah dicapai oleh anak didik melalui program kegiatan
belajar.
3. Pengukuran atau measurement merupakan suatu proses atau kegiatan untuk menentukan kuantitas sesuatu yang bersifat numerik.
Pengukuran lebih bersifat kuantitatif, bahkan merupakan instrumen untuk melakukan penilaian. Dalam dunia pendidikan, yang dimaksud
pengukuran sebagaimana disampaikan Cangelosi (1995: 21) adalah proses pengumpulan data melalui pengamatan empiris.

13

Gambar 1. Diagram hubungan Tes, Testing, Pengukuran, Penilaian, dan Evaluasi

Gambar 2. Kedudukan istilah Evaluasi, Penilaian, Pengukuran, Asesmen, dan Tes


B. BENTUK DAN JENIS PENILAIAN (ASSESMEN)
1. Teknik Asesmen Proses dan Hasil Belajar
Untuk mengumpulkan informasi tentang kemajuan belajar siswa dapat dilakukan
dengan teknik tes maupun non tes, baik untuk mengases proses belajar maupun hasil belajar.
Teknik mengumpulkan informasi tersebut pada prinsipnya adalah cara asesmen kemajuan
belajar peserta didik terhadap pencapaian standar kompetensi dan kompetensi dasar. Asesmen
suatu kompetensi dasar dilakukan berdasarkan indikator-indikator pencapaian hasil belajar,
baik berupa domain kognitif, afektif, maupun psikomotor. Setidaknya ada tujuh ragam teknik

12

yang dapat digunakan, yaitu penilaian unjuk kerja, penilaian sikap, penilaian tertulis,
penilaian proyek, penilaian produk, penggunaan portofolio, dan penilaian diri.

13

Tabel 2. Bentuk-Bentuk Penilaian

Unjuk Kerja

Penugasan

Portofolio

Penilaian
Sikap.

Teknik Tes

Asesmen
Produk

Asesmen diri Jurnal


(self
assessment)

Penilaian
antar teman

Penilaian unjuk
kerja
(Performance
assessment atau
performancebased
assessment)
merupakan jenis
penilaian yang
memberikan
kesempatan
kepada
para
siswa
untuk
mendemonstrasi
kan
pengetahuan,
dan
keterampilan
yang
mereka

Penugasan
adalah
penilaian yang
berbentuk
pemberian
tugas
yang
mengandung
penyelidikan
(investigasi)
yang
harus
selesai dalam
waktu tertentu.
Penyelidikan
tersebut
dilaksanakan
secara
bertahap yakni
perencanaan,
pengumpulan

Portofolio
merupakan
penilaian
berkelanjutan
yang
didasarkan
pada
kumpulan
informasi
yang
menunjukkan
perkembanga
n kemampuan
peserta didik
dalam
satu
periode
tertentu.
Informasi
tersebut dapat

Sikap bermula
dari perasaan
(suka
atau
tidak
suka)
yang terkait
dengan
kecenderunga
n
seseorang
dalam
merespon
sesuatu/objek.
Sikap
dapat
dibentuk,
sehingga
terjadinya
perilaku atau
tindakan yang
diinginkan.
Sikap terdiri

Teknik
tes
meliputi tes
lisan,
tes
tertulis dan
tes perbuatan.
Khusus
tes
tertulis,
ragamnya
meliputi
:
tes essay ata
u disebut juga
tes subyektif
dan
tes
obyektif,
yang terdiri
dari tes isian,
salah-benar,
menjodohkan
dan pilihan

Asesmen
produk
merupakan
ragam
penilaian
untuk menilai
kemampuan
siswa dalam
membuat
produk
tertentu,
seperti
:
teknologi tepat
guna,
karya
seni, keramik,
lukisan
dan
lain-lain.
Asesmen
produk dapat

Asesmen diri
adalah suatu
teknik
penilaian
dimana siswa
diminta untuk
menilai
dirinya
sendiri
berkaitan
dengan
status, proses
dan tingkat
pencapaian
kompetensi
yang
dipelajarinya
dalam mata
pelajaran

Penilaian
antar teman
merupakan
teknik
penilaian
dengan cara
meminta
peserta didik
untuk
mengemukak
an kelebihan
dan
kekurangan
temannya
dalam
berbagai hal,
Untuk itu ada
pedoman
penilaian

13

Jurnal
merupakan
catatan
pendidik
selama proses
pembelajaran
yang berisi
informasi
kekuatan dan
kelemahan
peserta didik
yang berkait
dengan
kinerja sikap
peserta didik
yang
dipaparkan
secara
deskriptif

miliki
dalam
berbagai
konteks. Seperti
berbicara,
berpidato,
membaca puisi,
dan berdiskusi;
kemampuan
peserta
didik
dalam
memecahkan
masalah dalam
kelompok;
partisipasi
peserta
didik
dalam diskusi;
ketrampilan
menari;
ketrampilan
memainkan alat
musik;
kemampuan
berolah
raga;
ketrampilan
menggunakan
peralatan
laboratorium;

data,
pengolahan
data,
dan
penyajian data.
Penilaian
penugasan ini
bermanfaat
untuk menilai
keterampilan
menyelidiki
secara umum,
pemahaman
dan
pengetahuan
dalam bidang
tertentu,
kemampuan
mengaplikasi
pengetahuan
dalam
suatu
penyelidikan,
dan
kemampuan
menginformasi
kan
subjek
secara
jelas.
Penugasan

berupa karya
peserta didik
dari
proses
pembelajaran
yang
dianggap
terbaik oleh
peserta didik,
pekerjaanpekerjaan
yang sedang
dilakukan,
beberapa
contoh
tes
yang
telah
selesai
dilakukan,
berbagai
keteranganketerangan
yang
diperoleh
peserta didik,
keselarasan
antara
pembelajaran
dan
tujuan

dari
tiga
komponen,
yakni: afektif,
kognitif, dan
konatif.
Komponen
afektif adalah
perasaan yang
dimiliki oleh
seseorang atau
penilaiannya
terhadap
sesuatu objek.
Komponen
kognitif adalah
kepercayaan
atau keyakinan
seseorang
mengenai
objek. Adapun
komponen
konatif adalah
kecenderunga
n
untuk
berperilaku
atau berbuat
dengan cara-

ganda.

digunakan
untuk menilai
Tes
essay proses maupun
atau
tes hasil belajar
uraian adalah siswa.
bentuk
tes
berupa soal- Pengembanga
soal
yang n
produk
masingmeliputi tiga
masing
tahap,
yaitu
mengandung tahap
permasalahan persiapan,
dan menuntut tahap
penguaraian
pembuatan
sebagai
produk
dan
jawabannya.
tahap penilaian
Materi
tes produk.
yang dipilih
adalah materi
yang
sekiranya
cocok untuk
tes essay. Tes
ini dibedakan
menjadi
2
yaitu:
tes
uraian
14

tertentu
didasarkan
atas kriteria
yang
telah
ditetapkan.
Tujuan utama
asesmen diri
adalah untuk
mendukung
atau
memperbaiki
proses
pembelajaran
.
Ada
beberapa
jenis asesmen
diri,
diantaranya
adalah : a)
penilaian
langsung dan
spesifik, yaitu
penilaian
langsung
pada saat atau
setelah siswa
melakukan

antarteman
yang memuat
indicator
perilaku yang
dinilai.

praktek sholat,
bermain peran,
bernyanyi, dan
ketrampilan
mengoperasikan
suatu alat.

dapat
dilakukan
secara
individual
maupun
kelompok.

spesifik yang
telah
dirumuskan,
contoh-contoh
hasil
pekerjaannya
sehari-hari,
evaluasi diri
terhadap
perkembanga
n
pembelajaran
dan
hasil
observasi
guru.

cara tertentu
berkenaan
dengan
kehadiran
objek sikap.
Secara umum,
objek
sikap
yang
perlu
dinilai dalam
proses
pembelajaran
berbagai mata
pelajaran
adalah sebagai
berikut. Sikap
terhadap
materi
pelajaran,
sikap terhadap
guru/pengajar,
sikap terhadap
proses
pembelajaran,
sikap
berkaitan
dengan nilai
atau
norma

jawaban
singkat yaitu
tes
yang
meminta
jawaban
panjangnya
sekitar satu
dua kalimat
dan tes uraian
jawaban
luas/panjang.
Tes obyektif
terdiri
dari
pertanyaanpertanyaan
atau
pernyataanpernyataan
yang
harus
dijawab atau
dipilih
dari
beberapa
alternatif
jawaban
dengan cara
menulisnya,
15

tugas
tertentu, b)
penilaian
tidak
langsung dan
holistik, yaitu
penilaian
yang
dilakukan
dalam kurun
waktu yang
panjang,
misalnya satu
semester
untuk
memberikan
penilaian
secara
keseluruhan,
dan
c)
penilaian
sosia-afektif,
yaitu
penilaian
terhadap
unsur-unsur
afektif atau

yang
berhubungan
dengan suatu
materi
pelajaran.
Asesmen
sikap
dapat
dilakukan
dengan
beberapa cara
antara
lain:
observasi
perilaku,
pertanyaan
langsung, dan
laporan
pribadi, daftar
chek,
skala
sikap,
buku
harian, angket,
ungkapan
perasaan,
catatan
anekdot, dan
lain lain.

atau mengisi
jawaban
pendek tanpa
menguraikan.
Tes
ini
disebut
obyektif
karena skor
yang
diberikan
relatif tidak
dipengaruhi
oleh
faktor
subyektif
penilai.
Ragam
tes
obyektif
meliputi tes
isian
(Completion
Test),
Tes
Salah-Benar
(True False
Test),
Tes
Menjodohkan
(Matching
Test), dan Tes
16

emosional.
Misalnya
siswa diminta
untuk
membuat
tulisan yang
memuat
curahan
perasaannya
terhadap
obyek
tertentu.

Pilihan
Ganda
(Multiple
Choice Test).

Tabel 3. Contoh Instrumen penilaian unjuk kerja dalam mengukur volume air dengan menggunakan gelas ukur

No.

Aspek yang dinilai

Skor
4

Gelas ukur diletakkan di atas tempat yang datar,


skala menghadap pengamat

Menuang air ke dalam gelas ukur sampai hampir


mencapai 100 ml, penuangan dihentikan.

Volume air ditambah setetes demi setetes


menggunakan pipet sampai mencapai 100 ml.

17

Permukaan air didalam gelas dibaca dengan posisi


sejajar mata.

Hasil pengukuran dicatat dengan benar.

18

Berilah skor:
4 bila aspek tersebut dilakukan dengan benar dan cepat
3 bila aspek tersebut dilakukan dengan benar tapi lama
2 bila aspek tersebut dilakukan selesai tapi salah
1 bila dilakukan tapi tidak selesai

Penilaian Autentik dalam Pembelajaran Fisika


Penilaian autentik memiliki relevansi kuat terhadap pendekatan ilmiah (scientific
approach) dalam pembelajaran sesuai dengan tuntutan Kurikulum 2013. Karena penilaian
semacam ini mampu menggambarkan peningkatan hasil belajar peserta didik, baik dalam
rangka mengobservasi, menalar, mencoba, membangun jejaring, dan lain-lain. Penilaian
autentik cenderung fokus pada tugas-tugas kompleks atau kontekstual, memungkinkan
peserta didik untuk menunjukkan kompetensi mereka yang meliputi sikap, pengetahuan, dan
keterampilan.
Penilaian autentik adalah penilaian kinerja, termasuk di dalamnya penilaian
portofolio dan penilaian proyek. Penilaian autentik disebut juga penilaian responsif, suatu
metode untuk menilai proses dan hasil belajar peserta didik yang memiliki ciri-ciri khusus,
mulai dari mereka yang mengalami kelainan tertentu, memiliki bakat dan minat khusus,
hingga yang jenius. Penilaian autentik dapat diterapkan dalam berbagai bidang ilmu seperti
seni atau ilmu pengetahuan pada umumnya, dengan orientasi utamanya pada proses dan hasil
pembelajaran. Hasil penilaian autentik dapat digunakan oleh pendidik untuk merencanakan
program perbaikan (remedial), pengayaan (enrichment), atau pelayanan konseling. Selain itu,
hasil penilaian autentik dapat digunakan sebagai bahan untuk memperbaiki proses
pembelajaran. Penilaian autentik merupakan penilaian yang dilakukan secara komprehensif
untuk menilai mulai dari masukan (input), proses, dan keluaran (output) pembelajaran
mencakup sikap, pengetahuan, dan keterampilan. Penilaian sikap dilakukan melalui
observasi/pengamatan,

jurnal, penilaian diri, dan/atau penilaian antar teman. Penilaian

pengetahuan melalui tes tertulis, tes lisan, dan/atau penugasan. Penilaian keterampilan
melalui tes praktik, penilaian proyek, dan penilaian portofolio.
Q.S.Az-Zumar ayat 33.
18

()

Artinya:
33. dan orang yang membawa kebenaran (Muhammad) dan membenarkannya, mereka Itulah
orang-orang yang bertakwa.
(http://quran.0pick.com/iframe/?sid=9&aid=119&pid=arabicid)

Penilaian autentik tersebut dapat dijabarkan sebagai berikut;


1.

Penilaian Aspek Sikap


Penilaian sikap dilakukan melalui pengamatan, jurnal, penilaian diri, dan penilaian antar
teman.
a. Pengamatan dapat menggunakan lembar pengamatan dalam bentuk ceklis atau skala
likert, dilakukan selama aktivitas pembelajaran berlangsung(dimulai pada kegiatan
pendahuluan sampai kegiatan penutup).

(Permendikbud No.104)
b. Jurnal adalah catatan guru yang sistematis di dalam dan di luar kelas yang berisi
informasi hasil pengamatan tentang kekuatan dan kelemahan peserta didik berkaitan
dengan sikap dan perilaku.Jurnal dapat memuat penilaian peserta didik terhadap
aspek tertentu secara kronologis.

(Permendikbud No.104)

19

c. Penilaian-diri (self-assessment) termasuk dalam rumpun penilaian kinerja. Penilaian


diri merupakan suatu teknik penilaian di mana peserta didik diminta untuk menilai
dirinya sendiri berkaitan dengan status, proses dan tingkat pencapaian kompetensi
yang dipelajarinya dalam mata pelajaran tertentu. Teknik penilaian diri dapat
digunakan untuk mengukur kompetensi kognitif, afektif dan psikomotor. Penilaian
ranah sikap misalnya, peserta didik diminta mengungkapkan curahan perasaannya
terhadap suatu objek tertentu berdasarkan kriteria atau acuan yang telah disiapkan;
Penilaian ranah keterampilan misalnya, peserta didik diminta untuk menilai
kecakapan atau keterampilan yang telah dikuasainya oleh dirinya berdasarkan kriteria
atau acuan yang telah disiapkan; Penilaian ranah pengetahuan misalnya, peserta didik
diminta untuk menilai penguasaan pengetahuan dan keterampilan berpikir sebagai
hasil belajar dari suatu mata pelajaran tertentu berdasarkan atas kriteria atau acuan
yang telah disiapkan. Penilaian diri dilakukan sebelum dilaksanakan ulangan harian.

20

(Permendikbud No.104)
d. Penilaian antar teman adalah penilaian yang dilakukan terhadap sikap seorang
peserta didik oleh seorang (atau lebih) peserta didik lainnya dalam suatu kelas atau
rombongan belajar.Penilaian ini merupakan bentuk penilaian untuk melatih peserta
didik penilai menjadi pembelajar yang baik.Instrumen sesuai dengan kompetensi dan
indikator yang akan diukur.

21

(Permendikbud No.104)
2.

Penilaian Aspek Pengetahuan


Kompetensi siswa pada aspek pengetahuan dapat diukur melalui tes dan nontes. Bentuk
tes yang digunakan antara lain adalah tes tertulis (uraian, pilihan ganda, isian, benar salah,
dll), tes lisan, dan/atau tes praktik. Sedangkan, bentuk nontes dapat dilakukan melalui
tugas-tugas yang diberikan, baik tugas menjawab soal, atau tugas membuat laporan
tertulis.
a. Tes Tulis
Penilaian tertulis atas hasil pembelajaran tetap lazim dilakukan.Testertulis terdiri dari
memilih atau mensuplai jawaban dan uraian.Memilih jawaban terdiri dari pilihan
ganda, pilihan benar-salah, ya-tidak, menjodohkan, dan sebab-akibat.Mengisijawaban
terdiri dari isian atau melengkapi, jawaban singkat atau pendek, dan uraian.
b. Tes Lisan
Tes lisan adalah tes yang menuntut siswa memberikan jawaban secara
lisan.Pelaksanaan Tes lisan dilakukan dengan mengadakan tanya jawab secara
langsung antara pendidik dan peserta didik.
c. Penugasan.
22

Instrumen penugasan dapat berupa pekerjaan rumah dan/atau proyek yang harus
dikerjakan oleh peserta didik, baik secara individu atau kelompok, sesuai dengan
karakteristik tugas.
3.

Penilaian Aspek Keterampilan


Penilaian aspek keterampilan dapat dilakukan melalui tes praktik, proyek, atau
portofolio.
a. Tes Praktik
Tes praktik

dilakukan dengan

mengamati kegiatan peserta didik dalam

melakukan sesuatu. Penilaian digunakan untuk menilai ketercapaian kompetensi yang


menuntut peserta didik melakukan tugas tertentu seperti: praktik di laboratorium,
praktik salat, praktik olahraga, bermain peran, memainkan alat musik, bernyanyi,
membaca puisi/deklamasi, dan sebagainya. (Direktorat Pembinaan SMA-Ditjen
Pendidikan Menengah, 2014: 9-13)
b. Penilaian Proyek
Penilaian proyek (project assessment) merupakan kegiatan penilaian terhadap
tugas yang harus diselesaikan oleh peserta didik menurut periode/waktu tertentu.
Penyelesaian tugas dimaksud berupa investigasi yang dilakukan oleh peserta didik,
mulai dari perencanaan, pengumpulan data, pengorganisasian, pengolahan, analisis,
dan penyajian data.Dengan demikian, penilaian proyekbersentuhan dengan aspek
pemahaman, mengaplikasikan, penyelidikan, dan lain-lain.
c. Penilaian Portofolio
Penilaian

portofolio

merupakan

penilaian

atas

kumpulan artefak yang

menunjukkan kemajuan dan dihargai sebagai hasil kerja dari dunia nyata.Penilaian
portofolio bisa berangkat dari hasil kerja peserta didik secara perorangan atau
diproduksi secara berkelompok, memerlukan refleksi peserta didik, dan dievaluasi
berdasarkan beberapa dimensi. Memalui penilaian portofolio guru akan mengetahui
perkembangan atau kemajuan belajar peserta didik.
Penilaian portofolio dalam kurikulum 2013 harus dilakukan secara utuh dan
berkesinambungan, serta mencakup seluruh kompetensi inti yang dikembangkan.
(Mulyasa, 2014: 148).

23

2. Prosedur asesmen proses dan hasil belajar


Prosedur asesmen proses dan hasil belajar meliputi penetapan indikator pencapaian
kompetensi, penetapan kriteria ketuntasan belajar, pemetaan standar kompetensi, kompetensi
dasar dan indikator, dan penetapan teknik asesmen.
3. Penetapan Indikator Pencapaian Kompetensi
Indikator merupakan ukuran, karakteristik, ciri-ciri, perbuatan atau proses yang
berkontribusi/menunjukkan ketercapaian suatu kompetensi dasar. Indikator pencapaian
kompetensi dirumuskan dengan menggunakan kata kerja operasional yang dapat diukur,
seperti: mengidentifikasi, menghitung, membedakan, menyimpulkan, menceritakan kembali,
mempraktekkan, mendemonstrasikan, dan mendeskripsikan.
Indikator pencapaian kompetensi dikembangkan oleh guru dengan memperhatikan
perkembangan dan kemampuan peserta didik. Setiap kompetensi dasar dapat dikembangkan
menjadi dua atau lebih indikator pencapaian kompetensi. Hal ini sesuai dengan keluasan dan
kedalaman kompetensi dasar yang terkait. Indikator pencapaian kompetensi, yang menjadi
bagian dari silabus, dijadikan acuan dalam merancang penilaian.
Berikut contoh pengembangan indikator mata pelajaran Pendidikan Jasmani, Olah Raga dan
Kesehatan tingkat SMA kelas X/1.

Kompetensi inti

Kompetensi Dasar

Indikator Pencapaian

Mempraktikkan
Mempraktikkan
1. Melakukan 2 jenis
keterampilan rangkaian
serangkaian senam lantai rangkaian gerak senam
senam lantai dan nilai yang tanpa alat serta niali
lantai dengan percaya diri
terkandung di dalamnya
percaya diri, kerjasama dan
2. Menjelaskan nilai yang
tanggung jawab
terkandung dalam
rangkaian gerakan senam
3. dst.

4. Penetapan Kriteria Ketuntasan Belajar

24

Penentuan kriteria ketuntasan belajar (KKB) untuk masing-masing indikator dalam suatu
kompetensi dasar (KD) dilakukan dengan mempertimbangkan kondisi sekolah, yakni: tingkat
kemampuan rata-rata siswa, kompleksitas kompetensi, serta kemampuan sumber daya
pendukung dalam penyelenggaraan pembelajaran.
Berikut contoh penetapan KKB untuk masing-masing indikator.

Kompleksitas kompetensi
Sedang

=2

Rendah

=3

Sumber daya pendukung


Sedang

=2

Rendah

=1

Kemampuan Akademis
Sedang

=2

Rendah

=1

: Tinggi

: Tinggi

: Tinggi

=1

=3

=3

Jika kondisi indikator 1 (pada tabel di bawah) : kompleksitas rendah, daya dukung tinggi dan
tingkat kemampuan akademis siswa sedang, maka kriteria ketuntasan belajar menjadi :
(3 + 3 + 2) x 100 = 88.89 %
9
Kriteria
ketuntasan
belajar (%)

Kondisi sekolah
KI dan Indikator
Kompleksitas Daya dukung Kemampuan
akademis
Menganalisis atmosfer dan
dampaknya terhadap kehidupan

25

88.89 %

di muka bumi
1. Mengidentifikasi ciri-ciri
lapisan atmosfer dan
pemanfaatannya
2.

5. Pemetaan Standar Kompetensi, Kompetensi Dasar, dan Indikator


Pemetaan standar kompetensi dilakukan untuk memudahkan guru dalam menentukan teknik
penilaian. Berikut contoh pemetaan untuk mata pelajaran bahasa Inggris.

Krit
N
o

Aspek

Standar Kompetensi

Kompete
nsi Dasar

Indikator

Te Un- Pr
Ketunta
s kerj osan
a du
k

1 Mendengar Kemampuan
Merespon Merespons75 %
kan
memahami maknas
sapaan orang
dalam
tekspercakapa yang
percakapan,
n
belum/sudah
transaksional/interpe transaksio dikenal
rsonal,
sangatnal (to get
Merespons
sederhana
untukthings
berinteraksi dengandone) danperkenalan
lingkungan terdekat interperso diri
nal untuksendiri/orang
bersosiali lain
sasi lisan
75 %
Merespons
secara
akurat, perintah/lara
ngan
lancar
dan
bertema,d
st
26

Teknik/ragam
asesmen
Pr Portofo
o- lio
ye
k

70 %

2 Berbicara Dst

Dst

dst

3 Membaca

Dst

dst

4 Menulis

Dst

dst

6. Penetapan Teknik Asesmen


Dalam memilih teknik asesmen mempertimbangkan ciri indikator, contoh :
1. Apabila tuntutan indikator melakukan sesuatu, maka teknik penilaiannya adalah unjuk
kerja (performance).
2. Apabila tuntutan indikator berkaitan dengan pemahaman konsep, maka teknik
penilaiannya adalah tertulis.
3. Apabila tuntutan indikator memuat unsur penyelidikan, maka teknik penilaiannya
adalah proyek.
C. FUNGSI PENILAIAN
1.
2.
3.
4.

5.

Fungsi dari penilaian menurut Nana Sudjana, (1995: 4)adalah sebagai berikut :
Alat untuk mengetahui tercapai tidaknya tujuan intruksional. Dengan demikian penilaian
harus mengacu pada rumusan-rumusan tujuan intruksional.
Umpan balik bagi perbaikan proses belajar mengajar.
Perbaikan mungkin dilakukan dalam hal tujuan intruksional, kegiatan belajar siswa,
strategi mengajar guru dan lain-lain.
Dasar dalam menyusun laporan kemajuan belajar siswa kepada para orang tua. Dalam
laporan tersebut dikemukakan kemampuan dan kecakapan belajar siswa dalam berbagai
bidang studi dalam bentuk nilai-nilai prestasi yang dicapainya.
Penilaian di sini berfungsi sebagai alat untuk mengetahui seberapa berhasilkah proses
belajar mengajar yang terjadi. Selain itu juga sebagai perbaikan dalam melakukan proses
belajar mengajar yang dilakukan oleh guru dan siswa. Dan juga sebagai laporan kemauan
belajar siswa yang diberikan kepada orang tua agar orang tuanya mengetahui hasil belajar
anaknya dalam bentuk raport yang biasanya diberikan pada akhir semester.
27

Fungsi penilaian yang lainnya di sini bukan hanya untuk menentukan kemajuan belajar
siswa, tetapi sangat luas. Fungsi penilaian adalah sebagai berikut:
6. Penilaian membantu siswa merealisasikan dirinya untuk mengubah atau mengembangkan
perilakunya.
7. Penilaian membantu siswa mendapat kepuasan atas apa yang telah dikerjakannya.
8. Penilaian membantu guru untuk menetapkan apakah metode mengajar yang digunakannya
telah memadai.
9. Penilaian membantu guru membuat pertimbangan administrasi. (Cronbach, 1954 dalam
Hamalik, 2002: 204). (Dikmenum:2010)
Menurut Eko (2009) fungsi penilaian dalam pendidikan adalah :
10. Dasar mengadakan seleksi
11. Dasar penempatan
12. Diagnostik
13. Umpan balik
14. Menumbuhkan motivasi belajar dan mengajar
15. Perbaikan kurikulum dan program pendidikan
16. Pengembangan ilmu

Penilaian Hasil Belajar oleh pendidik memiliki fungsi untuk memantau kemajuan
belajar, memantau hasil belajar, dan mendeteksi kebutuhan perbaikan hasil belajar peserta
didik secara berkesinambungan. Berdasarkan fungsinya penilaian hasil belajar oleh pendidik
meliputi:
1.

Formatif yaitu memperbaiki kekurangan hasil belajar peserta didik dalam sikap,
pengetahuan, dan keterampilan pada setiap kegiatan penilaian selama proses
pembelajaran dalam satu semester, sesuai dengan prinsip Kurikulum 2013 agar peserta
didik tahu, mampu dan mau. Hasil dari kajian terhadap kekurangan peserta didik
digunakan untuk memberikan pembelajaran remedial dan perbaikan RPP serta proses
pembelajaran yang dikembangkan guru untuk pertemuan berikutnya;
2.
Sumatif yaitu menentukan keberhasilan belajar peserta didik pada akhir suatu
semester, satu tahun pembelajaran, atau masa pendidikan di satuan pendidikan. Hasil dari
penentuan keberhasilan ini digunakan untuk menentukan nilai rapor, kenaikan kelas dan
keberhasilan belajar satuan pendidikan seorang peserta didik.

Tujuan dari penilaian adalah sebagai berikut:


1.

Mengetahui tingkat penguasaan kompetensi dalam sikap, pengetahuan, dan


keterampilan yang sudah dan belum dikuasai seorang/sekelompok peserta didik untuk
ditingkatkan dalam pembelajaran remedial dan pengayaan.
2.
Menetapkan program perbaikan atau pengayaan berdasarkan tingkat penguasaan
kompetensi bagi mereka yang diidentifikasi sebagai peserta didik yang lambat atau cepat
dalam belajar dan pencapaian hasil belajar.
3.
Menetapkan ketuntasan penguasaan kompetensi belajar peserta didik ditetapkan
harian, satu semesteran, satu tahunan, dan masa studi satuan pendidikan.
28

4.
5.

Memperbaiki proses pembelajaran pada pertemuan dan/atau semester berikutnya.


Memetakan mutu satuan pendidikan.

29

D. VALIDITAS DAN REABILITAS


MATRIKS PERBEDAAN JENIS-JENIS VALIDITAS
Pengertian

Jenis-Jenis Validitas

Azwar (1986) Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan
suatu alat ukur dalam melakukan fungsi ukurnya.
Walizer (1987) adalah tingkaat kesesuaian antara suatu batasan konseptual yang diberikan dengan bantuan
operasional yang telah dikembangkan.
Aritonang R. (2007) validitas suatu instrumen berkaitan dengan kemampuan instrument itu untuk mengukur atu
mengungkap karakteristik dari variabel yang dimaksudkan untuk diukur.
Masri Singarimbun, validitas menunjukkan sejauh mana suatu alat pengukur itu mengukur apa yang ingin diukur.
Suharsimi Arikunto, validitas adalah keadaan yang menggambarkan tingkat instrumen bersangkutan yang mampu
mengukur apa yang akan diukur.
Soetarlinah Sukadji, validitas adalah derajat yang menyatakan suatu tes mengukur apa yang seharusnya diukur.
Suryabrata (2000: 41) menyatakan bahwa validitas tes pada dasarnya menunjuk kepada derajat fungsi pengukurnya
suatu tes, atau derajat kecermatan ukurnya sesuatu tes.
Sudjana (2004: 12) menyatakan bahwa validitas berkenaan dengan ketepatan alat penilaian terhadap konsep
yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai.
Suatu alat ukur disebut memiliki validitas bilamana alat ukur tersebut isinya lanyak mengukur obyek yang
seharusnya diukur dan sesuai dengan kriteria tertentu (Thoha, 1990).
Grondlund (Ibrahim & Wahyuni, 2012) validitas mengarah kepada ketepatan interpretasi hasil penggunan suatu
prosedur evaluasi sesuai dengan tujuan pengukurannya.
Ebel (dalam Nazirz 1988) membagi validitas menjadi :
1. Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan kinerja.
2. Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa yang diukur oleh suatu
pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat menyebabkan kinerja yang baik dalam
pengukuran.
3. Face Validity adalah validitas yang berhuubungan apa yang nampak dalam mengukur sesuatu dan bukan
terhadap apa yang seharusnya hendak diukur.
27

4. Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor-faktor yang bersamaan
dalam suatu kelompok atau ukuran-ukuran perilaku lainnya, di mana validitas ini diperoleh dengan
menggunakan teknik analisis faktor.
5. Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria
tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.
6. Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti
kuantitatif dan objektif untuk mendukung bhwa suatu alat ukur benar-benar mengukur apa yang seharusny
diukur.
7. Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerj
seorang di msa mendatang.
8. Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi.
9. Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan menilai
seberapa jauh pungukuran tersebut merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai
dengan tujuan instruksional.
Kerlinger (1990) membagi validitas menjadi tiga yaitu:
1. Content validity (Validitas isi) adalah validitas yang diperhitungkan melalui pengujian terhadap isi alat ukur
dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validitas ini adalah sejauh mana item-item
dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang
bersangkutan? atau berhubungan dengan representasi dari keseluruhan kawasan.
Validitas isi suatu instrumen berkaitan dengan kesesuaian antara karakteristik dari variaabel yang
dirumuskan pada definisi konseptual dan operasionalnya. Apabila semua karakteristik variabel yang
dirumuskan pada definisi konseptualnya dapat diungkap melalui butir-butir suatu instrument, maka instrument
itu dinyatakan memiliki validitas isi yang baik. Sayangnya, hal itu mungkin tidak akan pernah tercapai karena
sulitnya untuk mendefinisikan keseluruhan karakteristik itu. Selain itu, dari seluruh karakteristik yang
dirumuskan pada definisi konseptual suatu variabel seringkali sulit untuk mengembangkan butir-butir yang
valid untuk mengungkap atau mengukurnya.
Validitas isi dapat dianalisis dengan cara memperhatikan penampakan luar dari instrument dan dengan
menganalisis kesesuaian butir-butirnya dengan karakteristik yang dirumuskan pada definisi konseptual variabel
yang diukur. Validitas yang dianalisis dengan memperhatikan penampilan luar instrument itu disebut validitas
28

tampang (face validity). Validitas tampang dievaluasi dengan membaca dan menyelidiki butir-butir instrument
serta sekaligus membandingkannya dengan definisi konseptual mengenai variabel yang akan diukur. Validitas
yang dianalisis dengan memperhatikan kerepresentativan butir-butir instrument disebut validitas penyampelan
(sampling validity) atau kuikulum (curriculum validity). Validitas tampang maupun penyampelan disebut juga
sebagai validitas teoritis karena penganalisisannya lazim dilakukan tanpa didasarkan pada data empiris. Alat
yang digunakan untuk menganalisis validitas itu adalah logika dari orang yang menganalisisnya.
Menurut Saifuddin Azwar, validitas isi merupakan validitas yang diestimasi lewat pengujian terhadap
isi tes dengan analisis rasional atau lewat professional judgement. Pertanyaan yang dicari jawabannya dalam
validitas ini adalah sejauh mana item-item dalam tes mencakup keseluruhan kawasan ini (dengan catatan tidak
keluar dari batasan tujuan ukur) objek yang hendak diukur atau sejauh mana isi tes mencerminkan ciri atribut
yang hendak diukur.
a. Selanjutnya, validitas isi terbagi lagi menjadi dua tipe (Saifuddin Azwar), yaitu:
Face Validity (Validitas Muka) adalah tipe validitas yang paling rendah signifikansinya karena hanya
didasarkan pada penilaian selintas mengenai isi alat ukur. Apabila isi alat ukur telah tampak sesuai dengan
apa yang ingin diukur maka dapat dikatakan maka validitas muka telah terpenuhi.
b. Logical Validity (Validitas Logis) disebut juga sebagai Validitas Sampling (Sampling Validity) adalah
validitas yang menunjuk pada sejauh mana isi alat ukur merupakan representasi dari aspek yang hendak
diukur.
Validitas logis sangat penting peranannya dalam penyusunan prestasi dan penyusunan skala, yaitu dengan
memanfaatkan blue-print atu table spesifikasi.
2. Construct validity (Validitas konstruk) adalah tipe validitas yang menunjukkan sejauh mana alat ukur
mengungkap suatu trait atau konstruk teoritis yang hendak diukurnya. (Allen & Yen, dalam Azwar 1986).
Pengujian validitas konstruk merupakan prosesyang terus berlanjut sejalan dengan perkembangan konsep
mengenai trait yang diukur.
Menurut Saifuddin Azwar, validitas konstruk adalah seberapa besar derajat tes mengukur hipotesis
yang dikehendaki untuk diukur. Konstruk adalah perangai yang tidak dapat diamati, yang menjelaskan perilaku.
Menguji validitas konstruk mencakup uji hipotesis yang dideduksi dari suatu teori yang mengajukan konstruk
tersebut.
3. Criterion-related validity (Validitas berdasar kriteria). Validitas ini menghendaki tersedianya criteria eksternal
29

Penilaian Validitas

yang dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah variabel perilaku yang akan
diprediksi oleh skor alat ukur.
Dilihat dari segi waktu untuk memperoleh skor kriterianya, prosedur validasi berdasar kriteria menghasilkan dua
macam validitas (Saifuddinn Azwar), yaitu:
1. Validitas Prediktif. Validitas Prediktif sangat penting artinya bila alat ukur dimaksudkan untuk berfungsi
sebagai predictor bagi kinerja di masa yang akan datang. Contoh situasi yang menghendaki adanya prediksi
kinerja ini antara lain adalah dalam bimbingan karir; seleksi mahasiswa baru, penempatan karyawan, dan
semacamnya. Menurut Saifuddin Azwar, validitas prediktif adalah seberapa besar derajat tes berhasil
memprediksi kesuksesan seseorang pada situasi yang akan datang. Validitas prediktif ditentukan dengan
mengungkapkan hubungan antara skor tes dengan hasil tes atau ukuran lain kesuksesan dalam satu situasi
sasaran.
2. Validitas Konkuren. Apabila skor alat ukur dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka
korelasi antara kedua skor termaksud merupakan koefisien validitas konkuren. Menurut Saifuddin Azwar,
validitas ini menunjukkan seberapa besar derajat skor tes berkorelasi dengan skor yang diperoleh dari tes lain
yang sudah mantap, bila disajikan pada saat yang sama, atau dibandingkan dengan criteria lain yang valid yang
diperoleh pada saat yang sama.
Asosiasi Psikologi Amerika (APA) (1974; dalam Anastasia, 1982) membedakan tiga tipe validitas, yaitu validitas
isi, yang dikaitkan dengan criteria, dan konnstrak.
Untuk mencari tingkat validitas digunakan rumus product moment metoda Pearson sebagai berikut:
xy
r=
dimana x = X Xrata-rata dan y = Y Yrata-rata
(1)
x2 y2
Keterangan:
x = Deviasi penilaian akhir
y = Deviasi penilaian awal
r = Korelasi antara x dan y (dua variabel yang akan dikorelasikan)
Dari nilai r yang telah didapatkan maka perlu interpretasi dari nilai tersebut untuk menunjukkan kevalidan
suatu penilaian. Kriteria nilai r yang digunakan untuk menentukan suatu penilaian valid dapat dilihat pada Tabel 1
30

berikut:
Tabel 1. Kriteria Korelasi Koefisien Validitas
No
Nilai r antara
Klasifikasi
1.

0,000 0,200

Korelasi sangat rendah

2.

0,200 0,400

Korelasi rendah

3.

0,400 0,600

Korelasi cukup

4.

0,600 0,800

Korelasi tinggi

5.

0,800 1,000

Korelasi sangat tinggi

Sumber: Suharsimi (2008: 221)

MATRIKS PERBEDAAN JENIS-JENIS RELIABILITAS

Pengertian

Walizer (1987) menyebutkan pengertian Reliability (Reliabilitas) adalah keajegan pengukuran.


John M. Echols dan Hasan Shadily (2003: 475) reliabilitas adalah hal yang dapat dipercaya
Popham (1995: 21) menyatakan bahwa reliabilitas adalah "...the degree of which test score are free from error
measurement"
Masri Singarimbun, realibilitas adalah indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau
dapat diandalkan
Brennan (2001: 295) reliabilitas merupakan karakteristik skor, bukan tentang tes ataupun bentuk tes.
Sumadi Suryabrata (2004: 28) reliabilitas menunjukkan sejauhmana hasil pengukuran dengan alat tersebut dapat
dipercaya.
Aiken (1987: 42) sebuah tes dikatakan reliabel jika skor yang diperoleh oleh peserta relatif sama meskipun dilakukan
pengukuran berulang-ulang.
31

Jenis-Jenis
Reliabilitas

Nur (1987: 47) menyatakan bahwa reliabilitas ukuran menyangkut seberapa jauh skor deviasi individu, atau skor-z,
relatif konsisten apabila dilakukan pengulangan pengadministrasian dengan tes yang sama atau tes yang ekivalen.
Azwar (2003 : 176) menyatakan bahwa reliabilitas merupakan salah-satu ciri atau karakter utama instrumen
pengukuran yang baik.
Arifin (1991: 122) menyatakan bahwa suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama bila
diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda.
Sudjana (2004: 16) menyatakan bahwa reliabilitas alat penilaian adalah ketepatan atau keajegan alat tersebut dalam
menilai apa yang dinilainya. Artinya, kapanpun alat penilaian tersebut digunakan akan memberikan hasil yang relatif
sama
Suharsimi (2009) Reliabilitas adalah suatu ukuran yang berhubungan dengan indikasi tetap dan konsisten dari hasil
sebuah penilaian.
Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu:
1. Relibilitas stabilitas. Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap orang atau setiap
unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini menyangkut penggunaan indicator yang sama,
definisi operasional, dan prosedur pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda.
Untuk dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah sama atau hampir sama.
2. Reliabilitas ekivalen. Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda
pada waktu yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih indicator yang
berbeda, batasan-batasan operasional, paeralatan pengumpulan data, dan / atau pengamat-pengamat. Menguji
reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bias menempuh beberapa bentuk.
Bentuk yang paling umum disebut teknik belah-tengah. Cara ini seringkali dipakai dalam survai.Apabila satu
rangkaian pertanyaan yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan
tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik
belah tengah ini.) Hasil masing-masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing
bagian terseb itu dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian tersebut dibandingkan.
Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah. Reliabilitas ekivalen dapat juga diukur
dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan pulsa.
Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek
nampak cemas pada ukuran gelisah orang tersebut haruslah menunjukkan tingkatan kecermatan relatif yang
32

sama bila tekanan darahnya yang diukur.


Teknik
Pengujian Tiga tehnik pengujian realibilitas instrument antara lain :
Realibilitas
1. Teknik Paralel (Paralel Form atau Alternate Form)
Teknik paralel disebut juga tenik double test double trial. Sejak awal peneliti harus sudah menyusun dua
Instrument
perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah
kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari instrumen
kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen
tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).
2. Teknik Ulang (Test Re-test)
Disebut juga teknik single test double trial. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau
skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas.Teknik
perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson.
Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke
waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada
kelompok yang sama, pada waktu yang berbeda. Metode pengujian reliabilitas stabilitas yang paling umum
dipakai adalah metode pengujian tes-kembali (test-retest). Metode test-retest menggunakan ukuran atau test
yang sama untuk variable tertentu pada satu saat pengukuran yang diulang lagi pada saat yang lain. Cara lain
untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah memasukkan pertanyaan yang
sama di dua bagian yang berbeda dari kuesioner atau wawancara. Misalnya the Minnesota Multiphasic
Personality Inventory (MPPI) mengecek reliabilitas test-retest dalam satu kuesionernya dengan mengulang
pertanyaan tertentu di bagian-bagian yang berbeda dari kuesioner yang panjang. Kesulitan terbesar untuk
menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa sifat/ variable yang akan diukur memang
benar-benar bersifat stabil sepanjang waktu. Karena kemungkinan besar tidak ada ukuran yang andal dan sahih
yang tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori dan/atau
putusdan terbaik. Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya mempertahankan asumsi
tersebut atas dasar pijakan yang obyektif.
3. Teknik Belah Dua (Split Halve Method)
Disebut juga tenik single test single trial. Peneliti boleh hanya memiliki seperangkat instrument saja dan hanya
diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrument menjadi dua
33

Penilaian Reliabilitas

sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomor ganjil-genap, atas
dasar nomor awal-akhir, dan dengan cara undian. Menurut Saifuddin Azwar, realibilitas ini diukur dengan
menentukan hubungan antara skor dua paruh yang ekuivalen suatu tes, yang disajikan kepada seluruh kelompok
pada suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang sebenarnya, rumus
Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat.
Salah satu cara yang bisa dipakai untuk menentukan reliabilitas adalah dengan cara ekuivalen. Metode ekuivalen
sering pula dinamakan alternate-forms methods atau doble-test-trial method. Menurut Sumarna (2005: 97), metode ini
berkaitan dengan penggunaan dua buah penilaian tertulis yang sama atau relatif sama kepada peserta didik yang sama.
Kesamaan yang dimaksud adalah kesamaan tujuan, tingkat kesukaran, dan susunan. Persamaan yang dipakai untuk
menentukan reliabilitas penilaian tertulis dengan metode ekuivalen adalah sebagai berikut :
n
n
n

N x1 x2 X 1 X 2
i 1
i 1
i 1

r
2
2
n
n

n

n

2
2
N
X

X
N
X

1
1
2
2
i 1
i 1
i 1
i 1

(2)
Keterangan :
r
= Reliabilitas secara keseluruhan
N
= Jumlah peserta
X1
= Nilai awal
X2
= Nilai akhir
Tabel 2. Klasifikasi Indeks Reliabilitas
No Indeks
Klasifikasi
1.
0,00 0,20
Sangat rendah
2.
0,20 0,40
Rendah
3.
0,40 0,60
Sedang
4.
0,60 0,80
Tinggi
5.
0,80 1,00
Sangat tinggi
i

Sumber: Suharsimi (2008: 221)


34

VALIDITAS

RELIABILITAS

Ada dua jenis validitas yang akan dibicarakan, yaitu : pertama Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes
menyangkut soal secara keseluruhan dan yang kedua menyangkut dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut
butir soal atau item.
dapat memberikan hasil yang tetap
Validitas dapat dikelompokkan menjadi validitas logis dan validitas Cara mencari besarnya reliabilitas
empiris.
Kriterium yang digunakan untuk mengetahui adanya ketetapan ada
yang berada di luar tes (consistency external) dan pada tes itu sendiri
(cosistency internal).
a.Metode bentuk paralel.
b. Metode tes ulang .
c. Metode belah dua atau split-half method
Cara pembelahan yang dapat dilakukan adalah:

dua macam validitas logis yang dapat dicapai oleh sebuah instrumen,
yaitu: validitas isi dan validitas konstruksi

35

Pembelahan ganjil genap

Pembelahan awal-akhir

Ada dua macan validitas empiris, Yaitu validitas ada sekarang atau
concurrent validity dan validitas predictive.
Cara mengetahui kevaliditasan memakai teknik korelasi product
moment yang dikemukan oleh Pearson
Validitas Faktor
yaitu faktor-faktor atau bagian keseluruhan mater. Butir-butir soal
dalam faktor dikatakan valid apabila mempunyai dukungan yang
besar terhadap soal-soal secara keseluruhan.

36

E. BIAS, STANDARD ERROR MEASUREMENT


Standard error dari mean (SEM) adalah standar deviasi sampel estimasi mean
sebuahpopulasi mean. Ini juga dapat dilihat sebagai standar deviasi kesalahan dalam mean
sampel relatif terhadap mean sebenarnya, sejak mean sampel merupakan penduga yang tidak
bias. SEM biasanya diperkirakan dengan estimasi sampel penduduk deviasi standar(deviasi
standar sampel ) dibagi dengan akar kuadrat dari ukuran sampel (dengan asumsi statistik nilainilai kemerdekaan dalam sampel): di mana s adalah deviasi standar sampel(yaitu, sampel
perkiraan berdasarkan standar deviasi dari populasi), dan n adalah ukuran (jumlah pengamatan)
sampel. Standar kesalahan juga dapat didefinisikan sebagai standar deviasi dari kesalahan
Standar error memberikan langkah-langkah sederhana ketidakpastian dalam nilai dan sering
digunakan karena:
1. Jika error standar kuantitas dari beberapa individu kemudian dikenal standard error dari
beberapa fungsi dari kuantitas dapat dengan mudah dihitung dalam banyak kasus;
2. Mana distribusi probabilitas dari nilai yang diketahui, dapat digunakan untuk menghitung
pendekatan yang baik untuk yang tepat dan
3. Mana distribusi probabilitas tidak diketahui,

hubungan

sepertiChebyshev 's

atau ketidaksetaraan Vysochanski-Petunin dapat digunakan untuk menghitung interval


keyakinan konservatif
4. Sebagai ukuran sampel yang cenderung tak terhingga teorema limit sentral menjamin
bahwa distribusi sampling mean asimtotik normal.
Rumus yang diberikan di atas untuk standard error mengasumsikan bahwa ukuran sampel
jauh lebih kecil daripada ukuran populasi, sehingga populasi dapat dianggap efektif dalam
ukuran tak terbatas. Ketika sampling fraksi besar (sekitar sebesar 5% atau lebih), perkiraan
kesalahan harus dikoreksi menggunakan "populasi terbatas koreksi" menjelaskan tambahan
diperoleh presisi sampling dekat dengan persentase yang lebih besar dari populasi. Efek dari FPC
adalah bahwa kesalahan menjadi nol ketika ukuran sampel nadalah sama dengan ukuran
populasi N.
BAB III
PENUTUP
A. KESIMPULAN
37

Penilaian merupakan serangkaian kegiatan untuk memperoleh, menganalisis, dan


menafsirkan data tentang proses dan hasil belajar peserta didik yang dilakukan secara sistematis
dan berkesinambungan, sehingga menjadi informasi yang bermakna dalam pengambilan
keputusan. Dalam kurikulum 2013 terdapat beberapa penilaian yaitu penilaian autentik, penilaian
diri, penilaian Projek, ulangan harian , ulangan tengah semester, ulangan akhir semester, ujian
tingkat kompetensi, ujian mutu tingkat kompetensi, ujian nasional, ujian sekolah. Ranah
penilaian kurikulum meliputi sikap, pengetahuan dan keterampilan.
Dalam ranah sikap penilaian dilakukan dengan cara observasi, penilaian diri, penilaian antar
peserta didik, dan jurnal. Pada ranah pengetahuan penilaian dilakukan dengan cara tes tulis, tes
lisan, dan penugasan.
B. SARAN
Penulis mengetahui bahwa makalah ini belum sempurna, untuk itu diharapkan kepada dosen
pembimbing serta pembaca ikut memberikan saran agar makalah ini lebih baik untuk
selanjutnya.

DAFTAR PUSTAKA
Anonim.2013.Pengertian

Evaluasi,

Pengertian

Penilaian,

Pengertian

Pengukuran.

www.peneltiantindakankelas.blogspot.co.id.diakses tanggal 14 februari 2016


Dikmenum.2010.Panduan Penilaian.www.dikmenum.go.id.diakses tanggal 14 februari 2016
38

Eko Putro Widoyoko.2012.Evaluasi Program Pembelajaran.Pustaka Pelajar:Yogyakarta


Ilyas, Asnelly. 2006. Evaluasi Pendidikan. STAIN Batusangkar Press : Batusangkar
Iman.2013.Tes, Pengukuran, Penilaian dan Evaluasi.www.imankoekoeh.blogspot.co.id.diakses
tanggal 14 Februari 2016
Mawardi.2011.Asesmen Proses dan Hasil Belajar.www. mawardis3ip.staff.fkip.uns.ac.id.diakses
tanggal 14 Februari 2016
Mulyasa. 2014. Pengembangan dan Implementasi Kurikulum 2013. Bandung. PT. Remaja
Rosdakarya Ofset.
Nurhayati.2010.Penilaian, Asesmen, Pengukuran, Testing. www.nurhayatifisika.blogspot.co.id.
diakses tanggal 14 Februari 2016.
Permendikbud No 104.2014. Pedoman Penilaian Hasil Belajar Oleh Pendidik. Jakarta
Sudaryono.2012.Dasar-dasar Evaluasi Pembelajaran.Graha ILmu : Yogyakarta
Zaldizakaria.2015.Hubungan dan Perbedaan Tes Pengukuran. www.zaldizakaria.blogspot.co.id.
Diakses tanggal 14 Februari 2016

39