Anda di halaman 1dari 46

VALIDITAS INSTRUMEN PENILAIAN

Dosen Pengampu:
Prof. Dr. Heri Retnawati, M.Pd.
Dr. Syukrul Hamdi, M.Pd.

Disampaikan pada “MK Penilaian Pembelajaran Matematika”


2022
Pengukuran, Penilaian & Evaluasi

Evaluasi

Penilaian

Pengukuran

Menurut Griffin & Nix (1991), pengukuran, penilaian dan


evaluasi memiliki sifat hirarki.
Pengukuran, penilaian dan evaluasi
 Gronlund, Keeves, dan Masters (1999) mengungkapkan bahwa pengukuran adalah
pemberian angka (kuantitas numerik) pada objek-objek atau kejadian-kejadian
menurut aturan.
 Nunnally (1978) juga menjelaskan bahwa pengukuran itu terdiri dari aturan-aturan
untuk memberikan angka/bilangan kepada objek dengan cara yang sedemikian rupa
sehingga dapat mempresentasikan secara kuantitatif sifat-sifat objek tersebut.

 Sttigins (2012) menjelaskan bahwa penilaian adalah proses pengumpulan informasi


tentang belajar siswa/mahasiswa untuk perbaikan pembelajaran.
 Wright dan Stones (1992) Penilaian dapat menjelaskan seberapa jauh siswa belajar di
sekolah dan sumber apa saja yang diperlukan untuk mencapai hasil pembelajaran
tersebut.

 Fitzpatrick, et.al. (2011) mengungkapkan evaluasi merupakan kegiatan sistematis yang


meliputi mengidentifikasi, mengklarifikasi dan mengaplikasikan suatu kriteria untuk
menentukan keberhasilan suatu program.
 Mertens (2010) menjelaskan evaluasi adalah usaha yang sistematik dan obyektif untuk
menilai perkembangan dan pencapaian tujuan suatu program.
SKALA PENGUKURAN
Karakteristik utama dalam proses pengukuran adalah
adanya penggunaan angka (skor) atau skala tertentu
dan dalam menentukan angka tersebut didasarkan
atas aturan atau formula tertentu.

Skala atau angka dalam pengukuran dapat


diklasifikasikan kedalam 4 (empat) kategori, yaitu:
• Skala Nominal
• Skala Ordinal
• Skala Interval
• Skala Rasio
Prinsip penilaian hasil belajar:
 sahih, berarti penilaian didasarkan pada data yang mencerminkan kemampuan yang diukur;
 objektif, berarti penilaian didasarkan pada prosedur dan kriteria yang jelas, tidak dipengaruhi
subjektivitas penilai;
 adil, berarti penilaian tidak menguntungkan atau merugikan peserta didik karena berkebutuhan
khusus serta perbedaan latar belakang agama, suku, budaya, adat istiadat, status sosial ekonomi,
dan gender.
 terpadu, berarti penilaian merupakan salah satu komponen yang tak terpisahkan dari kegiatan
pembelajaran;
 terbuka, berarti prosedur penilaian, kriteria penilaian, dan dasar pengambilan keputusan dapat
diketahui oleh pihak yang berkepentingan;
 menyeluruh dan berkesinambungan, berarti penilaian mencakup semua aspek kompetensi
dengan menggunakan berbagai teknik penilaian yang sesuai, untuk memantau dan menilai
perkembangan kemampuan peserta didik;
 sistematis, berarti penilaian dilakukan secara berencana dan bertahap dengan mengikuti langkah-
langkah baku;
 beracuan kriteria, berarti penilaian didasarkan pada ukuran pencapaian kompetensi yang
ditetapkan; dan
 akuntabel, berarti penilaian dapat dipertanggungjawabkan, baik dari segimekanisme, prosedur,
teknik, maupun hasilnya.
ACUAN PENILAIAN

Acuan Kriteria
• Aacuan kriteria berasumsi bahwa hampir semua orang bisa belajar apa saja, meskipun
dengan waktu yang berbeda. Konsekuensi acuan tersebut adalah adanya program
perbaikan dan pengayaan. Mereka yang belum memiliki kompetensi seperti yang
disyaratkan harus belajar lagi sampai kemampuannya mencapai kriteria atau standar
tertentu, yang disebut remidi atau perbaikan. Sebaliknya, mereka yang telah
mencapai kompetensi standar, diberikan pelajaran tambahan, yang disebut
pengayaan. Jadi, irama belajar yang berlaku adalah kompetensi individual, yang
cepat diberikan penyayaan dan yang lambat diberikan remidi.

Acuan Norma
• Tes acuan norma berasumsi bahwa kemampuan orang berbeda dan dapat digambarkan
menurut distribusi normal. Perbedaan itu harus ditunjukkan oleh hasil pengukuran,
misalnya setelah mengikuti pembelajaran selama satu semester, mahasiswa dites.
Hasil tes seorang mahasiswa dibandingkan dengan kelompoknya, sehingga dapat
diketahui posisi mahasiswa tersebut di kelas itu. Acuan tersebut juga digunakan pada
tes seleksi, karena sesuai dengan tujuannya, tes seleksi untuk membedakan
kemampuan seseorang, khususnya bila jumlah pendaftar yang diterima berdasarkan
pada kuota atau daya tampung.
Penilaian Kompetensi Pengetahuan Slide 7
TAKSONOMI (COGNITIVE DOMAIN) Slide 8
Kata Kerja
Operasional
Ranah
Pengetahuan
Penulisan Soal
 Bentuk soal
bervariasi, yaitu pilihan ganda (PG), pilihan ganda kompleks,
menjodohkan, isian, dan esai atau uraian.

OBJEKTIF:
• Pilihan Ganda
• Pilihan Ganda Komplek
• Bentuk soal dua pilihan jawaban
(Benar-salah, Ya-Tidak)
• Menjodohkan
• Isian atau melengkapi
• Jawaban singkat atau pendek

NON OBJEKTIF:
• Soal Uraian
Bentuk Soal Pilihan Ganda

• Pengertian: Soal yang jawabannya harus dipilih dari


beberapa kemungkinan jawaban yang telah disediakan

Terdiri atas
• Dasar pertanyaan/stimulus (bila ada)
• Pokok soal (stem)
• Pilihan jawaban (terdiri dari kunci jawaban dan
pengecoh)
Kaidah Penulisan Soal Pilihan Ganda

Materi
1. Soal harus sesuai dengan indikator-> menanyakan
perilaku dan materi yg hendak diukur sesuai rumusan
indikator dlam kisi-kisi
2. Pengecoh harus berfungsi
3. Setiap soal harus mempunyai satu jawaban yang benar.
Konstruksi

• Pokok soal dirumuskan secara jelas dan tegas. Tdk menimbulkan


salah tafsir dng pembuat. Setiap soal hanya mengandung satu
persoalan/gagasan.
• Rumusan pokok soal dan pilihan jawaban merupakan pernyataan
yang diperlukan saja
• Pokok soal jangan memberi petunjuk kearah jawaban yang benar
• Pokok soal jangan mengandung pernyataan yang bersifat negatif
ganda.
• Piihan jawaban harus homogen dan logis dari segi materi
• Panjang rumusan pilihan jawaban relatif sama
LANJUTAN

• Pilihan jawaban jangan mengandung pernyataan “semua pilihan


jawaban benar” atau “semua pilihan jawaban salah”
• Pilihan jawaban bentuk angka atau waktu harusdisusun
berdasarkan besar kecilnya angka atau kronologisnya waktu
• Gambar, grafik, tabel, diagram, dsb harus jelas dan berfungsi
• Tidak menggunakan ungkapan yang tdk pasti misal, kadang-kadang,
umumnya, sebaiknya
• Butir soal sebaiknya tidak bergantung pada jawaban sebelumnya
• Gunakan bahasa yang sesuai dengan kaidah bahasaIndonesia,
bahasa harus komunikatif, jangan menggunakan bahasa yang
berlaku hanya setempat.
Instrumen Penilaian

Instrumen

TES NON-
TES

Sebelum mengembangkan Tes dan Non Tes perlu membuat kisi-kisi


instrumen. Instrumen yang baik adalah instrumen yang valid dan
reliabel
TELAAH INSTRUMEN TES
Validitas dan Reliabilitas

1. Mendekati atau mengumpul pada titik yang telah ditetapkan (tembakan yang demikian dinyatakan valid
dan reliabel)
2. Menyebar pada bidang sasarn, tidak fokus pada titik yang telah ditetapkan (tidak valid dan tidak reliabel)
3. Mengumpul di tempat tertentu, akan tetapi jauh dari titik sasaran yang telah ditetapkan (tidak valid namun
reliabel)
Macam-macam validitas
yang sering digunakan
dalam pengukuran

Suatu instrumen atau alat ukur perlu


dibuktikan apakah alat ukur tersebut valid
atau tidak. Validitas suatu alat ukur adalah
sejauhmana alat ukur itu mampu
mengukur apa yang seharusnya diukur
(Nunnally, 1978, Allen & Yen, 1979)

Sumber: Hamdi, 2014


Validitas Isi dengan Gregory

Sumber: Retnowati, 2016


Validitas Isi
 Penilaian dilakukan dengan cara memberikan skor 1 (sangat tidak mewakili atau
sangat tidak relevan) sampai dengan 5 (sangat mewakili atau sangat relevan).
Selanjutnya digunakan persamaan V dari Aikens (Saifuddin Azwar, 2013):

V = ∑ s /[n(c-1)]
Keterangan:
s = r – lo
∑s = s1 + s2 + dst
Lo = angka penilaian validitas yang terendah
c = angka penilaian validitas yang tertinggi
r = angka yang diberikan oleh seorang penilai
 Selain menggunakan persamaan Aiken, validitas isi juga dapat dibuktikan menggunakan rumus
Lawshe, yakni Content Validity Ratio (CVR) diteruskan dengan ke Content Validity Index (CVI). Rumus
CVR yang dimaksudkan adalah sebagai berikut (Saifuddin Azwar, 2013).
CVR = [(2ne/ n) – 1]
Keterangan:
CVR = Content Validity Ratio
ne = banyaknya SME yang menilai suatu butir tes itu esensial
n = banyaknya SME yang melakukan penilaian

Sebagai contoh, suatu butir dinilai tingkat esensialnya oleh sepuluh penilai (SME); enam penilai
menyatakan bahwa butir itu esensial, tiga penilai menyatakan butir itu berguna tetapi tidak esensial, dan
1 penilai menyatakan bahwa butir itu tidak diperlukan. Dengan demikian: CVR = [(2.6)/10 -1] = 0, 20
Angka CVR bergerak dari -1,00 sampai dengan +1,00 bila harga CVR positif atau > 0 maka 50% SME
menilai butir itu esensial. Semakin tinggi harga CVR, semakin baik validitas isi butir itu. Dalam hal ini butir
dikatakan memiliki validitas baik bila CVR ≥ 0,3.

Sementara itu validitas isi suatu tes atau Content Validity Index (CVI) adalah rata-rata dari CVR semua butir, sehingga:
CVI = (∑CVR)/k
Keterangan: CVI = Content Validity Index; CVR= Content Validity Ratio; k = jumlah butir dalam tes

Contoh tabel penilaian ahli
Tabel Penilaian Ketepatan Butir Terhadap Indikator

Skor Ketepatan Butir


Terhadap Indikator

INDIKATOR NOMOR BUTIR


TT KT TP ST

Indikator_1 2
3
Indikator_2 4
5
Indikator_3
6
Lanjutan Slide 22
Contoh Tabel Penilaian Sejawat/Ahli untuk Aspek Materi, Konstruksi, dan Bahasa untuk Soal PG

Skor
No Aspek yang ditelaah/dinilai
1 2 3 4
A Materi
1 Soal sesuai dengan indicator
2 Materi yang ditanyakan sesuai dengan kompetensi (urgensi, relevansi, kontinuitas, keterpakaian sehari-hari tinggi)

3 Pilihan jawaban homogen dan logis


4 Hanya ada satu kunci jawaban
B Konstruksi
5 Pokok soal dirumuskan dengan singkat, jelas dan tegas
6 Rumusan pokok soal dan pilihan jawaban merupakan pernyataan yang diperlukan saja
7 Pokok soal tidak memberi petunjuk kunci jawaban
8 Pokok soal bebas dari pernyataan yang bersifat negatif ganda
9 Pilihan jawaban homogen dan logis ditinjau dari segi materi
10 Gambar, grafik, tabel diagram atau sejenisnya jelas dan berfungsi
11 Panjang pilihan jawaban relative sama
12 Pilihan jawaban tidak menggunakan pernyataan “Semua jawaban di atas salah atau benar” dan sejenisnya

13 Pilihan jawaban yang berbentuk angka/ waktu disusun berdasarkan urutan besar kecilnya angka atau kronologisnya

14 Konstruksi soal dalam satu group/kelompok soal testlet dapat dipahami siswa
15 Jumlah soal yang ada sesuai dengan waktu yang tersedia dilihat dari aspek materi dan kemampuan siswa

16 Tingkat kesulitan butir dari satu kelompok testlet berjenjang dari yang paling mudah sampai yang sulit
C Bahasa
17 Menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia
18 Menggunakan bahasa yang komunikatif
19 Tidak menggunakan bahasa yang berlaku setempat atau tabu
20 Pilihan jawaban tidak mengulang kata/kelompok kata yang sama kecuali merupakan satu kesatuan pengeritan
Slide 24

VALIDITAS KONSTRUK
(Analisis Faktor Eksploratory)
• Analisis faktor merupakan suatu teknik
untuk mereduksi data. Proses analisis
faktor mencoba menemukan hubungan
antar variabel yang saling independen
tersebut sehingga bisa dapat dibuat
satu atau beberapa kumpulan variabel
yang lebih sedikit dari jumlah variabel
awal.

10/6/2022 25
• Contoh: semula ada 8 variabel (X)
yang saling independen, dengan
analisis faktor mungkin bisa diringkas
menjadi 3 kumpulan variabel baru
yang selanjutnya disebut faktor.
Analisis faktor ini disebut dg Analisis
Faktor Eksploratori (AFE)

10/6/2022 26
Analisis Faktor Eksploratori
(AFE): peneliti tidak memiliki
kajian teori yang mantap
tentang yang diteliti, dengan
demikian teknik ini dapat
membantu membangun teori
dalam suatu penelitian.

10/6/2022
• 27
Tujuan AFE:

• Mereduksi data, yaitu melakukan


korelasi, variabel lama dikurangi
dengan cara mengelompokkan unsur-
unsur variabel lama yg sejenis menjadi
variabel baru yang disebut dg faktor.
• Mengidentifikasi adanya hubung an
antar variabel dengan mela kukan uji
korelasi

10/6/2022 28
⚫ Faktor merupakan variabel baru yang
bersifat unobservable atau variabel laten
atau variabel konstruk atau variabel non-
visible
⚫ Variabel lama atau variabel X merupakan
variabel yang dapat diamati atau dapat
juga disebut dengan variabel teramati atau
observable variable

10/6/2022 29
Rotasi faktor

⚫ Bila
faktornya banyak
⚫ Supaya mudah menginterpretasikan,
maka faktor perlu dirotasi

10/6/2022 30
⚫ Variabel yang layak dilakukan faktoring
atau reduksi data.
⚫ Agar reduksi data lebih optimal maka perlu
dilakukan pemutaran sumbu. Untuk itu,
hasil analisis komputer yang dilihat adalah
Rotated component matrix
⚫ Memperoleh variabel baru atau variabel
laten (faktor) dan variabel teramati.

10/6/2022 31
LANGKAH-LANGKAH ANALISIS FAKTOR
EKSPLORATORI (AFE)

⚫ Menilai kelayakan variabel untuk dianalisis


(variabel yang memiliki koefisien korelasi
anti image kurang dari 0,3, tidak diikutkan
dalam analisis lanjutan)
⚫ Menilai kecukupan sampel, ini dilihat dari
harga Kaiser-Mayer-Olkin Measure of
Sampling Adequacy (KMO-MSA > 0,5 dan
p < 0,05) analisis dapat diteruskan)
10/6/2022 32
FA : KMO (Kaiser-Meyer-Olkin) measure
of sampling adequacy

KMO Measure Recommendation


 0,90 Marvelous
0,80 + Meritorious
0,70 + Middling
0,60 + Mediocre
0,50 + Miserable
Below 0,50 Unacceptable
Referensi: Subhash Sharma (1996; pp. 116)
FA : studi kasus Food price data

Data tentang harga-harga


beberapa bahan makanan
di 23 kota besar USA.
(Subhash Sharma, 1996;
pp. 71)
FA studi kasus : Hasil analisis

Harga oranges mempunyai


std. deviation terbesar

Harga Oranges
signifikan berkorelasi
hanya dengan
tomatos
FA studi kasus : Hasil lanjutan
KMO keseluruhan variabel
sudah lebih dari 0,5.
Tes Bartlett menunjukkan
bahwa matrik korelasi bukan
matrik identitas.

MSA untuk
masing-masing
variabel sudah
menunjukkan
lebih dari 0,50.
FA studi kasus : Hasil lanjutan

Hasil analisis faktor menunjukkan bahwa


ada DUA faktor yang dapat dibentuk
berdasarkan nilai eigen yang lebih dari 1.
Secara umum, DUA faktor ini menerang-
kan sebanyak 70,543% variansi data.
FA studi kasus : Hasil lanjutan

Hasil identifikasi jumlah faktor dengan


Scree Plot menunjukkan bahwa ada DUA
faktor yang dapat dibentuk (nilai eigen
yang lebih dari 1).
FA studi kasus : Hasil lanjutan

Hasil analisis faktor


sebelum dirotasi

Hasil analisis faktor


setelah dirotasi
Perintah Factor Analysis di SPSS
1

2 3

1. Klik Analyze
2. Klik Data Reduction
 Pilih option yang diinginkan summary 3. Klik Factor …
pada Descriptives, Extraction, 4. Pilih Variables 5.
Rotation, Scores, dan Options. Lengkapi Toolbar lain
FA studi kasus : Hasil analisis

Harga oranges mempunyai


std. deviation terbesar

Harga Oranges
signifikan berkorelasi
hanya dengan
tomatos
FA studi kasus : Hasil analisis

Harga oranges mempunyai


std. deviation terbesar

Harga Oranges
signifikan berkorelasi
hanya dengan
tomatos
FA studi kasus : Hasil lanjutan

Hasil analisis faktor


sebelum dirotasi

Hasil analisis faktor


setelah dirotasi
Daftar Istilah (1)
◼ Measure of sampling adequacy (MSA) atau ukuran kecukupan sampling:
pengukuran/perhitungan matriks korelasi baik secara keseluruhan maupun
masing-masing variabel untuk mengevaluasi kesesuaian penerapan analisis
faktor.
◼ Anti-image correlation matrix berisi kovarians parsial negatif dan korelasi.
Diagonalnya digunakan sebagai ukuran kecukupan sampling (MSA).
◼ Bartlett test of sphericity (uji Bartlett sphericity): uji statistik untuk
signifikansi secara menyeluruh dari semua korelasi dalam matriks korelasi.
Digunakan sebagai ukuran kecukupan sampling (MSA).
◼ Tabel correlation matrix (matriks korelasi): tabel yang menunjukkan inter-korelasi
antara semua variabel.
◼ Faktor: kombinasi linear dari variabel-variabel asli. Faktor merepresentasikan
konstruk dasar dari ringkasan atau account untuk kumpulan asli variabel yang
diamati.
Daftar Istilah (2)
◼ Faktor loading: korelasi antara variabel dan faktor. Faktor loading
adalah kunci untuk memahami sifat dari suatu faktor tertentu. Faktor
loadings Squared menunjukkan berapa persen varians dalam variabel
asli yang dijelaskan oleh faktor.
◼ Common factor (faktor umum): a factor on which two or more variables load.
◼ Faktor laten: faktor yang mendasari hipotesis teoritis untuk
mempengaruhi sejumlah variabel yang diamati. Analisis faktor pada
umumnya mengasumsikan variabel laten berhubungan linier dengan
variabel yang diamati.
◼ Communality (Komunalitas): proporsi varians variabel yang
dijelaskan oleh struktur faktor atau dengan kata lain sumbangan efektif
tiap variabel terhadap faktor yang terbentuk. Perkiraan komunalitas
akhir adalah jumlah kuadrat loading untuk variabel dalam matriks faktor
ortogonal.
Sekian & Terima Kasih
Semoga Bermanfaat

Anda mungkin juga menyukai