Validitas Aitem Jadi

Validasi Aitem
Untuk memenuhi tugas mata kuliah Psikometri
Dosen Pembimbing :
Dra. Tri Esti Budiningsih, M. A.
Woro Aprilianasari, S.Psi.
Oleh
Nur Afidah 1511414125
Kurnia Galih Nastiti 1511414127
Arif Faradita R 1511414150
JURUSAN PSIKOLOGI
FAKULTAS ILMU PENDIDIKAN
UNIVERSITAS NEGERI SEMARANG
2016
VALIDITAS
Indeks Validitas Aitem

Menurut Allen& Yen(2002), meskipun banyak metode telah diusulkan untuk
melakukan analisis aitem, ada empat metode yang banyak digunakan:
(1) analisis tingkat kesulitan aitem dan indeks diskriminasi aitem (korelasi
aitem-totalskor tes),
(2) reliabilitas,
(3) indeks validitas aitem
(4) karakteristik kurva item;
(5) analisis faktor.
Terlihat di sini bahwa korelasi aitem total merupakan bagian dari properti
indeks diskriminasi aitem dan bukan indeks validitas aitem.Indeks validitas aitem
memang terkait dengan korelasi aitem total, akan tetapi ada penambahan deviasi
standar dalam penghitungannya. indeks validitas aitem merupakan perkalian
antara korelasi aitem total (rit) dengan deviasi standar aitem (si).
MACAM-MACAM VALIDITAS
Hasil yang diperoleh dalam kegiatan evaluasi disebut data evaluasi. Data
evaluasi yang sesuai dengan kenyataan disebut data valid. Untuk memperoleh data
yang valid diperlukan instrumen evaluasi yang valid pula. Terdapat 2 macam
validitas, yaitu:
1. Validitas logis
Validitas logis menggunakan instrumen yang dinyatakan valid
berdasarkan penalaran. Hal ini dikarenakan instrumen tersebut dirancang baik
sesuai dengan teori dan ketentuan yang ada. Maka dari itu, instrumen tersebut
tidak perlu diuji karena sudah sesuai dengan teori yang ada.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu :
a) Validitas isi. Validitas isi sudah dicapai oleh instrumen jika
instrumen tersebut disusun berdasarkan isi materi pelajaran yang
dievaluasi. Oleh karena materi pelajaran tersebut sudah ada di
dalam kurikulum, maka validitas isi disebut juga validitas
kurikuler.
b) Validitas kontruksi (construct validity) Kata konstruksi dalam
pembahasan ini bukan diartikan sebagai susunan, namun
merupakan suatu rancangan diciptakan oleh para ahli Ilmu Jiwa
untuk memperdalam ingatan, pemahaman, aplikasi dan lain-lain
jiwa seseorang.
Bentuk dari rancangan tersebut dalam suatu kegiatan belajar mengajar (KBM)
adalah soal-soal dalam tes. Setiap butiran soal dirancang untuk mengukur dan
memperdalam setiap aspek berpikir seseorang, apakah sesuai dengan tujuan
instruksional.
2. Validitas empiris
Validitas empiris menggunakan instrumen yang dinyatakan valid
berdasarkan pengalaman. Maka dari itu, instrumen tersebut harus diuji. Terdapat
dua macam validitas empiris, yaitu
a) Validitas “ada sekarang” (concurrent validity). Instrumen yang
memiliki validitas ini adalah instrumen yang sudah tersedia dan
sudah teruji berdasarkan pengalamannya.
b) Validitas prediksi (predictive validity) Kata prediksi memiliki arti
ramalan. Dengan begitu hal-hal yang dimaksudkan belum terjadi.
Dalam validitas prediksi ini, dapat dikatakan berhasil, apabila
beberapat waktu yang akan datang kenyataan sesuai dengan yang
pernah diramalkan/ prediksikan.
MENGANALISIS ITEM
Kualitas item sanagt mempengaruhi kualitas sebuah skala psikologi,

oleh karena itu melakukan prosedur analisis dan seleksi item pada skala
penting dilakukan agar setiap item dapat menggambarkan dengan sesuai
kondisi subjek. Untuk menjaga kualitas item dilakukan dengan mengikuti
secara cermat indikator keperilakuan yang ada pada blue-print skala dan
spesifikasinya. Hanya item yang sesuai dengan blue-print dan penulisan
dengan kaidah yang sesuai-lah yang dapat mendukung validitas skala secara
keseluruhan. Oleh sebab itu, penting bagi peneliti untuk membaca ulang
dengan saksama dan kritis, item-item yang telah disusunnya. Adapun tahap
untuk menguji item-item pada skala psikologi, dapat dilakukan dengan cara
berikut :
1. Pra Uji-Coba
Setelah peneliti membaca ulang dengan seksama dan kritis item
yang telah disusun, langkah berikutnya adalah menguji coba kepada
sampel berukuran kecil yakni kurang lebih 20 orang. Dalam langkah ini
tujuannya adalah untuk menguji apakah kalimat yang disusun oleh peneliti
sudah dapat dipahami dan dimengerti oleh orang lain. Masukan dan
komentar dari sampel perlu diperhatikan untuk melakukan revisi.
2. Evaluasi Kualitatif
Tujuan evaluasi ini adalah untuk menguji item telah sesuai dengan
blue-print dan indikator perilaku, menguji item telah ditulis dengan kaidah
yang sesuai, dan melihat item-item yang ditulis masih mengandung social
desirability yang tinggi. Evaluasi ini dilakukan oleh para ahli (expert
judgement) psikometri dan ahli dalam atribut yang akan diukur pada skala
yang sedang disusun. Hasil evaluasi ini akan menghasilkan penilaian
masing-masing item menjadi (a) diterima, (b) diterima dengan perbaikan,
(c) ditolak.
3. Evaluasi Empirik
Tahap selanjutnya adalah menguji item secara empirik. Pengujian
ini dilakukan dengan melakukan pada subjek yang memiliki karaktersitik
yang setara dengan subjek yang hendak dikenai skala nantinya. Pada tahap
ini paling tidak akan dilakuakn analisis daya diskriminasi item.
a. Real Testing Situation
Uji coba empirik atau field test dilaksanakan dalam situasi dan
kondisi yang sebenarnya. Sebaiknya subjek tidak mengetahui bahwa
yang bersangkutan sedang dilakukan sebagai subjek uji coba. Item-
item disajikan lengkap dan ideal dengan petunjuk, aturam, dan contoh
pengerjaan seperti tes yang sebenarnya sehingga subjek dapat
menjawab item seperti sebagaimana kondisi sebenarnya dan tidak
merasa sedang diuji coba.
b. Ukuran Sampel
Field test harus dilaksanakan pada subjek dalam jumlah yang
besar. Tidak ada jumlah yang pasti untuk menentukannya namun,
semakin heterogen populasi, maka semakin besar jumlah sampel yang
dibutuhkan. Dalam analisis item, sebagai rekomendasi, Croker dan
Algina (1986) menyarankan 200 orang sebagai jumlah sampel.
Sedangkan menurut Gable (1986) mengatakan bahwa jumlah sampel
haruslah enam sampai sepuluh kali lipat dari jumlah item. Apabila
jumlah item 50, maka sampel yang dibutuhkan yakni 300 sampai 500
orang. Banyaknya sampel kembali lagi pada kemampuan peneliti
dengan prinsip semakin banyak semakin baik.
4. Daya Diskriminasi Item

Daya diskriminasi item adalah sejauh mana item mampu
membedakan antara individu atau kelompok individu yang memiliki dan
yang tidak memiliki atribut yang diukur. Contohnya sebuah skala disusun
untuk mengukur minat beli konsumen, maka item yang disusun harus
mampu membedakan mana konsumen yang berminat membeli dan yang
tidak berminat membeli. Indeks daya diskriminasi item merupakan pula
indikator keselarasan atau konsistensi antara fungsi item dengan fungsi
skala secara keseluruhan yang disebut dengan konsistensi item-total.
5. Memilih Aitem Berdasarkan Daya Diskriminasi
Parameter daya beda aitem yang berupa koefisien korelasi antara

distribusi skor aitem dengan distribusi skor total skala (riX)
memperlihatkan kesesuaian fungsi aitem dengan fungsi skala dalam
mengungkap perbedaan individu. Pemilihan aitem-aitemnya didasarkan
pada besarnya angka koefisien korelasi termaksud.
Besarnya koefisien korelasi aitem-total bergerak dari 0-1,00
dengan tanda positif atau negative. Sekalipun formula komputasi korelasi
memungkinkan diperolehnya koefisien sebesar 1,00 namun dalam
kenyataannya koefisien maksimal seperti itu tidak pernah dijumpai.
Semakin baik daya diskriminasi aitem maka koefisien korelasinya semakin
mendekati angka 1,00. Koefisien yang kecil mendekati angka 0 atau yang
memiliki tanda negative mengindikasikan bahwa aitem yang bersangkutan
tidak memiliki daya diskriminasi.
6. Validitas Aitem
Skala yang seluruh aitemnya memiliki daya diskriminasi tinggi
belum tentu berarti bahwa skala itu berfungsi valid. Oleh karena itu satu
aitem yang daya diskriminasinya tinggi, juga belum tentu merupakan
aitem yang valid. Validitas aitem dan daya diskriminasi aitem merupakan
dua hal yang berbeda pengertian. Secara logika, aitem yang ditulis dengan
cara yang benar dan sesuai dengan indicator keperilakuan yang telah
dirumuskan dengan benar pula adalah aitem yang valid. Secara empiric,
validitas aitem ditunjukkan oleh koefisien validitas aitem yang dihitung
berdasarkan data skor.
Validitas butir soal berguna untuk butir-butir soal yang

menyebabkan soal secara keseluruhan menjadi jelek karena memiliki
validitas yang rendah. Sedangkan validitas item berguna untuk
mengetahui validitas item jika mempuyai dukungan besar terhadap skor
total. Jadi, sebuah item memiliki validitas yang tinggi jika skor pada item
sejajar dengan skor total. Cara lain untuk menghitung validitas item
adalah dengan menggunakan rumus sebagai berikut:
Mp−Mt p
γ pbi=
St √ q
Keterangan:
γ pbi = koefisien kolerasi biserial
Mp = rerata skor dari subjek yang menjawab betul bagi item yang dicari
validitasnya
Mt = rerata skor total
p = proporsi siswa yang menjawab benar
banyaknya siswa yang benar

p=
jumlah seluruh siswa
q = proporsi siswa yang menjawab salah
banyaknya siswa yang salah

q=
jumlah seluruh siswa
Validasi suatu aitem secara empiric memerlukan kriteria. Kriteria

validasi tersebut adalah ukuran lain yang relevan, yaitu yang angka-
angkanya menujukan indikasi atribut yang serupa dengan atribut yang
diukur oleh skala. Kriterianya merupakan ukuran apapun asalkan memiliki
tujuan ukur yang sama dengan skala. Jadi untuk memvalidasi aitem-aitem
dalam skala Agresivitas pada para siswa sekolah dapat menggunakan skor
tes Afresivitas lain yang sudah ada atau dapat menggunakan reting dari
guru terhadap agresivitas subjek sebagai kriterianya. Koefisien korelasi
antara skor aitem (i) dalam skala dengan skor kriteria (Y) tersebut
merupakan koefisien validitas aitem yang bersangkutan (riX)
riY = ΣiY - (Σi)(ΣY)/n

√[ Σi2 – (Σi)2/n ][ΣY2 – (ΣY)2/n]
Sebagai ilustrasi, Tabel 5.5 menyajikan kembali data skor aitem-

aitem dalam Skala X (dari Tabel 5.1) dan data skor kriteria Y. Dalam
ilustrasi ini, skor y adalah ukuran yang relevan dengan tujuan ukur Skala
X.
skor skor
skor aitem skala kriteria
1 1
1 2 3 4 5 6 7 8 9 0 1 12 X Y
A 0 2 1 2 0 0 1 1 2 1 0 1 11 98
B 3 2 4 4 3 3 4 2 4 3 3 4 39 124
C 4 4 4 3 3 3 4 3 4 2 3 3 40 124
D 1 1 2 1 2 2 1 0 0 0 1 2 13 111
E 1 1 2 2 3 2 1 2 0 0 2 3 19 120
F 3 4 3 4 4 3 4 2 2 3 3 4 39 120
G 4 4 4 4 4 4 3 4 3 3 4 4 45 120
H 1 1 2 1 0 0 0 0 3 2 1 0 11 99
I 3 3 4 3 4 2 3 3 4 3 3 4 39 120
J 1 1 1 2 1 2 2 1 3 0 2 3 19 101
K 1 1 3 2 2 1 2 0 0 2 1 1 16 101
Tabel 5.5 Distribusi Skor Aitem (i), Skor Skala (X), dan Skor Kriteria
Validasi (Y) (Data Fiktif)
Hasil komputsi koefisien validitas dari keduabelas aitem di atas disajikan
berikut ini.
Nomor Daya Koefisien Nomor Daya Koefisien

Aitem Beda Validitas Aitem Beda Validitas
riX riY riX riY
1 0,965 0,926 7 0,902 0,872
2 0,858 0,779 8 0,883 0,722
3 0,854 0,858 9 0,612 0,543
4 0,920 0,790 10 0,736 0,658
5 0,851 0,807 11 0,947 0,832
6 0,854 0,824 12 0,854 0,783
Dengan komputasi koefisien validitas aitem riY barulah pertanyaan

apakah suatu aitem itu valid atau apakah suatu aitem itu brfungsi
mengukur atribut yang seharusnya, dapat dijawab.
Sama halnya dengan koefisien korelasi aitem-total yang
menunjukkan daya beda aitem, koefisien validitas aitem pun tidak
memiliki batasan tunggal dalam interpretasinya. Kelaziman yang
dilakukan adalah menganggap bahwa aitem dengan riY ≥ 0,30 sebagai
aitem yang validitasnya memuaskan.
Dalam kompilasi aitem menjadi sebuah skala, dapatkah aitem-
aitem dipilih tidak berdasar pertimbangan daya beda aitem melainkan
berdasarkan validitas aitem? Dengan kata lain, skala akan diisi oleh aitem-
aitem yang memiliki koefisien riY tinggi.
Memilih aitem semata-mata berdasar tingginya koefisien validitas
aitem akan menghasilkan skala yang valid, yaitu yang memiliki koefisien
validitas skala yang tinggi. Kumpulan aitem yang valid akan membentuk
skala yang valid. Sayangnya, tingginya koefisien validitas tersebut akan
diiringi oleh menuunnya koefisien reliabilitas. Cara ini sebenarnya tidak
biasanya dilakukan oleh para penyusun skala dikarenakan adanya factor
lain yang ikut berpengaruh terhadap kondisi skor skala, yaitu varians
masing-masing aitem.
Cara yang lebih lazim adalah memilih komposisi aitem
berdasarkan indeks reliabilitas aitem bersama indeks validitas aitem.
Indeks reliabilitas aitem bersama indeks validitas aitem. Indeks reliabilitas
aitem (ira)dan indeks validitas aitem (iva) adalah dua statistic aitem yang
rumunya memasukkan factor variabilitas aitem. Kedua statistic tersebut
dipertimbangkan bersama untuk mengoptimalkan fungsi ukur skala.
DAFTAR PUSTAKA
Azwar, S. (2016). Penyusunan Skala Psikologi. Yogyakarta: Pustaka Pelajar.
Azwar, S. (2016). Reliabilitas Dan Validitas. Yogyakarta: PUSTAKA PELAJAR.

Hadi, S. (2015). Metodologi Penelitian. Yogyakarta: Pustaka Pelajar.

Validitas Aitem Jadi

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Validitas Aitem Jadi

Diunggah oleh

Hak Cipta:

Format Tersedia

Validasi Aitem

Untuk memenuhi tugas mata kuliah Psikometri

Dra. Tri Esti Budiningsih, M. A.

Woro Aprilianasari, S.Psi.

Indeks Validitas Aitem

Kualitas item sanagt mempengaruhi kualitas sebuah skala psikologi,

4. Daya Diskriminasi Item

Parameter daya beda aitem yang berupa koefisien korelasi antara

Validitas butir soal berguna untuk butir-butir soal yang

Mt = rerata skor total

p = proporsi siswa yang menjawab benar

banyaknya siswa yang benar

q = proporsi siswa yang menjawab salah

banyaknya siswa yang salah

Validasi suatu aitem secara empiric memerlukan kriteria. Kriteria

riY = ΣiY - (Σi)(ΣY)/n

Sebagai ilustrasi, Tabel 5.5 menyajikan kembali data skor aitem-

Nomor Daya Koefisien Nomor Daya Koefisien

Dengan komputasi koefisien validitas aitem riY barulah pertanyaan

Azwar, S. (2016). Penyusunan Skala Psikologi. Yogyakarta: Pustaka Pelajar.

Azwar, S. (2016). Reliabilitas Dan Validitas. Yogyakarta: PUSTAKA PELAJAR.

Anda mungkin juga menyukai