Disusun oleh:
Niken Saraswati
NIM. 16108241134
YOGYAKARTA
2018
1. LANGKAH-LANGKAH PENGEMBANGAN INSTRUMEN
1. Menentukan tujuan penyusunan instrumen Pada awal menyusun instrumen, perlu ditetapkan
tujuan penyusunan instrumen. Tujuan penyusunan ini memandu teori untuk mengonstruk
instrumen, bentuk instrumen, penyekoran sekaligus pemaknaan hasil penyekoran pada intrumen
yang akan dikembangkan. Tujuan penyusunan instrumen ini perlu disesuaikan dengan tujuan
penelitian. Sebagai contoh, ketika peneliti akan mengetahui pengaruh pembelajaran berbasis
masalah terhadap motivasi dan kemampuan berfikir tingkat tinggi. Tentunya ada dua intrumen
yang perlu dikembangkan, instrumen pengukur motivasi dan instrumen pengukur kemampuan
berfikir tingkat tinggi.
2. Mencari teori yang relevan atau cakupan materi. Setelah tujuan penyusunan instrument
ditetapkan, selanjutnya perlu dicari teori atau cakupan materi yang relevan. Teori yang relevan
digunakan untuk membuat konstruk, apa saja indicator suatu variabel yang akan diukur.
Kaitannya dengan tes, perlu dibatasi juga cakupan materi apa saja yang menjadi bahan
menyusun tes. Sebagai contoh pada kemampuan berfikir tingkat tinggi, yang akan diukur harus
memiliki indikator pemecahan masalah (problem solving), kebaruan, kreativitas, kontekstual
dan lain-lain. Jika yang akan diukur adalah siswa SMP, cakupan materi apa saja yang akan
diukur perlu menjadi bahan pertimbangan.
3. Menyusun indikator butir instrumen/soal Indikator soal ini ditentukan berdasarkan kajian teori
yang relevan pada instrumen nontes. Adapun pada instrumen tes, selain mempertimbangkan
kajian teori, perlu dipertimbagkan cakupan dan kedalaman materi. Indikator ini telah bersifat
khusus, sehingga dengan menggunakan indicator dapat disusun menjadi butir instrumen.
Biasanya aspek yang akan diukur dengan indikatornya disusun menjadi suatu tabel. Tabel
tersebut kemudian disebut dengan kisi-kisi (blue print). Penyusunan kisi-kisi ini mempermudah
peneliti menyusun butir soal
7. Melakukan ujicoba kepada responden yang bersesuaian untuk memeroleh data respons peserta
Setelah revisi, butir-butir instrumen kemudian disusun lengkap (dirakit) dan siap diujicobakan.
Ujicoba ini dilakukan dalam rangka memeroleh bukti empiris. Ujicoba ini dilakukan kepada
responden yang bersesuaian dengan subjek penelitian. Peneliti dapat pula menggunakan
anggota populasi yang tidak menjadi anggota sampel.
8. Melakukan analisis (reliabilitas, tingkat kesulitan, dan daya pembeda) Setelah melakukan
ujicoba, peneliti memeroleh data respons peserta ujicoba. Dengan menggunakan respons
peserta, peneliti kemudian melakukan penskoran tiap butir. Selanjutnya hasil penskoran ini
digunakan untuk melakukan analisis reliabilitas skor perangkat tes dan juga analisis
karakteristik butir. Analisis karakteristik butir dapat dilakukan dengan pendektatan teori tes
klasik maupun teori respons butir. Analisis pada kedua pendekatan ini akan dibahas pada bab-
bab selanjutnya.
9. Merakit instrumen Setelah karakteristik butir diketahui, peneliti dapat merakit ulang perangkat
instrumen. Pemilihan butir-butir dalam merakit perangkat ini mempertimbangkan karakteristik
tertentu yang dikehendaki peneliti, misalnya tingkat kesulitan butir. Setelah diberi instruksi
pengerjaan, peneliti kemudian dapat mempergunakan instrumen tersebut untuk mengumpulkan
data penelitian.
2. VALIDITAS
Validitas atau keabsahan data adalah data yang tidak berbeda antara data yang diperoleh
oleh peneliti dengan data yang terjadi sesungguhnya pada objek penelitian sehingga keabsahan
data yang telah disajikan dapat dipertanggungjawabkan. Suryabrata (2000: 41) menyatakan bahwa
validitas tes pada dasarnya menunjuk kepada derajat fungsi pengukurnya suatu tes, atau derajat
kecermatan ukurnya sesuatu tes. Validitas suatu tes mempermasalahkan apakah tes tersebut benar-
benar mengukur apa yang hendak diukur. Maksudnya adalah seberapa jauh suatu tes mampu
mengungkapkan dengan tepat ciri atau keadaan yang sesungguhnya dari obyek ukur, akan
tergantung dari tingkat validitas tes yang bersangkutan. Sudjana (2004: 12) menyatakan bahwa
validitas berkenaan dengan ketepatan alat penilaian terhadap konsep yang dinilai sehingga betul-
betul menilai apa yang seharusnya dinilai. Suatu tes yang valid untuk tujuan tertentu atau
pengambilan keputusan tertentu, mungkin tidak valid untuk tujuan atau pengambilan keputusan
lain. Jadi validitas suatu tes, harus selalu dikaitkan dengan tujuan atau pengambilan keputusan
tertentu. Tes masuk di SMA misalnya harus selalu dikaitkan dengan seberapa jauh tes masuk
tersebut dapat mencerminkan prestasi atau hasil belajar para calon peserta didik baru setelah belajar
nanti. Konsep validitas tes dapat dibedakan atas tiga macam yaitu validitas isi (content validity),
validitas konstruk (construct validity), dan validitas empiris atau validitas kriteria.
Validitas Instrumen
Ada berbagai pendapat mengenai validitas untuk instrumen yang digunakan pengukuran,
baik di bidang pendidikan maupun psikologi. Menurut “American Educational Research
Association, American Psychological Association, and National Council on Measurement in
Education” (AERA, APA, and NCME) dalam Standards for Educational and Psychological
Testing, validitas merujuk pada derajat dari fakta dan teori yang mendukung interpretasi skor tes,
dan merupakan pertimbangan paling penting dalam pengembangan tes. Ahli lain mengemukakan
bahwa validitas suatu alat ukur adalah sejauhmana alat ukur itu mampu mengukur apa yang
seharusnya diukur ( Kerlinger, 1986). linnBerdasarkan beberapa pendapat tersebut, dapat
disimpulkan bahwa validitas akan menunjukkan dukungan fakta empiris dan alasan teoretis
terhadap terhadap interpretasi skor tes atau skor suatu instrumen, dan terkait dengan kecermatan
pengukuran.
Validitas itu dapat dikelompokkan menjadi tiga tipe, yaitu: (1) validitas kriteria (criterion-
related), (2) validitas isi, dan (3) validitas konstruk (Nunnally, 1978, Allen & Yen, 1979,
Fernandes, 1984, Woolfolk & McCane, 1984, Kerlinger, 1986, dan Lawrence, 1994). Validitas ini
dapat diketahui melalui fakta keberadaaan validitas.
Validitas berdasarkan kriteria dibedakan menjadi dua, yaitu validitas prediktif dan validitas
konkuren. Fernandes (1984) mengatakan validitas berdasarkan kriteria dimaksudkan untuk
menjawab pertanyaan sejauh mana tes memprediksi kemampuan peserta di masa mendatang
(predictive validity) atau mengestimasi kemampuan dengan alat ukur lain dengan tenggang waktu
yang hampir bersamaan (concurrent validity). Hal senada juga disampaikan oleh Lawrence (1994)
yang mengatakan bahwa tes dikatakan memiliki validitas prediktif bila tes itu mampu
memprediksikan kemampuan yang akan datang. Dalam analisis validitas prediktif, performansi
yan g hendak diprediksikan disebut dengan kriteria. Besar kecilnya harga estimasi validitas
prediktif suatu instrumen digambarkan dengan koefisien korelasi antara prediktor dengan kriteria
tersebut.
Nurkancana (1992: 141) menyatakan bahwa suatu alat pengukur dapat dikatakan alat pengukur
yang valid apabila alat pengukur tersebut dapat mengukur apa yang hendak diukur secara tepat.
Dalam hal validitas dan reliabilitas, tentunya dipengaruhi oleh (1) instrumen, (2) subjek yang
diukur, dan (3) petugas yang melakukan pengukuran. Dalam hal pengukuran, khususnya dalam
pendidikan tentunya yang terpenting adalah informasi hasil ukur yang benar. Sebab dengan hasil
ukur yang tidak atau kurang tepat maka akan memberikan informasi yang tidak benar, sehingga
kesimpulan yang diambil juga tidak benar. Steven (dalam Nur, 1987: 1) menyatakan bahwa
pengukuran adalah pemberian angka atas objek atau kejadian sesuai dengan aturan.
3. VALIDITAS ISI
Validitas adalah sejauh mana tes itu mengukur apa yang dimaksudkan untuk diukur. Secara
umum ada tiga pendekatan dalam meneliti validitas suatu alat ukur, yaitu 1) validitas isi, 2)
validitas konstruk, dan 3) validitas kriteria (Suryabrata, 2005), sehingga analisis rasional adalah
proses utama yang dilakukan dalam analisis validitas isi (Azwar, 2005). Validitas isi suatu
instrumen adalah sejauhmana butir-butir dalam instrumen itu mewakili komponen-komponen
dalam keseluruhan kawasan isi objek yang hendak diukur dan sejauh mana butir-butir itu
mencerminkan ciri perilaku yang hendak diukur (Nunnally, 1978; Fernandes, 1984). Sementara itu
Lawrence (1994) menjelaskan bahwa validitas isi itu keterwakilan pertanyaan terhadap
kemampuan khusus yang harus diukur. Berdasarkan hal ini, dapat disimpulkan bahwa validitas isi
terkait dengan analisis rasional terhadap domain yang hendak diukur untuk mengetahui
keterwakilan instrumen dengan kemampuan yang hendak diukur.
Validitas isi menunjukkan sejauhmana pertanyaan, tugas atau butir dalam suatu tes atau
instrumen mampu mewakili secara keseluruhan dan proporsional perilaku sampel yang dikenai tes
tersebut. Artinva tes itu valid apabila butir-butir tes itu mencerminkan keseluruhan konten atau
materi yang diujikan atau yang seharusnya dikuasai secara proporsional. Untuk mengetahui apakah
tes itu valid atau tidak, harus dilakukan melalui penelaahan kisi-kisi tes untuk memastikan bahwa
soal-soal tes itu sudah mewakili atau mencerminkan keseluruhan konten atau materi yang
seharusnya dikuasai secara proporsional. Oleh karena itu validitas isi suatu tes tidak mempunyai
besaran tertentu yang dihitung secara statistika tetapi dipahami bahwa tes itu sudah valid
berdasarkan telaah kisi-kisi tes. Oleh karena itu, validitas isi sebenarriya mendasarkan pada analisis
logika, tidak merupakan suatu koefisien validitas yang dihitung secara statistika.
Untuk mewujudkan validitas isi yang baik harus digunakan dengan beragam metode, baik
secara kualitatif atau kuantitatif, untuk menilai semua elemen instrumen asesmen. Pada tahap awal
pengembangan instrumen tujuan validasi isi adalah mengurangi variasi potensi kesalahan
pembuatan instrumen dan meningkatkan kemungkinan diperolehnya indeks validitas konstruk
dalam studi lanjutan. Karena sumber-sumber kesalahan antara konstruk teoritis, metode asesmen,
dan fungsi asesmen berbeda-beda, maka metode validasi isinya juga akan berbeda (Haynes,
Richard, & Kubany, 1995). Anjuran-anjuran dalam merancang validasi alat ukur dilihat dari sisi
isi (Haynes, Richard, & Kubany, 1995), yaitu:
2. Perhatikan semua elemen instrumen asesmen untuk melakukan validasi isi. Elemen-
elemen dari instrumen seperti format jawaban dan instruksi harus diperhatikan agar sesuai
dengan tipe alat ukur. Instruksi “Jawablah pertanyaan-pertanyaan berikut dengan benar”
tidak tepat untuk alat ukur subyektif seperti kuesioner dan self report, dan self monitoring.
Variable-variabel seperti self esteem, konsep diri atau motivasi tidak tepat jika
menggunakan instruksi seperti yang diatas. Instruksi diatas hanya tepat jika digunakan
untuk tes-tes kemampuan maksimal seperti tes inteligensi dan bakat.
3. Gunakan populasi dan tahapan penyampelan untuk memperoleh item-item awal dan
elemen-elemen lain. Untuk mengetahui perilaku yang ingin diukur sebaiknya
menggunakan banyak sumber informasi tentang perilaku itu. Selain para ahli yang
memahami betul perilaku itu, mewawancarai subyek dari populasi yang menjadi target
pengukuran perlu juga dilakukan untuk memperoleh gambaran perilaku yang lebih
komprehensif, relevan dan representative terhadap aspek-aspek kontruk.
4. Gunakan penilaian dari penilai yang beragam untuk validasi isi dan kuantitatifkan
penilaian yang menggunakan prosedur pengskalaan yang formal. Setiap elemen dalam
instrumen harus dinilai apakah relevan atau tidak digunakan dalam pengukuran perilaku
yang ingin diukur. Setiap elemen ini harus dinilai oleh beberapa ahli. Penilaian yang
diberikan itu menggunakan skala penilaian dengan lima atau tujuh. Penilaian itu ditujukan
kepada relevansi, reprentasi, spesifikasi, dan kejelasan alat ukur. Statistic deskriptif
terhadap penilaian itu bisa menjadi patokan untuk memutuskan tingkat kevalidan alat ukur
itu.
6. Laporkan hasil validasi isi jika menerbitkan instrumen asesmen yang baru. Indeks atau
hasil secara kuantitatif terhadap validitas isi akan membantu masyarakat untuk
mengetahui sejauhmana alat ukur telah melalui proses validasi ini. Angka-angka yang
menunjukkan penilaian terhadap, misalnya kerelevanan, kerepresentatifan, sangat penting
untuk member gambaran yang jelas terhadap pengguna alat ukur itu. Dengan indeks ini
maka calon pengguna alat ukur akan merasa yakin bahwa alat ukur yang akan
digunakannya berkualitas baik.
Dibawah ini penulis berusaha membuat sebuah panduan penilaian atau judgment validitas
isi yang menggunakan berbagai elemen alat ukur sebagai hal-hal yang dinilai oleh para ahli.
Dengan panduan penilaian kuantitatif ini maka akan dengan mudah menilai seberapa baik validitas
isi alat ukur. Dalam deskripsi alat ukur penyusunnya harus menguaraikan elemen-elemen dalam
alat ukur untuk kemudian dinilai oleh penilai. Mulai dari alat ukurnya sampai kepada waktu
pengisian instrumen.
4. Fungsi Instrumen : (Untuk seleksi, untuk self report, atau untuk self monitoring atau lainnya
6. Format Jawaban : (pola pilihanpilihan jawaban yang diberikan) 7. Jumlah Item : (Jumlah
pernyataan untuk setiap indikator atau satu alat ukur)
9. Sampel populasi : (Jumlah dan karakteristik sampel responden yang akan diujicobakan)
10. Waktu : Interval waktu perilaku yang diukur dengan waktu pengukuran
Validitas adalah sejauhmana tes itu mengukur apa yang dimaksudkan untuk diukur.
Validitas sering diartikan sebagai tes keabsahan data. Pemeriksaan terhadap keabsahan data pada
dasarnya, selain digunakan untuk menyanggah balik yang dituduhkan kepada penelitian kualitatif
yang mengatakan tidak ilmiah, juga merupakan sebagai unsur yang tidak terpisahkan dari tubuh
pengetahuan penelitian kualitatif (Moleong, 2007:320). Keabsahan data dilakukan untuk
membuktikan apakah penelitian yang dilakukan benar-benar merupakan penelitian ilmiah
sekaligus untuk menguji data yang diperoleh. Keabsahan data adalah derajat kepercayaan atau
kebenaran hasil penelitian. Menurut Lincoln dan Guba (1985: 23), dalam penelitian kualitatif, suatu
realitas itu bersifat majemuk, dinamis, sehingga tidak ada yang konsisten dan berulang seperti
semula. Untuk mendapatkan hasil penelitian yang berkualitas, sangat dibutuhkan suatu keabsahan
data. Tingkat keabsahan data akan ditentukan oleh empat faktor, yaitu: (1) derajat kepercayaan
(credibility), (2) keterahlian (transferability), (3) ketergantungan (dependebility), dan (4) kepastian
(confirmability).
Sejalan dengan pendapat (Sugiyono 2007:270) Uji keabsahan data dalam penelitian
kualitatif meliputi uji, credibility, transferability, dependability, dan confirmability (Sugiyono,
2007:270). Hal tersebut dimaksudkan agar data dalam penelitian kualitatif dapat
dipertanggungjawabkan sebagai penelitian ilmiah perlu dilakukan uji keabsahan data. Adapun uji
keabsahan data yang dapat dilaksanakan.
1. Credibility
Uji credibility (kredibilitas) atau uji kepercayaan terhadap data hasil penelitian yang disajikan
oleh peneliti agar hasil penelitian yang dilakukan tidak meragukan sebagai sebuah karya
ilmiah dilakukan.
b. Triangulasi
Menurut Sugiyono (2017:330) triangulasi diartikan sebagai teknik pengumpulan data
yang bersifat menggabungkan dari bebagai teknik pengumpulan data dan sumber data yang
telah ada. Bila peneliti melakukan pengumpulan data dengan triangulasi, maka sebenarnya
peneliti mengumpulkan data yang sekaligus menguji kredibilitas data, yaitu mengecek
kredibilitas data dengan berbagai teknik pengumpulan data dan bebagai sumber data.
a. Triangulasi Data
Selain data verbal, wawancara dan diskusi kelompok, data visual saat ini menerima
perhatian yang cukup besar dalam penelitian kualitatif. Terlepas dari penekanan pada observasi
(tidak hanya partisipan), rekaman video dan foto digunakan dengan sebagian besar peneliti.
Sebagai hasil dari ini, perspektif baru dalam triangulasi data muncul: selain dari
penggunaannya dalam wawancara, data visual dapat di triangulasi dengan data verbal sebagai
sumber informasi independen. Jenis data yang benar-benar baru, seperti data elektronik,
membuka kemungkinan lebih lanjut dari triangulasi dengan jenis data tradisional.
b. Triangulasi Investigator
Implementasi ini dapat ditemukan dalam proposal bahwa interpretasi data yang
dikumpulkan hanya boleh dilakukan dalam kelompok, sehingga memperluas,
memperbaiki atau memeriksa pandangan subjektif penafsir. Dalam kontek shermeneutika
obyektif ini telah lama diperlukan. Ide-ide yang berbeda tentang loka karya penelitian juga
berhutang budi pada gagasan ini.
Ini adalah kombinasi dari metode yang berbeda, penekanan yang berbeda terdapat
pada menghubungkan metode kualitatif dan kuantitatif dalam desain penelitian yang
berbeda. Selain itu, triangulasi pendekatan yang berbeda memungkinkan untuk
menangkap aspek yang berbeda dari masalah penelitian. Seperti contoh konkret dari
aktivitas profesional dan pengetahuan tentang mode tindakan dan rutinitas seseorang.
Triangulasi metodologis memiliki andil yang cukup besar dalam bidang etnografi.
Etnografi berubah menjadi strategi penelitian yang mencakup setiap opsi yang mungkin
dan secara etika dapat dipertahankan untuk mengumpulkan data’. Di sini pendekatan-
pendekatan metodologis yang diperlukan untuk merealisasikan opsi-opsi semacam itu
ditriangulasikan satu sama lain, bahkan ketika istilah itu tidak selalu disebutkan secara
eksplisit.
Triangulasi teknik, berarti peneliti menggunakan teknik pengumpulan data yang berbeda
– beda untuk mendapatkan data dari sumber yang sama. Peneliti menggunakan observasi
partisipatif, wawancara mendalam, dan dokumentasi untuk sumber data yang sama secara
serempak. Triangulasi sumber berarti, untuk mendapatkan data dari sumber yang berbeda –
beda dengan teknik yang sama.
Norman K. Denzin (1978) mendefinisikan triangulasi sebagai gabungan atau
kombinasi berbagai metode yang dipakai untuk mengkaji fenomena yang saling terkait dari
sudut pandang dan perspektif yang berbeda. Menurutnya, triangulasi meliputi empat hal,
yaitu: (1) triangulasi metode, (2) triangulasi antar-peneliti (jika penelitian dilakukan
dengan kelompok), (3) triangulasi sumber data, dan (4) triangulasi teori.
Salah satu instrument yang untuk memudahkan dalam rangka triangulasi data adalah
lembar catatan data. Lembar catatan data dapat membantu peneliti dalam mengorganisir data,
membuat ringkasan sementara dari permasalahan penelitian yang terkait sekaligus
mengcrosscheck data apasaja yang telah tersedia dan belum serta data apa saja yang layak
analisis atau yang telah dikonfirm dengan sumber data lain.
c. Analisis Kasus Negatif
Melakukan analisis kasus negatif berarti peneliti mencari data yang berbeda atau
bahkan bertentangan dengan data yang telah ditemukan. Bila tidak ada lagi data yang
berbeda atau bertentangan dengan temuan, berarti masih mendapatkan data-data yang
bertentangan dengan data yang ditemukan, maka peneliti mungkin akan mengubah
temuannya (Sugiyono, 2007: 275).
e. Mengadakan Membercheck
Tujuan membercheck adalah untuk mengetahui seberapa jauh data yang diperoleh
sesuai dengan apa yang diberikan oleh pemberi data. Jadi tujuan membercheck adalah agar
informasi yang diperoleh dan akan digunakan dalam penulisan laporan sesuai dengan apa
yang dimaksud sumber data atau informan (Sugiyono, 2007: 276).
2. Dependability
Reliabilitas atau penelitian yang dapat dipercaya, dengan kata lain beberapa percobaan
yang dilakukan selalu mendapatkan hasil yang sama. Penelitian yang dependability atau
reliabilitas adalah penelitian apabila penelitian yang dilakukan oleh orang lain dengan proses
penelitian yang sama akan memperoleh hasil yang sama pula. Pengujian dependability
dilakukan dengan cara melakukan audit terhadap keseluruhan proses penelitian. Dengan cara
auditor yang independen atau pembimbing yang independen mengaudit keseluruhan aktivitas
yang dilakukan oleh peneliti dalam melakukan penelitian. Misalnya bisa dimulai ketika
bagaimana peneliti mulai menentukan masalah, terjun ke lapangan, memilih sumber data,
melaksanakan analisis data, melakukan uji keabsahan data, sampai pada pembuatan laporan
hasilpengamatan.
3. Confirmability
Objektivitas pengujian kualitatif disebut juga dengan uji confirmability penelitian.
Penelitian bisa dikatakan objektif apabila hasilpenelitian telah disepakati oleh lebih banyak
orang. Penelitian kualitatif uji confirmability berarti menguji hasil penelitian yang dikaitkan
dengan proses yang telah dilakukan. Apabila hasil penelitian merupakan fungsi dari proses
penelitian yang dilakukan, maka penelitian tersebut telah memenuhi standar confirmability.
Validitas atau keabsahan data adalah data yang tidak berbeda antara data yang
diperoleh oleh peneliti dengan data yang terjadi sesungguhnyapada objek penelitian sehingga
keabsahan data yang telah disajikan dapat dipertanggungjawabkan.
4. Transferability
Transferability merupakan validitas eksternal dalam penelitian kualitatif. Validitas
eksternal menunjukkan derajat ketepatan atau dapat diterapkannya hasil penelitian ke populasi
di mana sampel tersebut diambil (Sugiyono, 2007: 276). Pertanyaan yang berkaitan dengan
nilai transfer sampai saat ini masih dapat diterapkan atau dipakai dalam situasi lainnya. Bagi
peneliti, nilai transfer sangat bergantung pada si pemakai, sehingga ketika penelitian dapat
digunakan dalam konteks yang berbeda di situasi sosial yang berbeda validitas nilai transfer
masih dapat dipertanggungjawabkan.
Menurut Nunally ( dalam Ardial,2014 : 462), validitas alat pengumpul data dapat
digolongkan ke dalam beberapa jenis, yakni validitas konstruksi, validitas isi, validitas
prediktif, validitas eksternal, serta validitas rupa (face validity).
Validitas isi ditentukan menggunakan kesepakatan ahli. Kesepakatan ahli bidang studi
atau sering disebut dengan domain yang diukur menentukan tingkatan validitas isi (content
related). Hal ini dikarenakan instrumen pengukuran, misalnya berupa tes atau angket
dibuktikan valid jika ahli (expert) meyakini bahwa bahwa instrumen tersebut mengukur
penguasaan kemampuan yang didefinisikan dalam domain ataupun juga konstruk psikologi
yang diukur. Untuk mengetahui kesepakatan ini, dapat digunakan indeks validitas, diantaranya
dengan indeks yang diusulkan oleh Aiken (1985; 131-142) Kumaidi, (2014). Indeks validitas
butir yang diusulkan Aiken ini dirumuskan sebagai berikut:
dengan V adalah indeks kesepakatan rater mengenai validitas butir; s skor yang ditetapkan
setiap rater dikurangi skor terendah dalam kategori yang dipakai (s = r – lo, dengan r = skor
kategori pilihan rater dan lo skor terendah dalam kategori penyekoran); n banyaknya rater; dan
c banyaknya kategori yang dapat dipilih rater. Berdasarkan pendapat tersebut, indeks Aiken V
merupakan indeks kesepakatan rater terhadap kesesuaian butir (atau sesuai tidaknya butir)
dengan indikator yang ingin diukur menggunakan butir tersebut. Jika diterapkan untuk
instrument pengukuran, menurut seorang rater maka n dapat diganti dengan m (banyaknya
butir dalam satu instrumen). Indeks V ini nilainya berkisar diantara 0-1. Contoh membuktikan
validitas isi dari instrumen yang disajikan selengkapnya pada Bab 3. Dari hasil perhitungan
indeks V, suatu butir atau perangkat dapat dikategorikan berdasarkan indeknya. Jika indeksnya
kurang atau sama dengan 0,4 dikatakan validitasnya kurang, 0,4-0,8 dikatakan validitasnya
sedang, dan jika lebih besar dari 0,8 dikatakan sangat valid.
Cara lain membuktikan validitas isi dengan kesepakatan ahli adalah dengan menggunakan
indeks kesepakatan ahli yang disarankan oleh Indeks ini juga berkisar diantara 0-1. Dengan
membuat tabel kontingensi pada dua ahli, dengan kategori pertama tidak relevan dan kurang
relevan menjadi kategori relevansi lemah, dan kategori kedua untuk yang cukup relevan dan sangat
relevan yang dibuat kategori baru relevansi kuat. Indeks kesepakatan ahli untuk validitas isi
merupakan perbandingan banyaknya butir dari kedua ahli dengan kategori relevansi kuat dengan
keseluruhan butir. Ada hal lain yang perlu diperhatikan terkait dengan validitas isi. Keterwakilan
indikator dari domain yang akan diukur benar-benar perlu menjadi perhatian. Beberapa ahli
menggolongkan hal ini sebagai validitas logis. Kebenaran konsep yang dinyatakan dalam
instrumen merupakan hal yang dapat dijadikan kriteria dan bahan pertimbangan untuk mengisi
skor dalam format penilaian. Jika instrumen berbentuk pilihan ganda, maka keberadaan kunci
jawaban, keberfungsian distraktor, format penulisan, keterbacaan butir,dan juga berfungsinya
gambar atau tabel juga dapat dijadikan pertimbangan. Beberapa ahli mengategorikan ini sebagai
validitas kenampakan (face validity).
Azwar (2012 :112) menjelaskan bahwa validitas tampang hanya sekedar tahap penerimaan
orang pada umumnya terhadap fungsi pengukuran tes, serta tidak berhubungan dengan statistic
validitas seperti koefisien atau indeks. Sekaran (2006:43) Validitas tampang/muka (face validity)
merupakan validitas isi yang paling dasar dan sangat minimum. Validitas isi menunjukkan bahwa
aitem-aitem yang dimaksudkan untuk mengukur sebuah konsep, memberikan kesan mampu
mengungkap konsep yang hendak di ukur
Setelah butir-butir soal tersusun, langkah selanjutnya adalah validasi. Validasi ini dilakukan
dengan menyampaikan kisi-kisi, butir instrumen, dan lembar diberikan kepada ahli untuk ditelaah
secara kuantitatif dan kualitatif. Tugas ahli adalah melihat kesuaian indicator dengan tujuan
pengembangan instrumen, kesesuaian indicator dengan cakupan materi atau kesesuaian teori,
melihat kesuaian instrumen dengan indicator butir, melihat kebenaran konsep butir soal, melihat
kebenaran isi, kebenaran kunci (pada tes), bahasa dan budaya. Proses ini disebut dengan validasi
isi dengan mempertimbangkan penilaian ahli (expert judgement). Jika validasi isi akan
dikuantifikasi, peneliti dapat meminta ahli mengisi lembar penilaian validasi. Paling tidak, ada 3
ahli yang dilibatkan untuk proses validasi instrumen penelitian. Berdasarkan isian 3 ahli,
selanjutnya penelitian menghitung indeks kesepakatan ahli atau kesepakatan validator dengan
menggunakan indeks Aiken atau indeks Gregory. (Heri Retnawati,2016 : 3-5).
Aiken ( 1983) dalam jurnalnya berjudul Three Coefficients for Analyzing the Reliability
and Validity of Ratings tahun 1985, menjelaskan formula untuk menghitung koefisien validitas
Aiken’s V adalah sebagai berikut.
s = r – lo
r = angka yang diberikan penilai
lo = angka penilaian validitas terendah
n = jumlah penilai
c = angka penilaian validitas tertinggi
Sebagai contoh, suatu item dinilai oleh 3 rater dengan skala 1-5 dengan masing-masing nilai dari
rater 1-3 adalah 4, 4, 5, maka n=4, c=5, lo=1.
S rater 1 = 4-1=3
S rater 2 = 4-1=3
S rater 3= 5-1=4
V=(3+3+4)/[3(5-1)]=0,833
Setelah dilakukan perhitungan dan menghasilkan indeks V, Aiken juga memberikan panduan
untuk kita apakah suatu item tersebut diterima atau tidak. Rambu-rambu untuk menilai indeks V
tersebut ditampilkan dalam tabel di bawah ini.
Setelah dilakukan perhitungan dan menghasilkan CVR, Lawshe juga memberikan panduan
untuk kita apakah suatu item tersebut diterima atau tidak. Rambu-rambu untuk menilai CVR
tersebut ditampilkan dalam tabel di bawah ini.
Sumber: Lawshe, 1975
Kolom pertama tabel menunjukkan jumlah penilai dan kolom kedua menunjukkan nilai
minimal CVR yang diterima. Dari tabel tersebut, terlihat bahwa jumlah penilai minimal yang
disarankan adalah 5 orang, dan agar item tersebut diterima, seluruh penilai tersebut harus
mengatakan bahwa item adalah esensial.
Sebagai contoh, jika kita memiliki penilai sejumlah 15 orang dan ada 12 penilai yang
menyatakan bahwa item kita adalah esensial, maka nilai CVR=(2x12/15)-1 = 0,6. Dengan melihat
pada tabel, nilai minimal CVR dengan 15 penilai adalah 0,49, sedangakan nilai CVR kita 0,6,
sehingga dapat dikatakan bahwa item kita valid.
Dari kedua jurnal tersebut dapat terlihat bahwa sebenarnya untuk jumlah rater yang
disarankan adalah semakin banyak semakin baik karena semakin banyak rater nilai minimum yang
diperlukan juga semakin kecil. Namun kualitas rater juga tetap harus dijaga, karena rater
seharusnya adalah orang yang benar-benar mengerti tentang konstrak atau tujuan ukur alat ukur.
7. RELIABILITAS ALPHA
Ghozali (2009) menyatakan bahwa reliabilitas adalah alat untuk mengukur suatu kuesioner
yang merupakan indikator dari peubah atau konstruk. Suatu kuesioner dikatakan reliabel atau
handal jika jawaban seseorang terhadap pernyataan adalah konsisten atau stabil dari waktu ke
waktu. Reliabilitas suatu test merujuk pada derajat stabilitas, konsistensi, daya prediksi, dan
akurasi. Pengukuran yang memiliki reliabilitas yang tinggi adalah pengukuran yang dapat
menghasilkan data yang reliabel.
Tinggi rendahnya reliabilitas, secara empirik ditunjukan oleh suatu angka yang disebut
nilai koefisien reliabilitas. Reliabilitas yang tinggi ditunjukan dengan nilai rxx mendekati angka
1. Kesepakatan secara umum reliabilitas yang dianggap sudah cukup memuaskan jika ≥ 0.700.
Keterangan :
Jika nilai alpha > 0.7 artinya reliabilitas mencukupi (sufficient reliability) sementara jika
alpha > 0.80 ini mensugestikan seluruh item reliabel dan seluruh tes secara konsisten memiliki
reliabilitas yang kuat. Atau, ada pula yang memaknakannya sebagai berikut:
Jika alpha > 0.90 maka reliabilitas sempurna. Jika alpha antara 0.70 – 0.90 maka reliabilitas
tinggi. Jika alpha 0.50 – 0.70 maka reliabilitas moderat. Jika alpha < 0.50 maka reliabilitas
rendah. Jika alpha rendah, kemungkinan satu atau beberapa item tidak reliabel.
Menurut Hadi (1997) yang dimaksud dengan daya beda (discriminating power) adalah
kemampuan alat ukur untuk menyatakan berbeda dua hal yang memang dalam kenyataannya
berbeda. Sedangkan menurut Suryabrata (1997) berpendapat daya pembeda soal diukur dari
kesesuaian soal itu dengan keseluruhan tes (kumpulan soal) dalam membedakan antara mereka
yang tinggi kemampuannya dan mereka yang rendah kemampuannya dalam hal yang diukur oleh
tes yang bersangkutan. Sedangkan menurut Arikunto (1999: 211) daya pembeda soal adalah
kemampuan suatu soal untuk membedakan antara siswa yang berkemampuan tinggi dengan yang
berkemampuan rendah.
9. VALIDITAS KONSTRUK
Menurut Ghozali I (2001: ) uji validitas konstruk juga dilakukan untuk mengetahui apakah
butir-butir pertanyaan atau indikator yang digunakan dapat mengkonfirmasi konstruk atau
variabel.. sedangkan menurut Djaali dan Pudji (2008: ) berpendapat validitas konstruk adalah
validitas yang mempermasalahkan seberapa jaug item-item tes mampu mengukur apa yang benar-
benar hendak diukur sesuai dengan konsep khusus atau definisi konseptual yang telah ditetapkan.
Dan menurut Suryabrata (2000: ) validitas konstruk (construct validity) menyatakan sejauh mana
skor-skor hasil pengukuran dengan suatu instrument itu merefleksikan konstruk teoritik yang
mendasari penyusunan instrumen tersebut.
Sedangkan menuurt Widoyoko (2009: 131) sebuah tes dikatakan memiliki validitas
konstruk apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berpikir
seperti yang disebutkan dalam tujuan pembelajaran atau mengukur sesuatu sesuai dengan definisi
yang digunakan. Validitas konstruk mengacu pada sejauh mana suatu instrumen mengukur konsep
dari suatu teori, yaitu yang menjadi dasar penyusunan instrument. Definisi atau konsep yang diukur
berasal dari teori yang digunakan.
Sama halnya dengan pendapat Sudjana (1991: 14) yang mengatakan bahwa construct
validity merupakan kesanggupan alat penilaian untuk mengukur pengertian-pengertian yang
terkandung dalam materi yang diukur. Lebih lanjut dijelaskan Arikunto (2006: 65), validitas
konstruk menunjuk kondisi instrument yang disusun berdasarkan konstrak- aspek kejiwaan- yang
seharusnya di evaluasi. Butir-butir soal tersebut dapat mengukur setiap aspek berpikir seperti yang
disebutkan dalam Tujuan Instruksional Khusus (TIK).
Purwanto (1992: 138) menambahkan, untuk menentukan adanya construct validity, hasil-
hasil tes itu disesuaikan dengan tujuan atau ciri-ciri tingkah laku (domein) yang hendak diukur.
Sukardi (2011: 34) menambahkan bahwa proses melakukan validasi konstruk dapat dilakukan
dengan cara melibatkan hipotesis testing yang diedukasi dari teori yang menyangkut dengan
konstruk yang relevan. Adapun langkah-langkah melakukan uji validitas konstruk dengan
menggunakan analisis faktor antara lain sebagaimana dikemukakan De Vaus (1991) yakni: (1)
memilih variabel yang akan dianalisis, (2) ekstraksi awal seperangkat faktor, (3) ekstraksi akhir
seperangkat faktor dengan rotasi, dan (4) menyusun skala untuk digunakan analisis lanjut.
Menurut Cronbach dan Meehl (1955), validitas konstruk mengacu pada pemeriksaan suatu
ukuran dari atribut (atau konstruk) yang tidak didefinisikan secara operasional atau diukur secara
langsung. Selama proses membangun validitas konstruk. Peneliti menguji hipotesis spesifik
tentang bagaimana mengukur terkait untuk ukuran lain berdasarkan teori. Abbott (2003)
menambahkan validitas konstruk dalam arti luas bisa disebut sebagai validitas struktural atau
faktorial. Koeske (1994) memberikan diskusi yang sangat baik tentang validitas konstruk,
termasuk rekomendasi untuk penggunaan terminologi validitas yang konsisten dalam penelitian
pekerjaan sosial.
Suryanto (1998: ) mengemukakan bahwa analisis faktor merupakan kajian tentang kesaling
tergantungan antara variabel-variabel, dengan tujuan untuk menemukan himpunan variabel-
variabel baru yang lebih sedikit jumlahnya daripada variabel semula dan yang menujukkan mana
di antara variabel-variabel semula itu sebagai faktor-faktor persekutuan. Sedangkan pendapat dari
Fruchter (1954) analisa faktor adalah suatu metode untuk menganalisis sejumlah observasi,
dipandang dari sisi interkorelasinya untuk mendapatkan apakah variasi-variasi yang nampak dalam
observasi itu mungkin berdasarkan atas sejumlah kategori dasar yang jumlahnya lebih sedikit dari
yang nampak.
Sementara itu Kerlinger (1990) mengungkapkan bahwa analisa faktor adalah gagasan atau
konsep suatu hipotesis yang sungguh-sungguh ada yang mendasari suatu tes, skala, item dan
pengukuran-pengukuran dalam banyak hal. Secara garis besar ada dua tipe analisa faktor, yaitu:
1) Confirmatory Factor Analysis
Model yang diasumsikan untuk menggambarkan, menjelaskan atau menghitung
data empirik. Konstruksi dari model ini berdasar pada informasi yang apriori mengenai
sifat dari struktur data atau isi dari teori (Joreskog & Sorbon, 1989).
Model yang diaplikasikan untuk mengeksplorasi data yang ada mengenai jumlah
karakteristiknya, sifat-sifat yang menarik dan hubungan-hubungan yang mungkin
ada. Exploratory Factor Analysis ini berguna untuk tujuan menggenerasikan struktur,
model-model teoritis dan mengetes hipotesis (Crowley & Fan, 1997). Pada penelitian ini
yang digunakan adalah analisis faktor eksploratori (exploratory factor analysis). Menurut
Panter,dkk (1997) aplikasi dari exploratory factor analysis adalah mengidentifikasi
makna, konstrak atau dimensi yang dievaluasi oleh kovarians yang diobservasi yang
meliputi sifat yang diobservasi, respon, tanda dan symton.
Model ini secara umum dijelaskan sebagai perilaku yang diobservasi yang dapat
digambarkan dalam bentuk konstrak tertentu dengan asumsi hanya pada kasus yang jarang
yang dapat menjadi korespondensi secara eksak antara indeks perilaku spesifik yang
diobservasi tertentu yang bervariasi atau operasionalisasi dan konstruks tertentu yang
berhubungan.
Model-model dari analisa faktor mempunyai peranan penting didalam
memformulasikan model konsep didalam kepribadian dan untuk menguji secara empiris
berbagai instrumen yang mengukur kepribadian (Panter,dkk, 1997). Hal ini didukung oleh
pendapat Ozer dan Reise, 1994 (dalam Panter,dkk, 1997) bahwa pendekatan analisa faktor
didalam asesmen kepribadian mempunyai peran utama didalam mengkontruksi skala dan
mengetes teori dalam hal struktur kepribadian dan perkembangannya. Banyak inventori-
inventori kepribadian yang telah dikonstruksi dengan menggunakan metode analisa faktor
(Aiken, 1997).
EFA digunakan dalam kondisi dimana peneliti tidak memiliki informasi awal atau hipotesis
harus dikelompokkan ke dalam variabel mana saja sekumpulan indikator yang telah dibuat. jadi
peneliti berangkat dari indikator (manifest) kemudian membentuk variabel. EFA juga digunakan
dalam kondisi dimana variabel laten memiliki indikator yang belum jelas. indikator satu variabel
laten dimungkinkan overlap dengan indikator variabel laten lainnya.
Analisis faktor eksploratori atau analisis komponen utama (PCA = principle component
analysis) yaitu suatu teknik analisis faktor di mana beberapa faktor yang akan terbentuk berupa
variabel laten yang belum dapat ditentukan sebelum analisis dilakukan. Pada prinsipnya analisis
faktor eksploratori di mana terbentuknya faktor-faktor atau variabel laten baru adalah bersifat acak,
yang selanjutnya dapat diinterprestasi sesuai dengan faktor atau komponen atau konstruk yang
terbentuk. Analisis faktor eksploratori persis sama dengan anlisis komponen utama (PCA).
Menurut Child (2013) dalam artikel ilmiah An Gie Yong dan Sean Pearce menjelaskan
bahwa “Confirmatory Factor Analysis (CFA) attempts to confirm hypotheses and uses path
analysis diagrams to represent variables and factors, whereas Exploratory Factor Analysis (EFA)
tries to uncover complex patterns by exploring the dataset and testing predictions.
Child (2013) menjelaskan bahwa CFA adalah cara untuk membantu membangun teori baru karena
peneliti tidak mengetahui teori atau hipotesis dan menggunakan jalur analisis diagram untuk
mewakili variabel dan faktor, sedangkan EFA adalah analisis yang sebelumnya sudah terprediksi,
lalu dibuat sebuah pola yang lebih kompleks.
Secara umum, EFA merupakan analisa langkah awan pada langkah lanjutan untuk
membangun sistem pengukuran yang menghasilkan suatu dasar berupa hasil agar dapat diuraikan.
Untuk itu, analisis faktor eksploratori membuat sebuah kelompok nilai yang memiliki banyak
varian baru yang menggantikan sejumlah variable asal. Apabila sudah terbentuk, pastikan
kelompok nilai tersebut memiliki sebuah data yang berupa nilai akhir.
Analisis Faktor konfirmatori merupakan salah satu metode analisis multivariat yang dapat
digunakan untuk mengkonfirmasikan apakah model pengukuran yang dibangun sesuai dengan
yang dihipotesiskan. Dalam Analisis Faktor konfirmatori, peubah laten dianggap sebagai peubah
penyebab (peubah bebas) yang mendasari peubah-peubah indikator (Ghozali, 2003). Peubah-
peubah terdiri dari peubah-peubah yang dapat diamati atau diukur langsung disebut peubah
manifest dan peubah-peubah yang tidak dapat diukur secara langsung disebut peubah laten (latent
variable). Peubah laten tidak dapat diukur secara langsung tetapi dapat dibentuk dan dibangun oleh
peubah-peubah lain yang dapat diukur. Peubah-peubah yang digunakan untuk membangun peubah
laten disebut peubah indikator. Analisis validitas merupakan analisis terhadap suatu ukuran yang
menunjukkan tingkat kevalidan dari suatu kuesioner.Tinggi rendahnya validitas instrumen
menunjukkan sejauh mana data yang terkumpul tidak menyimpang dari gambaran tentang validitas
yang dimaksud. Validitas dilakukan dengan analisis data reduction factor dengan melihat hasil dari
Keiser-Meyer Olkin Measure of Sampling Adequacy (KMO – MSA).
Teo (2013:290) menyatakan bahwa Confirmatory factor analysis (CFA) adalah teknik
statistik yang kuat dan fleksibel yang telah menjadi alat yang semakin populer di semua bidang
psikologi termasuk penelitian pendidikan. CFA berfokus pada pemodelan hubungan antara
manifes (yaitu, diamati) indikator dan mendasari variabel laten (faktor). CFA adalah kasus khusus
pemodelan persamaan struktural (SEM) di mana hubungan antara variabel laten dimodelkan
sebagai kovarians / korelasi daripada sebagai hubungan struktural (yaitu, regresi). CFA juga dapat
dibedakan dari analisis faktor eksplorasi (EFA) dalam CFA yang mengharuskan peneliti untuk
secara eksplisit menentukan semua karakteristik dari model pengukuran yang dihipotesiskan
(misalnya, jumlah faktor, pola hubungan indikatorfaktor) untuk diperiksa sedangkan EFA lebih
banyak data-driven. Sedangkan menurut Scott (1983:13) Analisis Faktor Konfirmatori menyajikan
persamaan CFM dasar dan asumsi, memberikan diskusi menyeluruh tentang identifikasi dalam
model tersebut, dan membandingkan berbagai metode estimasi statistik, termasuk kuadrat terkecil
yang tidak ditimbang, kuadrat terkecil secara umum, dan metode kemungkinan maksimum.
Analisis faktor adalah prosedur statistik untuk mengungkap (biasanya) sejumlah kecil variabel
laten dengan mempelajari kovariat di antara satu set variabel yang diamati.
Metode analisis faktor konfirmatori dikembangkan jauh lebih baru (Joreskog, 1969: 183-
202). Analisis ini mengharuskan peneliti harus memiliki harapan khusus mengenai :
CFA secara eksplisit dan langsung menguji kecocokan model faktor. Peneliti tanpa teori
tidak dapat menggunakan CFA, tetapi peneliti dengan teori biasanya menemukan CFA lebih
bermanfaat daripada PUS. Menurut Thompson (2004:6), Analisis faktor konfirmatori lebih
berguna dalam keberadaan teori karena (a) teori diuji langsung oleh analisis dan (b) tingkat
kecocokan model dapat dikuantifikasi dalam berbagai cara. Tentu saja, beberapa peneliti memulai
penyelidikan dengan harapan teoritis tertentu, tetapi setelah menerapkan CFA menemukan bahwa
harapan mereka sangat salah, dan kemudian dapat kembali ke prosedur PUS. Meskipun analisis
faktor telah dicirikan sebagai "salah satu metode yang paling kuat namun untuk mengurangi
kompleksitas variabel ke kesederhanaan yang lebih besar" (Kerlinger, 1979:180) dan sebagai
"pengembangan logis terjauh dan memerintah ratu metode korelasional" (Cattell, 1978:4), metode
telah dikritik keras oleh orang lain (Armstrong, 1967).
Determinan atau matriks korelasi harus diperiksa pada analisis faktor (Field, 2005:640).
Dalam analisis komponen utama murni itu tidak relevan. Dalam analisis faktor, periksa bahwa
determinan matriks ini lebih besar dari 0,00001; jika kemudian multikolinearitas bukan masalah.
Sedangkan menurut Leech (2004: 82) Determinan (terletak di bawah matriks korelasi) seharusnya
lebih dari .00001. Di sini, itu adalah 0,001 sehingga asumsi ini terpenuhi. Jika determinannya nol,
maka faktor solusi analitik tidak dapat diperoleh, karena ini akan membutuhkan pembagian dengan
nol. Ini artinya itu setidaknya salah satu item dapat dipahami sebagai kombinasi linear dari
beberapa set item lainnya.
Menurut Mattjik dan Sumertajaya (2011) deteminan dari matriks A berukuran n x n adalah
perkalian dari semua akar ciri A, λ1, λ2, ..., λn dapat dinotasikan | A|, sehingga
|A| = λn x…x λn
Jadi |A | = 0 jika dan hanya jika paling tidak ada satu akar yang nol, yaitu terjadi jika dan hanya
jika A singular.
Menurut Norm(2013: 82) Dalam analisis komponen utama, "total nilai eigen dari matriks
korelasi" sama dengan jumlah total variabel yang dianalisis (karena setiap variabel berkontribusi
satu unit varian ke dataset). Bersama analisis faktor, bagaimanapun, total nilai eigen akan sama
dengan jumlah komunalitas yang muncul pada diagonal utama dari matriks yang sedang dianalisis.
Ketika data dimasukkan dalam bentuk matriks korelasi dengan standar deviasi, sebenarnya tidak
perlu membagi semua skor dengan beberapa konstanta.
15. KAISER MEYER OLKIN (KMO)
Uji KMO bertujuan untuk mengetahui apakah semua data yang telah terambil telah
cukup untuk difaktorkan. Dengan kata lain KMO (Kaiser-Meyer Olkin) mengukur kecukupan
pengambilan sampel secara keseluruhan dan mengukur kecukupan pengambilan sampel untuk
setiap indikator. Apabila nilai KMO lebih besar dari 0,5 maka dapat disimpulkan jumlah data telah
cukup difaktorkan. Dengan menggunakan aplikasi SPSS, ada petunjuk yang bisa digunakan untuk
melihat homogenitas indikator seperti yang disarankan oleh Kaiser, yaitu:
Nilai KMO ini diperoleh dengan membandingkan besarnya koefisien korelasi terobservasi
dengan besarnya koefisien korelasi parsial. Untuk lebih jelasnya berikut ini adalah rumus KMO
yang rumuskan oleh Norusis (2004):
Dimana :
Dengan demikian, apabila nilai KMO lebih besar dari 0,5 penelitian telah memenuhi syarat
minimal kecukupan data. KMO dapat dihitung untuk variabel individu dan ganda dan mewakili
rasio korelasi kuadrat antara variabel dengan korelasi parsial kuadrat antara variabel. Statistik
KMO bervariasi antara 0 dan 1. Nilai 0 menunjukkan bahwa jumlah korelasi parsial relatif besar
dengan jumlah korelasi, menunjukkan difusi dalam pola korelasi [maka, analisis faktor
kemungkinan akan tidak sesuai). Nilai mendekati 1 menunjukkan bahwa pola korelasi relatif
kompak dan analisis faktor harus menghasilkan faktor yang berbeda dan dapat diandalkan. KMO
dapat dihitung untuk beberapa variabel dan individual. Nilai KMO untuk variabel individu
dihasilkan pada diagonal matriks korelasi anti-gambar. Nilai-nilai ini membuat matriks korelasi
anti-gambar merupakan bagian yang sangat penting dari output (meskipun matriks kovarians ami-
image dapat diabaikan).
Statistik KMO harus lebih besar dari 0,5 sebagai minimum; jika tidak mengumpulkan lebih banyak
data. Kaiser (1974: 33) merekomendasikan menerima nilai yang lebih besar dari 0,5 sebagai hampir
tidak dapat diterima (nilai di bawah ini akan mengarahkan Anda untuk mengumpulkan lebih
banyak data atau untuk memikirkan kembali variabel mana yang harus disertakan). Lebih lanjut,
Penghapusan variabel mempengaruhi statistik KMO, sehingga Anda melakukan remo variabel
pastikan untuk memeriksa kembali matriks korelasi anti-gambar baru. Adapun sisa matriks korelasi
anti-gambar, unsur-unsur diagonal merupakan korelasi parsial antara variabel. Untuk analisis
faktor yang baik, kami ingin agar korelasi ini menjadi kecil (semakin kecil semakin baik). Statistik
KMO juga dapat diperiksa untuk variabel individu dengan melihat diagonal Matriks Anti-Citra,
sekali lagi, nilai-nilai ini harus di atas 0,5 (ini berguna untuk mengidentifikasi variabel bermasalah
jika keseluruhan KMO tidak memuaskan).
Ada beberapa hal yang harus dipenuhi untuk melakukan analisis factor yaitu: 1) variabel
dependennya harus berupa data kuantitatif pada tingkat pengukuran interval atau ratio karena data
kategori tidak dapat dilakukan analisis faktor, dan 2) data harus berdistribusi normal bivariat untuk
tiap pasangan variabel dan pengamatan harus saling bebas. Selain itu analisis faktor menghendaki
bahwa matrik data harus memiliki korelasi yang cukup agar dapat dilakukan analisis faktor. Jika
berdasarkan data visual tidak ada nilai korelasi diatas 0,30 maka analisis faktor tidak dapat
dilakukan. Cara lain menentukan dapat tidaknya dilakukan analisis faktor adalah dengan melihat
matriks korelasi secara keseluruhan. Untuk menguji apakah terdapat korelasi antar variabel
digunakan uji Barlett test of sphericity. Jika hasilnya signifikan berarti matriks korelasi memiliki
korelasi signifikan dengan sejumlah variabel.
Uji bartlett pertama kali diperkenalkan oleh M. S. Bartlett pada tahun 1937. Uji bartlett
dapat digunakan apabila data yang digunakan sudah di uji normalitas dan datanya merupakan data
normal. apabila datanya ternyata tidak normal bisa menggunakan uji levene. Pengujian ini
digunakan untuk melihat apakah matriks korelasi bukan merupakan matriks identitas. Tujuan dari
melihat apakah matriks korelasi merupakan matriks identitas atau bukan adalah agar penyusutan
dimensi peubah menjadi lebih sederhana dan bermanfaat tanpa banyak kehilangan informasi
sebelumnya. Apabila dari uji Bartlett hasilnya significant, maka matriks korelasi bukan matriks
identitas. Maka penyusutan dimensi peubah tersebut bermakna untuk dilakukan analisis komponen
utama. Dengan kata lain, pengurangan peubah akan mempunyai arti dan kegunaan.
⋆ Hipotesis
H0: Matriks korelasi merupakan matriks identitas
H1: Matriks korelasi bukan merupakan matriks identitas
⋆ Statistik Uji
Dimana:
Keterangan:
n = banyaknya sampel
⋆ Pengambilan Keputusan
19. MSA
Uji lain yang dapat digunakan untuk melihat interkorelasi antar variabel dan dapat tidaknya
analisi faktor dilakukan adalah Measure of Sampling Adequacy (MSA). Hair dan Anderson (1998)
menyatakan bahwa MSA merupakan ukuran lain yang digunakan untuk mengukur interkorelasi
antar variabel dan kesesuaian dari analisis faktor. Nilai MSA ini bervariasi antara 0 sampai 1, jika
nilai MSA < 0,50 maka analisis faktor tidak dapat dilakukan. Adapun terkait dengan ukuran
sampel, menurut Gable (1986), ukuran sampel atau banyaknya responden adalah 5 sampai 10 kali
jumlah item, misalnya dalam satu angket dimuat 15 butir, maka banyaknya responden yang harus
mengisi kuesioner antara 75 orang sampai dengan 150 orang.
MSA ≥ 0,5 variabel masih bisa diprediksi dan dianalisis lebih lanjut
MSA < 0,5 variabel dapat dieliminasi untuk tidak disertakan dalam analisis
faktor
Menurut Bilson (2000: 99) eigenvalue adalah jumlah varians (dalam angka, bukan
presentase) dalam variabel asli yang berhubungan dengan faktor hanya faktor nilai eigen lebih
besar dari 1,0 yang diambil. Tujuan dari analisis komponen utama adalah untuk dapat
memperkirakan matriks korelasi dan ini dapat dilakukan dengan mencari karakteristik persamaan
matriks. Ini membutuhkan dua set nilai:
1. Vektor karakteristik dari matriks, juga disebut vektor laten atau vektor eigen - vektor
hanyalah sebuah kolom atau deretan angka dalam sebuah matriks. Simbol untuk vektor
karakteristik adalah Va;
2. Akar karakteristik, juga disebut akar laten atau nilai eigen yang simbol untuk akar
karakteristik adalah la.
Jumlah kuadrat dari faktor pembebanan dari masing-masing faktor mencerminkan proporsi
varian dijelaskan oleh masing-masing faktor. Jumlah total ini varians adalah akar karakteristik atau
nilai egen. Semakin besar nilai eigen semakin banyak perbedaan dijelaskan oleh faktor. Jadi untuk
menghitung nilai-nilai komponen utama eigen dan vektor eigen atau akar dan nilai-nilai
karakteristik harus dihitung. Itu metode asli dari Hotelling (1933) akan dijelaskan karena itu
kejelasan dan kesederhanaan, meskipun prosedur normalisasi adalah tidak persis sama.
Analisis Eigen adalah salah satu teknik yang memberikan ringkasan struktur data yang
direpresentasikan oleh matriks korelasi ataupun kovarians (Johnson dan Wichern, 2002). Proporsi
dari eigen value menggambarkan seberapa besar struktur data yang dapat diwakili atau
direpresentasikan oleh matriks korelasi atau kovarians tersebut. Dalam analisis komponen utama
dan analisis faktor, proporsi dari eigen value memberikan interpretasi mengenai seberapa besar
data dapat terwakili dalam dimensi yang telah direduksi.
Pada kasus pengelompokkan dalam analisis cluster, matriks korelasi yang digunakan
adalah matriks similarity dari objek yang akan dikelompokkan. Prinsipnya adalah semakin tinggi
nilai similaritas antara objek satu dengan yang lain maka nilai pengamatan antar objek tersebut
memiliki banyak kesamaan (berarti memungkinkan untuk menjadi satu kelompok). Proporsi eigen
value untuk ilustrasi ini berarti memberikan informasi besarnya tingkat kesamaan antar objek.
Proporsi eigen value 100 persen diberikan oleh semua eigen yang terbentuk yang banyaknya sama
dengan banyak objek yang dikelompokkan.
Nilai Eigen adalah representasi dari variasi tingkat item teragregasi terkait dengan suatu faktor.
Mereka dapat dilihat sebagai statistik kolom — lagi-lagi membayangkan tabel pemuatan faktor.
Jika Anda menomori setiap faktor yang memuat dan menjumlahkan semuanya dalam kolom, Anda
harus mendapatkan perkiraan nilai eigen untuk faktor itu (sekali lagi dalam kesalahan pembulatan).
Dengan demikian, kriteria nilai nilai eigen menurut Osborne (2016:34) dapat dijabarkan sebagai
berikut :
a. nilai eigen lebih tinggi ketika setidaknya ada beberapa variabel dengan faktor tinggi
pembebanan, dan lebih rendah ketika ada sebagian besar beban rendah.
b. nilai eigen (dan komunalitas) berubah dari statistik awal (yang merupakan perkiraan dan
harus sama terlepas dari metode ekstraksi) untuk ekstraksi, yang akan bervariasi tergantung
pada matematika ekstraksi.
c. variabel persentase kumulatif yang dicatat oleh faktor yang diekstraksi tidak akan berubah
(akan dibahas nanti), tetapi distribusi varians akan berubah seiring dengan perubahan faktor
pemuatan selama rotasi.
Jadi, jika nilai eigen yang diekstraksi menyebabkan kumulatif 45% dari keseluruhan varians, maka
varians kumulatif yang diperhitungkan masih akan menjadi 45% setelah faktor-faktor tersebut
dirotasi, tetapi bahwa 45% mungkin memiliki distribusi yang sedikit berbeda di seluruh faktor
setelah rotasi. Ini akan menjadi lebih jelas dalam sedikit, seperti yang kita lihat pada beberapa
contoh data.
(Kaiser, 1974) mengusulkan bahwa nilai eigen lebih besar dari 1.0 adalah batas bawah yang
baik untuk mengharapkan suatu faktor menjadi berarti. Ini adalah karena nilai eigen
merepresentasikan jumlah pemuatan faktor kuadrat dalam kolom, dan untuk mendapatkan jumlah
1,0 atau lebih, seseorang harus memiliki beban faktor yang agak besar dan jumlah (misalnya, empat
pemuatan setidaknya 0,50 masing-masing, tiga pemuatan minimal 0,60 masing-masing). Tapi ini
kriteria menjadi kurang mengesankan karena lebih banyak item dianalisis. Sangat mudah untuk
mendapatkan banyak orang yang tidak penting faktor yang melebihi kriteria ini jika Anda
menganalisis 100 item dalam analisis.
Kriteria Kaiser dibangun denganCA dalam pikiran. Di PCA, setiap item menyumbang
100% dari variannya, dan dengan demikian nilai eigen 1 akan setara dengan 1 loading variabel
pada faktor tertentu. Ketika ini diterapkan ke analisis faktor, itu interpretasi berbeda. Nilai eigen 1
dapat lebih dari kontribusi rata-rata dari suatu barang. Misalnya, jika delapan item masing-masing
mengandung 70% varians bersama dan 30% unik varians, nilai eigen rata-rata untuk item adalah
0,70. Nilai eigen minimum kriteria adalah terjemahan dari Kriteria Kaiser ke konteks analisis
faktor, di mana nilai eigen minimum default adalah jumlah rata-rata varian bersama yang
disumbangkan oleh barang. Dalam contoh di atas, nilai eigen minimum default adalah 0,70. Ini
artinya kita akan mempertahankan semua faktor dengan nilai eigen di atas nilai ini. Perkiraan
default nilai eigen minimum sedikit berbeda dengan metode ekstraksi, tetapi mereka menawarkan
konsep yang sama.
Menurut Bilson (2000: 99) dalam kriteria nilai eigen, faktor-faktor yang ditarik, secara
kumulatif maksudnya harus menjelaskan varian total secara memuaskan. Namun, berapa angka
yang memuaskan tergantung pada masalahnya. Sehingga kriteria ini lemah karena tidak
mengemukakakn angka yang jelas.
Dengan menggunakan empat macam software statistika yaitu SPSS, Minitab, SAS dan R,
akan diperoleh komponen jumlah faktor. Keputusan pengambilan jumlah faktor sebanyak
didasarkan pada nilai eigenvalue dari matriks korelasi antar variabel dan pengelompokan variabel
dilakukan dengan membandingkan nilai loading faktor secara mutlak diantara faktor-faktor yang
terbentuk.
Seperti yang dijelaskan di atas penentuan banyak faktor di dasarkan pada nilai eigenvalue
dari matriks korelasi antar variabel. Dengan software SPSS dan SAS diperoleh output nilai
eigenvalue seperti yang ditampilkan pada tabel 3 berikut.
Tabel 3. Output SPSS dan SAS nilai Eigenvalue Matriks Korelasi
Eigenvalue
Variabel
SPSS SAS
1 4.44 55.47
2 1.42 17.69
3 0.81 10.18
4 0.51 6.36
5 0.37 4.61
6 0.31 3.84
7 0.11 1.36
8 0.04 0.49
Nilai eigenvalue yang diambil untuk menentukan berapa banyaknya faktor yang
terbentuk adalah nilai eigenvalue yang lebih besar dari satu (Subhash Sharma, 1996). Jika
mengacu pada tabel 3 maka jumlah faktor yang terbentuk sebanyak dua faktor. Untuk
software minitab dan R tidak terdapat output nilai eigenvalue matriks korelasi.
27. KRITERIA MUATAN FAKTOR
Pada software SPSS metode ekstraksi yang digunakan untuk pembagian variabel adalah
principal componen faktoring analysis. Pembagian variabel-variabel ke dalam kelompok faktor
tertentu didasarkan pada perbandingan nilai loading faktor secara mutlak mana yang lebih besar
antar loading faktor dari faktor 1 dan faktor 2.
Tabel 1.7
Component
1 2 3 4
X1 0,622 0,422 0,164 -
0,191
X2 0,497 0,502 0,217 -
0,099
X3 0,353 0,585 0,027 0,157
X4 0,597 0,025 0,189 0,138
X5 0,702 - 0,185 0,176
0,133
X6 0,578 0,417 0,069 0,335
X7 0,188 0,007 -0,01 0,741
X8 0,1 0,777 0,264 0,179
X9 0,239 0,704 0,39 -
0,156
X1 0,155 0,331 0,681 -
0 0,299
X12 - 0,664 - -
0,108 0,344 0,042
X13 - 0,061 0,176 0,845
0,033
X15 0,157 0,262 0,727 0,327
X16 0,156 - 0,745 0,198
0,139
X1 0,558 0,129 0,491 -
7 0,023
X18 0,731 0,147 - -
0,026 0,011
Hasil perhitungan rotasi faktor menunjukkan ada 4 faktor yang terbentuk. Dalam rotasi faktor
yang dapat diinterprestasikan apabila mempunyai nilai loading faktor lebih dari 0,5.
1. Faktor pertama yang mempunyai nilai lebih dari 0,5 pada indikator 1, 4, 5, 6, 17, dan 18.
2. Faktor kedua yang mempunyai nilai lebih dari 0,5 pada indikator 2, 3, 8, 9 dan 12.
3. Faktor ketiga yang mempunyai nilai lebih dari 0,5 pada indikator 10, 15 dan 16.
4. Faktor keempat yang mempunyai nilai lebih dari 0,5 pada indikator 7 dan 13.
Penamaan masing masing faktor pada penelitian ini menggunakan metode surrogate,
yaitu metode menamainya faktor berdasarkan pada nilai loading faktor tertinggi pada masing
masing faktor yang terbentuk (Simamora, 2008 dalam Tetuko, 2010:75).
Faktor pertama yang mempunyai nilai lebih dari 0,5 pada indikator X1, X4, X5, X6, X17,
dan X18. Nilai loading faktor tertinggi terletak pada indikator kedelapanbelas (X18) dengan nilai
loading 0,731 mengenai teman-teman sekitar mempengaruhi dalam mengambil keputusan untuk
tidak memilih bank syariah. Berdasarkan indikator tersebut maka disebut atau dinamai dengan
faktor rekomendasi pihak lain (teman).
Faktor kedua yang mempunyai nilai lebih dari 0,5 pada indikator X2, X3, X8, X9, dan
X12. Nilai loading faktor tertinggi terletak pada indikator kedelapan (X8) dengan nilai loading
0,777 mengenai petani bawang merah lebih tertarik melakukan pinjaman pada bank konvensional
daripada pada bank syariah. Berdasarkan indikator tersebut maka disebut atau dinamai dengan
faktor pesaing lain (bank konvensional). Faktor ketiga yang mempunyai nilai lebih dari 0,5 pada
indikator X10, X15, dan X16. Nilai loading faktor tertinggi terletak pada indikator keenambelas
(X16) dengan nilai loading 0,745 mengenai lokasi bank syariah yang jauh dari tempat tinggal
mereka. Berdasarkan indikator tersebut maka disebut atau dinamai dengan faktor lokasi. Faktor
keempat yang mempunyai nilai lebih dari 0,5 pada indikator X7 dan X13. Nilai loading faktor
tertinggi terletak pada indikator ketigabelas (X13) dengan nilai loading 0,845 mengenai bank
syariah yang relatif masih baru. Berdasarkan indikator tersebut maka disebut atau dinamai dengan
faktor brand image.
Beberapa kriteria yang digunakan dalam mentransformasi matrik adalah sebagai berikut.
a. Kriteria Varimax
Berasal dari Kaiser (1958), beberapa versi prosedur varimax tersedia (lihat Horst, 1965,
Bab 18; Lawley dan Maxwell, 1971) tergantung apakah komponen diputar secara bersamaan atau
berpasangan. Sejauh ini adalah kriteria paling populer untuk memutar sumbu PC. Kriteria
varimax sering digunakan dalam penelitian eksplorasi untuk mengungkap pola-pola interkorelasi
yang tidak terlihat dari pemeriksaan data, atau matriks korelasi. Selain itu, jika teori kurang, PCA
dapat menjadi alat yang berharga untuk mengungkap hubungan dan / atau struktur data
b. Kriteria Quartinsox
Kriteria varimax berusaha memaksimalkan varians dari pembebanan yang dilakukan
variabel-variabelnya. Kriteria yang lebih tua dalam penggunaan sebelumnya dan yang kadang-
kadang masih yang digunakan adalah kriteria quartimax yang disebut, yang berusaha untuk
memaksimalkan varians di seluruh PC.
DAFTAR PUSTAKA
Abbott, A. A. (2003). A confi rmatory factor analysis of the Professional Opinion Scale: A
values assessment instrument. Research on Social Work Practice, 13, 641–666.
Aiken, L. R. (1985). Three Coefficients for Analyzing the Reliability and Validity of
Ratings.Educational and Psychological Measurement. 45, 131-142
Aiken, L.R. (1980). Content validity and Reliability of Single Items or Questionnaires.
Educational and Psychological Measurement. 40(4).
Aiken,L.R. 1997. Psychological Testing and Assesment. Ninth edition. Boston: Allyn &
Bacon.
An Gie Yong and Sean Pearce. 2013. 79 A Beginner’s Guide to Factor Analysis: Focusing on
Exploratory Factor Analysis. University of Ottawa. Tutorials in Quantitative Methods
for Psychology 2013, Vol. 9(2), p. 79-94.
Armstrong, J. S. (1967). Derivation of theory by means of factor analysis or Tom Swift and his
electric factor analysis machine. American Statistician .
Cattell, R. B. (1978). The scientific use of factor analysis in behavioral and life sciences. New
York: Plenum.
Field, Andy. (2005). Discovering Statistics Using SPSS (Introducing Statistical Methods S.)
(2nd Edition). Sage Publications Ltd.
Fruchter, B. 1954. Introduction Factor Analysis, NewTork: D.van Nostrand Company, Ltd.
Ghozali, Imam. (2003). Aplikasi Analisis Multivariate dengan Program SPSS (4th ed.).
Semarang: Badan Penerbit-Undip.
Ghozali, Imam. 2001. Aplikasi Analisis Multivariate Dengan Program SPSS. Edisi Kedua.
Semarang: Badan Penerbit Universitas Diponegoro.
Ghozali, Imam. 2009. Aplikasi Analisis Multivariate Dengan Program SPSS. Edisi Keempat.
Semarang: Badan Penerbit Universitas Diponegoro.
Gregory, R.J. (2007). Psychological Testing : History, Principles, and Applications. America:
Pearson Educational.
Hair et al., (1998), Multivariate Data Analysis. Fifth Edition. Prentice Hall. Upper Saddle
River: New Jersey.
Haynes, S.N., Richard, D.c., & Kubany, E. S., (1995). Content Validity in Psychological
Assessment: A Functional Approach to Concepts and Methods. Psychological
Assessment, 7(3), 238-247.
Heri Retnawati. (2016). Validitas Reliabilitas & Karakteristik Butir. Yogyakarta: Parama
Publishing.
J.B Heaton. 1975. Writimg English Language Tests. London: Logman.
Johnson, Wichern. 2002. Applied Multivariate Statistical Analysis. Prentice Hall: New Jersey
Kaiser, H.F. 1958. The varimax criterion for analytic rotations in factor analysis.
Psychometrika, 23, 187–200.
Kerlinger, F.N (1986). Foundation of Behavioral Research. 3th edition. New York: Holt,
Rineheart, and Windston.
Kerlinger,F.N. 1990. Asas-asas Penelitian Behavioral. Edisi 3. Yogyakarta: Gadjah Mada
University Press.
Mattjik AA, Sumertajaya IM. 2011. Sidik peubah ganda dengan menggunakan SAS. Bogor:
Departemen Statistika. FMIPA IPB.
Norm, O'Rourk., Hatcher L.( 2013). A Step-by-Step Approach to Using SAS for Factor Analysis
and Structural Equation Modeling. USA : SAS Institute Inc.
Norusis, Marija J . (2004.) SPSS 13.0 Advance Statistical Procedures Companion. New Jersey:
Prentice Hall
Nunally, J. (1978). Psychometric theory (2nd edition.). New York, NY : McGraw Hill.
Santoso, S. 2003. Buku latihan SPSS Statistik Multivariat. Cetakan kedua. Jakarta: PT
Gramedia.
Scott, Long J. (1983). Confirmatory Factor Analysis : Quantitative Applications in the Social
Sciences Sage Publications, Inc.
Santoso, Singgih. 2003. Buku Latihan SPSS Statistik Multivariat. Jakarta: PT Elex Media
Komputindo.
Sekaran. (2006). Metodologi Penelitian Untuk Bisnis, Edisi Keempat. Jakarta: Penerbit
Salemba Empat.
Sharma, S. 1996. Applied Multivariate Techniques, New-York: John Wiley & Sons, Inc.
Sujarweni, V. Wiratna. 2007. Belajar Mudah SPSS Untuk Penelitian. Yogyakarta; Global
Media Informasi
Sukardi. (2011). Evaluasi Pendidikan: Prinsip dan Operasionalnya. Jakarta: Bumi Aksara
Suryabrata, S. (2000). Metodologi Penelitian. Jakarta: CV Rajawali Press
Suryabrata, S. (2005). Pengembangan Alat Ukur Psikologis. Jakarta: Andi.
Suryabrata,S. 1982. Metodologi Penelitian Analisis Kuantitatif. Dasar-Dasar Analisa
Faktor. Yogyakarta: Lembaga pendidikan Doktor Universitas Gadjah Mada.
Sutrisno Hadi. (1997). Metode Research. Yogyakarta: Yayasan Penerbit Fakultas Fisiologi
UGM
Woolfolk, A.E & McCane, L.N (1984). Educational Psychology for Teachers. Englewood
Cliffs, NJ : Prentice Hall.