LAPORAN BIOSTATISTIKA
KEGIATAN KE-1
DISUSUN OLEH:
MAR’ATUS SOLIKHATI
1401070028
A. TUJUAN
1. Untuk mengetahui cara menentukan uji validitas.
2. Untuk mengetahui cara menentukan uji reliabilitas.
3. Untuk mengetahui cara menentukan intepretasi data dari uji validitas dan
reliabilitas
B. DASAR TEORI
1. VALIDITAS
Menurut Azwar (1988) Validitas berasal dari kata validity yang mempunyai
arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan
fungsi ukurnya. Suatu skala atau instrumen pengukur dapat dikatakan
mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi
ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya
pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan
menghasilkan data yang tidak relevan dengan tujuan pengukuran. Terkandung di
sini pengertian bahwa ketepatan validitas pada suatu alat ukur tergantung pada
kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki
dengan tepat. Suatu tes yang dimaksudkan untuk mengukur variabel A dan
kemudian memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai
alat ukur yang memiliki validitas tinggi. Suatu tes yang dimaksudkan mengukur
variabel A akan tetapi menghasilkan data mengenai variabel A’ atau bahkan B,
dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur
variabel A dan tinggi validitasnya untuk mengukur variabel A’ atau B. Sisi lain
dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur
yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga
harus memberikan gambaran yang cermat mengenai data tersebut.
Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek
tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti
akan menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki
tingkat kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya
sebagai angka yang sebenarnya atau angka yang mendekati keadaan yang
sebenarnya (Azwar 1986).
Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran.
Oleh karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan
pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk
satu tujuan yang spesifik. Dengan demikian, anggapan valid seperti dinyatakan
dalam “alat ukur ini valid” adalah kurang lengkap. Pernyataan valid tersebut
harus diikuti oleh keterangan yang menunjuk kepada tujuan (yaitu valid untuk
mengukur apa), serta valid bagi kelompok subjek yang mana? (Azwar 1986).
Menurut Aritonang R. (2007), validitas suatu instrumen banyak dijelaskan
dalam konteks penelitian sosial yang variabelnya tidak dapat diamati secara
langsung, seperti sikap, minat, persepsi, motivasi, dan lain sebagainya. Untuk
mengukur variabel yang demikian sulit, untuk mengembangkan instrumen yang
memiliki validitas yang tinggi karena karakteristik yang akan diukur dari variabel
yang demikian tidak dapat diobservasi secara langsung, tetapi hanya melalui
indikator (petunjuk tak langsung) tertentu.
Menurut Masri Singarimbun (1989), validitas menunjukkan sejauh mana
suatu alat pengukur itu mengukur apa yang ingin diukur. Bila seseorang ingin
mengukur berat suatu benda, maka dia harus menggunakan timbangan.
Timbangan adalah alat pengukur yang valid bila dipakai untuk mengukur berat,
karena timbangan memang mengukur berat. Bila panjang sesuatu benda yang
ingin diukur, maka dia harus menggunakan meteran. Meteran adalah alat
pengukur yang valid bila digunakan untuk mengukur panjang, karena memang
meteran mengukur panjang. Tetapi timbangan bukanlah alat pengukur yang valid
bilamana digunakan untuk mengukur panjang. Sekiranya penelliti menggunakan
kuesioner di dalam pengumpulan data penelitian, maka kuesioner yang
disusunnya harus mengukur apa yang ingin diukurnya. Setelah kuesioner tersebut
tersusun dan teruji validitasnya, dalam praktek belum tentu data yang
dikumpulkan adalah data yang valid. Banyak hal-hal lain yang akan mengurangi
validitas data; misalnya apakah si pewawancara yang mengumpulkan data betul-
betul mengikuti petunjuk yang telah ditetapkan dalam kuesioner.
Macam-macam validitas dibagi menjadi tiga jenis yaitu:
1) Validitas isi
Validitas isi berkenaan dengan kesanggupan instrumen mengukur isi yang
harus diukur. Artinya, alat ukur tersebut mampu mengungkap isi suatu konsep
atau variabel yang hendak diukur. Misalnya tes hasil belajar bidang studi IPS,
harus bisa mengungkap isi bidang studi tersebut. Hal ini bisa dilakukan dengan
cara menyusun tes yang bersumber dari kurikulum bidang studi yang hendak
diukur. Di samping kurikulum dapat juga diperkaya dengan melihat/mengkaji
buku sumber. Sehingga tes hasil belajar tidak mungkin dapat mengungkap semua
materi yang ada dalam bidang studi tertentu sekalipun hanya untuk satu semester.
Oleh sebab itu harus diambil sebagian dari materi dalam bentuk sampel tes.
Sebagai sampel maka harus dapat mencerminkan materi yang terkandung dari
seluruh materi bidang studi. Cara yang ditempuh dalam menetapkan sampel tes
adalah memilih konsep-konsep yang esensial dari materi yang di dalamnya.
Misalnya menetapkan sejumlah konsep dari setiap pokok bahasan yang ada. Dari
setiap konsep dikembangkan beberapa pertanyaan tes.
Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum (materi
dan tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes dapat
meminta bantuan ahli bidang studi untuk menelaah apakah konsep materi yang
diajukan telah memadai atau tidak, sebagai sampel tes. Dengan demikian
validitas isi tidak memerlukan uji coba dan analisis statistik atau dinyatakan
dalam bentuk angka-angka.
2) Validitas bangun pengertian (Construct validity)
Validitas bangun pengertian (Construct validity) berkenaan dengan
kesanggupan alat ukur mengukur pengertian-pengertian yang terkandung dalam
materi yang diukurnya. Pengertian-pengertian yang terkandung dalam konsep
kemampuan, minat, sebagai variabel penelitian dalam berbagai bidang kajian
harus jelas apa yang hendak diukurnya. Konsep-konsep tersebut masih abstrak,
memerlukan penjabaran yang lebih spesifik, sehingga mudah diukur. Ini berarti
setiap konsep harus dikembangkan indikator-indikatomya. Dengan adanya
indikator dari setiap konsep maka bangun pengertian akan nampak dan
memudahkan dalam menetapkan cara pengukuran. Untuk variabel tertentu,
dimungkinkan penggunaan alat ukur yang beraneka ragam dengan cara
mengukurnya yang berlainan. Menetapkan indikator suatu konsep dapat
dilakukan dalam dua cara, yakni (a) menggunakan pemahaman atau logika
berpikir atas dasar teori pengetahuan ilmiah dan (b) menggunakan pengalaman
empiris, yakni apa yang terjadi dalam kehidupan nyata.
Apabila hasil tes menunjukkan indikator-indikator tes yang tidak
berhubungan secara positif satu sama lain, berarti ukuran tersebut tidak memiliki
validitas bangun pengertian. Atas dasar itu indikatornya perlu ditinjau atau
diperbaiki kembali. Cara lain untuk menetapkan validitas bangun pengertian
suatu alat ukur adalah menghubungkan (korelasi) antara alat ukur yang dibuat
dengan alat ukur yang sudah baku/standardized, seandainya telah ada yang baku.
Bila menunjukkan koefisien korelasi yang tinggi maka alat ukur tersebut
memenuhi validitasnya.
3) Validitas ramalan (predictive validity)
Validitas ramalan artinya dikaitkan dengan kriteria tertentu. Dalam validitas
ini yang diutamakan bukan isi tes tapi kriterianya, apakah alat ukur tersebut dapat
digunakan untuk meramalkan suatu ciri atau perilaku tertentu atau kriteria
tertentu yang diinginkan. Misalnya alat ukur motivasi belajar, apakah dapat
digunakan untuk meramal prestasi belajar yang dicapai. Artinya terdapat
hubungan yang positif antara motivasi dengan prestasi. Dengan kata lain dalam
validitas ini mengandung ciri adanya relevansi dan keajegan atau ketetapan
(reliability). Motivasi dapat digunakan meramal prestasi bila skor-skor yang
diperoleh dari ukuran motivasi berkorelasi positif dengan skor prestasi. Validitas
ramalan ini mengandung dua makna. Pertama validitas jangka pendek dan kedua
jangka panjang. Validitas jangka pendek, artinya daya ramal alat ukur tersebut
hanya untuk masa yang tidak lama. Artinya, skor tersebut berkorelasi pada waktu
yang sama. Misalnya, ketetapan (reliability) terjadi pada semester dua artinya
daya ramal berlaku pada semester dua, dan belum tentu terjadi pada semester
berikutnya. Sedangkan validitas jangka panjang mengandung makna skor
tersebut akan berkorelasi juga di kemudian hari. Mengingat validitas ini lebih
menekankan pada adanya korelasi, maka faktor yang berkenaan dongan
persyaratan terjadinya korelasi harus dipenuhi. Faktor tersebut antara lain
hubungan dari konsep dan variabel dapat dijelaskan berdasarkan pengetahuan
ilmiah, minimal masuk akal sehat dan tidak mengada-ada. Faktor lain adalah skor
yang dikorelasikan memenuhi linieritas. Ketiga validitas yang dijelaskan di atas
idealnya dapat digunakan dalam menyusun instrumen penelitian, minimal dua
validitas, yakni validitas isi dan validitas bangun pengertian. Validitas isi dan
bangun pengertian mutlak diperlukan dan bisa diupayakan tanpa melakukan
pengujian secara statistika.
2. RELIABILITAS
Menurut Masri Singarimbun (1989), realibilitas adalah indeks yang
menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat diandalkan.
Bila suatu alat pengukur dipakai dua kali – untuk mengukur gejala yang sama
dan hasil pengukuran yang diperoleh relative konsisten, maka alat pengukur
tersebut reliable. Dengan kata lain, realibitas menunjukkan konsistensi suatu alat
pengukur di dalam pengukur gejala yang sama.
Menurut Feldt & Brennan (1989: 105), keandalan sebuah alat ukur dapat
dilihat dari dua petunjuk yaitu kesalahan baku pengukuran dan koefisien
reliabilitas. Kedua statistik tersebut masing-masing memiliki kelebihan dan
keterbatasan. Reliabilitas, atau keandalan, adalah konsistensi dari serangkaian
pengukuran atau serangkaian alat ukur. Hal tersebut bisa berupa pengukuran dari
alat ukur yang sama (tes dengan tes ulang) akan memberikan hasil yang sama,
atau untuk pengukuran yang lebih subjektif, apakah dua orang penilai
memberikan skor yang mirip (reliabilitas antar penilai). Reliabilitas tidak sama
dengan validitas. Artinya pengukuran yang dapat diandalkan akan mengukur
secara konsisten, tapi belum tentu mengukur apa yang seharusnya diukur. Dalam
penelitian, reliabilitas adalah sejauh mana pengukuran dari suatu tes tetap
konsisten setelah dilakukan berulang-ulang terhadap subjek dan dalam kondisi
yang sama. Penelitian dianggap dapat diandalkan bila memberikan hasil yang
konsisten untuk pengukuran yang sama. Tidak bisa diandalkan bila pengukuran
yang berulang itu memberikan hasil yang berbeda-beda.
Menurut Feldt & Brennan (1989: 105), pengukuran reliabilitas dapat
dilakukan dengan menggunakan berbagai alat statistik. Berdasarkan sejarah,
reliabilitas sebuah instrumen dapat dihitung melalui dua cara yaitu kesalahan
baku pengukuran dan koefisien reliabilitas. Kedua statistik di atas memiliki
keterbatasannya masing-masing. Kesalahan pengukuran merupakan rangkuman
inkonsistensi peserta tes dalam unit-unit skala skor sedangkan koefisien
reliabilitas merupakan kuantifikasi reliabilitas dengan merangkum konsistensi
(atau inkonsistensi) diantara beberapa kesalahan pengukuran.
Menurut Saifuddin Azwar (2003: 29), dalam kerangka teori tes klasik, suatu
tes dapat dikatakan memiliki reliabilitas yang tinggi apabila skor tampak tes
tersebut berkorelasi tinggi dengan skor murninya sendiri. Interpretasi lainnya
adalah seberapa tinggi korelasi antara skor tampak pada dua tes yang pararel.
Reliabilitas alat ukur tidak dapat diketahui dengan pasti tetapi dapat diperkirakan.
Dalam mengestimasi reliabilitas alat ukur, ada tiga cara yang sering digunakan
yaitu: (1) pendekatan tes ulang, (2) pendekatan dengan tes pararel dan (3)
pendekatan satu kali pengukuran. Pendekatan tes ulang merupakan pemberian
perangkat tes yang sama terhadap sekelompok subjek sebanyak dua kali dengan
selang waktu yang berbeda. Asumsinya adalah bahwa skor yang dihasilkan oleh
tes yang sama akan menghasilkan skor tampak yang relatif sama. Estimasi
dengan pendekatan tes ulang akan menghasilkan koefisien stabilitas. Untuk
memperoleh koefisien reliabilitas melalui pendekatan tes ulang dapat dilakukan
dengan menghitung koefisien korelasi linear antara distribusi skor subyek pada
pemberian tes pertama dengan skor subyek pada pemberian tes kedua.
Pendekatan tes ulang sangat sesuai untuk mengukur ketrampilan terutama
ketrampilan fisik.
Menurut Sugiyono (2011), jenis-jenis reliabilitas menyebutkan bahwa ada
dua cara umum untuk mengukur reliabilitas, yaitu:
1. Reliabilitas stabilitas. Menyangkut usaha memperoleh nilai yang sama atau
serupa untuk setiap orang atau setiap unit yang diukur setiap saat anda
mengukurnya. Reliabilitas ini menyangkut penggunaan indicator yang sama,
definisi operasional, dan prosedur pengumpulan data setiap saat, dan
mengukurnya pada waktu yang berbeda. Untuk dapat memperoleh reliabilitas
stabilitas setiap kali unit diukur skornya haruslah sama atau hampir sama.
2. Reliabilitas ekivalen. Menyangkut usaha memperoleh nilai relatif yang sama
dengan jenis ukuran yang berbeda pada waktu yang sama. Definisi konseptual
yang dipakai sama tetapi dengan satu atau lebih indicator yang berbeda,
batasan-batasan operasional, paeralatan pengumpulan data, dan / atau
pengamat-pengamat.
Bahan:
Data soal
D. CARA KERJA
Uji Validitas
Pada jendela variabel view mengisi kolom nama dengan tulisan item1 sampai
item 10 pada masing-masing baris dan pada baris 11 mengisi dengan nama
jumlah. Mengganti kolom decimals dengan angka 0 untuk semua baris.
Menuliskan pada kolom label seperti pada kolom Name namun menggunakan
huruf kapital. Sehingga tampilan akan seperti dibawah ini :
5. Memindahkan semua item yang sudah diblok dari sebelah kiri ke sebelah
kanan dengan cara mengklik pada tanda panah kecil yang ada ditengah.
6. Langkah yang terakhir adalah mengklik OK dan akan muncul Output hasil uji.
Uji Reliabilitas
5. Memindahkan semua item yang diblok dari sebelah kiri ke sebelah kanan
dengan cara mengklik pada tanda panah kecil yang ada ditengah.
6. Kemudian menyesuaikan model yang akan dipilih dalam analisis uji reliabilitas
pada model di kiri bawah, pilih model Alpha.
7. Setelah model disesuaikan kemudian mengklik menu statistic dan akan muncul
jendela Reliability Analysis Statistics lalu memilih menu scale dan scale if item
delete dengan mencentangnya sehingga tampilannya seperti dibawah ini :
8. Kemudian melanjutkan dengan mengklik Continue setelah itu mengklik OK
dan akan muncul Output hasil uji seperti berikut ini :
E. HASIL ANALISIS DATA
Tabel 4.
Reliability Statistics
Cronbach's
Alpha N of Items
.675 11
Berdasarkan tabel 4 menunjukkan nilai Cronbach’s alpha sebesar 0,675 dan nilai N sebesar 11.
Tabel 5. Item total statistics uji reliabilitas
Item-Total Statistics
Scale Mean Scale Corrected Cronbach's
if Item Variance if Item-Total Alpha if Item
Deleted Item Deleted Correlation Deleted
ITEM1 11.50 12.278 .692 .607
ITEM2 11.30 14.900 -.006 .693
ITEM3 11.60 14.933 -.022 .696
ITEM4 11.40 11.822 .851 .587
ITEM5 11.50 13.611 .314 .657
ITEM6 11.10 14.322 .288 .665
ITEM7 11.90 14.322 .288 .665
ITEM8 11.20 14.400 .167 .674
ITEM9 11.40 14.044 .207 .670
ITEM10 11.10 13.433 .681 .636
JUMLA
6.00 3.778 1.000 .503
H
Dalam tabel 5 menunjukkan adanya nilai scale mean if item deleted, scale variance if item deleted, corrected item
total correlation dan cronbanch’s alpha if item deleted. Nilai alpha yang paling tinggi terdapat pada item soal 3 yaitu sebesar
0,696. Dan yang paling rendah sebesar 0,587 pada item soal 5. Nilai alpha minimal 0,7 untuk dapat dikatakan reliable.
Tabel 6.
Scale Statistics
Std. N of
Mean Variance Deviation Items
12.00 15.111 3.887 11
Tabel 7 terdapat nilai rata-rata untuk semua item soal adalah 12.00 dengan nilai Variance sebesar 15.111, nilai standar
deviasinya adalah 3.887.
Pada soal nomor enam data yang diperoleh adalah data dengan tingkat
validitas rendah karena 0,20 ≤ r hitung 0,362 ≤ 0,40 dinyatakan tidak valid dan tidak
signifikan karena nilai signifikansi 0,305 > 0,01 maupun 0,05 dan tidak ditandai
dengan * maupun **. Pada item soal nomor tujuh data yang diperoleh adalah data
dengan tikat validitas rendah karena 0,20 ≤ r hitung 0,362 ≤ 0,40 dinyatakan tidak
valid dan tidak validitas karena nilai signifikansi 0,305 > 0,01 maupun 0,05 dan
tidak ditandai dengan * maupun **. Pada item soal nomor delapan data yang
diperoleh adalah data dengan tingkat validitas rendah karena 0,20 ≤ r hitung 0,271 ≤
0,40 dinyatakan tidak valid dan tidak signifikan karena nilai signifikansi 0,449 > 0,01
maupun 0,05 dan tidak ditandai dengan * maupun **. Pada item soal nomor
sembilan data yang diperoleh adalah data dengan tingkat validitas rendah karena 0,20
≤ r hitung 0,332≤ 0,40 dinyatakan tidak valid dan tidak signifikan karena nilai
signifikansi 0,348 > 0,01 maupun 0,05 dan tidak ditandai dengan * maupun **. Dan
item soal yang terakhir yairu item ke sepuluh data yang diperoleh adalah data dengan
tingkat validitas tinggi karena 0,70 ≤ r hitung 0,723 ≤ 0,90 dinyatakan valid dan
signifikan karena nilai signifikasi 0,018 < 0,05 dan ditandai dengan *.
2. Uji realibilitas
Uji reliabilitas soal digunakan untuk mengetahui konsistensi instrument yang
digunakan dalam suatu penelitian. Instrument dikatakan reliabel apabilan dua kali atau
lebih pengevaluasian dengan siswa yang berbeda memperoleh hasil yang sama. Soal
penelitian yang baik yaitu soal yang memiliki reliabilitas tinggi (Arikunto, 2008).
Rumus secara manual yang digunakan untuk menghitung reliabilitas dengan rumus
Sperman Brown:
2𝑟1
1/2
2
𝑟11 = 1+(𝑛−1/2)𝑟 ………(Arikunto, 2008)
1/2
3. Uji keputusan
Setelah melakukan uji validitas dan uji reliabilitas, nilai validitas dan reliablitas
item soal kemudian dimasukkan kedalam tabel uji validitas dan dan reliabilitas item
soal. Data uji validitas item soal dimasukkan kedalam kolom r hitung validitas, dan
data uji reliabilitas item soal dimasukkan kedalam kolom r hitung reliablitas. Pada
validitas, kolom r tabel dicari dengan rumus r tabel = N-2, kemudian dilihat pada Tabel
r statistika. Berdasarkan perhitungan r tabel maka didapat r tabel validitas adalah
0,6319. Kemudian pada reliabilitas, kolom r tabel diisi dengan angka 0,7 sebagaimana
nilai minimal alpha untuk menghitung angket dan kuesioner yang reliabel. Setelah itu,
kemudian setiap item soal diambil keputuan untuk validitas dan reliablitan dengan
ketentuan:
Sedangkan pada pengambilan keputusan akhir uji validitas dan uji reliabilitas,
dicari dengan ketentuan: Apabila item soal valid dan reliabel, maka soal digunakan,
item soal valid dan tidak reliabel, maka soal diperbaiki, demikian sebaliknya.
Sedangkan apabila item soal tidak valid dan tidak reliabel, maka soal tidak
digunakan.
Berdasarkan penghitungan validitas dan reliabilitas pada tabel uji validitas dan
reliabilitas, pada item nomor 1 dapat diputuskan valid menurut uji validitasnya karena
nilai r hitung validitas 0,759 lebih besar dari r tabel validitas 0,6319. Sedangkan
menurut uji reliabilitas pada tabel uji validitas dan reliablitas item soal, dapat
diputuskan bahwa item soal tidak reliabel karena r hitung 0,607 lebih kecil dari r tabel
reliabilitas 0,7 . Maka, berdasarkan hasil uji validitas dan uji reliabilitas yang
dilakukan, dapat diputuskan bahwa item soal nomor 1 diperbaiki, karena valid dan
tidak reliabel.
Pada item nomor 2 dapat diputuskan tidak valid menurut uji validitasnya karena
nilai r hitung validitas 0,118 lebih kecil dari r tabel validitas 0,6319. Sedangkan
menurut uji reliabilitas pada tabel uji validitas dan reliabilitas item soal, dapat
diputuskan bahwa item soal tidak reliabel karena r hitung 0,693 lebih kecil dari r tabel
reliabilitas 0,7 . Maka, berdasarkan hasil uji validitas dan uji reliabilitas yang
dilakukan, dapat diputuskan bahwa item soal nomor 2 tidak digunakan karena tidak
valid dan tidak reliabel.
Pada item nomor 3 dapat diputuskan tidak valid menurut uji validitasnya karena
nilai r hitung validitas 0,111 lebih kecil dari r tabel validitas 0,6319. Sedangkan
menurut uji reliabilitas pada tabel uji validitas dan reliablitas item soal, dapat
diputuskan bahwa item soal tidak reliabel karena r hitung 0,696 lebih kecil dari r tabel
reliabilitas 0,7 . Maka, berdasarkan hasil uji validitas dan uji reliabilitas yang
dilakukan, dapat diputuskan bahwa item soal nomor 3 tidak digunakan, karena tidak
valid dan tidak reliabel.
Pada item nomor 4 dapat diputuskan valid menurut uji validitasnya karena nilai r
hitung validitas 0,886 lebih besar dari r tabel validitas 0,6319. Sedangkan menurut uji
reliabilitas pada tabel uji validitas dan reliablitas item soal, dapat diputuskan bahwa
item soal tidak reliabel karena r hitung 0,587 lebih kecil dari r tabel reliabilitas 0,7 .
Maka, berdasarkan hasil uji validitas dan uji reliabilitas yang dilakukan, dapat
diputuskan bahwa item soal nomor 4 diperbaiki, karena valid dan tidak reliabel.
Pada item nomor 5 dapat diputuskan tidak valid menurut uji validitasnya karena
nilai r hitung validitas 0,434 lebih kecil dari r tabel validitas 0,6319. Sedangkan
menurut uji reliabilitas pada tabel uji validitas dan reliablitas item soal, dapat
diputuskan bahwa item soal tidak reliabel karena r hitung 0,657 lebih kecil dari r tabel
reliabilitas 0,7. Maka, berdasarkan hasil uji validitas dan uji reliabilitas yang dilakukan,
dapat diputuskan bahwa item soal nomor 5 tidak digunakan, karena tidak valid dan
tidak reliabel.
Pada item nomor 6 dapat diputuskan tidak valid menurut uji validitasnya karena
nilai r hitung validitas 0,362 lebih kecil dari r tabel validitas 0,6319. Sedangkan
menurut uji reliabilitas pada tabel uji validitas dan reliablitas item soal, dapat
diputuskan bahwa item soal tidak reliabel karena r hitung 0,665 lebih kecil dari r tabel
reliabilitas 0,7 . Maka, berdasarkan hasil uji validitas dan uji reliabilitas yang
dilakukan, dapat diputuskan bahwa item soal nomor 6 tidak digunakan, karena tidak
valid dan tidak reliabel.
Pada item nomor 7 dapat diputuskan tidak valid menurut uji validitasnya karena
nilai r hitung validitas 0,362 lebih kecil dari r tabel validitas 0,6319. Sedangkan
menurut uji reliabilitas pada tabel uji validitas dan reliablitas item soal, dapat
diputuskan bahwa item soal tidak reliabel karena r hitung 0,665 lebih kecil dari r tabel
reliabilitas 0,7 . Maka, berdasarkan hasil uji validitas dan uji reliabilitas yang
dilakukan, dapat diputuskan bahwa item soal nomor 7 tidak digunakan, karena tidak
valid dan tidak reliabel.
Pada item nomor 8 dapat diputuskan tidak valid menurut uji validitasnya karena
nilai r hitung validitas 0271 lebih kecil dari r tabel validitas 0,6319. Sedangkan menurut
uji reliabilitas pada tabel uji validitas dan reliablitas item soal, dapat diputuskan bahwa
item soal tidak reliabel karena r hitung 0,674 lebih kecil dari r tabel reliabilitas 0,7 .
Maka, berdasarkan hasil uji validitas dan uji reliabilitas yang dilakukan, dapat
diputuskan bahwa item soal nomor 8 tidak digunakan, karena tidak valid dan tidak
reliabel.
Pada item nomor 9 dapat diputuskan tidak valid menurut uji validitasnya karena
nilai r hitung validitas 0,332 lebih kecil dari r tabel validitas 0,6319. Sedangkan
menurut uji reliabilitas pada tabel uji validitas dan reliablitas item soal, dapat
diputuskan bahwa item soal tidak reliabel karena r hitung 0,670 lebih kecil dari r tabel
reliabilitas 0,7 . Maka, berdasarkan hasil uji validitas dan uji reliabilitas yang
dilakukan, dapat diputuskan bahwa item soal nomor 9 tidak digunakan, karena tidak
valid dan tidak reliabel.
Pada item nomor 10 dapat diputuskan valid menurut uji validitasnya karena nilai r
hitung validitas 0,723 lebih besar dari r tabel validitas 0,6319. Sedangkan menurut uji
reliabilitas pada tabel uji validitas dan reliablitas item soal, dapat diputuskan bahwa
item soal tidak reliabel karena r hitung 0,636 lebih kecil dari r tabel reliabilitas 0,7 .
Maka, berdasarkan hasil uji validitas dan uji reliabilitas yang dilakukan, dapat
diputuskan bahwa item soal nomor 10 diperbiki, karena valid dan tidak reliabel.
G. KESIMPULAN
Berdasarkan hasil praktikum kali ini dapat disimpulakn bahwa :
- Item soal yang baik memiliki derajat ketepatan mengukur yang benar dan memiliki
tingkat validitas yang tinggi.
- Uji validitas menggunakan program SPSS menunjukkan bahwa dari 10 item soal
pilihan ganda terdapat 3 item soal valid dan 7 soal tidak valid.
- Soal penelitian yang baik yaitu soal yang memiliki reliabilitas tinggi.
- Uji reliabilitas menggunakan program SPSS menunjukkan bahwa dari 10 item soal
pilihan ganda terdapat 9 item soal memiliki tingkat reliabilitas tinggi dan 1 item soal
memiliki tingkat reliabilitas sedang.
- Pada pengambilan keputusan akhir uji validitas dan uji reliabilitas dari 10 item soal
menghasilkan 3 item soal diperbaiki dan 7 item soal lainnya tidak digunakan.
LAMPIRAN
CORRELATIONS
/VARIABLES=item1 item2 item3 item4 item5 item6 item7 item8 item9 item10 jumlah
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.
Correlations
JUMLA
ITEM1 ITEM2 ITEM3 ITEM4 ITEM5 ITEM6 ITEM7 ITEM8 ITEM9 ITEM10 H
ITEM1 Pearson
1 -.218 .000 .816** .200 .333 .333 .000 .408 .333 .759*
Correlation
Sig. (2-
.545 1.000 .004 .580 .347 .347 1.000 .242 .347 .011
tailed)
N 10 10 10 10 10 10 10 10 10 10 10
ITEM2 Pearson
-.218 1 .089 -.089 -.218 -.218 -.509 .764* -.535 .509 .118
Correlation
Sig. (2-
.545 .807 .807 .545 .545 .133 .010 .111 .133 .745
tailed)
N 10 10 10 10 10 10 10 10 10 10 10
ITEM3 Pearson
.000 .089 1 -.167 -.408 -.408 .408 -.102 -.167 .272 .111
Correlation
Sig. (2-
1.000 .807 .645 .242 .242 .242 .779 .645 .447 .761
tailed)
N 10 10 10 10 10 10 10 10 10 10 10
ITEM4 Pearson
.816** -.089 -.167 1 .408 .408 .272 .102 .583 .408 .886**
Correlation
Sig. (2-
.004 .807 .645 .242 .242 .447 .779 .077 .242 .001
tailed)
N 10 10 10 10 10 10 10 10 10 10 10
ITEM5 Pearson
.200 -.218 -.408 .408 1 .333 .333 .000 .000 .333 .434
Correlation
Sig. (2-
.580 .545 .242 .242 .347 .347 1.000 1.000 .347 .210
tailed)
N 10 10 10 10 10 10 10 10 10 10 10
ITEM6 Pearson
.333 -.218 -.408 .408 .333 1 .111 -.167 .408 -.111 .362
Correlation
Sig. (2-
.347 .545 .242 .242 .347 .760 .645 .242 .760 .305
tailed)
N 10 10 10 10 10 10 10 10 10 10 10
ITEM7 Pearson
.333 -.509 .408 .272 .333 .111 1 -.667* .272 .111 .362
Correlation
Sig. (2-
.347 .133 .242 .447 .347 .760 .035 .447 .760 .305
tailed)
N 10 10 10 10 10 10 10 10 10 10 10
ITEM8 Pearson
.000 .764* -.102 .102 .000 -.167 -.667* 1 -.408 .667* .271
Correlation
Sig. (2-
1.000 .010 .779 .779 1.000 .645 .035 .242 .035 .449
tailed)
N 10 10 10 10 10 10 10 10 10 10 10
ITEM9 Pearson
.408 -.535 -.167 .583 .000 .408 .272 -.408 1 -.272 .332
Correlation
Sig. (2-
.242 .111 .645 .077 1.000 .242 .447 .242 .447 .348
tailed)
N 10 10 10 10 10 10 10 10 10 10 10
ITEM1 Pearson
.333 .509 .272 .408 .333 -.111 .111 .667* -.272 1 .723*
0 Correlation
Sig. (2-
.347 .133 .447 .242 .347 .760 .760 .035 .447 .018
tailed)
N 10 10 10 10 10 10 10 10 10 10 10
JUML Pearson
.759* .118 .111 .886** .434 .362 .362 .271 .332 .723* 1
AH Correlation
Sig. (2-
.011 .745 .761 .001 .210 .305 .305 .449 .348 .018
tailed)
N 10 10 10 10 10 10 10 10 10 10 10
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
2. Data oleh SPSS uji reliabilitas
RELIABILITY
/VARIABLES=item1 item2 item3 item4 item5 item6 item7 item8 item9 item10 jumlah
/SCALE('ALL VARIABLES') ALL
/MODEL=ALPHA
/STATISTICS=SCALE
/SUMMARY=TOTAL.
Reliability
Scale: ALL VARIABLES
Case Processing Summary
N %
Cases Valid 10 100.0
Excludeda 0 .0
Total 10 100.0
a. Listwise deletion based on all
variables in the procedure.
Reliability Statistics
Cronbach's
Alpha N of Items
.675 11
Item-Total Statistics
Scale Mean Scale Corrected Cronbach's
if Item Variance if Item-Total Alpha if Item
Deleted Item Deleted Correlation Deleted
ITEM1 11.50 12.278 .692 .607
ITEM2 11.30 14.900 -.006 .693
ITEM3 11.60 14.933 -.022 .696
ITEM4 11.40 11.822 .851 .587
ITEM5 11.50 13.611 .314 .657
ITEM6 11.10 14.322 .288 .665
ITEM7 11.90 14.322 .288 .665
ITEM8 11.20 14.400 .167 .674
ITEM9 11.40 14.044 .207 .670
ITEM10 11.10 13.433 .681 .636
JUMLA
6.00 3.778 1.000 .503
H
Scale Statistics
Std. N of
Mean Variance Deviation Items
12.00 15.111 3.887 11
C. Interpretasi Data
1. Uji Validitas
JUMLA Keterangan Alasan
H
ITEM1 Pearson Correlation .759* Validitas tinggi 0,70 ≤ r hitung 0,759 ≤ 0,90
Sig. (2-tailed) Valid dan signifikan Nilai signifikasi 0,011 < 0,05 dan ditandai
.011
dengan *
N 10
ITEM2 Pearson Correlation .118 Validitas sangat rendah 0,00 ≤ r hitung 0,118 ≤ 0,20
Sig. (2-tailed) Tidak valid dan tidak Nilai signifikansi 0,745 > 0.01 maupun 0.05
.745
signifikan dan tidak ditandai dengan * maupun **
N 10
ITEM3 Pearson Correlation .111 Validitas sangat rendah 0,00 ≤ r hitung 0,118 ≤ 0,20
Sig. (2-tailed) Tidak valid dan tidak Nilai signifikansi 0,761 > 0.01 maupun 0.05
.761
signifikan dan tidak ditandai dengan * maupun **
N 10
ITEM4 Pearson Correlation .886** Validitas tinggi 0,70 ≤ r hitung 0,759 ≤ 0,90
Sig. (2-tailed) Valid dan signifikan Nilai signifikasi 0,001 < 0,01 dan ditandai
.001
dengan **
N 10
ITEM5 Pearson Correlation .434 Validitas sedang 0,40 ≤ r hitung 0,434 ≤ 0,40
Sig. (2-tailed) Tidak valid dan tidak Nilai signifikansi 0,210 > 0.01 maupun 0.05
.210
signifikan dan tidak ditandai dengan * maupun **
N 10
ITEM6 Pearson Correlation .362 Validitas rendah 0,20 ≤ r hitung 0,362 ≤ 0,40
Sig. (2-tailed) Tidak valid dan tidak Nilai signifikansi 0,305 > 0.01 maupun 0.05
.305
signifikan dan tidak ditandai dengan * maupun **
N 10
ITEM7 Pearson Correlation .362 Validitas rendah 0,20 ≤ r hitung 0,362 ≤ 0,40
Sig. (2-tailed) Tidak valid dan tidak Nilai signifikansi 0,305 > 0.01 maupun 0.05
.305
signifikan dan tidak ditandai dengan * maupun **
N 10
ITEM8 Pearson Correlation .271 Validitas rendah 0,20 ≤ r hitung 0,271 ≤ 0,40
Sig. (2-tailed) Tidak valid dan tidak Nilai signifikansi 0,449 > 0.01 maupun 0.05
.449
signifikan dan tidak ditandai dengan * maupun **
N 10
ITEM9 Pearson Correlation .332 Validitas rendah 0,20 ≤ r hitung 0,332≤ 0,40
Sig. (2-tailed) Tidak valid dan tidak Nilai signifikansi 0,348 > 0.01 maupun 0.05
.348
signifikan dan tidak ditandai dengan * maupun **
N 10
ITEM10 Pearson Correlation .723* Validitas tinggi 0,70 ≤ r hitung 0,723 ≤ 0,90
Sig. (2-tailed) Valid dan signifikan Nilai signifikasi 0,018 < 0,05
.018
dan ditandai dengan *
N 10
2. Reliabilitas
Arikunto, Suharsimi. 2008. Prosedur Penelitian Suatu Pendekatan Praktek. Jakarta : Rineka
Cipta.
Aritonang, R. Lerbin, R. (2007). Teoridan Praktik Riset Pemasaran. Bogor: Ghalia
Indonesia.
Azwar, Saifuddin. 1988. Sikap Manusia Teori dan Pengukurannya. Liberty: Yogyakarta.
Feldt, L. S., & Brennan, R. L. (1989). Reliability. In R. L. Linn (Ed.), Educational
measurement (pp. 105-146). New York: Macmillan.
Singarimbun, Masri & Sofian Effendi. (1989). Metode Penelitian Survai. Jakarta : LP3ES.
Sugiyono. 2011. Statistika Untuk Penelitian. Bandung: CV Alfa Beta.
Suherman, Erman 2003. Evaluasi Pembelajaran Matematika. Bandung: JICA UPI.