Powerpoint Kesahan Dan Kebolehpercayaan, Ujian

FCE3900
PENYELIDIKAN PENDIDIKAN
ALAT UKUR PENYELIDIKAN
Minggu 11
OBJEKTIF
Memahami maksud alat pengukuran dalam
penyelidikan.
Menggunakan
alat
pengukuran
dalam
penyelidikan pendidikan.
Jenis Alat Ukur atau

Instrumen Kajian
Ujian
1.
mengukur prestasi maksimum
Skala/Inventori
2.
mengukur pemeringkatan ciri-ciri subjek (contoh:

Minnesota Multiphasic Personality Inventory, MyersBriggs Type Indicator)
Soal Selidik
3.
mendapatkan maklumat daripada N yang besar
Lain-lain
4.
teknik sosiometrik & teknik projektif (contoh: Thematic

Apperception Test, Roscharch Inkblot Test)
3
Ujian
Satu
set
rangsangan
(soalan
atau
kenyataan) untuk mendapatkan respons
subjek berasaskan pemarkahan.
Bagi mengukur penguasaan pelajar dalam
sesuatu mata pelajaran, bidang, kemahiran,
kecerdasan atau bakat.
Tahap penguasaan pelajar dikuantifikasikan
dengan memberi markah kepada jawapan
yang diberi.
4
Ujian
Jenis-jenis Ujian
Ujian Pencapaian.
Ujian Kecerdasan (mental, emosi &
rohani).
Ujian Prestasi.
Ujian Kecekapan.
Ujian Bakat.
Ujian Personaliti, Sikap dan Minat.
Ujian Pencapaian
Mengukur secara khusus sejauh mana pelajar

menguasai isi sesuatu mata pelajaran yang diajar
Mempersoalkan apa yang pelajar telah belajar
Penguasaan isi mata pelajaran berlaku dalam
sesuatu tempoh sama ada selepas sesuatu sesi
pelajaran, satu minggu, setengah semester atau
sepanjang semester.
Boleh digunakan untuk menilai keberkesanan
pengajaran guru.
Ada ujian binaan guru dan ujian piawai
7
Merancang Ujian Pencapaian:

Mengenal pasti objektif.
Menentukan kandungan ujian.
Menentukan jenis item (subjektif /
objektif).
Menentukan bilangan item.
Menentukan paras kesukaran.
Ujian Kecerdasan
Mengukur kebolehan pelajar menyesuaikan

diri dengan persekitaran.
Kecerdasan melibatkan proses menakul
persekitaran bagi menyelesaikan masalah.
Memberi tumpuan kepada prestasi umum
pelajar.
Jenis: Kecerdasan mental, kecerdasan
emosi dan kecedasan rohani.
9
Ujian Prestasi
Menghendaki pelajar melakukan aktiviti yang

diperlukan
ujian kertas pensil digunakan untuk mengelak
berlakunya tekaan, dan untuk memberi
penekanan terhadap fakta
Memberi rangsangan kepada pelajar untuk
memperkenal dan mengembangkan aktiviti
pemikiran dan taakulan berasaskan kurikulum
yang diajar
Teknik folio, rakaman
Contoh: prestasi dalam kursus tertentu
10
Ujian Kecekapan
Mengukur kemahiran dan kecekapan

dalam melakukan sesuatu tugas yang
dipelajari
Contoh: kecekapan melukis, melakar
reka bentuk bangunan, kecekapan
memasak, kecekapan berlari, dan
sebagainya.
11
Ujian Bakat
Digunakan untuk membuat telahan
tentang kebolehan pelajar belajar pada
masa hadapan
Bakat merujuk kepada apa yang
pelajar boleh belajar
Contoh: Ujian Bakat Bermain Bola
Sepak, & Ujian Bakat Seni
12
Ujian Personaliti
Digunakan bagi memahami tingkah laku

pelajar khususnya sikap dan motivasi
mereka
Mengukur kewujudan keadaan atau trait
dalaman seseorang (introvert/ekstrovert)
Ujian sikap: mengukur kepercayaan yang
mendorong pelajar memberikan gerak
balas terhadap sesuatu rangsangan
Ujian minat: mengukur kecenderungan
seseorang pelajar melakukan sesuatu
perkara atau terhadap sesuatu bidang.
13
Skala atau Inventori
14
Skala atau Inventori
Untuk mengukur pemboleh ubah kualitatif yang

berbentuk gagasan seperti ciri tingkah laku, minat,
sikap, dan personaliti yang dapat diukur secara
kuantitatif.
Digunakan dalam ujian personaliti, ujian sikap, dan
persepsi.
15
Soal Selidik
16
Soal Selidik
Digunakan bagi mendapatkan maklumat

umum tentang fakta, kepercayaan,
kehendak, status sosio ekonomi, latar
belakang pelajar, pendapatan atau tahap
pendidikan.
Terdiri daripada jenis jawapan dibina, dan
jawapan dipilih.
Soal Selidik boleh dipos atau diberi
secara langsung kepada subjek.
17
Ciri-ciri soal selidik yang baik:

1. Berasaskan
kepada objektif dan definisi
operasi.
2. Disemak
dengan pengalaman & sorotan
berkaitan.
3. Tentukan kesesuaian soalan atau pernyataan.
4. Soalan tidak prejudis.
5. Nyatakan soalan atau pilihan jawapan dengan
jelas.
6. Jawapan ikhlas.
7. Soalan tidak memesong/memaksa subjek.
8. Tempoh menjawab minimum.
9. Disusun secara psikologi : mudah ke susah.
18
Soal Selidik Pos
Digunakan untuk bilangan subjek yang ramai dan

pelbagai.
Penyelidik perlu memastikan pulangan tinggi
dengan cara:
1.
2.
3.
4.
5.
6.
7.
Nyatakan kepentingan soal selidik kepada subjek.

Sertakan surat pengenalan (tujuan dan nilai penyelidikan)
dan surat sokongan (pihak berwibawa).
Sertakan sampul jawapan bersetem yang dan beralamat
sendiri.
Pastikan kesesuaian masa menjawab.
Soalan dan maklumat diperlukan mudah, jelas dan ringkas.
Format menarik.
Lakukan usaha memastikan pulangan tinggi dengan
minimumkan kesukaran subjek menjawab, menghantarkan
surat ingatan, soal selidik gantian, dan surat penghargaan
dan maklum balas jika perlu.
19
Temu Bual
20
Temubual
Melibatkan penyelidik dan subjek hadir sama.

Kaedah tertua.
Soalan dibina untuk merangsang maklumat.
Kekuatan:
+ kerjasama, interaksi secara langsung dan aktif.
+ Mudah suai, mengikut situasi subjek.
+ Hubungan lebih erat, jawapan lebih tepat.
Kelemahan:
-
Memerlukan masa, tenaga dan kos yang tinggi.

Dipengaruhi oleh personaliti subjek dan penyelidik.
Pengaruh faktor luaran; keletihan, kebosanan,
membuang masa, kebolehan merekod, kurang
pengetahuan tentang kajian, sikap dsb.
21
Pemerhatian
22
Pemerhatian
Memerhati tingkah laku berdasarkan pemboleh

ubah yang dikenal pasti seperti masa berbeza
akan menyebabkan tingkah laku berbeza.
Perlu dikenalpasti tingkah laku secara ekslusif
(tidak ada pertindanan tingkah laku) dan
extensive (kenal pasti kemungkinan kejadian
semua tingkah laku).
Peranan penyelidik sebagai pemerhati.
Aktiviti penyelidik adalah melihat, mendengar
dan merekod.
Penyelidikan bernilai tinggi jika dilakukan secara
objektif.
23
Jenis Pemerhatian
Pemerhatian turut serta
1.
Penyelidik berada dalam unit sosial subjek dan bergaul

dengan subjek tetapi tidak mempengaruhi subjek.
Penyelidik dan subjek lebih mengenali.
Masalah yang timbul adalah reaksi subjek;
Jawapan tepat jika subjek bereaksi positif.

Jawapan kurang tepat jika subjek bereaksi negatif.
Sukar mencatatkan tingkah laku: Isu penerimaan dan
penolakan subjek, isu perasaan seperti simpati, hilang
keobjektifan ketika merekod maklumat.
24
Pemerhatian tidak turut serta:
2.
Penyelidik berada di luar unit sosial yang

dicerap.
Penyelidik tidak mencampuri tingkah laku
subjek.
Maklumat lebih dipercayai kerana kurang
dipengaruhi oleh reaksi subjek, perasaan
dan simpati penyelidik.
Kesan sampingan berlaku jika subjek dan
unit sosial sedar akan kehadiran
penyelidikan sebagai pemerhati.
25
Pembinaan Instrumen
26
1.
2.
3.
4.
5.
6.
7.
8.
9.
Prinsip Pembinaan Instrumen

Kajian
Berpandukan objektif penyelidikan.

Berasaskan definisi operasi pemboleh ubah.
Tentukan sama ada jawapan dibina dan atau
dipilih.
Tentukan kesesuaian bilangan.
Tentukan kesesuaian aras kesukaran.
Tentukan kesesuaian aras diskriminasi.
Tentukan kesesuaian kebolehpercayaan.
Mudah tadbir.
Mudah tafsir.
27
Soal Selidik
Digunakan bagi mendapatkan maklumat.
Ciri-ciri soal selidik yang baik:
Berasaskan kepada objektif dan definisi operasi.

Disemak dengan pengalaman dan sorotan
berkaitan.
Tentukan kesesuaian soalan atau pernyataan.
Soalan tidak prejudis.
Nyatakan soalan atau pilihan jawapan dengan
jelas.
Pilihan jawapan saling ekslusif dan habisan.
Jawapan ikhlas.
Soalan tidak memesong atau memaksa subjek.
Tempoh menjawab minimum.
Disusun secara psikologi : mudah ke susah.
28
Langkah Membentuk Instrumen

Kajian
1.
2.
3.
4.
5.
Senaraikan pembolehubah yang ingin

dikaji dan rujuk teori dan model
berkaitan dengan pembolehubah yang
dikaji.
Bina
Jadual
Penentuan
Indeks
Pengukuran.
Jalankan ujian-pra.
Rujuk pakar dalam bidang berkenaan.
Jalankan ujian atau kajian rintis (pilot
test/study).
29
Jadual Penentuan Indeks Pengukuran

Jenis instrumen : Soal Selidik
Jenis Item : aneka Pilihan
Pembolehubah : Pemikiran Kreatif
Bil.
1.
Sub-Indeks (Pemikiran
kreatif)
Keaslian
2.
Kelancaran
3.
Penghuraian
Jumlah item
20
Bil.
Item
7
30
KESAHAN (VALIDITY)
31
Validity refers to the degree in

which our test or other measuring
device is truly measuring what
we intended it to measure.
Sejauh mana alat

mengukur apa yang ia
sepatutnya ukur
Kesahan bermaksud kebolehan ujian mengukur apa

yang sepatutnya diukur, Youngman & Eggleston,
1982; Sax & Newton, 1997)
Kesahan sesuatu alat pengukuran merujuk kepada
sejauh manakah alat yang digunakan mengukur
data yang dikehendaki untuk mencapai objektif
kajian (Mohd Majid Konting, 1990)
Kesahan ialah sejauhmanakah dapatan kajian atau
data yang dikumpul dapat memberikan penjelasan
yang bermakna kepada kajian yang dilakukan (Ary
et. al (2005)
Kesahan sesuatu alat pengukuran merujuk kepada

sejauh manakah alat yang digunakan mengukur
data yang dikehendaki untuk mencapai objektif
kajian (Mohd Majid Konting, 1990)
Kesahan ialah sejauhmanakah dapatan kajian atau
data yang dikumpul dapat memberikan penjelasan
yang bermakna kepada kajian yang dilakukan (Ary
et. al (2005)
Based on Internal
Structure
Kesahan Gagasan
Based on
Relations to Other
Variables
Based on content
Kesahan Kriteria
Criterion-referenced (scores are a
predictor of an outcome or criterion
they are expected to predict)
Concurrent
Evidence
Construct
(determination of the
significance, meaning,
purpose, and use of the
scores)
Predictive
Evidence
Kesahan Kandungan
Content (representative of
all possible questions that
could be asked)
Content validation is usually carried
out by experts
Menurut Fraenkel & Wallen (1996) kesahan

boleh dibuktikan melalui beberapa kaedah
seperti kesahan isi kandungan (content
validity), kesahan telahan (predictive
validity), kesahan serentak (concurrent
validity) dan kesahan gagasan (construct
validity)
Evidence Based on
KesahanContent
Kandungan
(Content Validity)
Sejauh mana alat merangkumi kandungan sesuatu

bidang.
Matlamat utama ialah untuk memastikan semua isi
dan kandungan bidang yang diukur menggambarkan
bidang tersebut.
Berdasarkan kepada skop dan objektif dan
kandungan sesuatu bidang yang dikaji.
Pendapat pakar atau penilai luar diperlukan bagi
menilai kesesuaian butiran bagi domain yang dipilih.
Content
Content validity
validity
is concerned with a tests ability to include or
represent all of the content of a particular construct.
The question 1 + 1 = ___ may be a valid basic
addition question. Would it represent all of the
content that makes up the study of mathematics? It
may be included on a scale of intelligence, but does it
represent all of intelligence? The answer to these
questions is obviously no. To develop a valid test of
intelligence, not only must there be questions on
math, but also questions on verbal reasoning,
analytical ability, and every other aspect of the
construct we call intelligence. There is no easy way to
determine content validity aside from expert opinion.
Content
Content validity
validity
1.
2.
3.
Do the items appear to represent the

thing you are trying to measure?
Does the set of items underrepresented
the constructs content (i.e., have you
excluded any important content areas or
topics?)
Do any of the items represent something
other than what you are trying to
measure (i.e., have you included any
irrelevant items?)
Content
Content validity
validity
Sebelum sesuatu instrumen itu dikatakan
mempunyai kesahan kandungan, lima syarat ini
perlu dipenuhi:
1.Bidang
kandungan mestilah dinyatakan dalam bentuk

tingkah laku yang secara umum diterima maknanya.
2.Bidang mestilah dihuraikan dengan jelas.
3.Bidang mestilah relevan dengan tujuan penggunaan
ujian.
4.Hakim-hakim yang berkelayakan mestilah bersetuju
bahawa bidang telah disampel secara mencukupi.
Evidence Based on Internal

Structure
Kesahan Gagasan
(Construct Validity)
To measure several components or dimensions of a

construct.
Use Factor Analysis to analyzes correlations among test
items and tells you the number of factors present. Its
tell you whether the test is unidimensional or
multidimensional.
Unidimensional all the item measure are single
construct.
Multidimensional different set of item tap different
construct or different component of a broader construct.
Internal Structure
Factor analysis tell you how many dimensions or

factors your test items represent.
Also can obtain a measure of test homogeneity
(i.e., the degree to which the different items
measure the same construct or trait)
Use coefficient alpha (Alpha Cronbach) for the test
of homogeneity.
If the alpha is low (e.g., <.70) for the test, then
some items might be measuring different
constructs or some items might be bad.
Examine the items that are contributing to your
low coefficient alpha and consider eliminating or
revising them.
Based on Relations to Other

Variables
Kesahan Kriteria
(Criterion Validity)
Obtained by relating your test scores to a relevant criterion.

A criterion is the standard or benchmark that you want to
predict accurately on the basis of scores from your test.
Sejauh mana kaitan antara alat dengan kriteria luaran yang
berkecuali (sama ada item mengukur kriteria yang hendak
diukur).
Ditentukan dengan analisis korelasi antara dua set markah.
Calculate correlation coefficients for the study of validity
validity coefficients.
Concurrent
Concurrent Validity
Validity
Concurrent Validity refers to a measurement devices ability to vary
directly with a measure of the same construct or indirectly with a
measure of an opposite construct . It allows you to show that your
test is valid by comparing it with an already valid test. Administering
the focal test and criterion test at approximately the same point in time
(i.e., concurrently) and then correlating the two set of scores. If the two
sets of scores highly correlated, you have concurrent evidence.
e.g.
A new test of adult intelligence, for example, would have concurrent
validity if it had a high positive correlation with the Wechsler Adult
Intelligence Scale since the Wechsler is an accepted measure of the
construct we call intelligence. An obvious concern relates to the validity
of the test against which you are comparing your test. Some
assumptions must be made because there are many who argue the
Wechsler scales, for example, are not good measures of intelligence.
Predictive
Predictive Validity
Validity
Obtain predictive evidence of validity by measuring your
participants at one point in time on your test and then, at a future
time, measuring them on the criterion measure.
Take more time and effort than concurrent evidence, but it can
provide superior evidence that your test does what you want it to
do.
In order for a test to be a valid screening device for some
future behavior, it must have predictive validity. The SAT is
used by college screening committees as one way to predict
college grades. The GMAT is used to predict success in
business school. And the LSAT is used as a means to predict
law school performance. The main concern with these, and
many other predictive measures is predictive validity because
without it, they would be worthless
Reliability is synonymous with the consistency of a test, survey,

observation, or other measuring device. Imagine stepping on your
bathroom scale and weighing 140 pounds only to find that your weight on
the same scale changes to 180 pounds an hour later and 100 pounds an
hour after that. Base on the inconsistency of this scale, any research
relying on it would certainly be unreliable. Consider an important study on
a new diet program that relies on your inconsistent or unreliable bathroom
scale as the main way to collect information regarding weight change.
Would you consider their results accurate?
Kebolehpercayaan
Sejauh mana instrumen mengukur dengan tekal

apa yang hendak diukur.
Scores from measuring variables that are stable
and consistent
Test-retest
Reliability
Internal
Consistency
Reliability
Equivalent
Forms
Reliability
Test-Retest
Reliability
Merujuk kepada ketekalan atau stabiliti markah
ujian jika dilakukan pada masa yang berbeza.
Contoh:
Ujian diberikan kepada 100 individu untuk satu masa dan diulangi
pada masa berlainan. Dua set markah ini dikorelasikan. Sekiranya
individu memperoleh markah tertinggi dalam ujian 1 juga
memperolehi markah tertinggi dalam ujian 2, begitu juga individu
yang mendapat markah terendah dalam ujian 1 juga mendapat
markah terendah dalam ujian, maka dikatakan mempunyai korelasi
yang tinggi. Oleh itu soalan ujian tersebut mempunyai
kebolehpercayaan yang tinggi.
Equivalent Forms
Reliability
Refers to the consistency of a group of individuals scores on two

equivalent forms of a test designed to measure the same
characteristic.
Menggunakan satu alat yang dibina dan satu lagi yang piawai.
Ditadbir ke atas subjek yang sama dan pada masa yang sama
atau masa yang lain.
Equivalent form means that two tests are constructed so that they
are identical in every way except for the specific items asked on
the test.
This means that they have the same number of items, the items
are the same difficulty level, the item measure the same
construct, and the test is administered, scored, and interpreted in
the same way.
The two set of scores are than correlated. If this reliability
coefficient to be very high and positive, that is the individuals who
do well on the first form of the test should also do well on the
second form, and individuals who performed poorly on the first
form of the test should perform poorly on the second test.
Internal Consistency
Reliability
Internal consistency refers to how consistently the items

on a test measure a single construct or concept.
The test-retest methods of assessing reliability are general
methods that can be used with just about any test.
Internal consistency measures are convenient and are
very popular with researchers because they require one
group of individuals to take the test one time.
Two indexes of internal consistency:
o Split half reliability
o Coefficient alpha
Split-half reliability
Splitting a test into two equivalent halves and then

assessing the consistency of the scores across the two
halves of the test.
Divide the test into halves and correlate the scores
from the two halves.
Compute the correlation between scores on the two
halves of the test using Spearman-Brown formula.
The low correlation indicates that the test was
unreliable, a high correlation indicates that the test was
reliable.
Coefficient alpha
Lee Cronbach 1951) developed coefficient alpha.. Alpha
Cronbach
Coefficient alpha tells you the degree to which the items
are interrelated.
Rule of thumb:
At a minimum, greater than or equal to .07 for research
purposes and somewhat greater than that value (e.g. .
09) for clinical testing purposes.
Validity and reliability
Sekiranya pekali
kebolehpercayaan
rendah???
Meningkatkan
Kebolehpercayaan
Pernyataan item mestilah jelas dan tepat.

Arahan mestilah jelas dan ringkas.
Item hendaklah bentuk sejenis.
Situasi dan masa pengukuran hendaklah piawai,
serupa dan terkawal.
Elakkan gangguan ke atas subjek.
Elakkan kebimbangan subjek dengan memberi
jaminan keselamatan dan kerahsiaan ke atas
maklumat yang diberi.
Fasa terakhir tinjauan

sebelum pengumpulan
data bermula.
Matlamatnya adalah untuk

mencari masalah dalam soal
selidik, termasuk soalan yang
lemah, arahan yang tidak lengkap
dan item yang sukar dijawab.
Tidak boleh gunakan

kumpulan fokus
sebenar.
Garis panduan
Untuk kajian ujian rintis
baharu,
lakukan dua
kali ujian rintis.
Jumlah responden tidak

ditentukan dengan tepat,
dicadangkan sekurangkurangnya 25 orang, lebih baik
antara 50 75 orang.
Train
researchers to
collect
observational
data
Develop
standard written
procedures for
administering an
instrument
Obtain
permission to
collect and
use public
documents
Procedures for
Administering the Data
Collection
Respect individuals and sites
during data gathering (ethics)
lp
a
du
i
v
i
Ind
ip
c
i
rt
n ts
Institutional or
organizational
(e.g., school
district)
Si
te
-s
se pec
co if
sc n ic
ho da (e .
ol ry g.,
)
What Permissions Are

Needed:
Obtaining Permission
Parents of
participants who are
not considered adults
Campus approval (e.g.,

university or college) and
Institutional Review
Board (IRB)
Kesahan
Sejauh mana alat mengukur

apa yang ia sepatutnya ukur.
Tiga Aspek:
1.
2.
3.
Kesahan Gagasan
Kesahan Kandungan
Kesahan Kriteria
61
Kesahan Kandungan
Sejauh mana alat merangkumi kandungan

sesuatu bidang.
Matlamat utama ialah untuk memastikan
semua isi dan kandungan bidang yang diukur
menggambarkan bidang tersebut.
Berdasarkan kepada skop dan objektif dan
kandungan sesuatu bidang yang dikaji.
Jika kandungan luas, perlu persampelan
kandungan.
Bina Jadual Penentuan bagi mengenalpasti
domain-domain yang hendak diukur.
Pendapat pakar atau penilai luar diperlukan
bagi menilai kesesuaian butiran bagi domain
62
yang dipilih.
Kesahan Gagasan
Sejauh mana alat menghasilkan gerak balas

yang mewakili gagasan (sikap, motivasi) yang
diukur.
Walau pun berbentuk abstrak, terdapat ciri
atau kesan daripada kewujudan atau ketidak
wujudan sesuatu gagasan pendidikan (diukur
secara tak langsung berasaskan kesan atau
ciri yang terhasil daripada gagasan).
Contoh: Minat terhadap matematik adalah
terdiri daripada bilangan latihan, tempoh masa
membuat latihan matematik dan sebagainya.
Analisis faktor digunakan bagi membina alat
ukur gagasan.
63
Kesahan Kriteria
Sejauh mana kaitan antara item alat dengan

kriteria luaran yang berkecuali (sama ada butir
mengukur kriteria yang hendak diukur).
Ditentukan dengan analisis korelasi antara dua
set markah (markah alat dibina dengan alat
kriteria).
Kriteria Serentak: kriteria yang ditunjukkan
pada masa yang sama dengan pengukuran.
Misalnya, kebolehan semasa bermain muzik.
Kriteria Jangkaan: kriteria yang ditunjukkan
pada masa hadapan selepas pengukuran.
Misalnya, kebolehan bermain muzik pada suatu
masa hadapan selepas pengukuran dilakukan.
64
KEBOLEH PERCAYAAN
(RELIABILITY)
65
Kebolehpercayaan
Sejauh mana alat mengukur dengan tekal

apa yang hendak diukur.
Keboleh percayaan alat ukur adalah
ketekalan alat mengukur pemboleh ubah
atau gagasan.
Variasi atau perubahan yang wujud antara
dua pengukuran dengan menggunakan alat
ukur yang sama merupakan aspek yang
penting dalam menentukan ketekalan alat
ukur.
66
Cara menentukan
kebolehpercayaan alat ukur
Indeks Kebolehpercayaan
Merupakan
pekali
yang
menunjukkan
ketekalan sesuatu alat ukur.
Ditentukan
dengan menggunakan pekali
korelasi antara dua set respons (markah) yang
diperolehi hasil daripada gerak balas subjek
terhadap alat ukur.
Kaedah menguji kebolehpercayaan:
1. Kaedah Bahagi Dua (Split-half)
2. Kaedah Uji dan Uji Kembali (Test-retest)
3. Kaedah Bentuk Setara (Equavalent Form)
67
1. Kaedah Bahagi Dua
Alat ukur yang sama ditadbirkan hanya

sekali ke atas subjek (hanya uji sekali).
Respons pada butir yang bernombor ganjil
diasingkan daripada butir yang bernombor
genap.
Kedua-dua set markah dikorelasikan.
Pekali korelasi yang positif dan teguh antara
dua set markah menunjukkan indeks
kebolehpercayaan yang tinggi.
Gunakan formula Spearman-Brown, Kuder
Richardson dan Alpha Cronbach untuk
mendapatkan pekali korelasi.
68
Pekali Alpha Cronbach ()
Digunakan untuk mengukur ketekalan dalaman dan

homogeniti.
Bergantung kepada ketekalan prestasi individu dari satu
butir ke satu butir yang lain (darjah persetujuan
terhadap butir-butir pernyataan).
Pekali Alpha Cronbach adalah berasaskan kepada
sisihan piawai alat ukur dan sisihan piawai butir-butir
yang berlainan.
69

Pekali
alpha
berasaskan
kepada sisihan piawai alat ukur
dan sisihan piawai butir yang
berlainan
n S S
n 1
S
2
S varians alat ukur

2
S Jumlah varians butir - butir

2
70
2. Kaedah Uji dan Uji Kembali
Ujian yang sama ditadbirkan dua kali

kepada respondens yang sama, pada masa
yang berlainan.
Dua set markah itu dikorelasikan.
Pekali korelasi = Indeks keboleh percayaan.
71
3.
Kaedah
Bentuk
(Equavalent Forms)
Setara
Digunakan apabila ada kemungkinan subjek

akan ingat respons pada ujian pertama.
Menggunakan satu alat yang dibina dan satu
lagi yang piawai.
Kedua-dua alat setara dari segi kandungan
(isi kandungan dan tahap kesukaran) tetapi
berbeza dari segi penyampaian.
Ditadbir ke atas subjek yang sama dan pada
masa yang sama atau masa yang lain.
Markah dua alat dikorelasikan dan hasil
korelasi
adalah
sama
dengan
pekali
kestabilan kesetaraan.
72
Meningkatkan
Kebolehpercayaan
Pernyataan butir mestilah jelas dan tepat.

Arahan mestilah jelas dan ringkas.
Butir hendaklah bentuk sejenis.
Situasi dan masa pengukuran hendaklah
piawai, serupa dan terkawal.
Elakkan gangguan ke atas subjek.
Elakkan kebimbangan subjek dengan
memberi
jaminan
keselamatan
dan
kerahsiaan ke atas maklumat yang diberi.
73
Ujian Rintis
74
Fasa terakhir tinjauan sebelum

pengumpulan data bermula.
Matlamatnya adalah untuk mencari
masalah dalam soal selidik, termasuk
soalan yang lemah, arahan yang
tidak lengkap dan item yang sukar
dijawab.
75
Garis panduan ujian rintis

1.
2.
3.
Jumlah responden tidak ditentukan

dengan tepat, dicadangkan
sekurang-kurangnya 25 orang, lebih
baik antara 50 75 orang.
Untuk kajian baru, lakukan dua kali
ujian rintis.
Tidak boleh gunakan kumpulan
fokus sebenar.
76
Pengumpulan Data
77
SEKIAN
TERIMA KASIH
78

Powerpoint Kesahan Dan Kebolehpercayaan, Ujian

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Powerpoint Kesahan Dan Kebolehpercayaan, Ujian

Diunggah oleh

Hak Cipta:

Format Tersedia

FCE3900

Jenis Alat Ukur atau

mengukur prestasi maksimum

mengukur pemeringkatan ciri-ciri subjek (contoh:

mendapatkan maklumat daripada N yang besar

teknik sosiometrik & teknik projektif (contoh: Thematic

Mengukur secara khusus sejauh mana pelajar

Merancang Ujian Pencapaian:

Mengukur kebolehan pelajar menyesuaikan

Menghendaki pelajar melakukan aktiviti yang

Mengukur kemahiran dan kecekapan

Digunakan bagi memahami tingkah laku

Skala atau Inventori

Skala atau Inventori

Untuk mengukur pemboleh ubah kualitatif yang

Digunakan bagi mendapatkan maklumat

Ciri-ciri soal selidik yang baik:

Soal Selidik Pos

Digunakan untuk bilangan subjek yang ramai dan

Nyatakan kepentingan soal selidik kepada subjek.

Melibatkan penyelidik dan subjek hadir sama.

Memerlukan masa, tenaga dan kos yang tinggi.

Memerhati tingkah laku berdasarkan pemboleh

Penyelidik berada dalam unit sosial subjek dan bergaul

Jawapan tepat jika subjek bereaksi positif.

Pemerhatian tidak turut serta:

Penyelidik berada di luar unit sosial yang

Prinsip Pembinaan Instrumen

Berpandukan objektif penyelidikan.

Berasaskan kepada objektif dan definisi operasi.

Langkah Membentuk Instrumen

Senaraikan pembolehubah yang ingin

Jadual Penentuan Indeks Pengukuran

Validity refers to the degree in

Sejauh mana alat

Kesahan bermaksud kebolehan ujian mengukur apa

Kesahan sesuatu alat pengukuran merujuk kepada

Menurut Fraenkel & Wallen (1996) kesahan

Sejauh mana alat merangkumi kandungan sesuatu

Do the items appear to represent the

kandungan mestilah dinyatakan dalam bentuk

Evidence Based on Internal

To measure several components or dimensions of a

Factor analysis tell you how many dimensions or

Based on Relations to Other

Obtained by relating your test scores to a relevant criterion.

Reliability is synonymous with the consistency of a test, survey,

Sejauh mana instrumen mengukur dengan tekal

Refers to the consistency of a group of individuals scores on two

Internal consistency refers to how consistently the items

Splitting a test into two equivalent halves and then

Validity and reliability

Pernyataan item mestilah jelas dan tepat.

Fasa terakhir tinjauan

Matlamatnya adalah untuk

Tidak boleh gunakan

Jumlah responden tidak

What Permissions Are

Campus approval (e.g.,

Sejauh mana alat mengukur

Sejauh mana alat merangkumi kandungan

Sejauh mana alat menghasilkan gerak balas

Sejauh mana kaitan antara item alat dengan