Anda di halaman 1dari 78

FCE3900

PENYELIDIKAN PENDIDIKAN
ALAT UKUR PENYELIDIKAN
Minggu 11

OBJEKTIF
Memahami maksud alat pengukuran dalam
penyelidikan.
Menggunakan
alat
pengukuran
dalam
penyelidikan pendidikan.

Jenis Alat Ukur atau


Instrumen Kajian
Ujian

1.

mengukur prestasi maksimum

Skala/Inventori

2.

mengukur pemeringkatan ciri-ciri subjek (contoh:


Minnesota Multiphasic Personality Inventory, MyersBriggs Type Indicator)

Soal Selidik

3.

mendapatkan maklumat daripada N yang besar

Lain-lain

4.

teknik sosiometrik & teknik projektif (contoh: Thematic


Apperception Test, Roscharch Inkblot Test)
3

Ujian

Satu
set
rangsangan
(soalan
atau
kenyataan) untuk mendapatkan respons
subjek berasaskan pemarkahan.
Bagi mengukur penguasaan pelajar dalam
sesuatu mata pelajaran, bidang, kemahiran,
kecerdasan atau bakat.
Tahap penguasaan pelajar dikuantifikasikan
dengan memberi markah kepada jawapan
yang diberi.
4

Ujian

Jenis-jenis Ujian
Ujian Pencapaian.
Ujian Kecerdasan (mental, emosi &
rohani).
Ujian Prestasi.
Ujian Kecekapan.
Ujian Bakat.
Ujian Personaliti, Sikap dan Minat.

Ujian Pencapaian

Mengukur secara khusus sejauh mana pelajar


menguasai isi sesuatu mata pelajaran yang diajar
Mempersoalkan apa yang pelajar telah belajar
Penguasaan isi mata pelajaran berlaku dalam
sesuatu tempoh sama ada selepas sesuatu sesi
pelajaran, satu minggu, setengah semester atau
sepanjang semester.
Boleh digunakan untuk menilai keberkesanan
pengajaran guru.
Ada ujian binaan guru dan ujian piawai
7

Merancang Ujian Pencapaian:


Mengenal pasti objektif.
Menentukan kandungan ujian.
Menentukan jenis item (subjektif /
objektif).
Menentukan bilangan item.
Menentukan paras kesukaran.

Ujian Kecerdasan

Mengukur kebolehan pelajar menyesuaikan


diri dengan persekitaran.
Kecerdasan melibatkan proses menakul
persekitaran bagi menyelesaikan masalah.
Memberi tumpuan kepada prestasi umum
pelajar.
Jenis: Kecerdasan mental, kecerdasan
emosi dan kecedasan rohani.
9

Ujian Prestasi

Menghendaki pelajar melakukan aktiviti yang


diperlukan
ujian kertas pensil digunakan untuk mengelak
berlakunya tekaan, dan untuk memberi
penekanan terhadap fakta
Memberi rangsangan kepada pelajar untuk
memperkenal dan mengembangkan aktiviti
pemikiran dan taakulan berasaskan kurikulum
yang diajar
Teknik folio, rakaman
Contoh: prestasi dalam kursus tertentu
10

Ujian Kecekapan

Mengukur kemahiran dan kecekapan


dalam melakukan sesuatu tugas yang
dipelajari
Contoh: kecekapan melukis, melakar
reka bentuk bangunan, kecekapan
memasak, kecekapan berlari, dan
sebagainya.

11

Ujian Bakat
Digunakan untuk membuat telahan
tentang kebolehan pelajar belajar pada
masa hadapan
Bakat merujuk kepada apa yang
pelajar boleh belajar
Contoh: Ujian Bakat Bermain Bola
Sepak, & Ujian Bakat Seni

12

Ujian Personaliti

Digunakan bagi memahami tingkah laku


pelajar khususnya sikap dan motivasi
mereka
Mengukur kewujudan keadaan atau trait
dalaman seseorang (introvert/ekstrovert)
Ujian sikap: mengukur kepercayaan yang
mendorong pelajar memberikan gerak
balas terhadap sesuatu rangsangan
Ujian minat: mengukur kecenderungan
seseorang pelajar melakukan sesuatu
perkara atau terhadap sesuatu bidang.
13

Skala atau Inventori

14

Skala atau Inventori

Untuk mengukur pemboleh ubah kualitatif yang


berbentuk gagasan seperti ciri tingkah laku, minat,
sikap, dan personaliti yang dapat diukur secara
kuantitatif.
Digunakan dalam ujian personaliti, ujian sikap, dan
persepsi.

15

Soal Selidik

16

Soal Selidik

Digunakan bagi mendapatkan maklumat


umum tentang fakta, kepercayaan,
kehendak, status sosio ekonomi, latar
belakang pelajar, pendapatan atau tahap
pendidikan.
Terdiri daripada jenis jawapan dibina, dan
jawapan dipilih.
Soal Selidik boleh dipos atau diberi
secara langsung kepada subjek.
17

Ciri-ciri soal selidik yang baik:


1. Berasaskan
kepada objektif dan definisi
operasi.
2. Disemak
dengan pengalaman & sorotan
berkaitan.
3. Tentukan kesesuaian soalan atau pernyataan.
4. Soalan tidak prejudis.
5. Nyatakan soalan atau pilihan jawapan dengan
jelas.
6. Jawapan ikhlas.
7. Soalan tidak memesong/memaksa subjek.
8. Tempoh menjawab minimum.
9. Disusun secara psikologi : mudah ke susah.
18

Soal Selidik Pos

Digunakan untuk bilangan subjek yang ramai dan


pelbagai.
Penyelidik perlu memastikan pulangan tinggi
dengan cara:
1.
2.

3.

4.
5.
6.
7.

Nyatakan kepentingan soal selidik kepada subjek.


Sertakan surat pengenalan (tujuan dan nilai penyelidikan)
dan surat sokongan (pihak berwibawa).
Sertakan sampul jawapan bersetem yang dan beralamat
sendiri.
Pastikan kesesuaian masa menjawab.
Soalan dan maklumat diperlukan mudah, jelas dan ringkas.
Format menarik.
Lakukan usaha memastikan pulangan tinggi dengan
minimumkan kesukaran subjek menjawab, menghantarkan
surat ingatan, soal selidik gantian, dan surat penghargaan
dan maklum balas jika perlu.
19

Temu Bual

20

Temubual

Melibatkan penyelidik dan subjek hadir sama.


Kaedah tertua.
Soalan dibina untuk merangsang maklumat.

Kekuatan:
+ kerjasama, interaksi secara langsung dan aktif.
+ Mudah suai, mengikut situasi subjek.
+ Hubungan lebih erat, jawapan lebih tepat.

Kelemahan:
-

Memerlukan masa, tenaga dan kos yang tinggi.


Dipengaruhi oleh personaliti subjek dan penyelidik.
Pengaruh faktor luaran; keletihan, kebosanan,
membuang masa, kebolehan merekod, kurang
pengetahuan tentang kajian, sikap dsb.

21

Pemerhatian

22

Pemerhatian

Memerhati tingkah laku berdasarkan pemboleh


ubah yang dikenal pasti seperti masa berbeza
akan menyebabkan tingkah laku berbeza.
Perlu dikenalpasti tingkah laku secara ekslusif
(tidak ada pertindanan tingkah laku) dan
extensive (kenal pasti kemungkinan kejadian
semua tingkah laku).
Peranan penyelidik sebagai pemerhati.
Aktiviti penyelidik adalah melihat, mendengar
dan merekod.
Penyelidikan bernilai tinggi jika dilakukan secara
objektif.
23

Jenis Pemerhatian
Pemerhatian turut serta

1.

Penyelidik berada dalam unit sosial subjek dan bergaul


dengan subjek tetapi tidak mempengaruhi subjek.
Penyelidik dan subjek lebih mengenali.
Masalah yang timbul adalah reaksi subjek;

Jawapan tepat jika subjek bereaksi positif.


Jawapan kurang tepat jika subjek bereaksi negatif.
Sukar mencatatkan tingkah laku: Isu penerimaan dan
penolakan subjek, isu perasaan seperti simpati, hilang
keobjektifan ketika merekod maklumat.

24

Pemerhatian tidak turut serta:

2.

Penyelidik berada di luar unit sosial yang


dicerap.
Penyelidik tidak mencampuri tingkah laku
subjek.
Maklumat lebih dipercayai kerana kurang
dipengaruhi oleh reaksi subjek, perasaan
dan simpati penyelidik.
Kesan sampingan berlaku jika subjek dan
unit sosial sedar akan kehadiran
penyelidikan sebagai pemerhati.
25

Pembinaan Instrumen

26

1.
2.
3.

4.
5.
6.
7.
8.
9.

Prinsip Pembinaan Instrumen


Kajian

Berpandukan objektif penyelidikan.


Berasaskan definisi operasi pemboleh ubah.
Tentukan sama ada jawapan dibina dan atau
dipilih.
Tentukan kesesuaian bilangan.
Tentukan kesesuaian aras kesukaran.
Tentukan kesesuaian aras diskriminasi.
Tentukan kesesuaian kebolehpercayaan.
Mudah tadbir.
Mudah tafsir.

27

Soal Selidik
Digunakan bagi mendapatkan maklumat.
Ciri-ciri soal selidik yang baik:

Berasaskan kepada objektif dan definisi operasi.


Disemak dengan pengalaman dan sorotan
berkaitan.
Tentukan kesesuaian soalan atau pernyataan.
Soalan tidak prejudis.
Nyatakan soalan atau pilihan jawapan dengan
jelas.
Pilihan jawapan saling ekslusif dan habisan.
Jawapan ikhlas.
Soalan tidak memesong atau memaksa subjek.
Tempoh menjawab minimum.
Disusun secara psikologi : mudah ke susah.
28

Langkah Membentuk Instrumen


Kajian
1.

2.

3.
4.
5.

Senaraikan pembolehubah yang ingin


dikaji dan rujuk teori dan model
berkaitan dengan pembolehubah yang
dikaji.
Bina
Jadual
Penentuan
Indeks
Pengukuran.
Jalankan ujian-pra.
Rujuk pakar dalam bidang berkenaan.
Jalankan ujian atau kajian rintis (pilot
test/study).
29

Jadual Penentuan Indeks Pengukuran


Jenis instrumen : Soal Selidik
Jenis Item : aneka Pilihan
Pembolehubah : Pemikiran Kreatif
Bil.
1.

Sub-Indeks (Pemikiran
kreatif)
Keaslian

2.

Kelancaran

3.

Penghuraian

Jumlah item

20

Bil.
Item
7

30

KESAHAN (VALIDITY)

31

Validity refers to the degree in


which our test or other measuring
device is truly measuring what
we intended it to measure.

Sejauh mana alat


mengukur apa yang ia
sepatutnya ukur

Kesahan bermaksud kebolehan ujian mengukur apa


yang sepatutnya diukur, Youngman & Eggleston,
1982; Sax & Newton, 1997)
Kesahan sesuatu alat pengukuran merujuk kepada
sejauh manakah alat yang digunakan mengukur
data yang dikehendaki untuk mencapai objektif
kajian (Mohd Majid Konting, 1990)
Kesahan ialah sejauhmanakah dapatan kajian atau
data yang dikumpul dapat memberikan penjelasan
yang bermakna kepada kajian yang dilakukan (Ary
et. al (2005)

Kesahan sesuatu alat pengukuran merujuk kepada


sejauh manakah alat yang digunakan mengukur
data yang dikehendaki untuk mencapai objektif
kajian (Mohd Majid Konting, 1990)
Kesahan ialah sejauhmanakah dapatan kajian atau
data yang dikumpul dapat memberikan penjelasan
yang bermakna kepada kajian yang dilakukan (Ary
et. al (2005)

Based on Internal
Structure

Kesahan Gagasan

Based on
Relations to Other
Variables

Based on content

Kesahan Kriteria
Criterion-referenced (scores are a
predictor of an outcome or criterion
they are expected to predict)
Concurrent
Evidence

Construct
(determination of the
significance, meaning,
purpose, and use of the
scores)

Predictive
Evidence

Kesahan Kandungan
Content (representative of
all possible questions that
could be asked)
Content validation is usually carried
out by experts

Menurut Fraenkel & Wallen (1996) kesahan


boleh dibuktikan melalui beberapa kaedah
seperti kesahan isi kandungan (content
validity), kesahan telahan (predictive
validity), kesahan serentak (concurrent
validity) dan kesahan gagasan (construct
validity)

Evidence Based on
KesahanContent
Kandungan
(Content Validity)

Sejauh mana alat merangkumi kandungan sesuatu


bidang.
Matlamat utama ialah untuk memastikan semua isi
dan kandungan bidang yang diukur menggambarkan
bidang tersebut.
Berdasarkan kepada skop dan objektif dan
kandungan sesuatu bidang yang dikaji.
Pendapat pakar atau penilai luar diperlukan bagi
menilai kesesuaian butiran bagi domain yang dipilih.

Content
Content validity
validity
is concerned with a tests ability to include or
represent all of the content of a particular construct.
The question 1 + 1 = ___ may be a valid basic
addition question. Would it represent all of the
content that makes up the study of mathematics? It
may be included on a scale of intelligence, but does it
represent all of intelligence? The answer to these
questions is obviously no. To develop a valid test of
intelligence, not only must there be questions on
math, but also questions on verbal reasoning,
analytical ability, and every other aspect of the
construct we call intelligence. There is no easy way to
determine content validity aside from expert opinion.

Content
Content validity
validity
1.

2.

3.

Do the items appear to represent the


thing you are trying to measure?
Does the set of items underrepresented
the constructs content (i.e., have you
excluded any important content areas or
topics?)
Do any of the items represent something
other than what you are trying to
measure (i.e., have you included any
irrelevant items?)

Content
Content validity
validity
Sebelum sesuatu instrumen itu dikatakan
mempunyai kesahan kandungan, lima syarat ini
perlu dipenuhi:
1.Bidang

kandungan mestilah dinyatakan dalam bentuk


tingkah laku yang secara umum diterima maknanya.
2.Bidang mestilah dihuraikan dengan jelas.
3.Bidang mestilah relevan dengan tujuan penggunaan
ujian.
4.Hakim-hakim yang berkelayakan mestilah bersetuju
bahawa bidang telah disampel secara mencukupi.

Evidence Based on Internal


Structure
Kesahan Gagasan
(Construct Validity)

To measure several components or dimensions of a


construct.
Use Factor Analysis to analyzes correlations among test
items and tells you the number of factors present. Its
tell you whether the test is unidimensional or
multidimensional.
Unidimensional all the item measure are single
construct.
Multidimensional different set of item tap different
construct or different component of a broader construct.

Internal Structure

Factor analysis tell you how many dimensions or


factors your test items represent.
Also can obtain a measure of test homogeneity
(i.e., the degree to which the different items
measure the same construct or trait)
Use coefficient alpha (Alpha Cronbach) for the test
of homogeneity.
If the alpha is low (e.g., <.70) for the test, then
some items might be measuring different
constructs or some items might be bad.
Examine the items that are contributing to your
low coefficient alpha and consider eliminating or
revising them.

Based on Relations to Other


Variables
Kesahan Kriteria
(Criterion Validity)

Obtained by relating your test scores to a relevant criterion.


A criterion is the standard or benchmark that you want to
predict accurately on the basis of scores from your test.
Sejauh mana kaitan antara alat dengan kriteria luaran yang
berkecuali (sama ada item mengukur kriteria yang hendak
diukur).
Ditentukan dengan analisis korelasi antara dua set markah.
Calculate correlation coefficients for the study of validity
validity coefficients.

Concurrent
Concurrent Validity
Validity
Concurrent Validity refers to a measurement devices ability to vary
directly with a measure of the same construct or indirectly with a
measure of an opposite construct . It allows you to show that your
test is valid by comparing it with an already valid test. Administering
the focal test and criterion test at approximately the same point in time
(i.e., concurrently) and then correlating the two set of scores. If the two
sets of scores highly correlated, you have concurrent evidence.

e.g.
A new test of adult intelligence, for example, would have concurrent
validity if it had a high positive correlation with the Wechsler Adult
Intelligence Scale since the Wechsler is an accepted measure of the
construct we call intelligence. An obvious concern relates to the validity
of the test against which you are comparing your test. Some
assumptions must be made because there are many who argue the
Wechsler scales, for example, are not good measures of intelligence.

Predictive
Predictive Validity
Validity
Obtain predictive evidence of validity by measuring your
participants at one point in time on your test and then, at a future
time, measuring them on the criterion measure.
Take more time and effort than concurrent evidence, but it can
provide superior evidence that your test does what you want it to
do.
In order for a test to be a valid screening device for some
future behavior, it must have predictive validity. The SAT is
used by college screening committees as one way to predict
college grades. The GMAT is used to predict success in
business school. And the LSAT is used as a means to predict
law school performance. The main concern with these, and
many other predictive measures is predictive validity because
without it, they would be worthless

Reliability is synonymous with the consistency of a test, survey,


observation, or other measuring device. Imagine stepping on your
bathroom scale and weighing 140 pounds only to find that your weight on
the same scale changes to 180 pounds an hour later and 100 pounds an
hour after that. Base on the inconsistency of this scale, any research
relying on it would certainly be unreliable. Consider an important study on
a new diet program that relies on your inconsistent or unreliable bathroom
scale as the main way to collect information regarding weight change.
Would you consider their results accurate?

Kebolehpercayaan

Sejauh mana instrumen mengukur dengan tekal


apa yang hendak diukur.
Scores from measuring variables that are stable
and consistent

Test-retest
Reliability

Internal
Consistency
Reliability

Equivalent
Forms
Reliability

Test-Retest
Reliability
Merujuk kepada ketekalan atau stabiliti markah
ujian jika dilakukan pada masa yang berbeza.
Contoh:
Ujian diberikan kepada 100 individu untuk satu masa dan diulangi
pada masa berlainan. Dua set markah ini dikorelasikan. Sekiranya
individu memperoleh markah tertinggi dalam ujian 1 juga
memperolehi markah tertinggi dalam ujian 2, begitu juga individu
yang mendapat markah terendah dalam ujian 1 juga mendapat
markah terendah dalam ujian, maka dikatakan mempunyai korelasi
yang tinggi. Oleh itu soalan ujian tersebut mempunyai
kebolehpercayaan yang tinggi.

Equivalent Forms
Reliability

Refers to the consistency of a group of individuals scores on two


equivalent forms of a test designed to measure the same
characteristic.
Menggunakan satu alat yang dibina dan satu lagi yang piawai.
Ditadbir ke atas subjek yang sama dan pada masa yang sama
atau masa yang lain.
Equivalent form means that two tests are constructed so that they
are identical in every way except for the specific items asked on
the test.
This means that they have the same number of items, the items
are the same difficulty level, the item measure the same
construct, and the test is administered, scored, and interpreted in
the same way.
The two set of scores are than correlated. If this reliability
coefficient to be very high and positive, that is the individuals who
do well on the first form of the test should also do well on the
second form, and individuals who performed poorly on the first
form of the test should perform poorly on the second test.

Internal Consistency
Reliability

Internal consistency refers to how consistently the items


on a test measure a single construct or concept.
The test-retest methods of assessing reliability are general
methods that can be used with just about any test.
Internal consistency measures are convenient and are
very popular with researchers because they require one
group of individuals to take the test one time.
Two indexes of internal consistency:
o Split half reliability
o Coefficient alpha

Split-half reliability

Splitting a test into two equivalent halves and then


assessing the consistency of the scores across the two
halves of the test.
Divide the test into halves and correlate the scores
from the two halves.
Compute the correlation between scores on the two
halves of the test using Spearman-Brown formula.
The low correlation indicates that the test was
unreliable, a high correlation indicates that the test was
reliable.

Coefficient alpha
Lee Cronbach 1951) developed coefficient alpha.. Alpha
Cronbach
Coefficient alpha tells you the degree to which the items
are interrelated.
Rule of thumb:
At a minimum, greater than or equal to .07 for research
purposes and somewhat greater than that value (e.g. .
09) for clinical testing purposes.

Validity and reliability

Sekiranya pekali
kebolehpercayaan
rendah???

Meningkatkan
Kebolehpercayaan

Pernyataan item mestilah jelas dan tepat.


Arahan mestilah jelas dan ringkas.
Item hendaklah bentuk sejenis.
Situasi dan masa pengukuran hendaklah piawai,
serupa dan terkawal.
Elakkan gangguan ke atas subjek.
Elakkan kebimbangan subjek dengan memberi
jaminan keselamatan dan kerahsiaan ke atas
maklumat yang diberi.

Fasa terakhir tinjauan


sebelum pengumpulan
data bermula.

Matlamatnya adalah untuk


mencari masalah dalam soal
selidik, termasuk soalan yang
lemah, arahan yang tidak lengkap
dan item yang sukar dijawab.

Tidak boleh gunakan


kumpulan fokus
sebenar.

Garis panduan
Untuk kajian ujian rintis

baharu,
lakukan dua
kali ujian rintis.

Jumlah responden tidak


ditentukan dengan tepat,
dicadangkan sekurangkurangnya 25 orang, lebih baik
antara 50 75 orang.

Train
researchers to
collect
observational
data

Develop
standard written
procedures for
administering an
instrument

Obtain
permission to
collect and
use public
documents

Procedures for
Administering the Data
Collection
Respect individuals and sites
during data gathering (ethics)

lp
a
du
i
v
i
Ind

ip
c
i
rt

n ts

Institutional or
organizational
(e.g., school
district)

Si
te
-s
se pec
co if
sc n ic
ho da (e .
ol ry g.,
)

What Permissions Are


Needed:
Obtaining Permission

Parents of
participants who are
not considered adults

Campus approval (e.g.,


university or college) and
Institutional Review
Board (IRB)

Kesahan

Sejauh mana alat mengukur


apa yang ia sepatutnya ukur.
Tiga Aspek:
1.
2.
3.

Kesahan Gagasan
Kesahan Kandungan
Kesahan Kriteria
61

Kesahan Kandungan

Sejauh mana alat merangkumi kandungan


sesuatu bidang.
Matlamat utama ialah untuk memastikan
semua isi dan kandungan bidang yang diukur
menggambarkan bidang tersebut.
Berdasarkan kepada skop dan objektif dan
kandungan sesuatu bidang yang dikaji.
Jika kandungan luas, perlu persampelan
kandungan.
Bina Jadual Penentuan bagi mengenalpasti
domain-domain yang hendak diukur.
Pendapat pakar atau penilai luar diperlukan
bagi menilai kesesuaian butiran bagi domain
62
yang dipilih.

Kesahan Gagasan

Sejauh mana alat menghasilkan gerak balas


yang mewakili gagasan (sikap, motivasi) yang
diukur.
Walau pun berbentuk abstrak, terdapat ciri
atau kesan daripada kewujudan atau ketidak
wujudan sesuatu gagasan pendidikan (diukur
secara tak langsung berasaskan kesan atau
ciri yang terhasil daripada gagasan).
Contoh: Minat terhadap matematik adalah
terdiri daripada bilangan latihan, tempoh masa
membuat latihan matematik dan sebagainya.
Analisis faktor digunakan bagi membina alat
ukur gagasan.
63

Kesahan Kriteria

Sejauh mana kaitan antara item alat dengan


kriteria luaran yang berkecuali (sama ada butir
mengukur kriteria yang hendak diukur).
Ditentukan dengan analisis korelasi antara dua
set markah (markah alat dibina dengan alat
kriteria).
Kriteria Serentak: kriteria yang ditunjukkan
pada masa yang sama dengan pengukuran.
Misalnya, kebolehan semasa bermain muzik.
Kriteria Jangkaan: kriteria yang ditunjukkan
pada masa hadapan selepas pengukuran.
Misalnya, kebolehan bermain muzik pada suatu
masa hadapan selepas pengukuran dilakukan.
64

KEBOLEH PERCAYAAN
(RELIABILITY)

65

Kebolehpercayaan

Sejauh mana alat mengukur dengan tekal


apa yang hendak diukur.
Keboleh percayaan alat ukur adalah
ketekalan alat mengukur pemboleh ubah
atau gagasan.
Variasi atau perubahan yang wujud antara
dua pengukuran dengan menggunakan alat
ukur yang sama merupakan aspek yang
penting dalam menentukan ketekalan alat
ukur.
66

Cara menentukan
kebolehpercayaan alat ukur
Indeks Kebolehpercayaan
Merupakan
pekali
yang
menunjukkan
ketekalan sesuatu alat ukur.
Ditentukan
dengan menggunakan pekali
korelasi antara dua set respons (markah) yang
diperolehi hasil daripada gerak balas subjek
terhadap alat ukur.
Kaedah menguji kebolehpercayaan:
1. Kaedah Bahagi Dua (Split-half)
2. Kaedah Uji dan Uji Kembali (Test-retest)
3. Kaedah Bentuk Setara (Equavalent Form)
67

1. Kaedah Bahagi Dua

Alat ukur yang sama ditadbirkan hanya


sekali ke atas subjek (hanya uji sekali).
Respons pada butir yang bernombor ganjil
diasingkan daripada butir yang bernombor
genap.
Kedua-dua set markah dikorelasikan.
Pekali korelasi yang positif dan teguh antara
dua set markah menunjukkan indeks
kebolehpercayaan yang tinggi.
Gunakan formula Spearman-Brown, Kuder
Richardson dan Alpha Cronbach untuk
mendapatkan pekali korelasi.
68

Pekali Alpha Cronbach ()

Digunakan untuk mengukur ketekalan dalaman dan


homogeniti.
Bergantung kepada ketekalan prestasi individu dari satu
butir ke satu butir yang lain (darjah persetujuan
terhadap butir-butir pernyataan).
Pekali Alpha Cronbach adalah berasaskan kepada
sisihan piawai alat ukur dan sisihan piawai butir-butir
yang berlainan.

69


Pekali
alpha
berasaskan
kepada sisihan piawai alat ukur
dan sisihan piawai butir yang
berlainan

n S S

n 1
S
2

S varians alat ukur


2

S Jumlah varians butir - butir


2

70

2. Kaedah Uji dan Uji Kembali

Ujian yang sama ditadbirkan dua kali


kepada respondens yang sama, pada masa
yang berlainan.
Dua set markah itu dikorelasikan.
Pekali korelasi = Indeks keboleh percayaan.

71

3.
Kaedah
Bentuk
(Equavalent Forms)

Setara

Digunakan apabila ada kemungkinan subjek


akan ingat respons pada ujian pertama.
Menggunakan satu alat yang dibina dan satu
lagi yang piawai.
Kedua-dua alat setara dari segi kandungan
(isi kandungan dan tahap kesukaran) tetapi
berbeza dari segi penyampaian.
Ditadbir ke atas subjek yang sama dan pada
masa yang sama atau masa yang lain.
Markah dua alat dikorelasikan dan hasil
korelasi
adalah
sama
dengan
pekali
kestabilan kesetaraan.
72

Meningkatkan
Kebolehpercayaan

Pernyataan butir mestilah jelas dan tepat.


Arahan mestilah jelas dan ringkas.
Butir hendaklah bentuk sejenis.
Situasi dan masa pengukuran hendaklah
piawai, serupa dan terkawal.
Elakkan gangguan ke atas subjek.
Elakkan kebimbangan subjek dengan
memberi
jaminan
keselamatan
dan
kerahsiaan ke atas maklumat yang diberi.
73

Ujian Rintis

74

Fasa terakhir tinjauan sebelum


pengumpulan data bermula.
Matlamatnya adalah untuk mencari
masalah dalam soal selidik, termasuk
soalan yang lemah, arahan yang
tidak lengkap dan item yang sukar
dijawab.

75

Garis panduan ujian rintis


1.

2.

3.

Jumlah responden tidak ditentukan


dengan tepat, dicadangkan
sekurang-kurangnya 25 orang, lebih
baik antara 50 75 orang.
Untuk kajian baru, lakukan dua kali
ujian rintis.
Tidak boleh gunakan kumpulan
fokus sebenar.
76

Pengumpulan Data

77

SEKIAN
TERIMA KASIH

78

Anda mungkin juga menyukai