TINJAUAN PUSTAKA
A. Big Five
mungkin saja mengalami depresi, namun sejauh mana tingkat depresi yang
dialaminya? Para ahli sepakat bahwa cara untuk menjawab pertanyaan itu adalah
rendah. Untuk melakukan hal itu maka kepribadian harus diuraikan menjadi
beberapa tipe. Hal ini mengundang perdebatan mengenai jumlah dimensi dasar
dari kepribadian. Berkaitan dengan hal ini, Allport pada tahun 1937 dan para ahli
kepribadian lain, seperti Eysenck, Cattell, dan Costa dan McCrae melakukan
dari trait (Coaley, 2010; John & Srivastava, 1999; McCrae & Costa, 2003; dalam
Pervin, 2005).
mengidentifikasi dimensi atau faktor dari sekian banyaknya trait ditahun 1980an,
konsep dimensi yang dibuat oleh Eysenck (3 dimensi utama) dan Cattell (16
12
dimensi utama) terhadap kepribadian. Tupes, Chrystal, dan Goldberg pada tahun
1981 (dalam Coaley, 2010), adalah peneliti pertama yang menemukan bahwa
yang ditemukan tersebut dibentuk dengan metode yang sederhana, yaitu mencoba
menggunakan analisis faktor untuk melihat trait yang mana yang bisa berjalan
secara bersamaan (Goldberg, dalam John, O. P., Naumann, L. P., & Soto, C. J.,
Costa dan McCrae pada tahun 1985, 1992, adalah para peneliti yang
paling terkenal dalam menemukan kelima faktor tersebut melalui analisis faktor
(Coaley, 2010). McCrae & Costa.Jr (dalam Pervin, 2005) menyatakan bahwa pada
trait kepribadian digambarkan dalam bentuk lima dimensi dasar. Lima faktor
Penamaan trait mungkin berbeda pada setiap teoris dan dari alat ukur yang
ada, namun ide dan kontennya tetap sama. Hal ini kemudian mengundang
persetujuan bahwa data yang ada mengarah pada kesimpulan bahwa yang
terbentuk adalah kelima faktor tersebut. Dengan kata lain, deskripsi kepribadian
individu dapat secara baik dibentuk dalam lima hal yang luas dan level abstraksi
yang luar biasa, yang dikenal sebagai Big Five (John & Srivastava, 1999; McCrae
Konsep Big Five banyak dilibatkan dalam berbagai penelitian oleh ahli
bahwa konsep Big Five stabil. (Coaley, 2010; Pervin, 2005). Bahkan terlihat
istilah lainnya adalah Five Factor Model (FFM) sejak terbentuknya konsep
tersebut. Tercatat pada tahun 2005-2009 jumlah publikasi mencapai lebih dari
1500an jika dibandingkan pada tahun awal terbentuknya konsep Big Five, yaitu
awal tahun 1990an yang hanya berkisar 250an publikasi (John, O. P., Naumann,
disimpulkan bahwa Big Five Personality adalah suatu pendekatan dalam dunia
yaitu trait yang tersusun dalam lima buah domain kepribadian yang telah dibentuk
dengan menggunakan analisis faktor. Berikut ini adalah trait-trait dalam domain-
domain dari Big Five Personality Costa & McCrae (dalam Pervin, 2005), yaitu:
a. Openness (O)
baru dan tidak biasa. Orang dengan skor tinggi merupakan orang yang memiliki
rasa ingin tahu, ketertarikan yang luas, kreatif, original, imajinatif, dan menyukai
hal yang bervariasi (tidak tradisional). Sedangkan orang dengan skor rendah
b. Conscientiousness (C)
berperilaku dalam meraih tujuan, tidak bergantung, tidak tahan dengan orang yang
ceroboh dan tidak bersemangat. Orang dengan skor tinggi dapat dipercaya,
terorganisir dan teratur, pekerja keras, disiplin dan tepat waktu, teliti, rapi,
ambisius, dan gigih. Sedangkan orang dengan skor rendah terlihat tanpa tujuan
dan terlihat tidak perduli akan sesuatu, malas, sulit diandalkan, sembrono dan
c. Extraversion (E)
kapasitas untuk memberi kesenangan. Orang dengan skor tinggi merupakan orang
d. Agreeableness (A)
lembut, good-nature, percaya pada orang lain, pemaaf, penolong, polos dan
serta manipulatif.
e. Neuroticism (N)
kestabilan emosi, yang berkaitan dengan distress psikologis, ide yang tidak
realistis, harapan atau dorongan yang berlebihan, dan coping respon yang
maladaptif. Orang dengan skor tinggi akan memiliki rasa khawatir, cemas,
emosional, merasa tidak aman, merasa ada yang kurang, dan perasaan sedih atas
dirinya. Sedangkan orang dengan skor rendah mempunyai bawaan santai, tenang,
tidak emosional, lebih stabil, merasa lebih aman dan merasa puas akan dirinya.
Kelima domain trait pada model Big Five tersebut dibagi kedalam enam
subfaktor oleh Costa & McCrae (dalam Pervin, 2005; John & Srivastava, 1999),
yaitu:
Dimensi Subfaktor
Fantasy (khayalan)
Aesthetics (keindahan)
Openness to Feelings (perasaan)
Experience Actions (tindakan)
Ideas (ide)
Values (nilai-nilai)
Self-discipline (disiplin)
Dutifulness (patuh)
Competence (kompetensi)
Conscientiousness Order (teratur)
Deliberation (pertimbangan)
Achievement striving(pencapaian prestasi)
Gregariousness (suka berkumpul)
Activity level (level aktivitas)
Assertiveness (asertif)
Extraversion Excitement Seeking (mencari kesenangan)
Positive Emotions (emosi yang positif)
Warmth (kehangatan)
Straightforwardness (berterusterang)
Trust (kepercayaan)
Altruism (mendahulukan kepentingan orang lain)
Agreeableness
Modesty (rendah hati)
Tendermindedness (berhati lembut)
Compliance (kerelaan)
Anxiety (kecemasan)
Self-consciousness (kesadaran diri)
Depression (depresi)
Neuroticism Vulnerability (mudah tersinggung)
Impulsiveness (menuruti kata hati)
Angry hostility (amarah)
Ada beberapa alat tes yang dibentuk dengan menggunakan konsep Big
Five, antara lain yaitu Big Five Inventory (BFI), NEO PI-R, International Item
Pool (IPIP), PCI, dan HPI. Mastuti (2005) menyatakan bahwa di Indonesia
penggunaan alat ukur kepribadian Big Five maupun pengembangan alatnya masih
belum begitu populer. Padahal banyak hal yang mampu diprediksi dengan
kepribadian big five. Selain itu, teori big five juga terbukti memiliki konsistensi
pada tahun 1991, John, Donahue, dan Kentle menyusun suatu alat ukur yang
kemudian dinamakan Big Five Inventory. Big Five Inventory (BFI) ini terdiri atas
44 (empat puluh empat) aitem, yang dapat direspon dalam waktu 5 (lima) menit,
dan dapat menghasilkan kelima dimensi Big Five yang dibentuk oleh Costa dan
McCrae (John, O. P., Naumann, L. P., & Soto, C. J., 2008; Rammstedt & John,
2006).
Burisch (dalam John, O. P., Naumann, L. P., & Soto, C. J., 2008; John &
pengujian, tetapi juga menghindari kebosanan dan kelelahan subjek, karena akan
ada subyek yang tidak memberi respon sesuai harapan jika tes terlihat terlalu
lama. Big Five Inventory (BFI) menggunakan frase pendek berdasarkan kata sifat
yang dikenal sebagai inti dari Big Five. Selanjutnya ditambahkan kata-kata yang
berfungsi sebagai tambahan informasi atau untuk memperjelas kata inti. Big Five
Inventory (BFI) dengan frase kata sifatnya juga memiliki keuntungan dalam
mencegah ambiguitas atau multiple meanings (John, O. P., Naumann, L. P., &
penelitian yang dilakukan oleh Mariyanti dan Rahmawati pada tahun 2011.
melihat kualitas BFI versi adaptasi Bahasa Indonesia dengan melihat karakteristik
psikometrisnya.
BFI versi Indonesia ini terdiri dari 44 aitem favourable dan unfavourable
yang terdiri dari kalimat pernyataan. Kalimat pernyataan tersebut direspon dengan
pada setiap pernyataan. Makna angka “1” adalah “sangat tidak setuju”, “2” adalah
“tidak setuju”, “3” adalah “netral”, “4” adalah “setuju”, dan “5” bermakna “sangat
setuju”. Aitem favourable akan diberi nilai dari angka 1 sampai 5 pada jawaban
STS sampai SS, sedangkan aitem unfavourable akan diberi nilai sebaliknya. BFI
yang sudah diadaptasi oleh Mariyanti dan Rahmawati (2011) ke dalam bahasa
Indonesia ini memiliki reliabilitas yang baik yaitu 0.70 dan juga memiliki
validitas konstruk yang memuaskan dengan nilai loading rata-rata diatas 0.30 dan
2011, terjadi pergeseran definisi dari kelima faktor dalam teori Big Five pada BFI
experience ketika individu tersebut cerdas dan suka berpikir, memiliki ide-
rencana dan menjalankannya serta memiliki rasa ingin tahu yang besar.
terhadap distress psikologis yaitu yang mudah mengalami rasa sedih, takut
respon maladptif. Selain itu juga terlihat dalam bentuk perilaku mudah
neurotis ketika individu tersebut mudah merasa tertekan dan sedih, tidak
rutin serta mampu bertahan dan mengerjakan suatu tugas hingga selesai.
lain.
e. Agreeableness (A) adalah faktor yang melihat kualitas trust dan seni
dan mempercayai orang lain, dan memiliki apresiasi terhadap seni, musik
atau sastra.
Jumlah
No. Faktor Nomor Butir Aitem Persentasi
Aitem
Faktor 1 5, 10, 11, 12, 13, 15, 16, 20, 25, 26,
1 13 29,55%
(Opennes) 33, 38, 40
Faktor 2
2 4, 9, 14, 19, 24, 29, 31, 34, 37, 39, 43 11 25%
(Neuroticism)
Faktor 3 15.91%
3 2, 3, 8, 18, 23, 28, 35 7
(Conscientiousness)
Faktor 4 13.63%
4 1, 6, 21, 27, 36, 42 6
(Extraversion)
Faktor 5 15.91%
5 7, 17, 22, 30, 32, 41, 44 7
(Agreeableness)
TOTAL 44 100%
pengembangan alat tes, yang meliputi berbagai jenis prosedur evaluasi. Ketika
karakteristik yang diukur. Untuk mengetahui kualitas alat tes, dapat dilihat
karakteristik psikometrisnya, yaitu validitas dan reliabilitas. Kedua hal ini berjalan
beriringan, yaitu tes tidak akan valid jika tidak teruji bahwa tes tersebut reliabel,
akan tetapi hal ini tidak berlaku sebaliknya. Meski demikian, para ilmuan
ini karena, reliabilitas berfokus pada akurasi hasil tes, sedangkan validitas
mengacu pada sejauh mana ketepatan dan kecermatan suatu alat ukur dalam
melakukan fungsi ukurnya atau memberikan hasil ukur yang sesuai dengan
Analisis aitem memiliki beberapa istilah, yaitu item impact, DIF, dan juga
bias aitem (Zumbo, 1999). Pada sudut pandang psikometri, perbedaan konsistensi
1997). Untuk mendapatkan reliabilitas yang baik, maka eror harus diminimalisir.
(Osterlind, 2010), sehingga berkaitan dengan bias yang terjadi pada tes, yang juga
DIF merupakan salah satu konsep dalam pengukuran bias (Sheppard, dkk.,
aitem yang terjangkit DIF tersebut. Selain itu, dalam pemahaman berdasarkan
Osterlind (2010), DIF termasuk dalam sumber bukti validitas berdasarkan struktur
internal.
DIF berbeda dengan bias aitem. Bias aitem terjadi ketika individu dari satu kelompok cenderung
untuk menyetujui pernyataan pada aitem tertentu dibandingkan peserta individu dari kelompok lainnya, karena
beberapa karakteristik dari aitem yang dipakai dalam mengukur atau situasi pengukuran yang tidak relevan
dengan tujuan tes. Sedangkan DIF adalah sebuah kondisi dimana individu dari kelompok yang berbeda,
memiliki kemungkinan/probabilitas berbeda dalam merespon setuju pada suatu pernyataan dalam sebuah
aitem, setelah level atribut/latent trait yang diukur dikondisikan setara (Zumbo, 1999; Widhiarso, 2004;
Osterlind, 2010). Kamata dan Vaughn pada tahun 2004 mengatakan bahwa DIF terjadi
jika suatu kelompok yang berbeda dengan kemampuan/latent trait yang sama
mendapat skor harapan yang berbeda pada aitem yang sama. Millsap dan Everson
mengungkapkan bahwa DIF adalah karakteristik tes yang berbeda secara statistik
pada kelompok yang berbeda yang memiliki kemampuan/latent trait yang sama
antar kelompok, etnis, jenis kelamin, dan juga perbedaan kelas sosial, umur,
daerah tempat tinggal, lingkungan rural, dan urban. DIF mengacu pada
referensi (reference group) dan kelompok fokal (focal group) (Hortensius, L.,
2012). Kelompok referensi juga memiliki istilah lain yaitu kelompok mayoritas
atau dapat juga dikenal sebagai kelompok pembanding yang juga disebut dengan
kelompok fokal memiliki istilah lain yaitu kelompok minoritas ataupun kelompok
yang menjadi fokus, yang juga dikenal sebagai kelompok yang tidak diuntungkan
jika berkaitan dengan tes kognitif. Terdapat banyak kelompok referensi demikian
halnya pada kelompok fokal, di mana individu mungkin terlibat pada satu atau
lebih. Misalnya saja pada wanita kulit putih, yang memiliki kemungkinan lebih
untuk masuk dalam kelompok referensi pada konteks tertentu, dan masuk
kedalam kelompok fokal pada konteks lainnya atau dengan kata lain dapat ditukar
(Camilli dan Shepard dalam Rahmawati, 2010; Jodoin, M.G. & Gierl, J., 1999).
dengan gender, ras/etnis, termasuk usia. Pada penelitian Sacco, dkk., pada
kelompok wanita dewasa dan wanita muda, salah satu kelompok mendapat nilai
tinggi sedangkan kelompok lain mendapat nilai yang rendah. Adapun penelitian
dari Greer pada tahun 2004 menemukan bahwa DIF berkaitan dengan spesifikasi
demografi, seperti pria-wanita dengan kemampuan yang sama, orang asia dan
tes (Lang, dkk). Beberapa bukti menunjukkan bahwa peserta tes lebih nyaman dan
yang juga bisa disebut dengan administrasi tes manual, termasuk diantaranya tes
(Rosenfeld, Doherty, Vicino, Kantor, dkk., 1989; Buchanan & Smith, 1999;
Cronk & West, 2002; dalam Kaplan & Sacuzzon, 2005). Individu menjadi lebih
nyaman dan terbuka (disclose) dalam merespons aitem ketika berinteraksi dengan
komputer (Davis, 1999; dalam Kaplan & Sacuzzo, 2005), lebih jujur, dan tidak
tes tanpa prosedur yang mengharuskan face-to-face (Kaplan & Sacuzzo, 2005).
Penelitian oleh Locke & Gilbert pada tahun 1995 (dalam Kaplan & Sacuzzo,
komputer baik administrasi, skoring, dan interpretasi (Britton & Tidwell, 1995;
dalam Kaplan & Sacuzzo, 2005; Anastasi & Urbina,1997), serta eror dalam
pendataan (Pettit, 2002; Miller, dkk., 2002; dalam Kaplan & Sacuzzo, 2005).
individu, namun tetap tidak bisa menggantikan secara penuh keutamaan yang bisa
cukup bukti untuk dikatakan sama baiknya dengan administrasi tes secara manual
yang merupakan merupakan setting-an asli yang menjadi awal mula, dasar, dan
acuan dalam hal pengadministrasian tes. Inilah alasan mengapa administrasi tes
administrasi tes online dianggap sebagai kelompok yang menjadi kelompok fokal
(menjadi fokus).
Guler dan Penfield pada tahun 2009 (dalam Hortensius, L., 2012),
mengatakan bahwa salah satu isu dalam deteksi DIF adalah adanya dampak
(impact). Ketika kelompok fokal dan kelompok referensi berbeda dalam distribusi
kemampuan yang rata-rata lebih tinggi daripada kelompok lain, hal ini disebut
dapat memunculkan kesalahan tipe I (type I error atau false positive) yaitu
tersebut tidak mengandung DIF (Guler dan Penfield , 2009; dalam Hortensius, L.,
Terdapat dua kategori DIF, yaitu DIF seragam (uniform DIF) dan DIF
tidak seragam (nonuniform DIF) (Mellenbergh, 1982; dalam Hortensius, L., 2012;
Rahmawati, 2010). DIF seragam (Uniform DIF atau consistent DIF) terjadi ketika
dalam merespons aitem yang sama pada dua kelompok yang berbeda), berbeda
namun tidak berpotongan atau bersinggungan. Dalam hal ini aitem cenderung
direspons setuju atau tidak setuju pada suatu kelompok tertentu dibanding
terdapat perbedaan respons dari kelompok yang berbeda dengan latent trait yang
sama. Sedangkan DIF tidak seragam (Nonuniform DIF atau inconsistent DIF)
terjadi jika ICCs kedua kelompok berbeda, namun ada persinggungan atau adanya
garis yang memotong pada beberapa poin skala θ (Camilli & Shepard, 1994;
Kristjanson, dkk., 2005; dalam Rahmawati, 2010; Zumbo, 1999; Widhiarso, 2012;
DIF dapat memberi keseimbangan atau justru malah tidak, pada masing-
masing kelompok pada tingkat tertentu. Singkatnya, hal ini terjadi jika terdapat
sehingga aitem akan menjadi sulit pada satu kelompok dengan tingkat
kemampuan yang lebih rendah dan menjadi lebih sulit pada kelompok lain dengan
tingkat kemampuan yang lebih tinggi, atau aitem menjadi cenderung direspons
setuju atau tidak setuju pada kelompok tertentu (Camilli & Shepard, 1994;
Gierl, Khaliq, dan Boughton pada tahun 1999 (dalam Acar, 2012)
Beberapa Metode berkaitan dengan Classical Test Theory (CTT), yaitu Mantel-
dan metode Item Respons Theory yang biasa disebut dengan IRT (Camili &
setuju terhadap suatu aitem, dilihat dari keanggotaannya dan kriteria atau variabel
Swaminathan dan Rogers (Hortensius, L., 2012; Jodoin, M.G. & Gierl, J., 1999).
Analisis regresi logistik merupakan analisis yang menggunakan jenis data ordinal
Jika data utama yang dipergunakan untuk menganalisis DIF adalah data
ordinal, maka analisis yang digunakan akan lebih dikhususkan lagi, yaitu dengan
Analisis regresi logistik ordinal merupakan perluasan dari analisis regresi yang
prediktor (Field, 2009). Regresi logistik ordinal merupakan salah satu metode
dan syntax program SPSS untuk analisis regresi logistik ordinal yang ditulis oleh
Bruno D. Zumbo, PhD. Aitem BFI versi Indonesia dikatakan mengandung DIF
administrasi tes jika nilai p ≤ 0,01 (Zumbo, 1999). Analisis regresi logistik juga
terkandung termasuk dalam jenis DIF seragam atau DIF tidak seragam (Zumbo,
1999). Berdasarkan Cohen pada tahun 1992, kategori Zumbo-Thomas effect size
adalah negligible dengan R2<0,13, moderate dengan 0,13< R2<0,26, dan large
dengan R2>0,26 (Jodoin, M.G. & Gierl, J., 1999). Dengan kata lain, nilai R2
Zumbo-Thomas effect size pada aitem paling tidak senilai 0,130 atau R-squared ≥
Zumbo, 1999).
C. Administrasi Tes
Anastasi & Urbina (1997) menyatakan bahwa pemikiran dasar dari suatu
tes meliputi generalisasi dari perilaku yang muncul di dalam situasi tes sampai
pada perilaku yang muncul pada situasi yang lain, yaitu situasi yang sebenarnya.
Administrasi tes psikologi adalah segala sesuatu proses yang berkenaan dengan
penyelenggaraan tes Psikologi. Skor dari suatu tes seharusnya dapat membantu
dalam memahami apa yang dirasakan oleh seseorang dan memprediksi bagaimana
perilaku orang tersebut. Kondisi-kondisi pada situasi saat itu kemudian dapat
mengurangi validitas tes tersebut. Dengan demikian, penting bagi kita untuk
membatasi dan meminimalkan kerusakan yang terjadi pada tes tersebut. Hal
penting yang dapat berpengaruh secara langsung terhadap validitas tes adalah
a. Persiapan Tester
Hal terpenting yang menjadi persyaratan dalam suatu administrasi tes yang
baik adalah persiapan yang baik. Pada administrasi tes, tidak boleh ada keadaan
darurat, atau dengan kata lain, tanpa adanya persiapan. Usaha yang spesifik harus
Instruksi lisan adalah hal yang sangat penting pada tes individual, meski tidak
jarang pula ada tes di mana instruksi tes dapat langsung dibaca oleh peserta.
Bukan berarti tester tidak berperan dalam situasi seperti. Tester harus dapat
memahami dan familiar dengan instruksi yang akan diberikan kepada para
peserta. Hal ini perlu dilakukan untuk mencegah kesalahan dalam memahami tes
ataupun kesalahan baca terhadap instruksi tes. Hal lain yang juga penting untuk
haruslah dekat dengan tester dan mudah untuk dijangkau tetapi jangan sampai
menganggu peserta tes. Pada tes yang diberikan secara manual, seluruh material
tes yang dibutuhkan seperti lembar soal, lembar jawaban, pensil khusus, dan
material lain yang dibutuhkan haruslah dihitung, diperiksa kembali, dan disusun
dengan teliti.
Terkhusus untuk tes individual, pelatihan administrasi tes adalah hal yang
pelatihan pemberian instruksi dan dilakukan lebih dari satu tahun. Untuk tes yang
sifatnya kelompok, perlu diadakan briefing terlebih dahulu antara tester dan
b. Kondisi Tes
Prosedur tes yang standar tidak hanya mengenai instruksi secara lisan,
waktu, bahan-bahan, dan aspek lainnya, namun juga mengenai kondisi tes. Kita
administrasi tes harus bebas dari keributan dan mampu menyediakan pencahayaan
yang baik, ventilasi, tempat duduk, dan ruang yang cukup bagi peserta tes untuk
tengah administrasi tes. Membuat tanda di pintu yang memberikan tanda tes
sedang berlangsung adalah hal yang cukup efektif. Pada administrasi tes yang
menjaga pintu dapat dilakukan untuk mencegah gangguan yang mungkin timbul,
terhadap skor tes. Bahkan aspek yang sangat kecil pun dapat berpengaruh, seperti
yang menggunakan kursi tanpa meja (T.L. Kelley, 1943; Traxler dan Hilkert,
1942; dalam Anastasi & Urbina, 1997). F.O. Bell, Hoff and Hoyt pada tahun 1964
juga dapat mempengaruhi skor tes (dalam Anastasi & Urbina, 1997). Administrasi
tes yang menggunakan lembar jawaban terpisah pada anak dibawah kelas lima
sekolah dasar dapat menyebabkan skor tes anak menjadi rendah. Oleh karena itu
pada administrasi tes yang dikenakan kepada anak di bawah kelas lima sekolah
dasar, lembar jawaban lebih baik tidak dipisah dari soal melainkan disatukan
saat mengerjakan suatu tes, khususnya pada tes bakat dan tes kepribadian. Ketika
tester yang memberikan tes adalah seorang yang familiar dengan peserta tes maka
hal ini akan sangat berpengaruh secara signifikan terhadap skor tes. (Sacks, 1952;
Tsudzuki, Hata, & Kuze, 1957; dalam Anastasi & Urbina, 1997). Dalam telaah
lain, Wickes dan Bernstein pada tahun 1956 mengatakan bahwa perilaku tester
menunjukkan adanya pengaruh terhadap hasil tes, terlebih pada tes proyektif
dimana kehadiran tester cenderung menghambat reaksi dan respon emosional dari
peserta tes untuk menuliskan cerita sesuai gambar yang diberikan. Kirchner pada
tahun 1966 mengatakan bahwa pada administrasi tes atau pengujian kecepatan
mengetik, pelamar kerja yang melaksanakan tes sendirian mengetik lebih cepat
berkelompok yang terdiri dari dua orang atau lebih (dalam Anastasi & Urbina,
1997)
administrasi tes. Pertama, ikuti prosedur standar secara mendalam dan mendetail.
Psikolog dan tester harus menjelaskan prosedur secara lengkap dan jelas pada
setiap administrasi tes. Kedua, catatlah setiap kondisi yang tidak biasa atau
kondisi yang dapat berpengaruh terhadap peserta tes sekecil apapun. Ketiga,
jadikan catatan mengenai kondisi tes tersebut sebagai bahan pertimbangan pada
meningkatkan ketertarikan peserta tes terhadap tes, meningkatkan kerja sama, dan
mendorong mereka untuk dapat merespon tes sesuai dengan tujuan dari tes
tersebut. Teknik yang digunakan dalam membangun rapport pada administrasi tes
keseragaman kondisi tes terhadap semua peserta tes sangat penting agar hasil tes
dapat dibandingkan. Seorang anak yang diberikan hadiah setelah mengerjakan tes
tidak bisa secara langsung dibandingkan dengan anak lain yang hanya diberikan
pujian saat selesai mengerjakan tes. Kondisi ini harus menjadi catatan dan
rapport juga dapat dilakukan pada tes berkelompok untuk memotivasi peserta tes
sehingga dapat mengurangi kecemasan pada peserta tes. Teknik yang spesifik
dalam membangun rapport juga harus disesuaikan dengan tes, usia dari peserta,
dan karakteristik lain dari peserta tes. Administrasi tes pada anak pra sekolah
sikap negatif yang dapat timbul pada orang asing. Sikap bersahabat, ceria, dan
santai oleh tester dapat membantu mengurangi kecemasan anak pada saat
melaksanakan tes.
Pelaksanaan tes baik pada anak usia sekolah ataupun pada orang dewasa,
harus menyadari bahwa tes yang dilakukan akan berefek pada harga diri setiap
individu. Oleh karena itu akan sangat bermanfaat apabila peserta tes diberikan
penjelasan bahwa peserta tes tidak harus mengerjakan tes hingga akhir ataupun
harus memastikan seluruh jawaban dijawab dengan benar. Hal ini dilakukan untuk
mencegah timbulnya perasaan gagal yang mungkin timbul pada saat peserta tes
tidak mampu menyelesaikan tes hingga akhir sesuai dengan waktu yang
masalah yang sering kali timbul. Tester harus lebih ekstra dalam meyakinkan
peserta bahwa hasil tes yang akan mereka peroleh nantinya bergantung kepada
ketertarikan dan usaha mereka dalam mengerjakan tes tersebut, sehingga nantinya
mereka akan mengurangi faking pada peserta tes, karena peserta tes dapat
menyadari bahwa jika tidak mengerjakan tes dengan baik dan maksimal, maka
Penting untuk memastikan seluruh bahan kebutuhan tes telah tersedia, dan bahkan
lebih baik ketika ada materi pendukung yang dapat berupa buku penjelasan yang
tersedia untuk para peserta tes. Buku penjelasan tersebut dapat berisikan
mengenai tujuan dari administrasi tes, petunjuk dan saran mengenai bagaimana
seharusnya tes dikerjakan, dan berisi beberapa contoh dalam mengerjakan tes
tersebut.
versi Indonesia
Prosedur tes yang standar tidak hanya mengenai instuksi secara lisan,
waktu, bahan-bahan, dan aspek lainnya, namun juga mengenai kondisi tes. Hal ini
dapat berpengaruh terhadap skor tes, bahkan pada aspek yang sangat kecil
sekalipun. Perlu adanya persiapan tester yang matang, penyesuaian kondisi tes,
membangun rapport dan mengenalkan tes kepada para peserta tes (Anastasi &
Urbina, 1997).
fase pada pemberian tes, termasuk administrasi, skoring, pemberian laporan, dan
interpretasi (F.B. Baker, 1989; Butcher, 1987; Gutkin & Wise, 1991; Roid, 1986;
dalam Anastasi & Urbina, 1997). Penggunaan komputer dan internet memberikan
revolusi baru pada dunia alat tes, termasuk pada variasi alat tes kepribadian yang
dapat diakses melalui internet (Kaplan & Sacuzzo, 2005), sehingga memunculkan
memiliki alasan yaitu pengguna komputer yang nantinya akan melaksanakan tes
secara online adalah seorang manusia. Dalam hal ini, perlu dipertimbangkan
dan bagaimana mereka mampu bereaksi pada situasi yang berbeda, termasuk pada
perbedaan metode yang diberikan sewaktu administrasi tes (Bushnell & Mullin,
1987).
didesain dalam versi elektronik dan di-posting ke Web site (Osterlind, 2010).
administrasi tes secara online, peserta langsung membaca instruksi yang sudah
ada pada layar komputer, tempat administrasi tes lebih fleksibel bahkan bisa
dilakukan oleh orang-orang yang berbeda negara, tidak menggunakan paper and
rapport dan mengenalkan alat tes juga hampir tidak ada karena minimnya
hasil mean yang berbeda pada tipe kepribadian Big Five Inventory. Pada
secara umum bahwa terdapat pengaruh instruksi yang terstandar dan yang tidak
terstandar dalam pengadministrasian Big Five Inventory terhadap hasil Big Five
yang berbeda (tidak standar) saja bisa memberikan pengaruh pada hasil tes,
pengukuran (Azwar, 2007). Pada proses pengembangan alat tes, analisis aitem
merupakan langkah awal yang krusial, yang meliputi berbagai jenis prosedur
Analisis aitem memiliki beberapa istilah, yaitu item impact, DIF, dan juga
bias aitem (Zumbo, 1999). Pada sudut pandang psikometri, perbedaan konsistensi
1997). Untuk mendapatkan reliabilitas yang baik, maka eror harus diminimalisir,
dengan bias pada tes, yang juga dapat merusak validitasnya (Coaley, 2010;
Osterlind, 2010; Reeve, tanpa tahun). Reliabilitas dipengaruhi oleh random error
(kesalahan yang berasal dari individu peserta tes), sedangkan kesalahan sistematik
2010), sehingga berkaitan dengan bias yang terjadi pada tes, yang juga dapat
merusak validitasnya (Coaley, 2010; Osterlind, 2010). DIF merupakan salah satu
konsep dalam pengukuran bias (Sheppard, dkk., 2006) yang berpengaruh pada
DIF berbeda dengan bias aitem, namun merupakan titik awal dari
kemampuan/latent trait yang sama dari kelompok yang berbeda, namun memiliki
kesempatan yang tidak sama dalam merespons aitem (cenderung setuju pada
pernyataan aitem tertentu). Bias aitem muncul ketika aitem tidak bisa mengukur
apa yang ingin diukur, atau hanya bisa mengukur sedikit dari apa yang ingin
diukur tersebut. Bias aitem dapat mempengaruhi validitas suatu tes karena dapat
apa yang seharusnya diukur (Rahmawati, 2010). Singkatnya, DIF adalah sebuah
aitem, setelah level atribut/latent trait yang diukur dikondisikan setara. Sedangkan
bias aitem terjadi ketika individu dari satu kelompok cenderung untuk menyetuji
karena beberapa karakteristik dari aitem yang dipakai dalam mengukur atau
situasi pengukuran yang tidak relevan dengan tujuan tes (Zumbo, 1999;
Widhiarso, 2004).
mungkin merupakan hasil dari bias aitem, berdasarkan pemahaman dari Osterlind
(2010), DIF lebih mengarah pada validitas berdasarkan bukti struktur internal.
Bias aitem dapat muncul dari eksternal struktur tes atau bukan merupakan bawaan
dari aitem yang tersedia. Proses respons yang berbeda tersebut dapat dipengaruhi
oleh extraneous variable, bukanlah dari internal atau aitemnya. Sedangkan pada
konsep DIF, berkaitan dengan aitem (struktur) yang disediakan untuk dikerjakan
oleh kelompok tertentu, dimana aitem tersebut yang membuat individu dari
kelompok tertentu memberi respons yang berbeda. Dapat dikatakan bahwa aitem-
lah yang disalahkan, bukan individu atau latar belakang individu yang disalahkan.
Terdapat dua kelompok yang akan dibandingkan pada konsep DIF, yaitu
penjabaran mengenai DIF diatas, DIF berkaitan dengan kedua hal tersebut yaitu
adanya perbedaan respon antara kelompok referensi dan kelompok fokal dalam
langsung kepada para peserta tes yang sudah pasti tidak bisa ditangkap oleh
komputer. Hal ini sejalan dengan pernyataan Kaplan & Sacuzzo (2005) bahwa
tersendiri dan tidak ada interaksi langsung, serta terkadang mampu memunculkan
tidak perlu sulit untuk scan hasil karena data langsung masuk ke dalam sistem
Osterlind, 2010).
sangat baik, tahapan administrasi dirancang sedemikian rupa agar dapat dilakukan
sendiri oleh peserta tes, lebih ada kesabaran (peserta tes tidak terburu-buru dalam
mengerjakan tes), hasil respons tepat waktu karena langsung ter-input oleh
komputer, mempermudah tugas tester (tester bisa melaksanakan tugas lain), dan
lebih mengontrol bias. Hal ini dapat meminimalisir kesalahan yang terjadi pada
tes paper-and pencil atau administrasi tes secara manual pada hal standarisasi,
Kantor, dkk., 1989; Buchanan & Smith, 1999; Cronk & West, 2002; dalam
Kaplan & Sacuzzon, 2005). Individu menjadi lebih nyaman dan terbuka (disclose)
dalam merespons aitem ketika berinteraksi dengan komputer (Davis, 1999; dalam
Kaplan & Sacuzzo, 2005), lebih jujur, dan tidak memunculkan efek social
desirability ketika dihadapkan pada situasi pelaksanaan tes tanpa prosedur yang
Gilbert pada tahun 1995 (dalam Kaplan & Sacuzzo, 2005) menunjukkan bahwa
reliabelnya dengan administrasi tes secara manual (Handel, Ben-Porath, & Matt,
1999; Schulenberg & Yutrzenka, 1999; dalam Kaplan & Sacuzzo, 2005; Groth-
Marnat, 1999).
manual, yang kemudian ditransformasi dan dibentuk dalam form digital yang
dapat diakses melalui komputer dan jaringan internet yang kemudian dikenal
keunggulan tersendiri, namun terlepas dari itu, pada awalnya setiap tes
dan meringankan kinerja individu, namun tetap tidak bisa menggantikan secara
penuh keutamaan yang bisa dilakukan individu itu sendiri. Administrasi tes online
pengujian agar memiliki cukup bukti untuk dikatakan sama baiknya dengan
administrasi tes secara manual yang merupakan merupakan setting-an asli yang
menjadi awal mula, dasar, dan acuan dalam hal pengadministrasian tes. Inilah
tuntutan setiap situasi (Anastasi & Urbina, 1997). Situasi yang berbeda dalam
kemudian bisa menjadikan dua individu yang memiliki kepribadian yang sama,
akan memiliki kemungkinan lebih untuk mendapatkan hasil skor BFI yang
skor mereka akan sama. Dengan melihat konsep DIF, maka akan terlihat apakah
aitem pada alat tes tersebut adil dan tidak memihak pada suatu kelompok tertentu
Big Five Inventory (BFI) dimasa ini juga sudah bisa diakses diinternet dan
administrasi tes pada BFI memberikan alasan untuk kemudian perlu dilakukan
pengecekkan karakteristik psikometrisnya. Hal ini juga berlaku pada BFI versi
Indonesia yang juga bisa dilaksanakan baik pada administrasi tes manual maupun
online, dimana kedua kelompok memiliki latent trait yang sama yaitu OCEAN.
layak untuk dipergunakan demi alasan pengembangan alat ukur BFI. Namun,
administrasi tes pada aitem BFI versi Indonesia. Dengan pengujian DIF
administrasi tes, akan teruji pula keadilan aitem pada alat tes BFI versi Indonesia
baik saat diadministrasikan secara manual maupun online. Dengan kata lain, akan
terlihat apakah BFI dengan administrasi tes online sama baiknya dengan
penyajian BFI dengan administrasi tes secara manual. Jika BFI ternyata
mengandung DIF pada konteks administrasi tes yang berbeda tersebut, maka
dapat dipastikan bahwa hal ini dapat berpengaruh pada skor tes. Kemungkinan ini
kualitasnya akan menurun dan penggunaannya juga masih sulit untuk diterapkan.
Hal ini akan menghambat terciptanya BFI versi Indonesia yang berkualitas dan