Sejarah Big 5

BAB II
TINJAUAN PUSTAKA
A. Big Five
1. Sejarah Big Five
Kepribadian menurut Allport (dalam Schultz, 2005) didefinisikan sebagai
suatu organisasi dinamik dalam diri individu yang merupakan sistem
psychophysical yang menentukan karakteristik perilaku dan pikiran individu.
Dalam usaha mempelajari kepribadian manusia muncul pertanyaan mengenai
perbandingan antara individu yang satu dan lainnya. Misalnya: seseorang
mungkin saja mengalami depresi, namun sejauh mana tingkat depresi yang
dialaminya? Para ahli sepakat bahwa cara untuk menjawab pertanyaan itu adalah
dengan mengkategorisasikan individu kedalam kelompok tinggi, sedang atau
rendah. Untuk melakukan hal itu maka kepribadian harus diuraikan menjadi
beberapa tipe. Hal ini mengundang perdebatan mengenai jumlah dimensi dasar
dari kepribadian. Berkaitan dengan hal ini, Allport pada tahun 1937 dan para ahli
kepribadian lain, seperti Eysenck, Cattell, dan Costa dan McCrae melakukan
pembahasan. Mereka kemudian membuat kesepakatan bahwa kepribadian terdiri
dari trait (Coaley, 2010; John & Srivastava, 1999; McCrae & Costa, 2003; dalam
Pervin, 2005).
Sejak kemunculan metode yang bernama analisis faktor, untuk
mengidentifikasi dimensi atau faktor dari sekian banyaknya trait ditahun 1980an,
maka mulailah banyak konsep mengenai trait yang bermunculan, termasuk
konsep dimensi yang dibuat oleh Eysenck (3 dimensi utama) dan Cattell (16
12
Universitas Sumatera Utara

13
dimensi utama) terhadap kepribadian. Tupes, Chrystal, dan Goldberg pada tahun
1981 (dalam Coaley, 2010), adalah peneliti pertama yang menemukan bahwa
kepribadian bisa dikecilkan menjadi hanya 5 (lima) komponen. Kelima faktor
yang ditemukan tersebut dibentuk dengan metode yang sederhana, yaitu mencoba
menemukan unit dasar dari kepribadian dengan menganalisis kata-kata yang
orang-orang biasa (tidak hanya psikolog) gunakan sehari-hari, untuk
mendeskripsikan kepribadian seseorang. Hasilnya kemudian diurutkan
menggunakan analisis faktor untuk melihat trait yang mana yang bisa berjalan
secara bersamaan (Goldberg, dalam John, O. P., Naumann, L. P., & Soto, C. J.,
2008; Pervin, 2005; Coaley, 2010).
Costa dan McCrae pada tahun 1985, 1992, adalah para peneliti yang
paling terkenal dalam menemukan kelima faktor tersebut melalui analisis faktor
(Coaley, 2010). McCrae & Costa.Jr (dalam Pervin, 2005) menyatakan bahwa pada
trait kepribadian digambarkan dalam bentuk lima dimensi dasar. Lima faktor
tersebut terdiri dari Opennes, Conscientiousness, Extraversion, Agreeableness,
dan Neuroticism, yang biasa disebut OCEAN untuk mempermudah
penghafalannya (John dalam Pervin, 2005).
Penamaan trait mungkin berbeda pada setiap teoris dan dari alat ukur yang
ada, namun ide dan kontennya tetap sama. Hal ini kemudian mengundang
persetujuan bahwa data yang ada mengarah pada kesimpulan bahwa yang
terbentuk adalah kelima faktor tersebut. Dengan kata lain, deskripsi kepribadian
individu dapat secara baik dibentuk dalam lima hal yang luas dan level abstraksi

14
yang luar biasa, yang dikenal sebagai Big Five (John & Srivastava, 1999; McCrae
& Costa, 2003; dalam Pervin, 2005; Coaley 2010).
Konsep Big Five banyak dilibatkan dalam berbagai penelitian oleh ahli
kepribadian di berbagai negara, dan tetap menghasilkan gambaran 5 dimensi dasar
kepribadian. Fakta ini mendukung munculnya kesepakatan yang menyatakan
bahwa konsep Big Five stabil. (Coaley, 2010; Pervin, 2005). Bahkan terlihat
peningkatan publikasi penelitian-penelitian yang berkaitan dengan Big Five atau
istilah lainnya adalah Five Factor Model (FFM) sejak terbentuknya konsep
tersebut. Tercatat pada tahun 2005-2009 jumlah publikasi mencapai lebih dari
1500an jika dibandingkan pada tahun awal terbentuknya konsep Big Five, yaitu
awal tahun 1990an yang hanya berkisar 250an publikasi (John, O. P., Naumann,
L. P., & Soto, C. J., 2008).
2. Tipe Kepribadian Big Five
Berdasarkan penjelasan mengenai sejarah Big Five, maka dapat
disimpulkan bahwa Big Five Personality adalah suatu pendekatan dalam dunia
psikologi untuk melihat kepribadian manusia dengan menggunakan konsep FFM,
yaitu trait yang tersusun dalam lima buah domain kepribadian yang telah dibentuk
dengan menggunakan analisis faktor. Berikut ini adalah trait-trait dalam domain-
domain dari Big Five Personality Costa & McCrae (dalam Pervin, 2005), yaitu:
a. Openness (O)
Openness yang dimaksudkan adalah openness to experience, dimana trait
ini mengidentifikasikan kepribadian individu dari sudut pandang keaktifan dalam
mencari dan mengapresiasi pengalaman hidup, toleransinya terhadap hal-hal yang

15
baru dan tidak biasa. Orang dengan skor tinggi merupakan orang yang memiliki
rasa ingin tahu, ketertarikan yang luas, kreatif, original, imajinatif, dan menyukai
hal yang bervariasi (tidak tradisional). Sedangkan orang dengan skor rendah
memiliki pemikiran yang konvensional, down-to-earth, ketertarikannya hanya
pada hal tertentu, tidak artistik, dan tidak analitis.
b. Conscientiousness (C)
Trait ini mengidentifikasikan kepribadian individu dari sudut pandang
derajat kemampuan individu terhadap pengorganisasian, daya tahan dan motivasi
berperilaku dalam meraih tujuan, tidak bergantung, tidak tahan dengan orang yang
ceroboh dan tidak bersemangat. Orang dengan skor tinggi dapat dipercaya,
terorganisir dan teratur, pekerja keras, disiplin dan tepat waktu, teliti, rapi,
ambisius, dan gigih. Sedangkan orang dengan skor rendah terlihat tanpa tujuan
dan terlihat tidak perduli akan sesuatu, malas, sulit diandalkan, sembrono dan
tidak teratur, mudah menyerah, dan suka bersenang-senang (hedonis).
c. Extraversion (E)
Trait ini mengidentifikasikan kepribadian individu dari segi kuantitas dan
intensitas interaksi interpersonal, level aktivitas, kebutuhan untuk menstimulasi,
kapasitas untuk memberi kesenangan. Orang dengan skor tinggi merupakan orang
yang bersosial, aktif, talkative, people-oriented, optimis, fun-loving, dan penuh
kasih. Sedangkan orang dengan skor rendah cenderung pendiam, task-oriented,
penyendiri, pasif, dan kurang mengekspresikan perasaannya.

16
d. Agreeableness (A)
Trait ini mengidentifikasikan kepribadian individu dari segi kualitas
pikiran, perasaan, dan tindakan, terhadap orientasi interpersonal dalam kontinum
(rentang) compassion hingga antagonism. Orang dengan skor tinggi berhati
lembut, good-nature, percaya pada orang lain, pemaaf, penolong, polos dan
terang-terangan/blak-blakan. Sedangkan orang dengan skor rendah lebih kasar,
curiga, sinis, kurang kooperatif, memiliki lebih mungkin dalam menyimpan
dendam, menyebalkan dan terkesan kejam, mementingkan kepentingan sendiri,
serta manipulatif.
e. Neuroticism (N)
Trait ini mengidentifikasi kepribadian individu pada sudut pandang
kestabilan emosi, yang berkaitan dengan distress psikologis, ide yang tidak
realistis, harapan atau dorongan yang berlebihan, dan coping respon yang
maladaptif. Orang dengan skor tinggi akan memiliki rasa khawatir, cemas,
emosional, merasa tidak aman, merasa ada yang kurang, dan perasaan sedih atas
dirinya. Sedangkan orang dengan skor rendah mempunyai bawaan santai, tenang,
tidak emosional, lebih stabil, merasa lebih aman dan merasa puas akan dirinya.
Kelima domain trait pada model Big Five tersebut dibagi kedalam enam
subfaktor oleh Costa & McCrae (dalam Pervin, 2005; John & Srivastava, 1999),
yaitu:

17
Tabel 1. Sub Faktor pada trait dalam model Big Five
Dimensi Subfaktor
Fantasy (khayalan)
Aesthetics (keindahan)
Openness to Feelings (perasaan)
Experience Actions (tindakan)
Ideas (ide)
Values (nilai-nilai)
Self-discipline (disiplin)
Dutifulness (patuh)
Competence (kompetensi)
Conscientiousness Order (teratur)
Deliberation (pertimbangan)
Achievement striving(pencapaian prestasi)
Gregariousness (suka berkumpul)
Activity level (level aktivitas)
Assertiveness (asertif)
Extraversion Excitement Seeking (mencari kesenangan)
Positive Emotions (emosi yang positif)
Warmth (kehangatan)
Straightforwardness (berterusterang)
Trust (kepercayaan)
Altruism (mendahulukan kepentingan orang lain)
Agreeableness
Modesty (rendah hati)
Tendermindedness (berhati lembut)
Compliance (kerelaan)
Anxiety (kecemasan)
Self-consciousness (kesadaran diri)
Depression (depresi)
Neuroticism Vulnerability (mudah tersinggung)
Impulsiveness (menuruti kata hati)
Angry hostility (amarah)
3. Big five Inventory (BFI)
Ada beberapa alat tes yang dibentuk dengan menggunakan konsep Big
Five, antara lain yaitu Big Five Inventory (BFI), NEO PI-R, International Item
Pool (IPIP), PCI, dan HPI. Mastuti (2005) menyatakan bahwa di Indonesia
penggunaan alat ukur kepribadian Big Five maupun pengembangan alatnya masih
belum begitu populer. Padahal banyak hal yang mampu diprediksi dengan
kepribadian big five. Selain itu, teori big five juga terbukti memiliki konsistensi
(laten kepribadian) meski diterapkan di Indonesia (Widhiarso, 2004).

18
John, Donahue, dan Kentle menyadari akan kebutuhan suatu instrumen
yang efisien, fleksibel, dan berlaku universal, dalam kepentingannya untuk
mengukur kepribadian individu dengan menggunakan konsep big five. Kemudian,
pada tahun 1991, John, Donahue, dan Kentle menyusun suatu alat ukur yang
kemudian dinamakan Big Five Inventory. Big Five Inventory (BFI) ini terdiri atas
44 (empat puluh empat) aitem, yang dapat direspon dalam waktu 5 (lima) menit,
dan dapat menghasilkan kelima dimensi Big Five yang dibentuk oleh Costa dan
McCrae (John, O. P., Naumann, L. P., & Soto, C. J., 2008; Rammstedt & John,
2006).
Burisch (dalam John, O. P., Naumann, L. P., & Soto, C. J., 2008; John &
Srivastava, 1999) mengatakan, skala pendek tidak hanya menghemat waktu
pengujian, tetapi juga menghindari kebosanan dan kelelahan subjek, karena akan
ada subyek yang tidak memberi respon sesuai harapan jika tes terlihat terlalu
lama. Big Five Inventory (BFI) menggunakan frase pendek berdasarkan kata sifat
yang dikenal sebagai inti dari Big Five. Selanjutnya ditambahkan kata-kata yang
berfungsi sebagai tambahan informasi atau untuk memperjelas kata inti. Big Five
Inventory (BFI) dengan frase kata sifatnya juga memiliki keuntungan dalam
mencegah ambiguitas atau multiple meanings (John, O. P., Naumann, L. P., &
Soto, C. J., 2008).
Banyak penelitian yang bertujuan untuk mengembangkan Big Five
Inventory (BFI) ini, termasuk di Indonesia, di mana salah satunya adalah
penelitian yang dilakukan oleh Mariyanti dan Rahmawati pada tahun 2011.
Mariyanti dan Rahmawati (2011) melakukan penelitian yang bertujuan untuk

19
melihat kualitas BFI versi adaptasi Bahasa Indonesia dengan melihat karakteristik
psikometrisnya.
BFI versi Indonesia ini terdiri dari 44 aitem favourable dan unfavourable
yang terdiri dari kalimat pernyataan. Kalimat pernyataan tersebut direspon dengan
memilih angka 1 hingga 5 dan menuliskannya ditempat yang telah disediakan
pada setiap pernyataan. Makna angka “1” adalah “sangat tidak setuju”, “2” adalah
“tidak setuju”, “3” adalah “netral”, “4” adalah “setuju”, dan “5” bermakna “sangat
setuju”. Aitem favourable akan diberi nilai dari angka 1 sampai 5 pada jawaban
STS sampai SS, sedangkan aitem unfavourable akan diberi nilai sebaliknya. BFI
yang sudah diadaptasi oleh Mariyanti dan Rahmawati (2011) ke dalam bahasa
Indonesia ini memiliki reliabilitas yang baik yaitu 0.70 dan juga memiliki
validitas konstruk yang memuaskan dengan nilai loading rata-rata diatas 0.30 dan
varian yang dapat dijelaskan sebesar 41.45%.
Berdasarkan hasil dari penelitian Mariyanti dan Rahmawati pada tahun
2011, terjadi pergeseran definisi dari kelima faktor dalam teori Big Five pada BFI
versi adaptasi Bahasa Indonesia, yaitu :
a. Openness (O) adalah faktor yang melihat keterbukaan individu untuk
mencari tantangan dan hal-hal baru. Seseorang dikatakan open to
experience ketika individu tersebut cerdas dan suka berpikir, memiliki ide-
ide inovatif, percaya diri, mampu mempertimbangkan dan membuat suatu
rencana dan menjalankannya serta memiliki rasa ingin tahu yang besar.
b. Neuroticism (N) adalah faktor yang mengidentifikasi individu yang rentan
terhadap distress psikologis yaitu yang mudah mengalami rasa sedih, takut

20
dan cemas berlebihan, memiliki dorongan berlebihan, memiliki coping
respon maladptif. Selain itu juga terlihat dalam bentuk perilaku mudah
tersinggung (irritability) dan pemarah (hostile). Seseorang dikatakan
neurotis ketika individu tersebut mudah merasa tertekan dan sedih, tidak
mampu menghadapi situasi stress dengan baik, pencemas, suasana hati
mudah berubah, labil, pemalu dan perhatiannya mudah terganggu.
c. Conscientiousness (C) adalah faktor yang melihat kesadaran diri, motivasi
dan kemampuan mengorganisasikan sesuatu dalam mencapai suatu tujuan.
Seseorang dikategorikan dalam faktor Conscientiousness ketika individu
tersebut teliti, terorganisir, tidak pemalas, menyukai suatu pekerjaan yang
rutin serta mampu bertahan dan mengerjakan suatu tugas hingga selesai.
d. Extraversion (E) adalah faktor yang melihat level aktivitas dan
kemampuan melakukan hubungan interpersonal individu. Seseorang
dikatakan extrovert apabila individu tersebut suka mengobrol, tidak
pendiam, santai, mudah bergaul dan senang bekerjasama dengan orang
lain.
e. Agreeableness (A) adalah faktor yang melihat kualitas trust dan seni
individu. Seseorang dikategorikan dalam faktor Agreeableness ketika
individu tersebut senang membantu dan tidak egois, mudah memaafkan
dan mempercayai orang lain, dan memiliki apresiasi terhadap seni, musik
atau sastra.

21
Tabel 2. Pengelompokan Aitem-Aitem pada BFI versi Indonesia
Jumlah
No. Faktor Nomor Butir Aitem Persentasi
Aitem
Faktor 1 5, 10, 11, 12, 13, 15, 16, 20, 25, 26,
1 13 29,55%
(Opennes) 33, 38, 40
Faktor 2
2 4, 9, 14, 19, 24, 29, 31, 34, 37, 39, 43 11 25%
(Neuroticism)
Faktor 3 15.91%
3 2, 3, 8, 18, 23, 28, 35 7
(Conscientiousness)
Faktor 4 13.63%
4 1, 6, 21, 27, 36, 42 6
(Extraversion)
Faktor 5 15.91%
5 7, 17, 22, 30, 32, 41, 44 7
(Agreeableness)
TOTAL 44 100%
B. Differential Item Functioning (DIF)
Analisis aitem merupakan langkah awal yang krusial dalam
pengembangan alat tes, yang meliputi berbagai jenis prosedur evaluasi. Ketika
dilakukan pengembangan, perlu dilakukan pengamatan berkaitan dengan
karakteristik yang diukur. Untuk mengetahui kualitas alat tes, dapat dilihat
karakteristik psikometrisnya, yaitu validitas dan reliabilitas. Kedua hal ini berjalan
beriringan, yaitu tes tidak akan valid jika tidak teruji bahwa tes tersebut reliabel,
akan tetapi hal ini tidak berlaku sebaliknya. Meski demikian, para ilmuan
psikologi menyadari bahwa validitas lebih penting dibandingkan reliabilitas. Hal
ini karena, reliabilitas berfokus pada akurasi hasil tes, sedangkan validitas
berfokus pada nature dari konstruk yang diukur (Coaley, 2010).
Reliabilitas merupakan konsep yang digunakan untuk menyatakan
sejauhmana hasil suatu pengukuran dapat dipercaya. Sedangkan validitas

22
mengacu pada sejauh mana ketepatan dan kecermatan suatu alat ukur dalam
melakukan fungsi ukurnya atau memberikan hasil ukur yang sesuai dengan
maksud dan tujuan dilakukannya pengukuran tersebut, sehingga berguna untuk
melakukan pengambilan keputusan yang bertujuan untuk pengukuran aspek
mental (Azwar, 2012; American Educational Research Association, dalam
Osterlind, 2010; Coaley, 2010).
Analisis aitem memiliki beberapa istilah, yaitu item impact, DIF, dan juga
bias aitem (Zumbo, 1999). Pada sudut pandang psikometri, perbedaan konsistensi
intrapersonal maupun interpersonal merupakan hal yang krusial terhadap
karakteristik psikometrisnya, yaitu validitas dan reliabilitas (Anastasi & Urbina,
1997). Untuk mendapatkan reliabilitas yang baik, maka eror harus diminimalisir.
Reliabilitas dipengaruhi secara langsung pada random error (kesalahan yang
berasal dari individu peserta tes), sedangkan kesalahan sistematik (systematic
error) merupakan kesalahan yg berasal atas keanggotaan suatu kelompok
(Osterlind, 2010), sehingga berkaitan dengan bias yang terjadi pada tes, yang juga
dapat merusak validitasnya (Coaley, 2010; Osterlind, 2010).
DIF merupakan salah satu konsep dalam pengukuran bias (Sheppard, dkk.,
2006) yang termasuk kesalahan sistematik (systematic error) dan dapat
berpengaruh pada validitas. Meskipun DIF merupakan kesalahan sistematik yang
berpengaruh terhadap validitas, namun didalam kelompok juga terdiri dari
individu yang dapat memberikan kontribusi kesalahan, sehingga akan dapat
berpengaruh pada reliabilitas dimana individu dalam kelompok merespons pada
aitem yang terjangkit DIF tersebut. Selain itu, dalam pemahaman berdasarkan

23
Osterlind (2010), DIF termasuk dalam sumber bukti validitas berdasarkan struktur
internal.
1. Definisi Differential Item Functioning (DIF)
DIF berbeda dengan bias aitem. Bias aitem terjadi ketika individu dari satu kelompok cenderung
untuk menyetujui pernyataan pada aitem tertentu dibandingkan peserta individu dari kelompok lainnya, karena
beberapa karakteristik dari aitem yang dipakai dalam mengukur atau situasi pengukuran yang tidak relevan
dengan tujuan tes. Sedangkan DIF adalah sebuah kondisi dimana individu dari kelompok yang berbeda,
memiliki kemungkinan/probabilitas berbeda dalam merespon setuju pada suatu pernyataan dalam sebuah
aitem, setelah level atribut/latent trait yang diukur dikondisikan setara (Zumbo, 1999; Widhiarso, 2004;
Osterlind, 2010). Kamata dan Vaughn pada tahun 2004 mengatakan bahwa DIF terjadi
jika suatu kelompok yang berbeda dengan kemampuan/latent trait yang sama
mendapat skor harapan yang berbeda pada aitem yang sama. Millsap dan Everson
mengungkapkan bahwa DIF adalah karakteristik tes yang berbeda secara statistik
pada kelompok yang berbeda yang memiliki kemampuan/latent trait yang sama
pada variabel yang ingin diukur (dalam Rahmawati, 2010).
2. Sumber Differential Item Functioning (DIF)
DIF berhubungan dengan suatu keanggotaan tertentu, seperti perbedaan
antar kelompok, etnis, jenis kelamin, dan juga perbedaan kelas sosial, umur,
daerah tempat tinggal, lingkungan rural, dan urban. DIF mengacu pada

24
membandingkan dua kelompok yang ada, yang disebut dengan kelompok
referensi (reference group) dan kelompok fokal (focal group) (Hortensius, L.,
2012). Kelompok referensi juga memiliki istilah lain yaitu kelompok mayoritas
atau dapat juga dikenal sebagai kelompok pembanding yang juga disebut dengan
kelompok yang diuntungkan jika berkaitan dengan tes kognitif, sedangkan
kelompok fokal memiliki istilah lain yaitu kelompok minoritas ataupun kelompok
yang menjadi fokus, yang juga dikenal sebagai kelompok yang tidak diuntungkan
jika berkaitan dengan tes kognitif. Terdapat banyak kelompok referensi demikian
halnya pada kelompok fokal, di mana individu mungkin terlibat pada satu atau
lebih. Misalnya saja pada wanita kulit putih, yang memiliki kemungkinan lebih
untuk masuk dalam kelompok referensi pada konteks tertentu, dan masuk
kedalam kelompok fokal pada konteks lainnya atau dengan kata lain dapat ditukar
(Camilli dan Shepard dalam Rahmawati, 2010; Jodoin, M.G. & Gierl, J., 1999).
Penelitian Sacco, dkk. (2010) menemukan bukti bahwa DIF berkaitan
dengan gender, ras/etnis, termasuk usia. Pada penelitian Sacco, dkk., pada
kelompok wanita dewasa dan wanita muda, salah satu kelompok mendapat nilai
tinggi sedangkan kelompok lain mendapat nilai yang rendah. Adapun penelitian
dari Greer pada tahun 2004 menemukan bahwa DIF berkaitan dengan spesifikasi
demografi, seperti pria-wanita dengan kemampuan yang sama, orang asia dan
orang Eropa, dan seterusnya (dalam Acar, 2012).
Perbedaan metode pengadministrasian tes juga dapat mempengaruhi hasil
tes (Lang, dkk). Beberapa bukti menunjukkan bahwa peserta tes lebih nyaman dan
menyukai interaksi dengan komputer dibandingkan dengan tes paper-and-pencil

25
yang juga bisa disebut dengan administrasi tes manual, termasuk diantaranya tes
manual yang kemudian dirancang menjadi versi administrasi tes online
(Rosenfeld, Doherty, Vicino, Kantor, dkk., 1989; Buchanan & Smith, 1999;
Cronk & West, 2002; dalam Kaplan & Sacuzzon, 2005). Individu menjadi lebih
nyaman dan terbuka (disclose) dalam merespons aitem ketika berinteraksi dengan
komputer (Davis, 1999; dalam Kaplan & Sacuzzo, 2005), lebih jujur, dan tidak
memunculkan efek social desirability ketika dihadapkan pada situasi pelaksanaan
tes tanpa prosedur yang mengharuskan face-to-face (Kaplan & Sacuzzo, 2005).
Penelitian oleh Locke & Gilbert pada tahun 1995 (dalam Kaplan & Sacuzzo,
2005) menyatakan bahwa peserta tes memberikan pengalaman positif dengan
komputer. Terdapat beberapa keunggulan yang diberikan ketika menggunakan
komputer baik administrasi, skoring, dan interpretasi (Britton & Tidwell, 1995;
dalam Kaplan & Sacuzzo, 2005; Anastasi & Urbina,1997), serta eror dalam
pendataan (Pettit, 2002; Miller, dkk., 2002; dalam Kaplan & Sacuzzo, 2005).
Kemajuan teknologi mungkin mempermudah dan meringankan kinerja
individu, namun tetap tidak bisa menggantikan secara penuh keutamaan yang bisa
dilakukan individu itu sendiri. Administrasi tes online memiliki keuntungan-
keuntungan tersendiri, namun masih perlu banyaknya pengujian agar memiliki
cukup bukti untuk dikatakan sama baiknya dengan administrasi tes secara manual
yang merupakan merupakan setting-an asli yang menjadi awal mula, dasar, dan
acuan dalam hal pengadministrasian tes. Inilah alasan mengapa administrasi tes
manual dianggap menjadi kelompok referensi (menjadi acuan) sedangkan

26
administrasi tes online dianggap sebagai kelompok yang menjadi kelompok fokal
(menjadi fokus).
Guler dan Penfield pada tahun 2009 (dalam Hortensius, L., 2012),
mengatakan bahwa salah satu isu dalam deteksi DIF adalah adanya dampak
(impact). Ketika kelompok fokal dan kelompok referensi berbeda dalam distribusi
kemampuan/latent trait yang mendasarinya, yaitu ketika satu kelompok memiliki
kemampuan yang rata-rata lebih tinggi daripada kelompok lain, hal ini disebut
dengan impact. Kehadiran impact akan mempersulit pendeteksian DIF karena
dapat memunculkan kesalahan tipe I (type I error atau false positive) yaitu
kesalahan dalam mengidentifikasi DIF pada aitem, padahal kenyataannya aitem
tersebut tidak mengandung DIF (Guler dan Penfield , 2009; dalam Hortensius, L.,
2012; Jodoin, M.G. & Gierl, J., 1999).
3. Jenis Differential Item Functioning (DIF)
Terdapat dua kategori DIF, yaitu DIF seragam (uniform DIF) dan DIF
tidak seragam (nonuniform DIF) (Mellenbergh, 1982; dalam Hortensius, L., 2012;
Rahmawati, 2010). DIF seragam (Uniform DIF atau consistent DIF) terjadi ketika
item characteristic curves atau ICC (persinggungan performansi setiap individu
dalam merespons aitem yang sama pada dua kelompok yang berbeda), berbeda
namun tidak berpotongan atau bersinggungan. Dalam hal ini aitem cenderung
direspons setuju atau tidak setuju pada suatu kelompok tertentu dibanding
kelompok lain setelah seluruh kemampuan disetarakan/latent trait sama, sehingga
terdapat perbedaan respons dari kelompok yang berbeda dengan latent trait yang
sama. Sedangkan DIF tidak seragam (Nonuniform DIF atau inconsistent DIF)

27
terjadi jika ICCs kedua kelompok berbeda, namun ada persinggungan atau adanya
garis yang memotong pada beberapa poin skala θ (Camilli & Shepard, 1994;
Kristjanson, dkk., 2005; dalam Rahmawati, 2010; Zumbo, 1999; Widhiarso, 2012;
Jodoin, M.G. & Gierl, J., 1999).
DIF dapat memberi keseimbangan atau justru malah tidak, pada masing-
masing kelompok pada tingkat tertentu. Singkatnya, hal ini terjadi jika terdapat
interaksi antara tingkat kemampuan dengan identitas kelompok (keanggotaannya),
sehingga aitem akan menjadi sulit pada satu kelompok dengan tingkat
kemampuan yang lebih rendah dan menjadi lebih sulit pada kelompok lain dengan
tingkat kemampuan yang lebih tinggi, atau aitem menjadi cenderung direspons
setuju atau tidak setuju pada kelompok tertentu (Camilli & Shepard, 1994;
Kristjanson, dkk., 2005; dalam Rahmawati, 2010; Hortensius, L., 2012).
4. Metode Analisis DIF
Gierl, Khaliq, dan Boughton pada tahun 1999 (dalam Acar, 2012)
mengatakan bahwa terdapat beberapa metode untuk mengidentifikasi DIF.
Beberapa Metode berkaitan dengan Classical Test Theory (CTT), yaitu Mantel-
Haenszel Procedure, Regresi Logistik, dan Simultaneous Bias Test (SIBTEST),
dan metode Item Respons Theory yang biasa disebut dengan IRT (Camili &
Shepard, 1994; Ogretmen, 1995; dalam Acar, 2012; Osterlind, 2010).
Regresi logistik adalah analisis yang didasarkan pada model statistik
terhadap kemungkinan untuk merespon benar/merespon setuju ataupun tidak
setuju terhadap suatu aitem, dilihat dari keanggotaannya dan kriteria atau variabel
yang dikondisikan (prediksi). Regresi logistik diusulkan sebagai alternatif uji

28
statistik Mantel-Haenszel untuk mengidentifikasi DIF pada tahun 1990 oleh
Swaminathan dan Rogers (Hortensius, L., 2012; Jodoin, M.G. & Gierl, J., 1999).
Analisis regresi logistik merupakan analisis yang menggunakan jenis data ordinal
dan binary (Field, 2009).
Jika data utama yang dipergunakan untuk menganalisis DIF adalah data
ordinal, maka analisis yang digunakan akan lebih dikhususkan lagi, yaitu dengan
menggunakan analisis regresi logistik ordinal (ordinal logistic regression).
Analisis regresi logistik ordinal merupakan perluasan dari analisis regresi yang
mampu memprediksi hasil data yang berbentuk ordinal, berdasarkan variabel
prediktor (Field, 2009). Regresi logistik ordinal merupakan salah satu metode
terkini yang tersedia untuk menginvestigasi DIF aitem-aitem yang biasanya
ditemukan dalam pengukuran kepribadian dan psikologi sosial dengan data
ordinal (Zumbo, 1999).
Analisis ini akan dibantu dengan aplikasi tambahan bernama ologit2.inc
dan syntax program SPSS untuk analisis regresi logistik ordinal yang ditulis oleh
Bruno D. Zumbo, PhD. Aitem BFI versi Indonesia dikatakan mengandung DIF
administrasi tes jika nilai p ≤ 0,01 (Zumbo, 1999). Analisis regresi logistik juga
dapat melihat effect-size sehingga dapat mengidentifikasi apakah DIF yang
terkandung termasuk dalam jenis DIF seragam atau DIF tidak seragam (Zumbo,
1999). Berdasarkan Cohen pada tahun 1992, kategori Zumbo-Thomas effect size
adalah negligible dengan R2<0,13, moderate dengan 0,13< R2<0,26, dan large
dengan R2>0,26 (Jodoin, M.G. & Gierl, J., 1999). Dengan kata lain, nilai R2
Zumbo-Thomas effect size pada aitem paling tidak senilai 0,130 atau R-squared ≥

29
0,130 untuk kemudian dikatakan memiliki kriteria effect-size (Widhiarso, 2012;
Zumbo, 1999).
C. Administrasi Tes
1. Definisi Administrasi Tes
Anastasi & Urbina (1997) menyatakan bahwa pemikiran dasar dari suatu
tes meliputi generalisasi dari perilaku yang muncul di dalam situasi tes sampai
pada perilaku yang muncul pada situasi yang lain, yaitu situasi yang sebenarnya.
Administrasi tes psikologi adalah segala sesuatu proses yang berkenaan dengan
penyelenggaraan tes Psikologi. Skor dari suatu tes seharusnya dapat membantu
dalam memahami apa yang dirasakan oleh seseorang dan memprediksi bagaimana
perilaku orang tersebut. Kondisi-kondisi pada situasi saat itu kemudian dapat
mempengaruhi keadaan tes yang kemudian dapat menyebabkan kesalahan dan
mengurangi validitas tes tersebut. Dengan demikian, penting bagi kita untuk
mengidentifikasi hal-hal yang dapat mempengaruhi apapun yang berkaitan dengan
tes, termasuk diantaranya validitas tes tersebut, sehingga nantinya dapat
membatasi dan meminimalkan kerusakan yang terjadi pada tes tersebut. Hal
penting yang dapat berpengaruh secara langsung terhadap validitas tes adalah
administrasi tes (Anastasi & Urbina, 1997).
2. Hal-hal yang berkaitan dengan Administrasi Tes
Ada beberapa hal yang berkaitan yang harus diperhatikan berkaitan
dengan administrasi tes (Anastasi & Urbina, 1997), yaitu :
a. Persiapan Tester

30
Hal terpenting yang menjadi persyaratan dalam suatu administrasi tes yang
baik adalah persiapan yang baik. Pada administrasi tes, tidak boleh ada keadaan
darurat, atau dengan kata lain, tanpa adanya persiapan. Usaha yang spesifik harus
dilakukan dalam mencegah terjadinya kondisi yang tiba-tiba atau darurat.
Instruksi lisan adalah hal yang sangat penting pada tes individual, meski tidak
jarang pula ada tes di mana instruksi tes dapat langsung dibaca oleh peserta.
Bukan berarti tester tidak berperan dalam situasi seperti. Tester harus dapat
memahami dan familiar dengan instruksi yang akan diberikan kepada para
peserta. Hal ini perlu dilakukan untuk mencegah kesalahan dalam memahami tes
ataupun kesalahan baca terhadap instruksi tes. Hal lain yang juga penting untuk
diperhatikan adalah ketersediaan material pendukung tes. Material pendukung tes
haruslah dekat dengan tester dan mudah untuk dijangkau tetapi jangan sampai
menganggu peserta tes. Pada tes yang diberikan secara manual, seluruh material
tes yang dibutuhkan seperti lembar soal, lembar jawaban, pensil khusus, dan
material lain yang dibutuhkan haruslah dihitung, diperiksa kembali, dan disusun
dengan teliti.
Terkhusus untuk tes individual, pelatihan administrasi tes adalah hal yang
sangat penting. Pelatihan yang dilakukan haruslah meliputi demonstrasi dan
pelatihan pemberian instruksi dan dilakukan lebih dari satu tahun. Untuk tes yang
sifatnya kelompok, perlu diadakan briefing terlebih dahulu antara tester dan
penyelenggara tes, sehingga masing-masing pihak mengetahui dengan baik tugas
dan fungsi yang akan dilakukan.
b. Kondisi Tes

31
Prosedur tes yang standar tidak hanya mengenai instruksi secara lisan,
waktu, bahan-bahan, dan aspek lainnya, namun juga mengenai kondisi tes. Kita
harus memperhatikan pemilihan tempat administrasi tes yang sesuai. Tempat
administrasi tes harus bebas dari keributan dan mampu menyediakan pencahayaan
yang baik, ventilasi, tempat duduk, dan ruang yang cukup bagi peserta tes untuk
bekerja. Langkah khusus harus dilakukan untuk mencegah adanya interupsi di
tengah administrasi tes. Membuat tanda di pintu yang memberikan tanda tes
sedang berlangsung adalah hal yang cukup efektif. Pada administrasi tes yang
melibatkan banyak peserta, mengunci pintu dan menyiapkan seseorang untuk
menjaga pintu dapat dilakukan untuk mencegah gangguan yang mungkin timbul,
termasuk dari peserta yang datang terlambat.
Penting untuk disadari bahwasannya kondisi tes dapat berpengaruh
terhadap skor tes. Bahkan aspek yang sangat kecil pun dapat berpengaruh, seperti
perbedaan penggunaan kursi, di mana kelompok yang menggunakan kursi
bermeja mendapatkan skor yang lebih tinggi dibandingkan dengan kelompok
yang menggunakan kursi tanpa meja (T.L. Kelley, 1943; Traxler dan Hilkert,
1942; dalam Anastasi & Urbina, 1997). F.O. Bell, Hoff and Hoyt pada tahun 1964
mengatakan bahwa penggunaan lembar jawaban yang tidak memenuhi standar
juga dapat mempengaruhi skor tes (dalam Anastasi & Urbina, 1997). Administrasi
tes yang menggunakan lembar jawaban terpisah pada anak dibawah kelas lima
sekolah dasar dapat menyebabkan skor tes anak menjadi rendah. Oleh karena itu
pada administrasi tes yang dikenakan kepada anak di bawah kelas lima sekolah

32
dasar, lembar jawaban lebih baik tidak dipisah dari soal melainkan disatukan
dalam bentuk booklet.
Banyak hal lain yang dapat berpengaruh terhadap performansi seseorang
saat mengerjakan suatu tes, khususnya pada tes bakat dan tes kepribadian. Ketika
tester yang memberikan tes adalah seorang yang familiar dengan peserta tes maka
hal ini akan sangat berpengaruh secara signifikan terhadap skor tes. (Sacks, 1952;
Tsudzuki, Hata, & Kuze, 1957; dalam Anastasi & Urbina, 1997). Dalam telaah
lain, Wickes dan Bernstein pada tahun 1956 mengatakan bahwa perilaku tester
seperti tersenyum dan memberikan komentar seperti “bagus” atau “baik”
menunjukkan adanya pengaruh terhadap hasil tes, terlebih pada tes proyektif
dimana kehadiran tester cenderung menghambat reaksi dan respon emosional dari
peserta tes untuk menuliskan cerita sesuai gambar yang diberikan. Kirchner pada
tahun 1966 mengatakan bahwa pada administrasi tes atau pengujian kecepatan
mengetik, pelamar kerja yang melaksanakan tes sendirian mengetik lebih cepat
secara signifikan dibandingkan ketika administrasi tes dilakukan secara
berkelompok yang terdiri dari dua orang atau lebih (dalam Anastasi & Urbina,
1997)
Terdapat tiga hal lain yang harus diperhatikan dalam pelaksanaan
administrasi tes. Pertama, ikuti prosedur standar secara mendalam dan mendetail.
Psikolog dan tester harus menjelaskan prosedur secara lengkap dan jelas pada
setiap administrasi tes. Kedua, catatlah setiap kondisi yang tidak biasa atau
kondisi yang dapat berpengaruh terhadap peserta tes sekecil apapun. Ketiga,

33
jadikan catatan mengenai kondisi tes tersebut sebagai bahan pertimbangan pada
saat menginterpretasi hasil tes.
c. Memperkenalkan Tes : Rapport dan Orientasi Peserta Tes
Istilah “rapport” pada administrasi tes adalah upaya tester untuk
meningkatkan ketertarikan peserta tes terhadap tes, meningkatkan kerja sama, dan
mendorong mereka untuk dapat merespon tes sesuai dengan tujuan dari tes
tersebut. Teknik yang digunakan dalam membangun rapport pada administrasi tes
sangat berhubungan dengan administrasi tes. Pada saat membangun rapport,
keseragaman kondisi tes terhadap semua peserta tes sangat penting agar hasil tes
dapat dibandingkan. Seorang anak yang diberikan hadiah setelah mengerjakan tes
tidak bisa secara langsung dibandingkan dengan anak lain yang hanya diberikan
pujian saat selesai mengerjakan tes. Kondisi ini harus menjadi catatan dan
menjadi bahan pertimbangan dalam melakukan interpretasi hasil tes.
Meskipun rapport dapat lebih maksimal dilakukan pada tes individual,
rapport juga dapat dilakukan pada tes berkelompok untuk memotivasi peserta tes
sehingga dapat mengurangi kecemasan pada peserta tes. Teknik yang spesifik
dalam membangun rapport juga harus disesuaikan dengan tes, usia dari peserta,
dan karakteristik lain dari peserta tes. Administrasi tes pada anak pra sekolah
misalnya, harus mempertimbangkan faktor-faktor seperti rasa malu anak dan
sikap negatif yang dapat timbul pada orang asing. Sikap bersahabat, ceria, dan
santai oleh tester dapat membantu mengurangi kecemasan anak pada saat
melaksanakan tes.

34
Pelaksanaan tes baik pada anak usia sekolah ataupun pada orang dewasa,
harus menyadari bahwa tes yang dilakukan akan berefek pada harga diri setiap
individu. Oleh karena itu akan sangat bermanfaat apabila peserta tes diberikan
penjelasan bahwa peserta tes tidak harus mengerjakan tes hingga akhir ataupun
harus memastikan seluruh jawaban dijawab dengan benar. Hal ini dilakukan untuk
mencegah timbulnya perasaan gagal yang mungkin timbul pada saat peserta tes
tidak mampu menyelesaikan tes hingga akhir sesuai dengan waktu yang
ditentukan, ataupun kesulitan dalam menjawab soal.
Administrasi tes yang dilakukan pada orang dewasa memunculkan
masalah yang sering kali timbul. Tester harus lebih ekstra dalam meyakinkan
peserta bahwa hasil tes yang akan mereka peroleh nantinya bergantung kepada
ketertarikan dan usaha mereka dalam mengerjakan tes tersebut, sehingga nantinya
skor yang didapat dapat mengindikasikan kemampuan mereka yang
sesungguhnya. Mengatakan bahwa hasil skor secara valid menggambarkan minat
mereka akan mengurangi faking pada peserta tes, karena peserta tes dapat
menyadari bahwa jika tidak mengerjakan tes dengan baik dan maksimal, maka
mereka hanya akan mendapat kerugian atas perlakuan mereka sendiri.
Hal kecil dan mendetail perlu diperhatikan demi keberlangsungan tes.
Penting untuk memastikan seluruh bahan kebutuhan tes telah tersedia, dan bahkan
lebih baik ketika ada materi pendukung yang dapat berupa buku penjelasan yang
tersedia untuk para peserta tes. Buku penjelasan tersebut dapat berisikan
mengenai tujuan dari administrasi tes, petunjuk dan saran mengenai bagaimana

35
seharusnya tes dikerjakan, dan berisi beberapa contoh dalam mengerjakan tes
tersebut.
D. Differential Item Functioning Administrasi tes pada Big Five Inventory
versi Indonesia
Prosedur tes yang standar tidak hanya mengenai instuksi secara lisan,
waktu, bahan-bahan, dan aspek lainnya, namun juga mengenai kondisi tes. Hal ini
dapat berpengaruh terhadap skor tes, bahkan pada aspek yang sangat kecil
sekalipun. Perlu adanya persiapan tester yang matang, penyesuaian kondisi tes,
membangun rapport dan mengenalkan tes kepada para peserta tes (Anastasi &
Urbina, 1997).
Perkembangan zaman dalam penggunaan komputer mempengaruhi setiap
fase pada pemberian tes, termasuk administrasi, skoring, pemberian laporan, dan
interpretasi (F.B. Baker, 1989; Butcher, 1987; Gutkin & Wise, 1991; Roid, 1986;
dalam Anastasi & Urbina, 1997). Penggunaan komputer dan internet memberikan
revolusi baru pada dunia alat tes, termasuk pada variasi alat tes kepribadian yang
dapat diakses melalui internet (Kaplan & Sacuzzo, 2005), sehingga memunculkan
metode pelaksanaan baru yaitu administrasi tes secara online.
Penggunaan komputer yang bahkan merambah ke dunia psikologi ini juga
memiliki alasan yaitu pengguna komputer yang nantinya akan melaksanakan tes
secara online adalah seorang manusia. Dalam hal ini, perlu dipertimbangkan
bagaimana individu tersebut bekerja, bagaimana mereka memproses informasi
dan bagaimana mereka mampu bereaksi pada situasi yang berbeda, termasuk pada

36
perbedaan metode yang diberikan sewaktu administrasi tes (Bushnell & Mullin,
1987).
Administrasi tes online adalah metode penggunaan komputer, dimana tes
paper-and-pencil yang juga dapat disebut dengan administrasi tes manual,
didesain dalam versi elektronik dan di-posting ke Web site (Osterlind, 2010).
Adanya administrasi tes secara online yang didasarkan pada penggunaan
komputer memunculkan perbedaan baru dalam pengadministrasian tes. Pada
administrasi tes secara online, peserta langsung membaca instruksi yang sudah
ada pada layar komputer, tempat administrasi tes lebih fleksibel bahkan bisa
dilakukan oleh orang-orang yang berbeda negara, tidak menggunakan paper and
pencil melainkan menggunakan media elektronik seperti komputer, laptop, atau
smartphone (Kaplan & Sacuzzo, 2005; Osterlind, 2010). Usaha membangun
rapport dan mengenalkan alat tes juga hampir tidak ada karena minimnya
interaksi peserta tes kepada tester (Kaplan & Sacuzzo, 2005).
Lang, dkk. (2011) menemukan bahwa metode yang diberikan memberikan
hasil mean yang berbeda pada tipe kepribadian Big Five Inventory. Pada
kelompok yang diberikan metode telephone interview, ditemukan bahwa openness
seorang individu meningkat dibandingkan ketika diberikan dengan metode self-
administered questioner. Penelitian oleh Aslam (2011) yang berkaitan dengan
standarisasi instruksi pada pengadministrasian tes juga menghasilkan kesimpulan
secara umum bahwa terdapat pengaruh instruksi yang terstandar dan yang tidak
terstandar dalam pengadministrasian Big Five Inventory terhadap hasil Big Five
Inventory. Hasil penelitian ini cukup memberikan bukti bahwa metode

37
pengadministrasian yang sama (administrasi manual), namun dengan instruksi
yang berbeda (tidak standar) saja bisa memberikan pengaruh pada hasil tes,
terlebih lagi jika metode pengadministrasiannya secara keseluruhan sudah jelas
berbeda seperti halnya pada administrasi tes manual dan online.
Adanya perbedaan metode administrasi tes akan berpengaruh pada hasil
skor alat tes, memunculkan tantangan baru berkaitan dengan karakteristik
psikometris alat tes. Karakteristik psikometris berkaitan dengan pengembangan
dasar evaluasi terhadap suatu alat tes psikologis, termasuk diantaranya
pengukuran (Azwar, 2007). Pada proses pengembangan alat tes, analisis aitem
merupakan langkah awal yang krusial, yang meliputi berbagai jenis prosedur
evaluasi termasuk karakteristik yang diukur (Coaley, 2010).
Analisis aitem memiliki beberapa istilah, yaitu item impact, DIF, dan juga
bias aitem (Zumbo, 1999). Pada sudut pandang psikometri, perbedaan konsistensi
intrapersonal maupun interpersonal merupakan hal yang krusial terhadap
karakteristik psikometrisnya, yaitu validitas dan reliabilitas (Anastasi & Urbina,
1997). Untuk mendapatkan reliabilitas yang baik, maka eror harus diminimalisir,
termasuk diantaranya kesalahan sistematik (systematic error) yang berkaitan
dengan bias pada tes, yang juga dapat merusak validitasnya (Coaley, 2010;
Osterlind, 2010; Reeve, tanpa tahun). Reliabilitas dipengaruhi oleh random error
(kesalahan yang berasal dari individu peserta tes), sedangkan kesalahan sistematik
merupakan kesalahan yg berasal atas keanggotaan suatu kelompok (Osterlind,
2010), sehingga berkaitan dengan bias yang terjadi pada tes, yang juga dapat
merusak validitasnya (Coaley, 2010; Osterlind, 2010). DIF merupakan salah satu

38
konsep dalam pengukuran bias (Sheppard, dkk., 2006) yang berpengaruh pada
validitas (Coaley, 2010).
DIF berbeda dengan bias aitem, namun merupakan titik awal dari
penelitian tentang bias aitem. DIF muncul ketika peserta memiliki
kemampuan/latent trait yang sama dari kelompok yang berbeda, namun memiliki
kesempatan yang tidak sama dalam merespons aitem (cenderung setuju pada
pernyataan aitem tertentu). Bias aitem muncul ketika aitem tidak bisa mengukur
apa yang ingin diukur, atau hanya bisa mengukur sedikit dari apa yang ingin
diukur tersebut. Bias aitem dapat mempengaruhi validitas suatu tes karena dapat
menyebabkan kesimpulan yang salah mengenai kemampuan tes untuk mengukur
apa yang seharusnya diukur (Rahmawati, 2010). Singkatnya, DIF adalah sebuah
kondisi dimana individu dari kelompok yang berbeda, memiliki
kemungkinan/probabilitas berbeda dalam menyetujui suatu pernyataan sebuah
aitem, setelah level atribut/latent trait yang diukur dikondisikan setara. Sedangkan
bias aitem terjadi ketika individu dari satu kelompok cenderung untuk menyetuji
pernyataan dalam aitem dibandingkan peserta individu dari kelompok lainnya,
karena beberapa karakteristik dari aitem yang dipakai dalam mengukur atau
situasi pengukuran yang tidak relevan dengan tujuan tes (Zumbo, 1999;
Widhiarso, 2004).
Lain halnya dengan validitas berdasarkan bukti proses respons yang
mungkin merupakan hasil dari bias aitem, berdasarkan pemahaman dari Osterlind
(2010), DIF lebih mengarah pada validitas berdasarkan bukti struktur internal.
Bias aitem dapat muncul dari eksternal struktur tes atau bukan merupakan bawaan

39
dari aitem yang tersedia. Proses respons yang berbeda tersebut dapat dipengaruhi
oleh extraneous variable, bukanlah dari internal atau aitemnya. Sedangkan pada
konsep DIF, berkaitan dengan aitem (struktur) yang disediakan untuk dikerjakan
oleh kelompok tertentu, dimana aitem tersebut yang membuat individu dari
kelompok tertentu memberi respons yang berbeda. Dapat dikatakan bahwa aitem-
lah yang disalahkan, bukan individu atau latar belakang individu yang disalahkan.
Terdapat dua kelompok yang akan dibandingkan pada konsep DIF, yaitu
kelompok fokal (minoritas/yang tidak diuntungkan) dan kelompok referensi
(mayoritas/diuntungkan) sebagai pembanding (Rahmawati, 2010). Seperti halnya
penjabaran mengenai DIF diatas, DIF berkaitan dengan kedua hal tersebut yaitu
adanya perbedaan respon antara kelompok referensi dan kelompok fokal dalam
merespon suatu aitem.
Administrasi tes secara online memiliki interaksi dan observasi secara
langsung kepada para peserta tes yang sudah pasti tidak bisa ditangkap oleh
komputer. Hal ini sejalan dengan pernyataan Kaplan & Sacuzzo (2005) bahwa
penggunaan komputer juga memiliki kekurangan pada interpretasi yang berkaitan
dengan clinical judgement. Meskipun terkadang menghasilkan kecemasan
tersendiri dan tidak ada interaksi langsung, serta terkadang mampu memunculkan
keyboard phobia pada sebagian orang, penggunaan komputer dapat menghemat
banyak waktu, berpotensi meningkatkan test-retest reliability, mengurangi bias,
tidak perlu sulit untuk scan hasil karena data langsung masuk ke dalam sistem
komputer (meningkatkan akurasi skoring), dan juga mengurangi biaya sehingga

40
meningkatkan efisiensi (Butcher, Perry, & Atlis, 2000; Groth-Marnat, 1999;
Osterlind, 2010).
Cronbach di awal tahun 1970 (dalam Kaplan & Sacuzzo, 2005)
menyampaikan beberapa keuntungan sistem komputer, yaitu standarisasi yang
sangat baik, tahapan administrasi dirancang sedemikian rupa agar dapat dilakukan
sendiri oleh peserta tes, lebih ada kesabaran (peserta tes tidak terburu-buru dalam
mengerjakan tes), hasil respons tepat waktu karena langsung ter-input oleh
komputer, mempermudah tugas tester (tester bisa melaksanakan tugas lain), dan
lebih mengontrol bias. Hal ini dapat meminimalisir kesalahan yang terjadi pada
tes paper-and pencil atau administrasi tes secara manual pada hal standarisasi,
kontrol, dan eror saat skoring.
Beberapa bukti menunjukkan bahwa peserta tes lebih nyaman dan
menyukai interaksi dengan komputer dibandingkan dengan administrasi tes
paper-and-pencil atau manual, termasuk diantaranya tes manual yang kemudian
dirancang menjadi versi administrasi tes online (Rosenfeld, Doherty, Vicino,
Kantor, dkk., 1989; Buchanan & Smith, 1999; Cronk & West, 2002; dalam
Kaplan & Sacuzzon, 2005). Individu menjadi lebih nyaman dan terbuka (disclose)
dalam merespons aitem ketika berinteraksi dengan komputer (Davis, 1999; dalam
Kaplan & Sacuzzo, 2005), lebih jujur, dan tidak memunculkan efek social
desirability ketika dihadapkan pada situasi pelaksanaan tes tanpa prosedur yang
mengharuskan face-to-face (Kaplan & Sacuzzo, 2005). Penelitian Locke &
Gilbert pada tahun 1995 (dalam Kaplan & Sacuzzo, 2005) menunjukkan bahwa
peserta tes memberikan pengalaman positif dengan komputer. Kebanyakan

41
penelitian menunjukkan bahwa administrasi tes menggunakan komputer sama
reliabelnya dengan administrasi tes secara manual (Handel, Ben-Porath, & Matt,
1999; Schulenberg & Yutrzenka, 1999; dalam Kaplan & Sacuzzo, 2005; Groth-
Marnat, 1999).
Pengadministrasian tes sejak awal dibuat untuk diadministrasikan secara
manual, yang kemudian ditransformasi dan dibentuk dalam form digital yang
dapat diakses melalui komputer dan jaringan internet yang kemudian dikenal
dengan adminitrasi tes online. Administrasi tes online mungkin memberikan
keunggulan tersendiri, namun terlepas dari itu, pada awalnya setiap tes
diadministrasikan secara manual. Kemajuan teknologi mungkin mempermudah
dan meringankan kinerja individu, namun tetap tidak bisa menggantikan secara
penuh keutamaan yang bisa dilakukan individu itu sendiri. Administrasi tes online
memiliki keuntungan-keuntungan tersendiri, namun masih perlu banyaknya
pengujian agar memiliki cukup bukti untuk dikatakan sama baiknya dengan
administrasi tes secara manual yang merupakan merupakan setting-an asli yang
menjadi awal mula, dasar, dan acuan dalam hal pengadministrasian tes. Inilah
alasan mengapa administrasi tes manual dianggap menjadi kelompok acuan
(kelompok referensi) sedangkan administrasi tes online dianggap sebagai
kelompok yang menjadi fokus (kelompok fokal).
Seorang individu akan berbeda perilakunya ketika bertemu dengan
tuntutan setiap situasi (Anastasi & Urbina, 1997). Situasi yang berbeda dalam
pelaksanaan tes dengan perbedaan pengadministrasian akan berpengaruh pada
skor subjek. Perbedaan metode dalam memberikan tes (administrasi tes)

42
kemudian bisa menjadikan dua individu yang memiliki kepribadian yang sama,
akan memiliki kemungkinan lebih untuk mendapatkan hasil skor BFI yang
berbeda, padahal seharusnya dengan kepribadian yang sama, maka diasumsikan
skor mereka akan sama. Dengan melihat konsep DIF, maka akan terlihat apakah
aitem pada alat tes tersebut adil dan tidak memihak pada suatu kelompok tertentu
(Hortensius, L., 2012; Jodoin, M.G. & Gierl, J., 1999).
Big Five Inventory (BFI) dimasa ini juga sudah bisa diakses diinternet dan
dikerjakan dengan metode pelaksanaan secara online. Adanya perbedaan
administrasi tes pada BFI memberikan alasan untuk kemudian perlu dilakukan
pengecekkan karakteristik psikometrisnya. Hal ini juga berlaku pada BFI versi
Indonesia yang juga bisa dilaksanakan baik pada administrasi tes manual maupun
online, dimana kedua kelompok memiliki latent trait yang sama yaitu OCEAN.
Reliabilitas dan validitas konstraknya sudah diuji oleh Mariyanti dan
Rahmawati dalam proses pengadaptasiannya ke dalam bahasa Indonesia, sehingga
layak untuk dipergunakan demi alasan pengembangan alat ukur BFI. Namun,
berkaitan dengan adanya perbedaan administrasi tes, perlu ditinjau DIF
administrasi tes pada aitem BFI versi Indonesia. Dengan pengujian DIF
administrasi tes, akan teruji pula keadilan aitem pada alat tes BFI versi Indonesia
baik saat diadministrasikan secara manual maupun online. Dengan kata lain, akan
terlihat apakah BFI dengan administrasi tes online sama baiknya dengan
penyajian BFI dengan administrasi tes secara manual. Jika BFI ternyata
mengandung DIF pada konteks administrasi tes yang berbeda tersebut, maka
dapat dipastikan bahwa hal ini dapat berpengaruh pada skor tes. Kemungkinan ini

43
akan memunculkan kesalahan sistematik dan berpengaruh pada validitas karena
tidak dapat memberikan bukti-bukti untuk memperkuat validitasnya, sehingga
kualitasnya akan menurun dan penggunaannya juga masih sulit untuk diterapkan.
Hal ini akan menghambat terciptanya BFI versi Indonesia yang berkualitas dan
teruji karakteristik psikometrisnya.

Sejarah Big 5

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Sejarah Big 5

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB II

1. Sejarah Big Five

Kepribadian menurut Allport (dalam Schultz, 2005) didefinisikan sebagai

suatu organisasi dinamik dalam diri individu yang merupakan sistem

psychophysical yang menentukan karakteristik perilaku dan pikiran individu.

Dalam usaha mempelajari kepribadian manusia muncul pertanyaan mengenai

perbandingan antara individu yang satu dan lainnya. Misalnya: seseorang

dengan mengkategorisasikan individu kedalam kelompok tinggi, sedang atau

pembahasan. Mereka kemudian membuat kesepakatan bahwa kepribadian terdiri

Sejak kemunculan metode yang bernama analisis faktor, untuk

maka mulailah banyak konsep mengenai trait yang bermunculan, termasuk

Universitas Sumatera Utara

kepribadian bisa dikecilkan menjadi hanya 5 (lima) komponen. Kelima faktor

menemukan unit dasar dari kepribadian dengan menganalisis kata-kata yang

orang-orang biasa (tidak hanya psikolog) gunakan sehari-hari, untuk

mendeskripsikan kepribadian seseorang. Hasilnya kemudian diurutkan

2008; Pervin, 2005; Coaley, 2010).

tersebut terdiri dari Opennes, Conscientiousness, Extraversion, Agreeableness,

dan Neuroticism, yang biasa disebut OCEAN untuk mempermudah

penghafalannya (John dalam Pervin, 2005).

Universitas Sumatera Utara

& Costa, 2003; dalam Pervin, 2005; Coaley 2010).

kepribadian di berbagai negara, dan tetap menghasilkan gambaran 5 dimensi dasar

kepribadian. Fakta ini mendukung munculnya kesepakatan yang menyatakan

peningkatan publikasi penelitian-penelitian yang berkaitan dengan Big Five atau

L. P., & Soto, C. J., 2008).

2. Tipe Kepribadian Big Five

Berdasarkan penjelasan mengenai sejarah Big Five, maka dapat

psikologi untuk melihat kepribadian manusia dengan menggunakan konsep FFM,

Openness yang dimaksudkan adalah openness to experience, dimana trait

ini mengidentifikasikan kepribadian individu dari sudut pandang keaktifan dalam

mencari dan mengapresiasi pengalaman hidup, toleransinya terhadap hal-hal yang

Universitas Sumatera Utara

memiliki pemikiran yang konvensional, down-to-earth, ketertarikannya hanya

pada hal tertentu, tidak artistik, dan tidak analitis.

Trait ini mengidentifikasikan kepribadian individu dari sudut pandang

derajat kemampuan individu terhadap pengorganisasian, daya tahan dan motivasi

tidak teratur, mudah menyerah, dan suka bersenang-senang (hedonis).

Trait ini mengidentifikasikan kepribadian individu dari segi kuantitas dan

intensitas interaksi interpersonal, level aktivitas, kebutuhan untuk menstimulasi,

yang bersosial, aktif, talkative, people-oriented, optimis, fun-loving, dan penuh

kasih. Sedangkan orang dengan skor rendah cenderung pendiam, task-oriented,

penyendiri, pasif, dan kurang mengekspresikan perasaannya.

Universitas Sumatera Utara

Trait ini mengidentifikasikan kepribadian individu dari segi kualitas

pikiran, perasaan, dan tindakan, terhadap orientasi interpersonal dalam kontinum

(rentang) compassion hingga antagonism. Orang dengan skor tinggi berhati

terang-terangan/blak-blakan. Sedangkan orang dengan skor rendah lebih kasar,

curiga, sinis, kurang kooperatif, memiliki lebih mungkin dalam menyimpan

dendam, menyebalkan dan terkesan kejam, mementingkan kepentingan sendiri,

Trait ini mengidentifikasi kepribadian individu pada sudut pandang

Universitas Sumatera Utara

Tabel 1. Sub Faktor pada trait dalam model Big Five

3. Big five Inventory (BFI)

(laten kepribadian) meski diterapkan di Indonesia (Widhiarso, 2004).

Universitas Sumatera Utara

John, Donahue, dan Kentle menyadari akan kebutuhan suatu instrumen

yang efisien, fleksibel, dan berlaku universal, dalam kepentingannya untuk

mengukur kepribadian individu dengan menggunakan konsep big five. Kemudian,

Srivastava, 1999) mengatakan, skala pendek tidak hanya menghemat waktu

Soto, C. J., 2008).

Banyak penelitian yang bertujuan untuk mengembangkan Big Five

Inventory (BFI) ini, termasuk di Indonesia, di mana salah satunya adalah