Anda di halaman 1dari 21

Tugas I Psikodiagnostik

Bias in Psychological Assessment: An Empirical Review and


Recommendation

Kelompok 4 Kelas B :
Nindya Fadillah S (151301034)
Kiki Amelia (151301036)
Rizki Ananda Irawan(151301038)
Wirda Verawati (151301040)
Hanifa Alia (151301044)

FAKULTAS PSIKOLOGI
UNIVERSITAS SUMATERA UTARA
KEBERATAN MINORITAS ATAS TES DAN PENGUJIAN
Sejak tahun 1968, Association of Black Psychologists (ABP) telah menyerukan
moratorium administrasi tes psikologi dan pendidikan dengan peserta ujian minoritas
(Samuda, 1975; Williams, Dotson, Dow, & Williams, 1980). The ABP membawa
panggilan ini untuk asosiasi profesional lain dalam psikologi dan pendidikan. American
Psychological Association (APA) menanggapi dengan meminta bahwa Dewan Urusan
Ilmiah membentuk komite untuk mempelajari penggunaan tes ini dengan siswa yang
kurang beruntung (lihat laporan komite, Cleary, Humphreys, Kendrick, & Wesman,
1975).
Asosiasi profesional lainnya mengeluarkan pernyataan kebijakan pada
pengujian. Williams et al. (1980) dan Reynolds, Lowe, dan Saenz (1999) mengutip
Asosiasi Nasional untuk Kemajuan Orang Kulit Berwarna (NAACP), Asosiasi
Pendidikan Nasional, National Association of Kepala Sekolah Dasar, dan Amerika
Personalia dan Bimbingan Association, antara lain , sebagai organisasi merilis laporan
tersebut. The ABP, mungkin dimotivasi oleh tindakan dan dorongan pada bagian dari
NAACP, mengadopsi sebuah resolusi yang lebih rinci pada tahun 1974.
ASAL USUL UJI BIAS KONTROVERSI
Nilai sosial dan Keyakinan
Kini konflik bias dalam tes standar dimotivasi terutama oleh kekhawatiran publik.
dorongan, dapat dikatakan, terletak dengan keyakinan fundamental bagi demokrasi di
Amerika Serikat. Kebanyakan orang Amerika, setidaknya orang-orang dari etnis
mayoritas, melihat Amerika Serikat sebagai tanah kesempatan-semakin, kesempatan
yang sama yang diperpanjang untuk setiap orang. Kami ingin percaya bahwa setiap
anak dapat tumbuh menjadi presiden. Bersamaan, kami percaya bahwa semua orang
diciptakan sama, bahwa semua orang pelabuhan potensi untuk sukses dan prestasi.
kesetaraan ini kesempatan tampaknya paling masuk akal jika semua orang sama-sama
bisa mengambil keuntungan dari itu. Orang tua dan profesional pendidikan memiliki
keyakinan yang sesuai: Anak-anak kami melayani memiliki potensi besar untuk sukses
dan prestasi; upaya besar kita curahkan untuk mengajar atau membesarkan anak-anak
adalah upaya dihabiskan; anak saya sendiri adalah cerdas dan mampu.
Karakter Tes dan Pengujian
Sifat karakteristik psikologis dan pengukuran mereka ikut bertanggung jawab
atas keprihatinan lama lebih dari tes Bias (Reynolds & Brown, 1984a). karakteristik
psikologis internal, sehingga para ilmuwan tidak dapat mengamati atau mengukur
langsung tetapi harus menyimpulkan mereka dari perilaku eksternal seseorang. Dengan
ekstensi, dokter harus bersaing dengan keterbatasan yang sama. Menurut
MacCorquodale dan Meehl (1948), proses psikologis merupakan variabel intervensi jika
diperlakukan hanya sebagai komponen dari suatu sistem dan tidak memiliki sifat luar
orang-orang yang secara operasional mendefinisikan itu. Dalam biologi, gen adalah
contoh dari sebuah konstruksi hipotetis. Gen memiliki sifat luar penggunaannya untuk
menggambarkan transmisi sifat-sifat dari satu generasi ke generasi berikutnya.
Kecerdasan dan kepribadian memiliki status konstruksi hipotetis. Sifat proses psikologis
dan konstruksi hipotetis tak terlihat lainnya sering subyek perdebatan terus-menerus
(lihat Ramsay, 1998b, untuk satu pendekatan). Intelijen, proses psikologis yang sangat
kompleks, telah menimbulkan perselisihan yang terutama sulit untuk menyelesaikan
(Reynolds, Willson, et al., 1999). Prosedur pengembangan tes (Ramsay & Reynolds,
2000a) pada dasarnya sama untuk semua tes standar. Awalnya, penulis tes
mengembangkan atau mengumpulkan kolam besar item berpikir untuk mengukur
karakteristik bunga. Teori dan kegunaan praktis standar yang biasa digunakan untuk
memilih kolam renang barang. Proses seleksi yang rasional.
Artinya, itu tergantung pada alasan dan pertimbangan; sarana ketat
melaksanakannya sama sekali tidak ada. Pada tahap ini, maka, tes penulis telah diterima
tidak umum bukti bahwa mereka telah memilih item yang sesuai.

Langkah kedua yang umum adalah untuk membuang barang-barang berkualitas


tersangka, lagi dengan alasan yang rasional, untuk mengurangi kolam renang untuk
ukuran dikelola. Selanjutnya, penulis tes atau penerbit mengelola item untuk kelompok
ujian disebut sampel tryout. prosedur statistik kemudian membantu untuk
mengidentifikasi item yang tampaknya akan mengukur karakteristik yang tidak
diinginkan atau lebih dari satu karakteristik. Penulis atau penerbit membuang atau
memodifikasi item ini.
Akhirnya, pemeriksa mengelola item yang tersisa untuk kelompok besar,
beragam orang disebut sampel standardisasi atau sampel norma. Sampel ini harus
mencerminkan setiap karakteristik penting dari populasi yang akan mengambil versi fi
nal dari test.Statisticians menyusun sejumlah sampel norming ke dalam sebuah array
disebut distribusi norma.
Akhirnya, klien atau peserta ujian lainnya mengikuti tes dalam bentuk fi nal nya.
Skor yang mereka peroleh, dikenal sebagai skor mentah, belum memiliki
meaning.Aclinician diinterpretasi membandingkan skor tersebut dengan norming
perbandingan distribution.The adalah proses matematika yang menghasilkan baru, nilai
standar untuk ujian. Dokter dapat menafsirkan skor tersebut, sedangkan interpretasi
aslinya, skor mentah akan sulit dan tidak praktis (Reynolds, Lowe, dkk., 1999).
Divergent Ideas of Bias (Ide-ide yang berbeda bias)
Selain karakter proses psikologis dan pengukuran mereka, berbeda pemahaman
yang diselenggarakan oleh berbagai segmen penduduk juga menambah kontroversi tes
Bias. Peneliti dan orang awam melihat bias yang berbeda. Dokter dan profesional
lainnya membawa pandangan berbeda tambahan. Banyak pengacara melihat Bias
sebagai ilegal, praktik diskriminatif pada bagian dari organisasi atau individu
(Reynolds, 2000a; Reynolds & Brown, 1984a).
Untuk masyarakat luas, Bias kadang-kadang memunculkan gagasan dari sikap
merugikan. Seseorang dilihat sebagai berprasangka dapat mengatakan, "Kau bias
terhadap Hispanik." Untuk orang awam lainnya, bias lebih umum miring karakteristik
dalam pemikiran orang lain, kurangnya objektivitas yang ditimbulkan oleh keadaan
hidup seseorang. Petugas penjualan mungkin mengatakan, "Saya pikir pegawai
penjualan harus lebih baik dibayar." "Ya, tapi kau bias," pendengar dapat membalas.
Pandangan ini berbeda dari statistik dan penelitian definisi bias untuk istilah lain, seperti
yang signifikan, asosiasi, dan membingungkan. Penelitian definisi bias yang sangat
spesifik, istilah tersebut tidak terbiasa untuk hampir semua orang. Akibatnya, pembaca
belum tahu dan sering salah menafsirkan laporan penelitian.
EFEK DAN IMPLIKASI DARI UJI BIAS KONTROVERSI
Sengketa tes bias telah memberikan dorongan ke korpus semakin canggih
penelitian. Dalam kebanyakan tempat, tes kualitas statistik cukup tinggi tampaknya
sebagian besar berisi. Untuk tes neuropsikologi, hasilnya baru dan masih jarang, tapi
sejauh ini mereka muncul untuk menunjukkan sedikit Bias. Kedua sisi perdebatan telah
mengabaikan sebagian besar temuan ini dan telah menekankan, sebaliknya, perbedaan
berarti antara kelompok etnis (Reynolds, 2000b).
Selain itu, penerbit telah merilis langkah-langkah baru seperti "budaya bebas" tes
nonverbal dan "budaya adil" atau; praktisi menafsirkan skor sehingga dapat diduga
meminimalkan pengaruh bias; dan, akhirnya, penerbit merevisi tes langsung, untuk
menghapus perbedaan kelompok. Untuk anggota kelompok minoritas, revisi ini
mungkin memiliki efek jangka panjang yang tidak diinginkan: mencegah studi dan
dengan demikian remediasi bias yang mungkin akan ditemukan.
Implikasi dari berbagai efek berbeda tergantung pada apakah penjelasan bias
benar atau salah, dengan asumsi itu diterima. Penjelasan Bias salah, jika diterima, akan
menyebabkan perubahan yang tidak akan kembali. Informasi penting mencerminkan,
benar dan apalagi akan menyajikan informasi yang tidak benar bahwa kelompok-
kelompok orang yang tidak melakukan telah dilakukan sama. Peneliti, tidak menyadari
atau lengah dari ketidaksetaraan tersebut, akan mengabaikan penelitian penyebabnya.
kesulitan ekonomi dan sosial akan datang ke tampak kurang berbahaya dan karena itu
lebih membenarkan fi mampu. program sosial, tidak lagi dilihat sebagai diperlukan
untuk meningkatkan tingkat minoritas pelajar, mungkin dihentikan, dengan konsekuensi
serius.
Penjelasan Bias benar, jika diterima, akan meninggalkan profesional dan anggota
kelompok minoritas dalam posisi yang relatif lebih baik. Kita akan memiliki penelitian
berlebihan benar menunjukkan bahwa bias hadir di nilai tes standar. Anehnya,
bagaimanapun, keterbatasan memiliki data ini mungkin lebih besar daripada manfaat.
Uji Bias akan menjadi kesimpulan yang benar mencapai salah.
Temuan bias mengandalkan terutama pada perbedaan rata-rata antara kelompok-
kelompok. Perbedaan-perbedaan ini akan terdiri sebagian bias dan sebagian konstituen
lainnya, yang akan proyek mereka ke atas atau ke bawah, mungkin tergantung pada
kelompok-kelompok tertentu yang terlibat. Dengan demikian, kita akan akurat dalam
menyimpulkan bias yang hadir tapi tidak akurat mengenai jumlah bias dan, mungkin,
arahnya: yaitu, mana dari kedua kelompok itu disukai. Setiap kation modi fi dibuat akan
melakukan terlalu sedikit, atau terlalu banyak, menciptakan bias yang baru dalam arah
yang berlawanan.
Kehadiran bias harus memungkinkan untuk penjelasan tambahan. Misalnya, bias
dan efek Steelean (Steele & Aronson, 1995), di mana takut mengonfirmasi stereotip
menghambat kinerja minoritas ', mungkin baik mempengaruhi hasil tes. kemungkinan
tambahan tersebut, yang kini menerima sedikit perhatian, akan menerima bahkan
kurang. Deprivasi ekonomi dan sosial, masalah serius selain masalah pengujian, akan
kembali tampil kurang berbahaya dan karena itu lebih membenarkan fi mampu. Upaya
untuk meningkatkan nilai masyarakat melalui program-program sosial akan sulit untuk
dipertahankan, karena pekerjaan ini mengandaikan bahwa faktor-faktor selain Bias tes
adalah penyebab perbedaan skor. Dengan demikian, kepercayaan Amerika 'di potensi
manusia akan dibenarkan, tapi mungkin dengan biaya yang cukup besar untuk individu
minoritas.
POSSIBLE SOURCE OF BIAS
Reynolds, Lowe et al. (1999) telah membagi masalah kedalam 7 kategori, yaitu :
1. Inappropriate content : tes dibuat dari pengalaman yang paling banyak dari
mayoritas. Respon / konten yang benar dibuat berdasarkan respon mayoritas
tersebut dan menjadi tidak familiar kepada minoritas.
2. Inappropriate standardization samples. Representase minoritas di sampel
normal cukup proposional tetapi tidak cukup untuk berpengaruh dalam
pengembangan tes.
3. Examiners’ and language bias. Penguji berkulit putih yang berbahasa inggris
mengintimidasi peserta berkulit hitam dan bahkan menurunkan hasil tes
mereka.
4. Inequitable social consequences. Orang yang berasal dari etnis minoritas tidak
dirugikan dari awal karena streotipe dan diskriminasi dari masa sebelumnya,
efek labeling juga salah satu contoh dari tipe ini.
5. Measurement of different construct. Tes yang dibuat dari budaya yang paling
besar mengukur karakteristik berbeda bersama orang yang minoritas.
6. Differential predictive validity. Tes yang standar dapat memprediksi secara
akurat orang dari grup mayoritas tetapi tidak dengan minoritas.
7. Qualitatively distinct aptitude and personality. Etnis miyoritas dan minoritas
harus dibuat dalam tipe berbeda. Jadi pengembanagn tes harus dibuat
berdasarkan definisi berbeda untuk grup miyoritas dan minoritas.

WHAT TEST BIAS IS AND IS NOT


Bias and Unfairness
Konsep dari tes bias dan ketidakadilan sebenarnya berbeda. Tes mungkin
memiliki sedikit bias tetapi orang klinik terkadang menggunakan itu secara tidak adil
kepada tester minoritas. Jensen (1980) adalah orang yang pertama mempermasalahkan
bahwa keadilan dan bias adalah konsep yang harus dipisahkan. Sebagaimana dicatat
oleh Brown et al. (1999), keadilan adalah masalah moral, filosofis, atau hukum yang
wajar orang bisa tidak setuju. Sebaliknya, bias itu seperti menggunakan tes dengan dua
atau lebih kelompok tertentu. Dengan demikian, Bias dapat diperkirakan melalui
statistic atau kuantitas dan bukan prinsip yang ditetapkan melalui perdebatan dan
pendapat.

Bias and Offensiveness


Perbedaan kedua adalah bahwa antara Bias tes dan item offensiveness.. Dalam
pengembangan nya , review dari orang minoritas untuk melihat item-item yang
mungkin dapat membuat satu atau lebih kelompok yang tersinggung.
Bagi peneliti, Bias tes adalah penyimpangan dari level performa si penguji. Bias
berjalan dengan banyak nama dan memiliki banyak karakteristik, tetapi selalu
melibatkan skor yang terlalu rendah atau terlalu tinggi untuk secara akurat mewakili
atau memprediksi skill dr si penguji, kemampuan, atau sifat-sifat. Untuk menunjukkan
Bias, dibutuhkan juga perkiraan skor.
Penguji tidak memiliki cara untuk memperkirakan bias tersebut. Tetapi
merekadapat menyarankan item mana yang mungkin menyinggung, tapi teknik statistic
diperlukan untuk menentukan bias tes
Culture Fairness, Culture Loading, and Culture Bias
Ada tiga konsep yang berbeda, yaitu culture loading dan culture Bias, sering
dikaitkan dengan konsep culture fairness. Cultural loading adalah sejauh mana tes atau
item khusus untuk suatu budaya tertentu. Sebuah tes dengan culture loading yang baik
memiliki potensi bias lebih besar bila diberikan kepada orang-orang dari beragam
budaya. Walaupun demikian, sebuah tes pemuatan budaya bias tanpa bias budaya.
Reynolds, Lowe, et al. (1999) mengamati, jika tes dikembangkan dalam sebuah budaya,
diberikan ke budaya lain akan menjadi masalah untuk verifikasi ilmiahnya. Skor tes
mungkin tidak memberikan interpretasi yang sama untuk budaya yang berbeda tanpa
bukti bahwa mereka interpretasi akan suara.
Test Bias and Social Issues
Penulis telah memperkenalkan berbagai kekhawatiran mengenai tes diberikan
kepada etnis minoritas (Brown et al., 1999). kekhawatiran lain, Para pendukung tes
berpendapat, gagal untuk menawarkan solusi atas perbedaan ras atau etnis (Scarr, 1981),
untuk menghadapi kekhawatiran masyarakat atas ras diskriminasi ketika menangani
bias tes (Gould, 1995, 1996), untuk menghormati penelitian ahli bahasa budaya dan ahli
antropologi (Figueroa, 1991; Helms, 1992), untuk mengatasi khusus yang tidak
memadai program pendidikan (Reschly, 1997), dan untuk memadai jumlah Afrika
Amerika dalam norming sample (Dent, 1996).

PERTANYAAN TERKAIT
Uji bias dan etiologi
etiologi kondisi berbeda dari pertanyaan tes Bias (review, Reynolds & Kaiser,
1992). pada kenyataannya, kebutuhan untuk etiologi penelitian muncul hanya setelah
bukti bahwa perbedaan skor adalah salah satu yang nyata, bukan sebuah artefak bias.
penulis menyimpulkan bahwa skor perbedaan sendiri menunjukkan perbedaan genetik,
menyiratkan bahwa satu atau lebih kelompok secara genetik rendah. inferensi ini secara
ilmiah tidak lebih untuk dipertahankan dan etchically jauh lebih sedikit daripada
gagasan bahwa mencetak perbedaan menunjukkan tes Bias.
Jensen (1969) berpendapat bahwa tes mental ukuran, sampai batas tertentu, faktor
g intelektual, ditemukan dalam studi genetika perilaku memiliki komponen genetik
yang besar.
Bias tes yang melibatkan kelompok dan individu
  Bias dapat mempengaruhi nilai individu, serta kelompok-kelompok, dan
kepribadian dan kemampuan tes. Oleh karena itu, para peneliti dapat dan harus
menyelidiki kedua ini sumber bias. sebuah metode statistik menyeluruh disebut model
linear umum premist pendekatan dengan memungkinkan kedua kelompok dan individu
untuk dianalisis sebagai variabel independen. di samping itu, hal karakteristik, motivasi,
dan Variabel nonintelletual lainnya (Reynolds, Lowe, et, al., 1999). Sternberg, 1980,
Wechsler, 1975). mengakui analisis meskipun pengodean ulang, kategorisasi, dan
expedients serupa.

MENJELASKAN PERBEDAAN KELOMPOK


Antara penelitian, isu bias budaya berasal sebagian besar dari temuan
terdokumentasi dengan baik, sekarang terlihat di lebih dari 100 tahun penelitian, bahwa
anggota kelompok etnis yang berbeda memiliki tingkat perbedaan dan pola kinerja pada
banyak menonjol tes kemampuan kognitif. kecerdasan telah menghasilkan beberapa
yang paling berpengaruh dan provokatif dari temuan ini (Elliot, 1987; Gutkin &
Reynold, 1991; Reynolds, Chastain, Kaufirman & Mc.Lean, 1987; Spitz, 1986). negara
di seluruh dunia, orang-orang yang berbeda etnis dan ras kelompok, jenis kelamin,
tingkat sosial ekonomi, dan demografi lainnya kelompok mendapatkan hasil tes
intelektual sistematis yang berbeda. Perbedaan IQ hitam-putih di Amerika Serikat telah
mengalami penyelidikan ekstensif selama lebih dari 50 tahun. Jensen (1980), Shuey
(1966), Tyler (1965), dan Willerman (1979) telah meninjau sebagian besar penelitian
ini. Temuan kadang-kadang agak berbeda dari satu kelompok usia yang lain, namun
mereka tidak berubah secara substansial dalam abad terakhir.
rata-rata, Blacks berbeda dari Whites sekitar 1,0 standar deviasi, dengan
kelompok-kelompok Putih memperoleh lebih tinggi skor. Perbedaan telah relatif
konsisten dalam ukuran untuk beberapa waktu dan di bawah beberapa metode
penyelidikan. Sebuah pengecualian adalah pengurangan Hitam-Putih IQ selisih bagian
intelijen dari K-ABC sekitar 0,5 standar penyimpangan, meskipun hasil ini
kontroversial dan buruk dipahami (lihat Kamphaus & Reynolds, 1987, untuk diskusi).
Selain itu, temuan tersebut konsisten hanya untuk Afrika Amerika. Lainnya, yang
sangat beragam temuan muncul untuk Afrika asli dan lainnya Hitam populasi (Jensen,
1980). Para peneliti telah diperhitungkan sejumlah demografi variabel, status sosial
ekonomi terutama (SES). Ukuran mean perbedaan Hitam-Putih di Amerika Negara
kemudian berkurang ke 0,5-0,7 standar deviasi (Jensen, 1980; Kaufman, 1973;
Kaufman & Kaufman, 1973; Reynolds & Gutkin, 1981)
Tetapi kuat dalam penampilan. kelompok Asia, meskipun kurang diteliti secara
menyeluruh dari kelompok hitam, telah secara konsisten dilakukan serta atau lebih baik
dari Whites (Pintner 1931; Tyler, 1965; Willerman, 1979). Asia Amerika memperoleh
rata skor kemampuan rata-rata (Flynn, 1991; Lynn, 1995;. Neisser et al, 1996;
Reynolds, Willson, & Ramsay, 1999).
Pencocokan merupakan pertimbangan penting dalam studi etnis perbedaan.
Perbedaan antara kelompok mungkin karena tidak untuk menguji Bias ataupun etnis
tetapi untuk SES, gizi, dan variabel lain yang mungkin terkait dengan hasil tes.
Pencocokan pada variabel-variabel ini kontrol untuk asosiasi mereka.
Keterbatasan pencocokan adalah bahwa hasil dalam regresi terhadap
mean. responden hitam dengan harga diri yang tinggi, untuk Misalnya, dapat dipilih dari
populasi dengan harga diri yang rendah. Ketika diperiksa kemudian, responden ini akan
menguji dengan rendah diri, setelah mundur ke mean lebih rendah populasi mereka
sendiri. skor tinggi ekstrim mereka dalam hal ini Kasus-yang karena kebetulan. Dokter
dan konsumen penelitian juga harus menyadari bahwa kesamaan antara kelompok etnis
yang jauh lebih besar daripada perbedaan. Prinsip ini berlaku untuk kecerdasan,
kepribadian, dan yang paling karakteristik lainnya, baik psikologis dan fisiologis. Dari
perspektif lain, variasi antara anggota dari salah satu kelompok etnis sangat melebihi
perbedaan antara kelompok. Kesamaan besar antara kelompok muncul berulang kali
dalam analisis statistik sebagai besar, statistic konstanta signifikan dan tumpang tindih
yang besar antara yang berbeda rentang kelompok 'skor.
Beberapa penulis (misalnya, Schoenfeld, 1974) telah membantah apakah perbedaan ras
dalam kecerdasan adalah nyata atau bahkan bisa diteliti. Namun demikian, temuan yang
sangat handal dari studi untuk belajar, bahkan ketika peserta studi mengidentifikasi
mereka sendiri ras. Dengan demikian, adanya perbedaan tersebut telah memperoleh
lebar penerimaan. Perbedaan yang nyata dan tidak diragukan lagi kompleks. Tugas yang
tersisa untuk menggambarkan mereka secara menyeluruh (Reynolds, Lowe, et al., 1999)
dan, lebih sulit, untuk menjelaskan mereka dalam arti kausal (Ramsay, 1998a, 2000).
Kedua rendah
Skor dari beberapa kelompok dan skor yang lebih tinggi dari orang lain harus
menjelaskan, dan belum tentu dengan cara yang sama.
Seiring waktu, eksklusif penjelasan genetik dan lingkungan telah kehilangan
begitu banyak kredibilitas mereka bahwa mereka bisa nyaris tidak bisa disebut saat ini.
Sebagian peneliti yang mengandaikan bahwa mencetak perbedaan nyata sekarang
mendukung perspektif interaksionis. Perkembangan ini mencerminkan pergeseran
serupa dalam psikologi
dan ilmu sosial secara keseluruhan. Namun, ini relatif baru masker konsensus kegigihan
halus asumsi sebelumnya bahwa perbedaan skor tes harus memiliki sebuah genetik atau
secara lingkungan. Kontribusi relatif gen dan lingkungan masih memprovokasi
perdebatan, dengan beberapa penulis tampaknya bertekad membangun didominasi
genetik atau dasar didominasi lingkungan. Perspektif interaksionis menggeser fokus
perdebatan dari berapa banyak bagaimana genetik dan faktor lingkungan berkontribusi
karakteristik. Dalam prakteknya, tidak semua ilmuwan telah membuat pergeseran ini.

UJI BIAS BUDAYA SEBAGAI PENJELASAN


Bias penjelasan perbedaan skor telah menyebabkan budaya Uji Bias hipotesis
(CTBH;. Brown et al, 1999; Reynolds, 1982a, 1982b; Reynolds & Brown, 1984b).
Menurut CTBH, perbedaan kinerja rata-rata untuk anggota yang berbeda kelompok
etnis tidak mencerminkan perbedaan nyata antara kelompok tetapi artefak dari tes atau
dari proses pengukuran. Pendekatan ini menyatakan bahwa tes kemampuan
mengandung kesalahan sistematik terjadi sebagai fungsi keanggotaan kelompok atau
nominal lainnya variabel yang harus relevan. Artinya, orang-orang yang harus
memperoleh skor yang sama mendapatkan yang tidak sama karena etnis mereka, jenis
kelamin, tingkat sosial ekonomi, dan sejenisnya. Untuk SES, Eells, Davis, Havighurst,
Herrick, dan Tyler (1951) merangkum logika CTBH sebagai berikut: Jika
(a) anak dari tingkat SES yang berbeda memiliki pengalaman yang berbeda jenis dan
dengan berbagai jenis bahan, dan jika (b) kecerdasan tes berisi jumlah yang tidak
proporsional dari bahan diambil dari pengalaman budaya yang paling akrab bagi high-
SES anak-anak, maka (c) tinggi SES-anak harus memiliki IQ yang lebih tinggi skor dari
anak rendah SES. Sebagai Eells et al. diamati, argumen ini cenderung menyiratkan
bahwa perbedaan IQ adalah artefak yang bergantung pada konten Item dan "tidak
mencerminkan secara akurat apa Kemampuan penting yang mendasari "(hal. 4) dalam
individu. Sejak tahun 1960-an, penjelasan CTBH telah merangsang banyak penelitian,
yang pada gilirannya sebagian besar telah membantah penjelasan. ulasan panjang
sekarang tersedia (misalnya, Jensen, 1980; Reynolds, 1995, 1998a; Reynolds & Brown,
1984b). Literatur ini menunjukkan bahwa tes yang perkembangannya, standardisasi, dan
keandalan adalah suara dan didokumentasikan tidak bias terhadap kelahiran asli, ras
Amerika atau etnis minoritas. Studi kadang-kadang menunjukkan bias tetapi biasanya
kecil, dan paling sering nikmat minoritas.

KESIMPULAN HARRINGTON
Harrington (1968a, 1968b), tidak seperti penulis seperti Mercer (1979) dan Helms
(1992), menekankan proporsional tapi sejumlah kecil peserta ujian minoritas dalam
sampel norma. Peneliti ( Harrington, 1975, 1976) menggunakan enam strain genetika
berbeda dari tikus untuk mewakili etnis. Dia kemudian terdiri enam populasi, masing-
masing dengan proporsi yang berbeda dari enam strain tikus. Berikutnya, Harrington
dibangun enam teks kecerdasan menyerupai Hebb - Williams labirin. labirin ini, mirip
dengan Mazes subtes dari skala Wechsler, biasanya digunakan sebagai tes kecerdasan
untuk tikus. Harrington beralasan bahwa tes bernorma pada populasi didominasi oleh
strain tikus yang diberikan akan menghasilkan rata-rata lebih tinggi skor untuk strain
yang. karya Harrington( 1975, 1976) dikurangi skor untuk ujian minoritas, sebuah jalan
penting dari penyelidikan. Artifactually skor rendah pada tes kecerdasan dapat
menyebabkan tindakan diskriminasi ras, seperti misassignment untuk program
pendidikan atau penolakan palsu kerja. Masalah ini adalah salah satu dari yang paling
kasus pengadilan yang melibatkan uji Bias telah diperebutkan ( Reynolds , Lowe , et al .
, 1999).
PERBEDAAN MEAN DENGAN UJI BIAS
Menurut para peneliti, perbedaan kelompok dalam skor rata-rata pada tes
kemampuan merupakan bias. Mereka berpendapat bahwa tes tidak ada yang valid,
alasannya bahwa kemampuan berbeda antar satu etnis dengan etnis lain. Sebagaimana
dicatat oleh Reynolds, lowe, et al (1999) penerimaan posisi baik tidak dapat dipandang
dari sudut ilmiah.
Kekeliruan Egaliter
Jensen (1980, Brown, et al 1999) bahwa ada tiga asumsi yang menghambat studi,
yaitu:
a) The Egalitarian Fallacy, yakni semua kelompok yang sama dalam karakteristik
diukur dengan tes sehingga perbedaan skor harus berasal dari bias.
b) The Culture-bound Fallacy, yakni pengulas dapat menilai peminatan budaya
melalui inspeksi atau penilaian.
c) Standarization Fallacy, yakni tes selalu bias jika di gunakan dengan kelompok
yang tidak termasuk dalam jumlah besar dalam sample normal.

Sebagai asumsi yang berlawanan pada setiap kelompok. Penelitian telah


menunjukkan perbedaan kelompok untuk banyak kemampuan dan bahkan untuk
kapasitas sensorik (Reynold, Wilson, et al 1999) kesamaan dan ketidaksetaraan
harus ditemukan secara empiris, melalui pengamatan ilmiah Torrance(1980)
mengamati bahwa anak berkulit hitam yang kurang di Amerika mendapat skor
kreatifitas tinggi dari anak berkulit putih, tingkat kemampuan itu baik sama atau
tidak itu dianggap sebagai keliru, karena asumsi kemampuan yang sama adalah
yang paling toleran. Asumsi egaliter menyiratkan bahwa kreativitas yang tinggi
dari anak-anak berkulit hitam adalah sebuah artefak dari tes. Asumsi
kemampuan yang sama adalah yang paling relevan. Para ilmuan tidak pernah
menganggap hipotesa nol sebagai bukti, Kemungkinan membuktikan hipotesa
nol bisa jadi relevan disini. Bias itu hanya menunjukkan bahwa hanya dua
kelompok berbeda ketika sarana/sampel yang diambil untuk mewakili kinerja
mereka.
Pembatasan Perbedaan Rata-rata
Menunjukkan bahwa kedua kelompok berbeda ketika sarana yang
diambil untuk mewakili knerja mereka juga berbeda dan seberapa baik skor
tipical analisis menunjukkan bahwa kedua kelompok berbeda dalam vaeriasi
skor. Sikap tambahan diperlukan untuk memahami setiap nilai kelompok, skor
akan simetris jika skor tinggi lancip secara bertahan,tapi skor rendah akan
mengumpul. Sebuah tes dengan sampel besar dapat menghasilkan skor simetris.
Bahkan sampel yang besar dapat menghasilkan skor simetris. Bahkan sampel
yang besar dapat mencakup sampel yang sangat kecil dalam kelompok, hal itu
yang menjadi perbedaan rata-rata untuk sampel itu sendiri.

HASIL DARI PENELITIAN BIAS

Jensen review
Jensen (1980) salah satu perhatian di bahas dalam review adalah
penelitian rasional yang item tes bias berdasarkan konten mereka. Menurut para
ilmuan, penilain rasional adalah yang didasarkan pada alasan daripada temuan
empiris, seperti dalam penelitian anak berkulit hitam dengan anak berkulit putih
CTBH pendukung mengkritik item ini sebagai bias terhadap anak anak berkulit
hitam.
Miele (1979) juga berpendapat bahwa bias mengarah pada anak berkulit
hitam dari pada anak berkulit putih. Hasil penilaian sering tidak empiris secara
rasional.

Prediktif dan Validitas Konstruktif

Jensen (1980) Sistematik kesalahan dalam memprediksi kesalahan dalam


memorediksi variable merupakan ciri-ciri dari orang di berbagai kelompok yang
berbeda. Bias ini terjadi ketika salah satu persamaan regresi tidak benar digunakan
untuk dua atau lebih pada kelompok. Kesimpulan yang di capai oleh Jensen :
a) Sebagian besar peneliti menunjukkan bahwa tes sama-sama berlaku untuk
kelompok-kelompok ini dan
b) Perbedaan prediksi yang berlebihan antara peserta ujian kulit hitam dengan
peserta ujian kulit putih

Bias Situasional

Jensen (1980) mengacu pada pengaruh dalam situasi, tetapi independen


dari tes itu sendiri yang menilai tes dalam bias. Jensen menyimpulkan bahwa
variable situasional ulasan tiidak mempengaruhi perbedaan kelompok dalam
skor. Psychological Association, menyimpulkan tidak ada karakteristik tes
membuat kontribusi besar bagi kulit hitam berdasarkan skor kecerdasan.

Review oleh Reynolds, Lowe dan Saenz

Validitas Isi
Konten validitas adalah sejauh mana isi tes merupakan sampel yang
representatifdari perilaku yang akan diukur (Anastasi, 1988). Item dengan Bias
konten harus berprilaku berbeda dari satu kelompok ke kelompok untuk orang
yang berdiri sama pada karakteristik yang sedang diukur. Isi validitas dengan tes
prestasi yang kompleks.
Isu validitas isi dengan tes prestasi yang kompleks. Variabel penting
untuk di pertimbangkan termasuk paparan instruksi, kemampuan umum dari
kelompok dan akurasi serta spesifitas item untuk sampel. (Reynols, lowe, et al.
1999, Schmidt, 1983) Penelitian kecil yang tersedia untuk test kepribadian, tapi
variable budaya yang dapat ditemukan untuk mempengaruhi suatu tes.
Personality termasuk keyakinan tentang disiplin dan agresi, nilai-nilai yang
berkaitan dengan pendidikan dan pekerjaan dan persepsi tentang keadilan
masyarakat terhadap kelompok seseorang.
Bias dapat menyebabkan temuan melalui penelitian dengan
pertimbangan konstruk di ukur. Para peneliti menyimpulkan bahwa ada sedikit
bukti jelas dari ras atau bias gender.

Path Modeling dan Bias Prediktif


Keith dan Reynolds telah menyarankan path analysis sebagai cara menilai
prediktif bias. Gambar dibawah menunjukkan jalurnya, masing-masing poin
menunjukkan sebuah variabel.

Intelligent Test
Score

True
Anggota Ability
Kelompok

Achievement Test
score

Achievement Test
score

Anggota
Kelompok

School
Achievment
Jalur dari anggota kelompok ke skor tes intelegensi menunjukkan bias. Nilai beta
harus kecil. Tidak adanya jalur akan menunjukkan bias nol. Keterbatasan da;am
pendekatan ini adalah bahwa tidak adanya kemampuan untuk mengukur. Oleh karena
itu, sebuah model jalur tidak dapat menggabungkan kemampuan yang benar kecuali jika
diukur dengan tiga atau lebih variabel yang telah ada. Gambar kedua diatas menunjukan
tujuan dari model ini yang membuang keterbatasan. Disini terdapat kemampuan yang
benar, dan jalur mengarah dari prediksi, Nilai skor yang didapat, sampai dengan kriteria,
dan pencapaian di sekolah. Jalur dari anggota kelompok menunjukkan adanya bias.
Maka dari itu, nilai beta harus kecil. Dengan tidak adanya jalur ini, maka akan
mencerminkan bias nol.

HUBUNGAN ANTARA PENGUJI DAN YANG DI UJI


Sebuah temuan menemukan bahwa banyak tenaga kerja profesional psikologis
menegaskan bahwa banyak penguji berkulit purih menghambat kinerja anggota
kelompok minoritas (Sattler, 1988). Didalam 23 studi yang di lakukan oleh Sattler dan
Gwynne, ditemukan bahwa kelompok ras penguji (kulit hitam atau kulit putih) dan
orang-orang yang diuji dengan kelompok ras yang berbeda dengan penguji, tidak saling
berasosiasi secara signifikan.
Pertanyaan tentang kemungkinan efek penguji dan yang di uji sudah memiliki
beberapa bentuk. Kaum minoritas yang di uji bisa saja mendapatkan pengurangan skor
dikarenakan oleh respon yang berbeda dari mereka terhadap penguji. Seorang penguji
dari ras yang berbeda bisa saja menciptakan kecemasan atau ketakutan kepada
kelompok minoritas. Penelitian hanya memberikan sedikit dukungan untuk
kemungkinan ini.
Penguji berkulit putih mungkin lebih kurang efektif dibandingkan penguji
berdarah amerika hispanik ketika sedang menguji anak-anak dan para remaja yang juga
berdarah amerika hispanik. Pernyataan ini juga hanya mendapat sedikit dukungan.
Gerkin menemukan bahwa etnik penguji maupun kemampuan berbahasa penguji tidak
memiliki asosiasi dengan skor tes WPPSI IQs atau Leiter International Performance
Scale pada anak-anak usia 4,5 dan 6 tahun. Morales dan George menemukan bahwa
anak berdarah hispanik yang menggunakan dua bahasa pada kelas 1 sampai 3
mendapatkan skor WISC-R yang lebih tinggi daripada penguji non-hispanik yang hanya
berbahasa menggunakan satu bahasa dengan penguji berdarah hispanik yang berbahasa
lebih dari satu, saat menguji anak dengan bahasa spanyol dan inggris. Temuan diatas
menunjukkan baha etnis si penguji memiliki hanya sedikit efek pada skor kaum
minoritas. Para penguji perlu dilatih dengan baik dan kompeten.
HELMS DAN KESETARAAN BUDAYA

Menurut Helms (1992), kesetaraan budaya memiliki tujuh bentuk, yaitu


1. Kesetaraan fungsional, dimana nilai tes memiliki arti yang sama dengan
grup kebudayaan yang berbeda.
2. Kesetaraan konseptual, bahwa item yang dites memiliki arti yang sama
dan pemahaman yang sama dalam kelompok budaya yang berbeda.
3. Kesetaraan linguistik, dimana suatu tes memiliki arti linguistik yang sama
dalam setiap kelompok budaya.
4. Kesetaraan psikometrik, Sejauh mana sebuah tes mengukur hal yang sama
untuk kelompok yang berbeda.
5. Kesetaraan kondisi tes, bahwa tiap grup sama-sama familiar dengan
prosedur didalam tes dan melihat tes tersebut sebagai sarana kemampuan
menilai.
6. Kesetaraan kontekstual, dimana kemampuan kognitif dinilai sama dalam
konteks yang berbeda-beda pada perilaku seseorang.
7. Kesetaraan sampling, dimana sampel yang dapat diuji pada tiap kelompok
budaya tersedia pada pengembangan tes, validasi dan interpretasi.
Untuk penelitian yang akan datang, Helms menyarankan beberapa point yaitu
1. Pengembangan pada pengukuran dalam ketergantungan budaya antar ras
dan tingkat akulturasi dan asimilasi dalam item tes.
2. Modifikasi pada konten di dalam tes untuk menyertakan item yang
mencerminkan diversitas budaya.
3. Pemeriksaan pada respon-respon yang tidak benar.
4. Gabungan dari psikologi kognitif kedalam mode penilaian yang interaktif.
5. Menggunakan teori-teori yang ada untuk memeriksa kriteria konten dalam
lingkungan.
6. memisahkan norma-norma pada kelompok ras dalam tes yang sedang
dilakukan.

TRANSLASI DAN TES KULTURAL


Penggunaan tes pada budaya linguistik yang baru mengaruskan untuk di
kembangangkan sejak awal. Adaptasi pada pendidikan dan tes psikologi paling sering
terjadi dikarenakan oleh tiga alasan yaitu :
 Untuk memfasilitasi studi komparatif etnis-etnis yang ada.
 Untuk memungkinkan seseorang di uji dengan bahasa mereka sendiri.
 Untuk mengurangi waktu dan biaya dalam pengembangan tes yang baru.
Tes dalam bidang perbandingan lintas budaya masih relatif baru. Tes dalam
bidang ini berfokus pada pemngembangan dan penggunaan pedoman beradaptasi, cara
untuk berinterpretasi dan penggunaan data perbandingan lintas budaya dan
perbandingan lintas nasional, lalu khususnya prosedur-prosedur untuk menciptakan
kesetaraan item. Item pada tes dikatakan setara ketika masing-masing anggota linguistik
dan kelompok budaya sama-sama memiliki pendirian pada proses pengukuran dengan
memiliki kemungkinan yang sama dengan cara memilih respon item yang benar pada
tes.
Disain yang dipakai untuk membentuk kesetaraan item terdiri dari dua kategori
yaitu judgmental dan statistical. Disain Judgmental berisikan tentang keputusan
seseorang maupun suatu kelompok mengenai tingkat pengertian kesetaraan dari sebuah
item.
Terdapat tiga desain statistikal, tergantung pada karakteristik sampel yang ada.
Lalu setelah administrasi dan penilaian, prosedur statistikal dipilih dan di gunakan untuk
menilai DIF. Prosedur termasuk faktor analisis, teori respon item, regresi teori, dan
teknik Mantek-Haenszel. Jika DIF secara signifikan bersifat statis, analisis tambahan
diperlukan untuk menginvestigasi kemungkinan terjadinya bias atau kurangnya
kesetaraan pada budaya atau bahasa yang berbeda.
NATURE VS NURTURE
Bagian dari emosi seputar kontroversi tes bias berasal dari asosiasi dalam pikiran
manusia dengan gagasan yang mengganggu diri sendiri, inferioritas genetik. Mengingat
perbedaan yang ada, penjelasan genetik bukan berarti terelakkan. Dengan tidak adanya
bias justu memungkinkan penyebab dari lingkungan sekitar. Perdebatan tentang nature
vs nurture yang terjadi tidaklah berpengaruh dengan tes bias, tes bias tetap masih bisa
berlangsung walaupun perdebatan itu masih belum terpecahkan.

KONKLUSI DAN REKOMENDASI


Konklusi pada hal-hal diatas adalah bahwa tes bias tidak benar-benar ada. Tes bias
itu sebenarnya ada, namun sangat kecil sehingga menimbulkan pertanyaan tentang
penting atau tidaknya hal tersebut.
Tes bias direkomendasikan untuk terus di periksa secara ketat, dan ketidak telitian
harus terus berlangsung, menggunakan teknik yang beragam terbaru. meskipun
demikian, semua orang harus berhati-hati dalam melabel bias dalam ketiadaan, atau
bertentangan dengan bukti yang reliabel.
Diskriminasi merupakan kekhawatiran yang nyata dan menarik. Tes bias bukanlah
simber utama diskriminasi. Karena, sumber seharusnya mengidentifikasi dan
mengurangi diskriminasi mungkin lebih baik jika di arahkan langsung pada penyebab
dalam dunia nyata, daripada dari tes standarisasi. Selain itu, kami mempertanyakan
apakah tujuan kesempatan yang sama disajikan jika mungkin bukti diskriminasi yang
dihasilkan itu terhapus oleh maksud yang baik dari si penguji.
Berita di media mungkin juga bertanggung jawab atas persepsi yang diberikan
kepada masyarakat bahwa tes dan penguji semuanya merupakan bias, atau adanya
ketidak adilan. Reynolds, Lowe, et al. (1999) menyarankan empat pedoman untuk
membantu memastikan penilaian yang adil, yaitu:
1. Menyelidiki kemungkinan rujukan sumber bias.
2. Memeriksa pengembang data pada suatu tes, untuk bukti analisis statistikal
pada bias yang sudah terjadi.
3. Melakukan penilaian dengan pengukur yang ada dan paling dapat
diandalkan.
4. Menilai beberapa kemampuan dan beberapa metode yang digunakan data
akurat yang berasal dari berbagai sumber sebelum membuat keputusan
tentang seorang individu.
Selain itu, usahakan dokter untuk selalu menggunakan tes yang adil untuk
kepentingan peserta ujian, Kami merekomendasikan bahwa konsumen tes mengevaluasi
setiap langkah secara terpisah untuk memastikan bahwa hasil yang berkaitan dengan
bias itu ada dan memuaskan.
Sebuah perspektif filosofis yang muncul dalam literatur bias, sebelum publikasi,
Pembuat tes tidak hanya harus mendemonstrasikan konten, isi, dan validitas prediktif,
tetapi juga harus membangun konten analisis dalam beberapa bentuk untuk meyakinkan
bahwa isi dalam tes yang bersifat ofensif itu tidak ada didalam tes tersebut.
Kurangnya ketersediaan pada penemuan untuk tes kepribadian adalah kelemahan
yang besar dalam literatur bias. Baru akhir-akhir ini para peneliti memulai untuk
merespon pada permasalahan ini. peningkatan dalam penelitian juga dibutuhkan untuk
neuropsychological test, untuk tes kemampuan dan prestasi belum di amati, untuk SES
dan orang yang diuji yang berasalh dari kelompok minoritas yang di uji dengan penguji
majoritas. Hasilnya sudah terduga, akan selalu mengindikasi adanya perbedaan lawan
jenis, ras, etnis dan kesamaan dalam kelompok.
Pada akhirnya, konsesus yang jelas pada keadilan, dan langkah-langkah yang
harus di lalui untuk mendapatkan hal tersebut, sangat dibutuhkan antara orang-orang
dengan tujuan kemanusiaan dan oleh orang-orang yang memiliki kebutuhan dalam
dunia sains pada tes bias. Akomodasi menuju akhir pembahasan ini adalah untuk
meyainkan bahwa setiap orang yang bersangkutan dengan tes yang diberikan merasa
puas dan bahwa tes tersebut bukanlah bias. Tes bias dan keadilan adalah domain dalam
kebutuhan yang besar terhadap konsensus, dan tujuan ini hanya bisa didapat dengan
konsesi di semua sisi.

Anda mungkin juga menyukai