Margaret W. Matlin, Thomas A-Persepsi

Machine Translated by Google
BAB 2 _
Visual dan Auditori

Pengakuan
Bab Pendahuluan
Ikhtisar Pengenalan Objek Visual

Sistem Visual
Organisasi dalam Persepsi Visual
Teori Pengenalan Objek Visual
Pemrosesan Top-Down dan Pengenalan Objek Visual

Pemrosesan Bottom-Up Versus Top-Down
Pemrosesan dan Pembacaan Top-Down
“Kesalahan Cerdas” dalam Pengenalan Objek
Proses Pengenalan Visual Khusus

Mengenali Wajah Versus Mengenali Objek Lain
Penelitian Ilmu Saraf tentang Pengenalan Wajah
Penelitian Terapan tentang Pengenalan Wajah
Persepsi Ucapan
Ciri-ciri Persepsi Ucapan
Teori Persepsi Ucapan
39
40 BAB 2 Pengenalan Visual dan Auditori
BAB PENDAHULUAN
Pegang tangan Anda tepat di depan mata Anda. Anda benar-benar mempersepsikan suatu benda
padat yang mempunyai ciri khas. Misalnya, Anda dapat dengan mudah mengidentifikasi ukuran,
bentuk, dan warnanya. Anda juga memperhatikan bahwa tangan Anda adalah objek yang menyatu,
terletak jelas di depan latar belakang yang lebih jauh dan kurang jelas.
Saat Anda mengalihkan pandangan kembali ke buku teks ini, mata Anda melihat serangkaian
coretan di halaman ini. Namun, Anda dapat langsung mengidentifikasi setiap coretan sebagai huruf
alfabet. Dan, Anda dapat mengenali kombinasi huruf sebagai kata utuh. Sistem visual Anda
merasakan lebih dari satu bentuk pada satu waktu. Faktanya, Anda dapat dengan cepat dan mudah
mengidentifikasi ratusan bentuk dalam pemandangan alam mana pun (Geisler, 2008). Kemampuan
pendengaran Anda juga sama mengesankannya. Bahkan, Anda bisa mengenali kata-kata yang
diucapkan teman Anda, begitu juga dengan musik, decitan kursi, dan langkah kaki.
Sehari-harinya, kita memproses informasi visual dan pendengaran dengan sangat akurat dan
mudah sehingga mudah untuk menganggap remeh kemampuan ini (Jain & Duin, 2004). Namun
pada kenyataannya, persepsi sebenarnya adalah kemampuan manusia yang sangat kompleks.
Persepsi tampaknya jauh lebih mudah dibandingkan keterampilan kognitif lainnya, seperti bermain
catur. Namun, seperti yang telah kita bahas di Bab 1, sebuah program komputer dapat dirancang
agar dapat mengungguli seorang master catur. Sebaliknya, Anda tidak bisa membeli mesin
penglihatan yang akan mengungguli keterampilan visual anak prasekolah.
Seperti yang akan Anda lihat di bab ini, pencapaian visual dan pendengaran kita sangat efisien
dan akurat (Grill-Spector & Kanwisher, 2005; Lappin & Craft, 2000). Tahukah Anda, misalnya, bahwa
Anda dapat mengidentifikasi suatu adegan kompleks—seperti pertandingan bisbol atau pernikahan
—dalam waktu sekitar sepersepuluh detik (Gallistel & King, 2009)? Proses persepsi memberikan
bukti jelas untuk Tema 2 buku teks ini.
Bab kami saat ini mengeksplorasi beberapa aspek pemrosesan persepsi. Kita akan mulai
dengan beberapa informasi latar belakang tentang pengenalan objek visual. Kemudian kita akan
mengkaji dua topik penting dalam visi: pemrosesan top-down dan proses pengenalan khusus.
Terakhir, kita akan beralih ke dunia persepsi persepsi saat kita mempertimbangkan persepsi ucapan.
Proses persepsi ini sangat penting karena mempersiapkan informasi sensorik “mentah” sehingga
dapat digunakan dalam proses mental yang lebih kompleks—seperti membaca—yang akan kita
bahas di bab selanjutnya dalam buku ini.
GAMBARAN UMUM PENGENALAN OBJEK VISUAL
Persepsi menggunakan pengetahuan sebelumnya untuk mengumpulkan dan menafsirkan rangsangan

yang dideteksi oleh indra. Misalnya, Anda menggunakan persepsi untuk menafsirkan setiap huruf di halaman ini.
Pertimbangkan bagaimana Anda berhasil memahami huruf di akhir kata persepsi. Anda
menggabungkan (1) informasi yang tercatat oleh mata Anda, (2) pengetahuan Anda sebelumnya
tentang bentuk huruf alfabet, dan (3) pengetahuan Anda sebelumnya tentang apa yang diharapkan
ketika sistem visual Anda telah memproses persepsi fragmen . Perhatikan bahwa persepsi
menggabungkan aspek dunia luar (rangsangan visual) dan dunia batin Anda (pengetahuan Anda
sebelumnya). Pengamatan ini memberikan manfaat
Ikhtisar Pengenalan Objek Visual 41
contoh Tema 5 buku ini. Untuk memahami dunia di sekitar Anda, persepsi menggabungkan
pemrosesan dari bawah ke atas dan dari atas ke bawah.
Banyak perguruan tinggi menawarkan seluruh mata kuliah tentang topik persepsi,
jadi kita tidak dapat menjelaskan disiplin ini hanya dalam satu bab. Sumber daya lain
dapat memberikan informasi tentang proses sensorik seperti sifat reseptor di mata dan
telinga, serta rincian lebih lanjut tentang area persepsi lainnya (Foley & Matlin, 2010;
Goldstein, 2010a; Wolfe et al., 2009) . Buku-buku ini mengkaji bagaimana kita memandang
karakteristik penting objek visual, seperti bentuk, ukuran, warna, tekstur, dan kedalaman.
Sumber daya ini juga menyelidiki sistem persepsi lainnya—audisi, sentuhan, rasa, dan
penciuman. Selain itu, memahami bagaimana pengetahuan tersimpan yang Anda miliki
berinteraksi dengan, dan secara mendasar membentuk, pemrosesan sensorik tingkat
rendah adalah topik hangat saat ini di banyak bidang ilmu kognitif (misalnya, Bar et al.,
2006; Chang et al. , 2006; Clark, 2013; Dikker et al., 2010; Noe, 2004; Pickering & Clark, 2014; Pickering & Garrod, 2013).
Karena persepsi berkontribusi pada hampir setiap proses kognitif lainnya dalam satu atau
lain cara, persepsi merupakan salah satu topik yang paling banyak diteliti dalam ilmu kognitif.
Karena terbatasnya ruang yang kita miliki untuk membahas proses persepsi, bab ini
paling banyak berfokus pada pengenalan objek. Selama pengenalan objek atau pengenalan
pola, Anda mengidentifikasi susunan rangsangan sensorik yang kompleks, dan Anda
merasakan bahwa pola ini terpisah dari latar belakangnya. Saat Anda mengenali suatu
objek, proses sensorik Anda mengubah dan mengatur informasi mentah yang diberikan
oleh reseptor sensorik Anda. Anda juga membandingkan rangsangan sensorik dengan
informasi yang Anda simpan di memori Anda.
Misalnya, ketika seseorang berbicara, mereka menciptakan sinyal fisik berupa
gelombang suara. Gelombang suara tersebut merambat ke telinga Anda, dan bagian dari
sistem pendengaran Anda bertanggung jawab untuk menganalisis sifat fisik (seperti
amplitudo dan frekuensi) gelombang suara. Analisis sifat fisik masukan yang terjadi lebih
awal setelah masukan tersebut melakukan kontak dengan reseptor sensorik Anda
merupakan bagian persepsi “bottom-up”. Setelah pemrosesan sensorik awal, terjadi
pemrosesan input tambahan pada tingkat yang lebih tinggi. Pada titik tertentu, masukan
diproses dengan cukup baik sehingga informasi tersebut dapat disesuaikan dengan
pengetahuan Anda yang tersimpan tentang bunyi linguistik. Ketika informasi yang
diproses dicocokkan dengan pengetahuan yang disimpan, Anda kemudian mengenali
suaranya. Peran yang dimainkan oleh pengetahuan Anda yang tersimpan dalam
memfasilitasi kemampuan Anda untuk mengenali suatu objek (dalam hal ini, bunyi linguistik yang diterima melalui mod
Pada bagian pertama bab ini, kita tidak fokus pada persepsi pendengaran, namun
pada pemrosesan visual. Selama pemrosesan visual, cahaya memantul dari permukaan
lingkungan, sehingga membawa informasi tentang isi dunia visual eksternal Anda ke
reseptor sensorik visual Anda (mata Anda). Kami mempertimbangkan tiga topik: (a) sistem
visual, (b) bagaimana organisasi beroperasi dalam persepsi visual, dan (c) tiga teori
tentang pengenalan objek.
Sistem Visual
Psikolog telah mengembangkan dua istilah untuk merujuk pada rangsangan persepsi.
Stimulus distal adalah objek sebenarnya yang “di luar sana” dalam lingkungan—misalnya,
pena di mejamu. Stimulus proksimal adalah informasi yang tercatat pada reseptor sensorik Anda—
misalnya, gambar yang dibuat pena di retina Anda. Retina Anda menutupi bagian dalam belakang
mata Anda; itu berisi jutaan neuron yang mencatat dan mengirimkan informasi visual dari dunia luar.
Ketika kita mengenali suatu objek, kita berhasil mengenali identitas stimulus distal, bahkan
ketika informasi yang tersedia dalam stimulus proksimal jauh dari sempurna (Kersten et al., 2004;
Palmer, 2003; Pasternak et al., 2003 ). Misalnya, Anda mengenali wajah manusia dalam Demonstrasi
1.2 dari Bab 1 meskipun wajah tersebut tidak memiliki hidung, mulut, dan telinga. Gazzaniga dan
rekan-rekannya (2009) menunjukkan bahwa pengenalan objek terutama bergantung pada bentuk,
bukan pada warna atau tekstur. Anda mengenali wajah manusia ini, meskipun warnanya biru.
Cobalah Demonstrasi 2.1 untuk mengilustrasikan keahlian Anda dalam mengidentifikasi stimulus distal.
Sebagaimana dicatat dalam demonstrasi ini, Anda dapat mengenali objek dalam adegan baru yang
telah disajikan sekitar sepersepuluh detik (Biederman, 1995). Apakah ini berarti sistem visual Anda
berhasil menerima stimulus proksimal, yang mungkin mewakili selusin objek, dan mengenali semua
objek ini dalam sepersepuluh detik?
Demonstrasi 2.1
Pengakuan Langsung terhadap Objek

Nyalakan pesawat televisi dan sesuaikan suaranya menjadi “mute”. Sekarang ganti
saluran dengan mata tertutup. Buka mata Anda lalu segera tutup. Ulangi latihan ini
beberapa kali. Perhatikan bagaimana Anda dapat langsung mengidentifikasi dan
menafsirkan gambar di layar TV, meskipun Anda tidak mengharapkan gambar
tersebut dan belum pernah melihatnya dalam bentuk persis seperti itu. Dalam
waktu kurang dari satu detik—dan tanpa usaha keras—Anda dapat mengidentifikasi warna, tekstur, kont
Demonstrasi ini awalnya dikemukakan oleh Irving Biederman (1995), yang
menyatakan bahwa orang biasanya dapat menafsirkan makna suatu adegan baru
dalam sepersepuluh detik. Konsisten dengan Tema 2, manusia sangat efisien
dalam mengenali pola.
Untungnya, sistem visual Anda mendapat bantuan dari salah satu komponen lainnya—memori
sensorik Anda (Gregory, 2004a). Memori sensorik adalah sistem penyimpanan berkapasitas besar
yang mencatat informasi dari setiap indra dengan akurasi yang wajar. Sehubungan dengan
penglihatan, memori ikonik, atau memori sensorik visual, menyimpan gambar stimulus visual untuk
jangka waktu singkat setelah stimulus tersebut hilang (Holling-worth, 2006b; Parks, 2004; Sperling,
1960).
Informasi visual yang tercatat di retina (stimulus proksimal) harus melewati jalur visual, yaitu
sekumpulan neuron antara retina dan korteks visual primer. Korteks visual primer terletak di lobus
oksipital otak; itu adalah bagian korteks serebral Anda yang berhubungan dengan pemrosesan dasar
rangsangan visual (lihat Gambar 2.1). Ini juga merupakan tempat pertama di mana informasi dari
Anda
43
Ikhtisar Pengenalan Objek Visual
GAMBAR 2.1
Gambar Skema Korteks Serebral, Dilihat dari Sisi Kiri, Menunjukkan Empat Lobus
Otak. Perhatikan korteks visual primer (dibahas di bagian ini). Korteks inferotemporal
memainkan peran penting dalam mengenali objek kompleks seperti wajah.
Lobus frontal Lobus parietal
Lobus oksipital
Lobus temporal Visual primer
korteks
Korteks inferotemporal
dua mata digabungkan (Briggs & Usrey, 2010). Jika Anda meletakkan tangan Anda di
belakang kepala, tepat di atas leher Anda, korteks visual utama terletak tepat di bawah
tengkorak Anda pada lokasi tersebut.
Informasi visual dapat berpindah dari retina ke korteks visual utama dengan sangat
cepat (~50–80 milidetik, Nowak, Munk et al., 1995). Korteks visual primer hanyalah
perhentian pertama di dalam korteks. Misalnya, para peneliti telah mengidentifikasi
setidaknya 30 area tambahan pada korteks yang berperan dalam persepsi visual (Bruce et
al., 2003; Fellman & Van Essen, 1991; Frishman, 2001; Sillito, 2004). Daerah di luar korteks
visual primer ini diaktifkan ketika kita mengenali objek yang kompleks. Para peneliti saat
ini sedang mempelajari fungsi kawasan tersebut. Misalnya, kemampuan Anda mengenali
alat—seperti garpu atau gunting—sebagian bergantung pada lobus parietal Anda (Almeida
dkk., 2010; Mahon dkk., 2010). Namun, penting untuk dicatat bahwa para peneliti belum
menemukan wilayah otak mana yang dipasangkan
setiap komponen proses pengenalan objek (Pasternak et al., 2003; Purves & Lotto, 2003).
Organisasi dalam Persepsi Visual

Ketika pengenalan objek terjadi, sistem visual kita dirancang untuk menerapkan
pengorganisasian pada dunia visual yang sangat rumit (Geisler & Super, 2000; Palmer, 2003).
Pada Bab 1, kami memperkenalkan pendekatan historis terhadap psikologi yang disebut
“psikologi gestalt”. Salah satu prinsip penting dalam psikologi gestalt adalah manusia
memiliki kecenderungan dasar untuk mengatur apa yang dilihatnya; tanpa usaha apa pun,
kita melihat pola, bukan pengaturan acak (Gordon, 2004; Schirillo, 2010). Misalnya, ketika
dua area mempunyai batas yang sama, gambarnya mempunyai bentuk yang berbeda dengan tepi yang jelas.
Sebaliknya, tanah adalah wilayah yang “tersisa”, yang menjadi latar belakang. Seperti yang
ditunjukkan oleh para psikolog Gestalt, gambar mempunyai bentuk yang pasti, sedangkan
tanah terus berlanjut di belakang gambar. Angka tersebut juga tampak lebih dekat dengan
kita dan lebih dominan dibandingkan dengan permukaan tanah (Kelly & Grossberg, 2000; Palmer, 2003; Rubin
Bahkan bayi kecil menunjukkan beberapa prinsip pengorganisasian gestalt (Quinn et al.,
2002).
Dalam hubungan ambigu antara gambar dan tanah, gambar dan tanah akan terbalik dari
waktu ke waktu, sehingga gambar menjadi dasar dan kemudian menjadi gambar lagi. Gambar
2.2 mengilustrasikan efek muka vas yang terkenal. Pada awalnya, Anda melihat vas putih
dengan latar belakang biru, tapi sesaat kemudian, Anda melihat dua wajah biru dengan latar
belakang putih. Bahkan dalam situasi yang ambigu ini, sistem persepsi kita memaksakan
pengorganisasian pada suatu stimulus, sehingga satu bagian menonjol dan sisanya
menghilang ke latar belakang. Kita begitu terbiasa dengan kepastian hubungan antara figur
dan daratan sehingga kita terkejut saat menghadapi situasi di mana figur dan daratan saling
bertukar tempat (Wolfe et al., 2009).
Penjelasan atas pembalikan gambar-tanah ini tampaknya memiliki dua komponen: (1)
Neuron di korteks visual menjadi beradaptasi dengan satu gambar, seperti versi “wajah”
pada Gambar 2.2, sehingga Anda lebih mungkin melihat gambar tersebut. versi alternatif
atau “vas”; dan (2) lebih jauh lagi, orang mencoba memecahkan paradoks visual dengan
bergantian antara dua solusi yang masuk akal (Gregory, 2004a; Long & Toppino, 2004; Toppino & Long, 2005)
Anehnya, kita bahkan bisa melihat hubungan antara gambar dan tanah ketika sebuah
adegan tidak memiliki batas yang jelas antara gambar dan tanah. Salah satu kategori ilusi
visual dikenal sebagai kontur ilusi. Dalam kontur ilusi (juga disebut kontur subjektif), kita
melihat tepian meskipun tepian tersebut tidak secara fisik hadir dalam stimulus. Dalam
kontur ilusi pada Gambar 2.3, misalnya, orang melaporkan bahwa segitiga putih terbalik
tampak muncul di depan garis luar segitiga kedua dan tiga lingkaran biru kecil. Lebih jauh
lagi, segitiga ini tampak lebih terang dibandingkan bagian stimulus lainnya (Grossberg,
2000; Palmer, 2002).
Dalam kehidupan kita sehari-hari, kita biasanya melihat pemandangan dengan lebih
akurat jika kita “aku tidak tahu apa-apa.” Namun, dalam kasus kontur ilusi, strategi rasional
ini menyebabkan kesalahan persepsi (Mendola, 2003; Purves & Lotto, 2003). Anda dapat
melihat mengapa psikolog gestalt sangat tertarik dengan hubungan gambaran-dasar yang
ambigu dan kontur ilusi (Foley & Matlin, 2010; Wolfe et al., 2009). Persepsi manusia lebih dari
sekedar jumlah informasi dalam stimulus distal.
GAMBAR 2.2
Efek Wajah Vas: Contoh Hubungan Gambar-Tanah yang Ambigu.
GAMBAR 2.3
Contoh Kontur Ilusi.

Teori Pengenalan Objek Visual

Para peneliti telah mengajukan banyak teori berbeda tentang pengenalan objek. Menurut
salah satu teori awal, sistem visual Anda membandingkan stimulus dengan serangkaian
templat, atau pola tertentu yang telah Anda simpan dalam memori. Kemudian ia
mencatat templat mana yang cocok dengan stimulus tersebut. Namun, setiap hari Anda
berhasil mengenali huruf-huruf yang sangat berbeda dari surat versi klasik, terutama dalam teks tulisan
Misalnya, perhatikan pada Gambar 2.4 bahwa semua huruf C ada di kata Kognitif
agak berbeda. Anda dapat melihat bahwa huruf P dalam Psikologi juga agak berbeda.
Namun, Anda tetap dapat mengenali masing-masing huruf tersebut, meskipun Anda
melihatnya dari sudut pandang yang berbeda (Palmer, 2003). Pendekatan template
bahkan lebih buruk lagi dalam mengenali objek yang lebih kompleks yang menempati
dunia visual Anda. Persepsi memerlukan sistem yang lebih fleksibel daripada
mencocokkan pola dengan templat tertentu (Gordon, 2004; Jain & Duin, 2004; Wolfe et al., 2009).
GAMBAR 2.4
Contoh Keberagaman Bentuk Huruf. Perhatikan secara khusus perbedaan bentuk
huruf P dalam Psikologi Kognitif.
Dua teori lainnya—analisis fitur dan pengenalan berdasarkan komponen—

lebih canggih. Saat Anda membaca tentang dua teori terkini ini, ingatlah bahwa
kita tidak perlu memutuskan bahwa satu teori benar dan teori lainnya salah.
Persepsi manusia agak fleksibel, dan kita mungkin menggunakan pendekatan
berbeda untuk tugas pengenalan objek yang berbeda (Mather, 2006).
Teori Analisis Fitur. Beberapa teori analisis fitur mengusulkan pendekatan

yang relatif fleksibel, di mana stimulus visual terdiri dari sejumlah kecil karakteristik
atau komponen (Gordon, 2004). Setiap ciri visual disebut ciri pembeda. Misalnya,
bagaimana para ahli teori analisis fitur dapat menjelaskan cara kita mengenali
huruf-huruf alfabet. Mereka berpendapat bahwa kami menyimpan daftar ciri khas
untuk setiap huruf. Misalnya ciri khas huruf R antara lain komponen melengkung,
garis vertikal, dan garis diagonal. Saat Anda melihat surat baru, sistem visual
Anda mencatat ada atau tidaknya berbagai fitur. Ia kemudian membandingkan
daftar ini dengan fitur yang disimpan dalam memori untuk setiap huruf dalam
alfabet. Tulisan tangan orang mungkin berbeda, tetapi setiap huruf R yang dicetak
akan menyertakan ketiga fitur ini.
Coba Demonstrasi 2.2, yang didasarkan pada bagan yang dikembangkan oleh
Eleanor Gibson (1969). Teori analisis fitur mengusulkan bahwa ciri khas setiap
huruf alfabet tetap konstan, baik surat tersebut ditulis tangan, dicetak, atau
diketik. Model-model ini juga dapat menjelaskan bagaimana kita memandang
berbagai macam pola dua dimensi, seperti gambar dalam lukisan, desain pada
kain, dan ilustrasi dalam buku. Namun, sebagian besar penelitian tentang topik ini
berfokus pada kemampuan kita mengenali huruf dan angka.
Teori analisis fitur konsisten dengan penelitian psikologi. Misalnya, penelitian
psikologi yang dilakukan oleh Eleanor Gibson (1969) menunjukkan bahwa orang
membutuhkan waktu yang relatif lama untuk memutuskan apakah satu huruf
berbeda dari huruf kedua ketika kedua huruf tersebut memiliki banyak ciri penting
yang sama. Berdasarkan tabel pada Demonstrasi 2.2, huruf P dan R memiliki
banyak ciri penting yang sama; Partisipan penelitian Gibson lambat mengambil
keputusan mengenai apakah kedua huruf ini berbeda. Sebaliknya, O dan L tidak
memiliki fitur penting yang sama. Dalam penelitian ini, orang-orang dengan cepat
memutuskan apakah pasangan huruf seperti ini berbeda satu sama lain.
Penelitian psikologi lainnya menganalisis huruf dan angka pada alamat yang
ditulis orang di amplop (Jain & Duin, 2004). Misalnya, Larsen dan Bundesen (1996)
merancang model berdasarkan analisis fitur yang mengenali dengan benar 95%
angka yang tertulis di alamat jalan dan kode pos.
Teori analisis fitur juga sesuai dengan bukti dari ilmu saraf (Gordon, 2004;
Palmer, 2002). Tim peneliti Hubel dan Wiesel berfokus pada korteks visual primer
hewan yang dianestesi (Hubel, 1982; Hubel & Wiesel, 1965, 1979, 2005). Mereka
menghadirkan stimulus visual sederhana—seperti seberkas cahaya vertikal—tepat
di depan mata masing-masing hewan. Hubel dan Wiesel kemudian mencatat
bagaimana neuron tertentu di korteks visual primer merespons stimulus visual
tersebut. Mereka terus menguji bagaimana berbagai neuron di wilayah korteks
merespons rangsangan visual.
48
BAB 2 Pengenalan Visual dan Auditori
Demonstrasi 2.2
Pendekatan Analisis Fitur

Eleanor Gibson mengusulkan bahwa huruf berbeda satu sama lain sehubungan
dengan ciri khasnya. Demonstrasi di bawah ini mencakup versi singkat dari tabel
yang dia usulkan. Perhatikan bahwa tabel menunjukkan apakah sebuah huruf
dalam alfabet mengandung salah satu ciri berikut: empat jenis garis lurus, kurva
tertutup, perpotongan dua garis, dan simetri. Seperti yang Anda lihat, P dan R memiliki banyak fitur ya
Namun, W dan O hanya berbagi satu fitur. Bandingkan pasangan huruf berikut
untuk menentukan ciri khas yang dimilikinya: A dan B; E dan F; X dan Y; aku dan L.
Fitur AEFHILVWXYZBCDGJOPRQ
Lurus
horisontal + + + + + + +
vertikal +++++ +++ ++
diagonal/ + +++++
diagonal\ + ++++ ++
Kurva Tertutup ++ ++++

Persimpangan +++++ + + +++
Simetri ++ +++++++++ +
Sumber: Gibson, EJ (1969). Prinsip pembelajaran dan pengembangan persepsi. New

York: Dewan Prentice.
Hasil Hubel dan Wiesel menunjukkan bahwa setiap neuron merespons

dengan sangat kuat ketika batang dipresentasikan pada wilayah retina
tertentu dan ketika batang memiliki orientasi tertentu. Misalnya, seberkas
cahaya dipresentasikan ke lokasi tertentu di retina hewan. Satu neuron
tertentu mungkin merespons dengan kuat ketika batang memiliki orientasi
vertikal. Neuron lain, yang berjarak sangat dekat di dalam korteks visual,
mungkin merespons paling kuat ketika batang diputar sekitar 10 derajat dari
vertikal. Sistem visual berisi pendeteksi fitur yang ada saat kita dilahirkan
(Gordon, 2004). Detektor ini membantu kita mengenali ciri-ciri tertentu dari huruf dan pola
Namun, pendekatan analisis fitur mempunyai beberapa masalah. Misalnya, teori analisis fitur
dibangun untuk menjelaskan pengenalan huruf yang relatif sederhana. Sebaliknya, bentuk-bentuk
yang terjadi di alam jauh lebih kompleks (Kersten et al., 2004). Bagaimana Anda bisa mengenali
seekor kuda? Apakah Anda menganalisis stimulus ke dalam ciri-ciri seperti surai, kepala, dan
kukunya? Bukankah ciri-ciri persepsi penting apa pun akan terdistorsi segera setelah kudanya
bergerak—atau segera setelah Anda bergerak? Kuda dan benda lain di lingkungan kita mengandung
terlalu banyak garis dan segmen melengkung. Mengenali objek-objek ini jauh lebih kompleks
dibandingkan mengenali huruf (Palmer, 2003; Vecera, 1998).
Sekarang mari kita pertimbangkan pendekatan pengenalan berdasarkan komponen pada
pengenalan objek. Pendekatan ini sangat penting karena secara khusus membahas bagaimana orang
mengenali jenis rangsangan kompleks yang kita temukan dalam kehidupan sehari-hari.
Teori Pengakuan Berdasarkan Komponen. Irving Biederman dan rekan-rekannya telah

mengembangkan teori untuk menjelaskan bagaimana manusia mengenali bentuk tiga dimensi
(Biederman, 1990, 1995; Hayworth & Biederman, 2006; Kayaert et al., 2003). Asumsi dasar teori
pengenalan berdasarkan komponen adalah bahwa pandangan spesifik suatu objek dapat
direpresentasikan sebagai susunan bentuk 3-D sederhana yang disebut geons.
Sama seperti huruf-huruf alfabet yang dapat digabungkan menjadi kata-kata, geon juga dapat
digabungkan untuk membentuk objek yang bermakna (Vuong, 2010).
Anda dapat melihat lima geon yang diusulkan di Bagian A pada Gambar 2.5. Bagian B dari
gambar ini menunjukkan enam objek yang dapat dibangun dari geon. Seperti yang Anda ketahui,
huruf-huruf alfabet dapat digabungkan untuk membentuk kata-kata yang mempunyai arti berbeda,
tergantung pada susunan huruf-hurufnya. Misalnya, no mempunyai arti yang berbeda dengan on.
Demikian pula, geon 3 dan 5 dari Gambar 2.5 dapat digabungkan untuk membentuk objek bermakna
berbeda. Cangkir berbeda dengan ember, dan teori pengenalan berdasarkan komponen menekankan
cara khusus di mana kedua geon ini digabungkan.
Secara umum, susunan tiga geon memberikan informasi yang cukup kepada orang-orang untuk
mengklasifikasikan suatu objek. Perhatikan bahwa teori pengenalan berdasarkan komponen
Biederman pada dasarnya adalah teori analisis fitur yang menjelaskan bagaimana kita mengenali
objek tiga dimensi.
Biederman dan rekan-rekannya telah melakukan penelitian fMRI dengan manusia, dan mereka
juga mencatat respons saraf pada monyet yang dianestesi. Temuan mereka menunjukkan bahwa area
korteks di luar korteks visual primer merespons geon seperti pada Gambar 2.5A (Hayworth &
Biederman, 2006; Kayaert et al., 2003). Lebih jauh lagi, penelitian pemodelan komputer menunjukkan
bahwa anak-anak pada awalnya mungkin mewakili setiap objek sebagai objek lengkap yang tidak
dapat dibedakan. Sebaliknya, anak-anak yang lebih besar dan orang dewasa dapat merepresentasikan
suatu objek sebagai kumpulan geon (Doumas & Hummel, 2010).
Namun, teori pengenalan berdasarkan komponen memerlukan modifikasi penting, karena
orang mengenali objek lebih cepat ketika objek tersebut dilihat dari sudut pandang standar,
dibandingkan dari sudut pandang yang jauh berbeda (Friedman et al., 2005; Graf et al. ., 2005).
Perhatikan, misalnya, bagaimana tangan Anda sendiri akan sulit dikenali jika Anda melihatnya dari
sudut pandang yang tidak biasa.
Salah satu modifikasi teori pengenalan berdasarkan komponen disebut pendekatan yang
berpusat pada pemirsa; pendekatan ini mengusulkan agar kami menyimpan sejumlah kecil tampilan
50
GAMBAR 2.5
Lima Geon Dasar (A) dan Objek Representatif yang Dapat Dibangun
dari Geon (B).
1 2
2
3 3
5 3
1
5
3 4
5
2
3
5 5
(A) (B)
Sumber: Biederman, I. (1990). Visi tingkat yang lebih tinggi. Dalam EN Osherson, SM Kosslyn, & JM
Hollerbach (Eds.), Undangan ke ilmu kognitif (Vol. 2, hlm. 41–72). Cambridge, MA: MIT.
objek tiga dimensi, bukan hanya satu tampilan (G. Mather, 2006). Misalkan kita melihat suatu objek dari sudut
yang tidak biasa, dan objek tersebut tidak sesuai dengan bentuk objek apa pun yang kita simpan di memori.
Kita kemudian harus memutar secara mental gambar objek tersebut hingga cocok dengan salah satu tampilan
yang disimpan dalam memori (Tarr & Vuong, 2002; Wolfe et al., 2009). Rotasi mental ini mungkin memerlukan
satu atau dua detik tambahan, dan kita bahkan mungkin tidak mengenali objeknya.
Saat ini, baik teori analisis fitur maupun teori pengenalan berdasarkan komponen (dimodifikasi untuk
memasukkan pendekatan yang berpusat pada penampil) dapat menjelaskan sebagian dari keterampilan luar
biasa kita dalam mengenali objek. Namun, para peneliti harus mengeksplorasi apakah teori-teori ini dapat
menjelaskan kemampuan kita untuk mengenali objek yang lebih rumit daripada cangkir dan ember yang
terisolasi. Misalnya, bagaimana Anda bisa segera mengidentifikasi berbagai objek kompleks dalam adegan
yang Anda tonton di televisi
layar di Demonstrasi 2.1? Penjelasan teoritis akan menjadi lebih rinci, seiring para peneliti
terus mengeksplorasi bagaimana kita mengenali objek dan pemandangan dunia nyata
dengan menggunakan metode penelitian yang semakin canggih (misalnya, Gordon, 2004;
Henderson, 2005; Hollingworth, 2006a, 2006b; Wolfe et al., 2009).
PERTANYAAN KUIS LATIHAN
1) Informasi visual yang dicatat oleh reseptor sensorik retina diketahui

sebagai:
a) stimulus distal.
b) muka gelombang.
c) aliran punggung.
d) stimulus proksimal.
2) Ilmu yang mempelajari pengenalan objek atau pengenalan pola berfokus pada cara-cara yang:
a) proses sensorik mengubah dan mengatur informasi mentah yang disediakan oleh sensorik
reseptor.
b) pengetahuan sebelumnya selalu menimbulkan persepsi yang akurat terhadap lingkungan
rangsangan.
c) proses pencocokan templat mendasari persepsi langsung terhadap objek dan pola. d)
reseptor sensorik menggunakan stimulus proksimal untuk menghasilkan stimulus distal baru
di dunia luar.
3) Cara orang mengenali pola visual sederhana (seperti huruf alfabet) sebagian dijelaskan
melalui proses analisis ciri, yang melibatkan analisis kombinasi ciri khas. Demikian pula,
cara orang mengenali objek kompleks (seperti cangkir kopi) sebagian dijelaskan oleh
proses pengenalan berdasarkan komponen, yang melibatkan analisis kombinasi dari:
a) templat. b)
perceptron. c)
menurut saya – hubungan dasar.
d) geon.
4) Misalkan Anda sedang melihat iklan yang menampilkan gambar besar. Pada awalnya,
Anda mengira sedang melihat sebuah bintang. Namun, jika Anda melihat lebih dekat,
Anda akan menyadari bahwa beberapa sisi bintang tidak benar-benar terlihat di kertas,
namun tampak ada secara fisik. Pengalaman persepsi ini
disebut: a) sebuah pola.
b) contoh pengolahan bottom-up.
c) ciri khas.
d) kontur ilusi.
5) Pendekatan analisis fitur:

a) nyatakan bahwa kami menyimpan templat untuk setiap huruf alfabet.
b) tidak dapat menjelaskan bagaimana kita bisa mengenali huruf-huruf alfabet tulisan tangan.
c) bertentangan dengan penelitian ilmu saraf.
d) membuat prediksi tentang mengapa R disamakan dengan P, dan bukan W.
PEMROSESAN TOP-DOWN DAN PENGENALAN OBJEK VISUAL

Diskusi kita sejauh ini menekankan bagaimana orang mengenali objek yang terisolasi. Kami belum
mempertimbangkan bagaimana pengetahuan dan harapan kami dapat membantu pengakuan.
Dalam kehidupan nyata, saat Anda mencoba menguraikan huruf alfabet yang ditulis dengan
tergesa-gesa, huruf-huruf di sekitar kata tersebut mungkin bisa membantu. Demikian pula,
konteks kedai kopi berguna ketika Anda mencoba mengidentifikasi objek yang terdiri dari geon
sempit dan melengkung yang dipasang pada sisi geon silinder yang lebih lebar.
Tema 5 menekankan perbedaan antara dua jenis pengolahan. Mari kita ulas dulu perbedaan
itu. Kemudian kita akan melihat bagaimana kedua proses ini bekerja sama secara saling melengkapi
untuk membantu kita mengenali kata-kata selama proses membaca.
Terakhir, kita akan melihat bagaimana terkadang kita bisa membuat kesalahan jika pemrosesan
top-down kita terlalu aktif.
Pemrosesan Bottom-Up Versus Top-Down

Sejauh ini, bab ini berfokus pada pemrosesan dari bawah ke atas. Pemrosesan dari bawah ke atas
menekankan bahwa karakteristik stimulus penting ketika Anda mengenali suatu objek. Secara
khusus, rangsangan fisik dari lingkungan dicatat pada reseptor sensorik. Informasi ini kemudian
diteruskan ke tingkat yang lebih tinggi dan lebih canggih dalam sistem persepsi (Carlson, 2010;
Gordon, 2004).
Misalnya, pandangan sekilas dari buku teks Anda dan fokus pada satu objek tertentu yang
ada di dekatnya. Perhatikan bentuk, ukuran, warna, dan ciri fisik penting lainnya.
Ketika karakteristik ini tercatat di retina Anda, proses pengenalan objek dimulai. Informasi ini
dimulai dari tingkat persepsi yang paling dasar (atau terbawah), dan terus berlanjut hingga
mencapai wilayah kognitif yang lebih “canggih” di otak, di luar korteks visual utama Anda.
Kombinasi fitur tingkat bawah yang sederhana membantu Anda mengenali objek utuh yang lebih
kompleks.
Bagian pertama dari pemrosesan visual mungkin bersifat bottom-up (Palmer, 2002). Namun
sesaat kemudian, proses kedua dimulai. Proses kedua dalam pengenalan objek ini adalah
pemrosesan top-down. Pemrosesan top-down menekankan bagaimana konsep, harapan, dan
memori seseorang dapat mempengaruhi pengenalan objek.
Secara lebih rinci, proses mental tingkat tinggi ini semuanya membantu dalam mengidentifikasi
objek. Anda mengharapkan bentuk-bentuk tertentu ditemukan di lokasi tertentu, dan Anda berharap
menemukan bentuk-bentuk ini karena pengalaman masa lalu Anda. Harapan-harapan ini membantu
Anda mengenali objek dengan sangat cepat. Dengan kata lain, ekspektasi Anda pada tingkat
pemrosesan visual yang lebih tinggi (atau teratas) akan menurun dan memandu kita
Pemrosesan Top-Down dan Pengenalan Objek Visual 53
pemrosesan awal stimulus visual (Carlson, 2010; Dikker et al., 2009; Donderi, 2006; Gregory,
2004a).
Pikirkan bagaimana pemrosesan top-down membantu Anda dengan cepat mengenali objek
tertentu di sekitar yang Anda pilih beberapa saat yang lalu. Pemrosesan top-down Anda
memanfaatkan ekspektasi dan ingatan Anda tentang objek yang biasanya ada di sekitar. Proses
top-down ini kemudian digabungkan dengan informasi fisik spesifik tentang stimulus dari
pemrosesan bottom-up. Hasilnya, Anda dapat mengidentifikasi objek dengan cepat dan lancar
(Carlson, 2010). Seperti yang kami catat sebelumnya, pengenalan objek memerlukan pemrosesan
bottom-up dan top-down (Tema 5). Sebelum Anda membaca lebih lanjut, cobalah Demonstrasi
2.3.
Demonstrasi 2.3
Pengenalan Konteks dan Pola

Bisakah Anda membaca kalimat berikut?
Seperti yang mungkin Anda bayangkan, pemrosesan dari atas ke bawah menjadi kuat
ketika stimulus didaftarkan hanya dalam sepersekian detik. Pemrosesan dari atas ke bawah
juga kuat ketika rangsangan tidak lengkap atau ambigu (Groome, 1999).
Bagaimana cara pemrosesan top-down beroperasi dalam visi? Para peneliti telah
mengusulkan bahwa struktur tertentu di sepanjang rute antara retina dan korteks visual mungkin
berperan. Struktur ini dapat menyimpan informasi tentang kemungkinan relatif melihat berbagai
rangsangan visual dalam konteks tertentu (Kersten et al., 2004).
Psikolog kognitif percaya bahwa pemrosesan bottom-up dan top-down diperlukan untuk
menjelaskan kompleksitas pengenalan objek (Riddoch & Humphreys, 2001). Misalnya, Anda
mengenali cangkir kopi karena dua proses yang hampir bersamaan: (1) Pemrosesan dari bawah
ke atas memaksa Anda untuk mendaftarkan fitur komponen, seperti lengkungan pegangan
cangkir; dan (2) konteks kedai kopi mendorong Anda untuk lebih cepat mengenali pegangan
cangkir, karena pemrosesannya bersifat top-down. Sekarang mari kita pertimbangkan bagaimana
pemrosesan top-down ini memfasilitasi pembacaan.
Pemrosesan dan Pembacaan Top-Down

Seperti yang ditunjukkan pada Demonstrasi 2.3, bentuk yang sama—huruf yang ambigu—
terkadang dapat dianggap sebagai huruf H dan terkadang sebagai A. Dalam demonstrasi ini,
Anda mulai mengidentifikasi keseluruhan kata “THE”, dan pengetahuan tentatif Anda tentang
kata tersebut membantu untuk mengidentifikasi huruf kedua sebagai H. Demikian pula,
pengetahuan Anda tentang kata “MAN” dan “RAN” membantu Anda mengidentifikasi huruf ambigu yang sama sebagai A dalam
Para peneliti telah menunjukkan bahwa pemrosesan dari atas ke bawah dapat
memengaruhi kemampuan kita untuk mengenali berbagai objek (misalnya, Carreiras et al.,
2013; Farmer et al., 2015; Gregory, 2004a; Hollingworth & Henderson, 2004; Kersten et al.,
2004; Kutas & Federmeier, 2011; Rahman & Sommer, 2008). Sebagian besar penelitian
tentang topik ini meneliti bagaimana konteks membantu kita mengenali huruf-huruf alfabet saat membaca.
Psikolog yang mempelajari membaca telah menyadari selama beberapa dekade bahwa
teori pengenalan harus mencakup faktor-faktor selain informasi dalam stimulus. Saat Anda
membaca, misalkan Anda mengidentifikasi setiap huruf dengan menganalisis fitur-fiturnya.
Selain itu, anggaplah setiap huruf mengandung empat ciri khas, sebuah tebakan konservatif.
Dengan mempertimbangkan jumlah huruf dalam sebuah kata rata-rata—dan kecepatan
membaca rata-rata—ini berarti Anda perlu menganalisis sekitar 5.000 fitur setiap menit.
Perkiraan ini sangatlah tinggi; proses persepsi Anda tidak dapat menangani beban kerja
seperti itu (Dahan, 2010).
Selain itu, kita masih bisa membaca sebuah kalimat, meskipun beberapa huruf tengah
dalam sebuah kata telah disusun ulang. Misalnya, Rayner dan rekan-rekannya (2006)
menemukan bahwa mahasiswa dapat membaca kalimat normal dengan kecepatan sekitar
255 kata per menit. Mereka masih bisa membaca kalimat-kalimat yang campur aduk seperti,
“Anak itu tidak bisa menyelesaikan masalahnya sehingga dia meminta bantuan.” Namun,
tingkat membaca mereka turun menjadi 227 kata per menit.
Salah satu fenomena yang paling banyak ditunjukkan dalam penelitian pengenalan
adalah efek superioritas kata. Menurut efek superioritas kata, kita dapat mengidentifikasi
sebuah huruf dengan lebih akurat dan lebih cepat ketika huruf tersebut muncul dalam sebuah
kata yang bermakna dibandingkan ketika huruf tersebut muncul sendiri-sendiri atau dalam
rangkaian huruf yang tidak memiliki arti dan tidak berhubungan (Dahan, 2010; Palmer,
2002;Vecera & Lee, 2010). Misalnya, Anda dapat mengenali huruf p dengan lebih mudah jika
muncul di kata seperti plan dibandingkan jika muncul di bukan kata seperti pnla.
Lusinan penelitian telah mengkonfirmasi pentingnya pemrosesan top-down dalam
pengenalan huruf (misalnya, Grainger & Jacobs, 2005; Palmer, 1999; Reicher, 1969; Williams
et al., 2006). Misalnya, huruf s dengan cepat dikenali pada kata island, meskipun huruf s
tidak diucapkan pada kata tersebut (Krueger, 1992).
Para peneliti juga telah menunjukkan bahwa konteks sebuah kalimat memudahkan
pengenalan sebuah kata dalam sebuah kalimat. Misalnya, orang dengan cepat mengenali
kata jus dalam kalimat, “Mary meminum jus jeruknya,” dibandingkan dengan kata yang
mungkin tetapi tidak diharapkan, seperti air (Altarriba, et al., 1996; Ashby et al., 2005 ; Balota
dkk., 1985; Ehrlich & Rayner, 1981; Kliegl dkk., 2004).
Mari kita bahas satu studi klasik yang mengeksplorasi pengaruh konteks kalimat pada
pemrosesan sebuah kata. Rueckl dan Oden (1986) menunjukkan bahwa fitur stimulus dan
sifat konteks mempengaruhi pengenalan kata. Dengan kata lain, pemrosesan bottom-up dan
top-down beroperasi secara terkoordinasi. Para peneliti ini menggunakan rangsangan yang
berupa huruf atau karakter seperti huruf. Misalnya, satu set rangsangan terdiri dari huruf n
yang terbentuk sempurna, huruf r yang terbentuk sempurna, dan tiga simbol yang menjadi
perantara antara kedua huruf tersebut. Perhatikan rangsangan yang disusun di sepanjang
bagian bawah Gambar 2.6. Dalam setiap kasus, stimulus khusus ini tertanam dalam urutan
huruf “bea-s.” Hasilnya, penelitian ini memasukkan lima rangsangan yang berkisar antara
“kacang” dan “beruang”. (Dengan kata lain, variabel ini menguji pengaruh pemrosesan bottom-up.)
Pemrosesan Top-Down dan Pengenalan Objek Visual

55
GAMBAR 2.6
Pengaruh Fitur Stimulus dan Konteks Kalimat Terhadap Identifikasi Kata.
100%
90%
80%
Penjinak singa dan
70% penjaga kebun binatang
60%
Ahli botani dan
peternak sapi perah
Persen 50%
40%
30%
20%
10%
0
N N N N N
Fitur stimulus (digunakan pada kata bea-s)
Sumber: Rueckl, JG, & Oden, GC (1986). Integrasi informasi kontekstual dan fitur
selama identifikasi kata. Jurnal Memori dan Bahasa, 25, 445–460.
Sifat konteksnya juga divariasikan dengan menggunakan kerangka kalimat “The _____
dibesarkan (beruang/kacang) untuk menambah penghasilannya.” Para peneliti menyusun empat
kalimat dengan mengisi bagian yang kosong dengan istilah yang dipilih dengan cermat: “penjinak
singa”, “penjaga kebun binatang”, “ahli botani”, dan “peternak sapi perah”. Anda akan melihat
bahwa penjinak singa dan penjaga kebun binatang lebih cenderung beternak beruang, sedangkan
ahli botani dan peternak sapi perah lebih cenderung beternak kacang-kacangan. Huruf ambigu dan
kerangka kalimat serupa lainnya juga dibuat, masing-masing menggunakan empat kata benda atau
frasa kata benda yang berbeda. (Dengan kata lain, variabel kedua ini menguji pengaruh pemrosesan top-down.)
Gambar 2.6 menunjukkan hasil penelitian Rueckl dan Oden (1986). Seperti yang Anda lihat,
orang-orang lebih cenderung memilih jawaban “beruang” ketika segmen garis di sisi kanan surat itu
pendek, bukan panjang: Ciri-ciri
stimulus ini sangat penting karena pengenalan kata beroperasi sebagian secara bottom-up.
Namun, Anda juga akan melihat bahwa orang-orang lebih cenderung memilih respons “beruang”
dalam kalimat penjinak singa dan penjaga kebun binatang dibandingkan dalam kalimat ahli botani dan
peternak sapi perah: Konteksnya penting karena pengenalan kata juga berfungsi sebagian dalam sebuah
kalimat. busana dari atas ke bawah. Secara khusus, pengetahuan kita tentang dunia membuat kita
berasumsi bahwa penjinak singa dan penjaga kebun binatang akan lebih cenderung memelihara beruang dibandingkan kaca
Pikirkan tentang bagaimana efek konteks ini dapat memengaruhi kecepatan membaca Anda. Huruf-
huruf sebelumnya dalam sebuah kata membantu Anda mengidentifikasi huruf-huruf lainnya dengan lebih cepat.
Selain itu, kata-kata lain dalam sebuah kalimat membantu Anda mengidentifikasi setiap kata dengan lebih
cepat. Tanpa konteks yang membantu Anda membaca lebih cepat, Anda mungkin masih membaca
pendahuluan bab ini!
Sejauh ini, kami hanya mempertimbangkan teks yang tercetak rapi; pemrosesan top-down tentu
saja beroperasi dalam situasi ini. Apa yang terjadi jika Anda membaca catatan dari seseorang yang
tulisan tangannya buruk? Sebuah artikel jurnal oleh Anthony Barnhart dan Stephen Goldinger (2010)
diberi judul yang tepat, “Menafsirkan goresan ayam: Akses leksikal untuk kata-kata tulisan tangan.”
Menurut artikel ini, ketika siswa dalam penelitian ini membaca catatan sepuluh tulisan tangan dengan
tulisan tangan yang tidak rapi dan ambigu, mereka bahkan lebih cenderung mengandalkan pemrosesan
top-down dibandingkan ketika siswa membaca teks yang dicetak dengan rapi.
“Kesalahan Cerdas” dalam Pengenalan Objek

Menurut Tema 2, proses kognitif kita sangat efisien dan akurat.
Namun, ketika kita kadang-kadang melakukan kesalahan, kesalahan tersebut sering kali disebabkan oleh
“kesalahan cerdas”, seperti penggunaan strategi pemrosesan top-down yang berlebihan. Karena kami
terlalu sering menggunakan pemrosesan top-down, terkadang kami menunjukkan kebutaan terhadap
perubahan; kita gagal mendeteksi perubahan pada suatu objek atau pemandangan.
Penggunaan pemrosesan top-down yang berlebihan juga dapat membuat kita menunjukkan
kesalahan kedua, yang disebut kebutaan yang tidak disengaja; ketika kita memperhatikan beberapa
peristiwa dalam sebuah adegan, kita mungkin gagal menyadari ketika objek yang tidak terduga namun
benar-benar terlihat tiba-tiba muncul (Most et al., 2005). Sekarang mari kita perhatikan dua jenis kesalahan pemrosesan visua
Ubah Kebutaan. Bayangkan Anda sedang berjalan di sepanjang trotoar dekat kampus Anda.
Kemudian orang asing menanyakan arah ke gedung tertentu. Tepat di tengah percakapan ini, dua orang
—yang membawa pintu kayu ke samping—berjalan di antara Anda dan orang asing ini. Ketika mereka
lewat, orang asing yang asli telah digantikan oleh salah satu orang asing yang memegang pintu (pintu
menghalangi pandangan Anda, sehingga Anda tidak dapat melihat secara langsung orang asing tersebut
berpindah tempat). Apakah Anda memperhatikan bahwa Anda tidak lagi berbicara dengan orang yang
sama? Anda mungkin tergoda untuk menjawab, “Tentu saja!”
Ketika Daniel Simons dan Daniel Levin (1997a, 1997b, 1998) mencoba studi orang asing dan pintu
ini, hanya setengah dari orang yang melihat melaporkan bahwa satu orang asing telah digantikan oleh
orang asing yang berbeda. Banyak yang masih “tidak mengerti” ketika ditanya secara eksplisit, “Apakah
Anda memperhatikan bahwa saya bukanlah orang yang sama yang mendekati Anda untuk menanyakan
arah?” (Simons & Levin, 1998, hal. 646). Luangkan waktu sejenak untuk mencoba Demonstrasi 2.4.
Seberapa cepat Anda dapat mendeteksi perbedaan antara dua pemandangan serupa ini?
Pemrosesan Top-Down dan Pengenalan Objek Visual 57
Demonstrasi 2.4
Mendeteksi Perbedaan Antara Dua Gambar

Buka Gambar Berwarna 1 pada sisipan di bagian belakang buku ini, di mana
Anda akan melihat dua foto berwarna anak-anak di taman. Perhatikan baik-
baik kedua pemandangan ini hingga Anda mendeteksi fitur mana yang
berbeda. Jawabannya muncul di akhir bab.
Untuk menemukan ciri yang berbeda pada kedua foto berwarna ini (di dalam sampul depan),
lihatlah gadis kecil dengan atasan hitam dan celana pendek oranye. Dalam salah satu versi, Anda
bisa melihat bagian kaus kaki putih di pergelangan kaki kirinya. Pada versi lain, bagian kaus kaki ini
berwarna hitam.
Bab ini membahas bagaimana kita melihat objek. Saat mengamati keseluruhan adegan,
pemrosesan top-down mendorong kita untuk berasumsi bahwa makna dasar dari adegan tersebut
akan tetap stabil. Asumsi ini rasional, dan persepsi yang salah itu masuk akal (Carlson, 2010; Rensink,
2010; Saylor & Baldwin, 2004). Di dunia nyata, satu orang tidak tiba-tiba berubah menjadi individu lain!
Penelitian laboratorium memberikan contoh lain dari kebutaan perubahan (Moore, 2010).
Misalnya, Rensink dan rekan-rekannya (1997) meminta peserta untuk melihat sebuah foto, yang
disajikan secara singkat sebanyak dua kali. Kemudian versi foto yang sedikit berbeda disajikan
secara singkat dua kali. Urutan pergantian ini diulang sampai peserta mendeteksi adanya perubahan.
Hasil ini menunjukkan bahwa masyarakat dengan cepat mengidentifikasi perubahan ketika
perubahan tersebut penting. Misalnya, ketika pandangan seorang pilot yang tergeletak di pesawat
menunjukkan sebuah helikopter berada di dekat atau jauh, peserta hanya memerlukan 4.0 pergantian
untuk melaporkan perubahan tersebut. Sebaliknya, mereka memerlukan 16,2 pergantian untuk
melaporkan perubahan yang tidak penting, seperti ketinggian pagar di belakang dua orang yang duduk di meja.
Sekali lagi, hasil ini masuk akal (Saylor & Baldwin, 2004). Makna dasar adegan dengan pilot akan
sangat berbeda jika helikopter berada di dekatnya, bukan jauh. Sebaliknya, ketinggian pagar tidak
mengubah makna sebenarnya dari pemandangan di meja.
Studi tambahan mengkonfirmasi bahwa orang secara mengejutkan buta terhadap perubahan
nyata pada objek yang mereka lihat (misalnya, Saylor & Baldwin, 2004; Scholl et al., 2004; Simons et
al., 2002). Secara umum, ketika kita melihat sebuah adegan dengan banyak objek, kita biasanya tidak
menyimpan representasi detail dari setiap item dalam adegan tersebut (Gillam et al., 2007). Menariknya,
efek ini juga meluas ke modalitas pendengaran, yang disebut dengan “Perubahan Ketulian”. Fenn
dkk. (2011) menunjukkan, misalnya, bahwa sebagian besar individu tidak menyadari ketika suara
pembicara berubah di tengah percakapan telepon (Fenn et al., 2011).
Kebutaan yang Tidak Disengaja. Secara umum para psikolog menggunakan istilah kebutaan perubahan
ketika orang gagal melihat perubahan di beberapa bagian stimulus. Sebaliknya, mereka menggunakan
istilah kebutaan yang tidak disengaja adalah ketika orang tidak menyadari bahwa objek baru telah
muncul (Moore, 2010). Namun dalam kedua kasus tersebut, orang menggunakan pemrosesan top-
down saat mereka berkonsentrasi pada beberapa objek dalam sebuah pemandangan. Akibatnya,
ketika suatu objek muncul yang tidak sesuai dengan konsep, harapan, dan ingatannya, orang
sering kali gagal mengenali objek yang diubah tersebut (kebutaan perubahan) atau pengenalan
objek baru (kebutaan yang tidak disengaja).
Sekarang mari kita perhatikan studi dramatis tentang kebutaan yang tidak disengaja. Simons
dan Chabris (1999) meminta peserta untuk menonton rekaman video orang-orang bermain bola basket.
Peserta ini diinstruksikan untuk menghitung secara mental berapa kali anggota kelompok tertentu
melakukan umpan pantulan atau umpan udara. Tak lama setelah video dimulai, seseorang yang
mengenakan kostum gorila masuk ke lokasi kejadian dan diam di sana selama 5 detik. Hebatnya,
46% peserta tidak memperhatikan gorila tersebut!
Penelitian lain menegaskan bahwa orang sering gagal memperhatikan suatu objek baru,
jika mereka memperhatikan sesuatu yang lain (Chabris & Simons, 2010; Most et al.,
2001; Most et al., 2005). Kebetulan, situs Web Daniel Simons berisi beberapa
demonstrasi menarik dari penelitiannya, termasuk “studi pintu” yang dibahas di atas
serta “studi gorila”: http://www.simonslab.com./videos.html
Seperti yang bisa Anda bayangkan, orang lebih mungkin mengalami kebutaan karena
kurangnya perhatian ketika tugas utamanya menuntut secara kognitif (Simons & Jensen, 2009).
Jika tugas utama dalam penelitian ini adalah memantau gerakan-gerakan dalam permainan catur
santai—dibandingkan gerakan dalam bola basket—bukankah orang-orang akan lebih kecil
kemungkinannya mengalami kebutaan yang tidak disengaja?
Kita baru saja melihat bahwa orang-orang sering kali melakukan dua kesalahan persepsi yang
serupa, yaitu kebutaan karena perubahan dan kebutaan karena kurangnya perhatian. Tema 2 buku
teks ini menyatakan bahwa proses kognitif kita sangat efisien dan akurat. Bagaimana kita dapat
menggabungkan kedua jenis kesalahan tersebut dengan tema ini? Salah satu poin penting adalah
bahwa banyak rangsangan visual yang tidak dapat dilihat oleh manusia tidak memiliki validitas ekologis yang tinggi (
Suatu penelitian memiliki validitas ekologis yang tinggi jika kondisi di mana penelitian tersebut
dilakukan serupa dengan kondisi alam di mana hasilnya akan diterapkan. Sejujurnya, saya ragu
apakah ada orang yang membaca buku ini pernah melihat seseorang berkostum gorila berjalan-
jalan di pertandingan bola basket!
Namun, Anda mungkin dapat mengingat saat Anda sedang mencari sesuatu dan gagal
menemukannya ketika berada di lokasi yang tidak terduga. Baik kebutaan perubahan maupun
kebutaan karena kurangnya perhatian juga dapat terjadi dalam kehidupan kita sehari-hari.
Simons dan Levin (1997a) menekankan bahwa kita sebenarnya berfungsi dengan baik dalam
lingkungan visual normal. Jika Anda berjalan di sepanjang jalan kota yang sibuk, berbagai
representasi persepsi akan berubah dengan cepat dari satu pandangan ke pandangan berikutnya.
Orang-orang menggerakkan kakinya, memindahkan tas ke lengan yang lain, dan menghilang di
balik rambu lalu lintas. Jika Anda melacak setiap detail dengan tepat, sistem visual Anda akan
dengan cepat kewalahan oleh perubahan-perubahan sepele. Sebaliknya, sistem visual Anda cukup
akurat dalam menciptakan “inti”, atau interpretasi umum sebuah adegan. Anda hanya fokus pada
informasi yang tampaknya penting, seperti kedekatan bus yang mendekat saat Anda menyeberang
jalan, dan Anda mengabaikan detail yang tidak penting. Kebutaan perubahan dan kebutaan karena
kurangnya perhatian menggambarkan poin yang kami sampaikan sehubungan dengan Tema 2:
Kesalahan kognitif kita sering kali dapat ditelusuri ke strategi rasional.
Proses Pengenalan Visual Khusus 59
1) Efek keunggulan kata adalah pada temuan bahwa orang dapat mengidentifikasi:
a) sebuah kata lebih baik jika muncul secara terpisah daripada muncul di akhir kalimat yang
bermakna.
b) suatu kata lebih baik jika ditulis dengan huruf besar (kapital) dibandingkan jika ditulis dengan huruf kapital
dalam huruf kecil (kecil).
c) satu huruf lebih baik bila muncul dalam suatu kata yang bermakna daripada bila muncul
dengan sendirinya atau dalam rangkaian huruf yang tidak berarti.
d) satu huruf lebih baik bila muncul dengan sendirinya dibandingkan jika muncul di tengah-tengah
suatu kata yang bermakna.
2) Stimulus yang sama (misalnya, “kacang” atau “beruang”) dapat dirasakan dengan cara yang berbeda
tergantung pada konteks kalimat (misalnya, “Petani membesarkan . . . ” vs. “Penjaga kebun
binatang membesarkan . . . ”). Hal ini mendukung pandangan bahwa pengenalan kata melibatkan:
a) pemrosesan dari bawah ke
atas. b) pemrosesan dari atas
ke bawah. c) pemrosesan bottom-up dan top-down. d)
proses selain pemrosesan bottom-up dan top-down.
3) Penelitian tentang kebutaan terhadap perubahan dan kebutaan karena kurangnya perhatian mengungkapkan bahwa orang-orang:
a) cenderung melakukan kesalahan kognitif karena tidak menggunakan informasi yang rasional-
strategi pengolahan.
b) sering gagal menyadari ketika suatu objek dalam suatu adegan telah berubah atau ketika ada objek baru
telah muncul.
c) biasanya akan memperhatikan kemunculan suatu objek baru hanya jika mereka memperhatikan
objek lain secara dekat. d)
Semua hal di atas benar.
PROSES PENGENALAN VISUAL KHUSUS
Sejauh ini, eksplorasi pengenalan visual kita terutama berfokus pada cara kita memahami huruf-huruf
alfabet atau berbagai objek. Kami mencatat bahwa fitur-fitur yang terkandung dalam masukan visual
diproses di korteks visual primer. Kami juga mencatat bahwa sejumlah besar struktur saraf tambahan
terlibat dalam pengenalan objek visual setelah pemrosesan informasi terjadi di korteks visual primer.
Namun menarik untuk dicatat bahwa pemrosesan jenis rangsangan visual tertentu tampaknya
didukung, setidaknya sebagian, oleh proses saraf dan kognitif yang agak terspesialisasi. Artinya, bagian
otak tertentu menjadi aktif ketika diberikan rangsangan tertentu. Proses pengenalan khusus telah
diusulkan untuk pengenalan wajah (misalnya, Kanwisher, et al., 1997; Sergent et al., 1992),
lokasi tertentu dan tata ruang (misalnya, Epstein & Kanwisher, 1998), dan kata-kata visual (misalnya,
Dehaene et al., 2002). Jenis rangsangan ini sering terjadi dan sangat penting untuk menavigasi dan
menafsirkan lingkungan visual seseorang. Oleh karena itu, ada kemungkinan bahwa bagian tertentu dari
jaringan saraf menjadi sangat terspesialisasi selama perkembangannya untuk mendukung pemrosesan
jenis rangsangan ini (McCandliss et al., 2003).
Pada bagian ini, kami mempertimbangkan penelitian tentang pengenalan wajah. Bagaimana cara
mengenali teman hanya dengan melihat wajah orang tersebut? Tugas ini seharusnya menantang, karena
semua permukaan mempunyai bentuk umum yang sama. Komplikasi selanjutnya adalah Anda dapat
mengenali wajah teman Anda Monica—bahkan ketika Anda melihat wajahnya dari sudut yang berbeda,
dalam suasana yang tidak biasa, dan menunjukkan ekspresi cemberut yang tidak terduga. Yang
mengesankan, Anda berhasil mengatasi semua sumber variasi ini (Esgate & Groome, 2005; McKone, 2004;
Styles, 2005). Hampir seketika, Anda menyadari bahwa orang tersebut memang Monica. Perhatikan betapa
pentingnya kemampuan pengenalan wajah bagi kehidupan sosial Anda (dan pikirkan betapa anehnya
hidup jika Anda tidak dapat mengenali wajah satu per satu).
Kami akan mempertimbangkan empat bidang penelitian di bagian bab ini. Pertama, kita akan
memeriksa beberapa penelitian berbasis laboratorium yang menunjukkan bahwa sistem persepsi kita
memproses wajah manusia secara berbeda dari rangsangan visual lainnya. Selanjutnya, kita akan
membahas penelitian ilmu saraf tentang persepsi wajah. Kami kemudian akan mengeksplorasi beberapa penelitian terapan ten
Mengenali Wajah Versus Mengenali Objek Lain

Para peneliti menekankan bahwa kebanyakan orang memandang wajah dengan cara yang berbeda dari
rangsangan lainnya. Dengan kata lain, persepsi wajah bersifat “istimewa” (Farah, 2004; McKone, 2004).
Misalnya, bayi muda lebih banyak melacak pergerakan wajah manusia yang difoto dibandingkan
rangsangan serupa lainnya (Bruce et al., 2003; Johnson & Bolhuis, 2000).
Demikian pula, Tanaka dan Farah (1993) menemukan bahwa partisipan penelitian adalah signifikan -
jauh lebih akurat dalam mengenali fitur wajah ketika fitur tersebut muncul dalam konteks keseluruhan
wajah, dibandingkan secara terpisah. Misalnya, mereka mengenali hidung dalam konteks seluruh wajah
jauh lebih akurat dibandingkan hidung terisolasi. Peserta yang sama juga menilai bagian-bagian sebuah
rumah. Dalam “kondisi rumah” ini, mereka sama akuratnya dalam mengenali fitur rumah (seperti jendela)
dalam konteks keseluruhan rumah, dibandingkan mengenali jendela secara terpisah.
Kita mengenali rumah dan sebagian besar objek lainnya dengan mengidentifikasi fitur-fitur individual
yang digabungkan untuk menciptakan objek-objek tersebut. Sebaliknya, wajah rupanya mempunyai status
istimewa dan istimewa dalam sistem persepsi kita. Kami mengenali wajah berdasarkan holistik-tikholistik
(pengenalan)—yaitu, berdasarkan bentuk dan struktur keseluruhannya (Richler et al., 2011). Dengan kata
lain, kita melihat wajah dalam kaitannya dengan gestalt atau kualitas keseluruhan yang melampaui elemen
individualnya. Masuk akal jika persepsi wajah memiliki status khusus, mengingat pentingnya wajah dalam
interaksi sosial kita (Fox, 2005; Macrae & Quadl ieg, 2010; Styles, 2005).
Penelitian Ilmu Saraf tentang Pengenalan Wajah

Sebagian besar penelitian tentang pengenalan wajah berasal dari disabilitas yang dikenal sebagai
prosopagno-sia (diucapkan “pros-o-pag-no-zhe-ah”). Orang dengan prosopagnosia tidak dapat mengenali
wajah manusia secara visual, meskipun mereka melihat objek lain secara relatif normal (Farah, 2004).
Pertimbangkan kasus seorang wanita dengan prosopagnosia yang berusia awal 30an, dan
dia baru saja menyelesaikan gelar PhD. Dia menggambarkan sebuah pengalaman ketika dia
pergi menjemput bayi laki-lakinya di pusat penitipan anak. “Saya menemui bayi yang salah di
tempat penitipan anak saya dan baru menyadari bahwa dia bukan anak saya ketika seluruh staf
penitipan anak menatap saya dengan rasa tidak percaya” (Duchaine & Nakayama, 2006, hal. 166).
Banyak studi kasus ilmu saraf menunjukkan bahwa individu dengan prosopagnosia dapat
dengan mudah mengenali objek umum. Misalnya, pria dengan prosopagnosia dapat dengan
cepat mengidentifikasi kursi, cangkir kopi, atau sweter. Dia bahkan mungkin melihat wajah
seorang wanita yang tersenyum dan melaporkan bahwa dia tampak bahagia. Namun, dia
mungkin tidak menyadari bahwa wanita ini adalah istrinya sendiri! Selain itu, penderita
prosopagnosia sering kali melaporkan bahwa berbagai bagian wajah seseorang—seperti
hidung, mulut, dan dua mata—tampak tidak bergantung satu sama lain, bukannya membentuk
wajah yang utuh dan utuh (Farah, 2004; Gazzaniga dkk. al., 2009).
Sebelumnya, kami telah menyebutkan bahwa lobus oksipital, di bagian belakang otak
Anda, adalah lokasi di bagian korteks yang bertanggung jawab atas pemrosesan visual awal
dan paling dasar. Informasi kemudian berpindah dari lobus oksipital ke berbagai lokasi lain di
seluruh otak. Lokasi yang paling bertanggung jawab untuk pengenalan wajah adalah korteks
temporal, di sisi otak Anda (Farah, 2004; Kanwisher et al., 2001; Sinha et al., 2010). Lokasi
spesifiknya dikenal sebagai area wajah fusiform, di bagian bawah korteks temporal (Kanwisher
et al., 1997).
Para peneliti juga telah menguji monyet dengan menggunakan teknik pencatatan ilmu saraf.
Mereka melaporkan bahwa sel-sel tertentu di korteks inferotemporal memberikan respons yang
sangat kuat terhadap foto wajah monyet lain (Rolls & Tovee, 1995; Wang et al., 1996).
Bab 1 menjelaskan tentang teknik fMRI, yaitu teknik untuk memperoleh gambaran aktivitas
otak manusia. Studi fMRI menunjukkan bahwa area wajah fusiform lebih aktif ketika seseorang
terpapar gambar wajah. Mereka telah menunjukkan bahwa otak merespons lebih cepat terhadap
wajah-wajah yang ditampilkan dalam posisi normal dan tegak, dibandingkan dengan wajah-
wajah yang ditampilkan dalam posisi terbalik (D'Esposito dkk., 1999). Demikian pula, penelitian
perilaku menunjukkan bahwa orang jauh lebih akurat dalam mengidentifikasi wajah yang tegak,
dibandingkan dengan wajah yang terbalik, sebuah fenomena yang disebut efek inversi wajah.
(Macrae & Quadl misalnya, 2010; Wilford & Wells, 2010; Wolfe dkk., 2009). Penelitian ini masih
jauh dari sempurna, namun mungkin dapat menjelaskan mengapa persepsi wajah tampaknya
mengikuti aturan yang berbeda, menekankan proses holistik dibandingkan komponen yang terisolasi.
Namun, penting untuk dicatat bahwa terdapat banyak kontroversi mengenai cara
menafsirkan data ini dan data ilmu saraf serupa. Meskipun data perilaku menunjukkan perbedaan
pemrosesan tertentu untuk kelompok rangsangan tertentu (seperti wajah), masih kurang jelas
apakah pemrosesan rangsangan tersebut benar-benar didukung oleh atau dilokalisasikan ke
area korteks tertentu. Misalnya, rangsangan selain wajah menghasilkan pola aktivasi di area
wajah fusiform. Memang benar, beberapa orang berpendapat bahwa area wajah fusiform benar-
benar merupakan area yang sensitif terhadap pemrosesan rangsangan yang mana individu
mempunyai banyak keahlian (Gauthier et al., 2000). Faktanya, Gauthier dan rekannya (2000)
menemukan bahwa ketika ahli mobil dan ahli burung masing-masing terpapar pada mobil atau
burung, area wajah fusiform diaktifkan. Oleh karena itu, area wajah fusiform mungkin tidak
dirancang untuk memproses informasi tentang wajah saja. Penelitian di masa depan akan
diperlukan untuk menentukan ada atau tidaknya struktur saraf spesifik yang dirancang untuk
memproses kelas rangsangan visual tertentu.
Penelitian Terapan tentang Pengenalan Wajah

Seperti yang telah kami catat sebelumnya, banyak psikolog kognitif kini menekankan pentingnya
validitas ekologis. Penelitian terapan tentang pengenalan wajah berfokus pada situasi kehidupan
nyata yang menganggap penting untuk mengenali wajah orang.
Kemp dan rekan penulisnya (1997) mempelajari keakuratan kasir supermarket yang telah
diinstruksikan untuk membuat penilaian tentang foto identitas. Khususnya, mahasiswa sarjana
diberikan kartu kredit yang menunjukkan foto berwarna wajah mereka berukuran 1ÿ × 1ÿ . Setiap
siswa disuruh memilih beberapa barang di supermarket dan kemudian menunjukkan kartu
kreditnya kepada kasir. Kasir kemudian dapat memutuskan apakah akan menerima atau menolak kartu kredit tersebu
Ketika siswa membawa kartu kredit yang menunjukkan foto mereka sendiri, 93% kasir
menerima kartu tersebut dengan benar. Namun, ketika siswa membawa kartu yang menunjukkan
foto orang lain—yang terlihat cukup mirip—mereka hanya menolak foto tersebut dengan benar
sebanyak 36%. Dengan kata lain, mereka membiarkan seseorang dengan foto ID yang salah
melewati mereka sebanyak 64%!
Studi terapan lainnya mengenai pengenalan wajah berfokus pada sistem pengawasan
keamanan. Banyak bank, bisnis, dan institusi menggunakan sistem keamanan video, biasanya
menangkap orang yang berjalan melewati pintu. Burton dan rekan penulisnya (1999) meminta
orang untuk melihat klip video profesor psikologi yang berjalan melewati pintu masuk departemen
psikologi di Universitas Glasgow di Skotlandia.
Pertama, seluruh peserta penelitian melihat serangkaian video klip 10 profesor.
Selanjutnya, mereka semua melihat serangkaian foto berkualitas tinggi dari 20 profesor; 10
profesor ini pernah muncul dalam video, dan 10 lainnya tidak. Para peserta diinstruksikan untuk
menilai setiap foto, menggunakan skala dari 1 (menunjukkan kepastian bahwa mereka belum
pernah melihat orang tersebut dalam video) hingga 7 (menunjukkan kepastian bahwa mereka telah melihat orang ter
Burton dan rekan-rekannya (1999) juga menguji tiga kategori peserta.
Dua puluh peserta telah diajar oleh 10 profesor di klip video.
Dua puluh orang adalah mahasiswa lain yang belum pernah diajar oleh salah satu profesor
tersebut, dan 10 orang adalah petugas polisi berpengalaman yang tidak mengenal satu pun profesor tersebut.
Gambar 2.7 menunjukkan penilaian yang diberikan oleh tiga kategori peserta. Seperti yang
Anda lihat, para siswa yang akrab dengan para profesor memiliki pengenalan yang sangat akurat.
Para mahasiswa ini sangat percaya diri dalam mengidentifikasi 10 profesor yang benar-benar
muncul dalam video tersebut, dan mereka juga sangat yakin bahwa 10 profesor lainnya tidak
muncul dalam video tersebut.
Namun, ketika mahasiswa belum mengenal profesor tersebut, mereka hanya sedikit lebih
percaya diri mengenai profesor yang sebenarnya mereka lihat di video, dibandingkan dengan
profesor yang belum pernah mereka lihat. Sayangnya, petugas polisi yang berpengalaman tidak
lebih akurat dibandingkan siswa kelompok kedua. Penelitian tambahan menegaskan bahwa orang
jauh lebih akurat dalam mengidentifikasi wajah-wajah yang dikenal dibandingkan wajah-wajah
yang tidak dikenal (Bruce et al., 2001; Henderson et al., 2001).
Kedua studi psikologi terapan ini telah mengeksplorasi apakah orang dapat mencocokkan
dua gambar wajah seseorang secara akurat. Penelitian lain meneliti apakah orang dapat membuat
penilaian yang akurat mengenai karakteristik tertentu dari wajah seseorang. Misalnya, Matthew
Rhodes (2009) mengulas penelitian di mana partisipan penelitian mencoba menebak usia seseorang
yang tidak dikenalnya. Secara umum, orang menebak dengan cukup akurat.
63
Proses Pengenalan Visual Khusus
GAMBAR 2.7
Keyakinan Peserta Tentang Pernah Melihat Orang Sasaran di Video Tadi,

Sebagai Fungsi Jenis Pengamat dan Benar atau Tidaknya Orang Sasaran
Muncul di Video.
6 Terlihat
Tak terlihat
5
4
Tingkat
0
Siswa Siswa POLISI
akrab dengan tidak terbiasa dengan tidak terbiasa dengan
profesor profesor profesor
Sumber: Burton, AM, Wilson, S., Cowan, M., & Bruce, V. (1999). Pengenalan wajah
dalam video berkualitas buruk: Bukti dari pengawasan keamanan. Ilmu Psikologi, 10, 243–248.
Perhatikan bahwa penelitian ini mempunyai penerapan penting ketika petugas mencoba
memutuskan apakah seorang remaja cukup umur untuk membeli produk seperti alkohol atau tembakau.
Penelitian pengenalan wajah juga dapat menjelaskan bagaimana individu dengan diagnosis
klinis memproses informasi visual secara berbeda dibandingkan mereka yang tidak memiliki diagnosis serupa.
Sebuah contoh yang baik dari penelitian interdisipliner ini berfokus pada hubungan antara
skizofrenia dan identifikasi wajah.
Skizofrenia adalah salah satu gangguan psikologis yang paling serius. Orang dengan
skizofrenia biasanya tidak menunjukkan emosi yang intens, dan mereka mungkin mengalami
halusinasi. Bagi siswa yang mempelajari psikologi kognitif, aspek yang sangat penting adalah
pemikiran yang tidak teratur. Selain itu, individu dengan skizofrenia cenderung memiliki kinerja
buruk dalam banyak tugas kognitif (Reichenberg & Harvey, 2007)
Para peneliti juga melaporkan bahwa penderita skizofrenia tampaknya mengalami kesulitan
dalam memahami wajah dan ekspresi wajah (Bediou et al., 2005; Hall et al., 2004; Martin et al.,
2005). Namun, Edith Pomarol-Clotet dan rekannya (2010) berhipotesis
bahwa buruknya kinerja dalam menilai wajah mungkin disebabkan oleh masalah yang lebih
umum pada tugas kognitif, dibandingkan kesulitan khusus pada wajah. Oleh karena itu, para
peneliti ini dengan cermat mencocokkan dua sampel mereka, yaitu kelompok yang terdiri
dari 22 orang dengan skizofrenia dan 20 anggota komunitas tanpa skizofrenia. Kedua
kelompok tersebut dicocokkan berdasarkan skor mereka pada tes kecerdasan serta usia dan jenis kelamin.
Setiap orang menilai satu set standar yang terdiri dari 60 foto wajah orang; foto-foto ini
telah banyak digunakan dalam penelitian tentang ekspresi wajah. Ada 10 foto untuk masing-
masing enam emosi, dan setiap foto menunjukkan emosi tertentu dalam jumlah sedang.
Para peneliti tidak ingin tugas tersebut menjadi terlalu mudah atau terlalu sulit.
Seperti yang Anda lihat pada Gambar 2.8, kedua kelompok orang tersebut memiliki
tingkat akurasi yang serupa. Analisis lebih lanjut menunjukkan tidak ada perbedaan yang
signifikan antara kedua kelompok pada salah satu dari enam emosi. Namun, individu dalam kelompok kontrol
GAMBAR 2.8
Keakuratan Peserta dalam Menilai Emosi Wajah, Sebagai Fungsi Jenis Emosi dan Kelompok
(Penderita Skizofrenia dan Orang dalam Kelompok Kontrol yang Cocok).
Orang dengan Skizofrenia

100 Orang-orang dari kelompok kontrol
90
80
70
60
Persentase
50
40
30
20
10
0
Kemarahan Jijik Takut Kebahagiaan Kesedihan Kejutan
Sumber: Pomarol-Clotet, E., dkk. (2010). Pemrosesan emosi wajah pada

skizofrenia: Definisi neuropsikologis nonspesifik? Pengobatan Psikologis, 40, 911–919.
secara signifikan lebih cepat dibandingkan individu dengan skizofrenia, konsisten dengan penelitian
sebelumnya (Pomarol-Clotet et al., 2010). Tidak jelas mengapa kedua kelompok memiliki skor yang
sama, namun kecocokan kecerdasan mungkin menjadi faktor penting.
1) Orang mengenali ciri-ciri wajah manusia secara relatif lebih baik (dibandingkan dengan ciri-ciri
objek kompleks lainnya, seperti rumah) jika ciri-ciri tersebut muncul dalam konteks keseluruhan
wajah, bukan secara terpisah. Temuan seperti ini mendukung pandangan bahwa pengenalan
wajah:
a) adalah
“istimewa.” b) melibatkan
pemrosesan holistik. c) mempunyai status khusus dalam
sistem penglihatan manusia. d) Semua hal di atas benar.
2) Bayangkan Anda sedang membaca artikel tentang pengenalan wajah. Artikel tersebut berpendapat
bahwa orang menggunakan pemrosesan holistik ketika mereka melihat wajah. Manakah dari
kalimat berikut yang kemungkinan besar Anda lihat di artikel ini?
a) “Orang dengan prosopagnosia cenderung menggunakan pemrosesan holistik.”
b) “Lesi otak biasanya mendorong penggunaan pemrosesan holistik pada wajah
pengakuan."
c) “Orang memandang wajah melalui pemrosesan holistik, dalam bentuk gestalt, bukan elemen
yang terpisah.”
d) “Bayi cenderung menggunakan pemrosesan holistik, sedangkan orang dewasa menggunakan pemrosesan gestalt.”
3) Seseorang dengan prosopagnosia kemungkinan besar akan:

a) berkinerja lebih baik dibandingkan orang lain pada tes kebutaan perubahan.
b) kesulitan mengenali buah dan sayur.
c) gagal mengenali huruf-huruf alfabet.
d) kesulitan mengenali wajah.
4) Siswa manakah di bawah ini yang memberikan ringkasan penelitian terbaik tentang
menggunakan sistem keamanan video untuk mengenali wajah?
a) Alex: “Manusia ahli dalam pengenalan wajah; dengan sistem video ini, pengenalan wajah
mereka menjadi lebih akurat.”
b) Magali: “Dengan sistem video ini, orang dapat mengenali familiar dengan akurat
wajah, tapi bukan wajah asing.”
c) Emmanuel: “Dengan sistem video ini, orang-orang dapat mengenali wajah-wajah yang tidak mereka kenal dengan
akurat, namun tidak mengenali wajah-wajah yang mereka kenal.”
d) Rose: “Sayangnya, video biasanya sangat buram sehingga orang kesulitan mengenali wajah
yang dikenal dan tidak dikenal.”
PERSEPSI PIDATO
. memikirkan segala
Persepsi ucapan tampaknya sangat mudah dan lugas. . sampai Anda mulai
sesuatu yang harus Anda capai untuk memahami kalimat yang diucapkan.
Selama persepsi ucapan, sistem pendengaran Anda harus merekam getaran suara yang dihasilkan
oleh seseorang yang berbicara; maka sistem harus menerjemahkan getaran ini menjadi rangkaian
suara yang Anda anggap sebagai ucapan. Orang dewasa yang berbicara bahasa Inggris
menghasilkan sekitar 15 suara setiap detiknya (Kuhl, 1994). Oleh karena itu, Anda harus merasakan
sekitar 900 suara setiap menitnya.
Untuk memahami sebuah kata, Anda harus membedakan pola bunyi satu kata dari puluhan
ribu kata tidak relevan yang tersimpan dalam ingatan Anda. Dan—seolah-olah tugas ini tidak
cukup menantang—Anda harus memisahkan suara pembicara dari kebisingan latar belakang yang
tidak relevan. Latar belakang ini biasanya mencakup percakapan simultan lainnya serta beragam
suara nonucapan (Brown & Sinnott, 2006; Mattys & Liss, 2008; Plack, 2005). Faktanya, sungguh
menakjubkan bahwa kita bisa memahami bahasa lisan!
Persepsi ucapan sangatlah kompleks, dan Anda dapat menemukan rincian lebih lanjut di
buku teks lainnya (Foley & Matlin, 2010; Goldstein, 2010b; Wolfe et al., 2009). Kita akan membahas
dua aspek persepsi ucapan di bagian ini: (1) karakteristik persepsi ucapan dan (2) teori persepsi
ucapan.
Ciri-ciri Persepsi Ucapan

Lain kali Anda mendengarkan penyiar radio, perhatikan suara yang Anda dengar daripada arti kata-
katanya. Saat mendeskripsikan bunyi ujaran ini, psikolog dan ahli bahasa menggunakan istilah
fonem (diucapkan “musuh-neem”). Fonem adalah satuan dasar bahasa lisan, seperti bunyi a, k,
dan th. Bahasa Inggris menggunakan antara 40 dan 45 fonem, angka yang mencakup vokal dan
konsonan (Dahan, 2010). Saat Anda mendengarkan bahasa Inggris lisan, Anda mungkin berpikir
bahwa Anda mendengar periode tenang singkat di sepanjang rangkaian suara ini. Namun,
sebagian besar kata-kata tersebut hanya disusun secara berurutan.
Mari kita pertimbangkan beberapa karakteristik penting dari persepsi ucapan:
1. Pendengar dapat memberikan batasan antar kata, meskipun kata-kata tersebut tidak
dipisahkan oleh keheningan.
2. Pengucapan fonem sangat bervariasi.
3. Konteks memungkinkan pendengar mengisi beberapa suara yang hilang.
4. Isyarat visual dari mulut pembicara membantu kita menafsirkan suara yang ambigu.
Semua karakteristik ini memberikan bukti lebih lanjut untuk Tema 2 buku ini.
Meskipun stimulus bicara kurang sempurna, kita memahami ucapan dengan akurasi dan efisiensi
yang luar biasa.
Batasan Kata. Pernahkah Anda mendengar percakapan dalam bahasa asing?

Kata-kata itu mungkin tampak mengalir bersama-sama dalam aliran yang berkesinambungan, tanpa batas
Persepsi Ucapan 67
keheningan untuk memisahkan mereka. Anda mungkin berpikir bahwa batasan antar kata
tampak jauh lebih jelas dalam bahasa Inggris—hampir sama jelasnya dengan spasi putih yang
mengidentifikasi batasan antara dua kata yang berdekatan dalam buku teks ini. Namun dalam
kebanyakan kasus, stimulus akustik sebenarnya dari bahasa lisan tidak menunjukkan jeda
yang jelas untuk menandai batasannya. Peristiwa fisik yang sebenarnya—seperti jeda—
menandai batas kata kurang dari 40% (Davis et al., 2002; McQueen, 2005; Sell & Kaschak, 2009).
Yang mengesankan, kita jarang menyadari bahwa sulit untuk menentukan batasan kata.
Penelitian menunjukkan bahwa sistem pengenalan ucapan kami pada awalnya
mempertimbangkan beberapa hipotesis berbeda tentang cara membagi frasa menjadi kata-
kata. Sistem ini dengan segera dan mudah menggunakan pengetahuan kita tentang bahasa
untuk menempatkan batasan pada lokasi yang tepat (Grossberg et al., 2004; McQueen, 2005;
Pitt, 2009; Samuel, 2011). Untungnya, pengetahuan ini biasanya membawa kita pada kesimpulan yang benar.
Variabilitas dalam Pengucapan Fonem. Memahami fonem pada awalnya tidak tampak
seperti tugas yang menantang. Lagi pula, bukankah kita hanya mendengar sebuah fonem dan
langsung memahaminya? Sebenarnya persepsi fonem tidaklah semudah itu. Misalnya, penutur
sangat bervariasi dalam nada dan nada suaranya, serta kecepatan produksi fonemnya
(McQueen, 2005; Plack, 2005; Uchanski, 2005).
Sumber variabilitas yang kedua adalah penutur sering kali gagal menghasilkan fonem
dengan tepat (Foley & Matlin, 2010; Pitt, 2009; Plack, 2005). Cobalah Demonstrasi 2.5 untuk
memahami masalah pengucapan yang ceroboh yang harus dipecahkan oleh pendengar.
Demonstrasi 2.5
Variabilitas dalam Pengucapan Fonem

Nyalakan radio dan cari stasiun tempat Anda mendengar seseorang berbicara.
Setelah mendengar satu atau dua kalimat, matikan radio dan tuliskan kedua kalimat
tersebut. Cobalah untuk menentukan apakah pembicara menghasilkan setiap
fonem dengan tepat. Misalnya, apakah pembicara menghilangkan sebagian kata
(misalnya, dilontarkan , bukan dikira)? Apakah dia mengucapkan konsonan seperti
k atau p dengan tepat? Sekarang cobalah mengucapkan kata-kata dalam setiap
kalimat dengan sangat hati-hati, sehingga setiap fonem dapat diidentifikasi dengan jelas.
Sumber variabilitas ketiga disebut koartikulasi: Saat Anda mengucapkan fonem tertentu,
bentuk mulut Anda tetap sama seperti saat Anda mengucapkan fonem sebelumnya; selain itu,
mulut Anda sedang bersiap untuk mengucapkan fonem berikutnya. Akibatnya, fonem yang
Anda hasilkan sedikit berbeda dari waktu ke waktu, bergantung pada fonem di sekitarnya
(Conway et al., 2010; Diehl et al., 2004; McQueen, 2005). Misalnya, perhatikan bahwa d pada
saat idle terdengar berbeda dengan d pada jangan.
Meskipun terdapat variabilitas yang luar biasa dalam pengucapan fonem, kita masih dapat
memahami fonem yang dimaksudkan oleh pembicara. Faktor-faktor seperti konteks dan isyarat
visual membantu kita mencapai tujuan ini.
Konteks dan Persepsi Ucapan. Manusia adalah pendengar yang aktif, sesuai dengan Tema 1.
Daripada menerima bunyi ujaran secara pasif, kita dapat menggunakan konteks sebagai isyarat untuk
membantu kita mengenali bunyi atau kata (Cleary & Pisoni, 2001; Warren, 2006). Kita telah melihat
sebelumnya dalam bab ini bahwa konteks dan faktor top-down lainnya mempengaruhi persepsi visual.
Faktor top-down juga mempengaruhi persepsi ucapan (Tema 5), karena kita menggunakan pengetahuan
kita yang luas tentang bahasa untuk membantu kita memahami kata-kata yang ambigu.
Misalnya, saat Anda mendengarkan ceramah profesor Anda, suara-suara asing terkadang
menutupi fonem. Orang-orang menjatuhkan buku dari meja, batuk, membalik halaman, dan berbisik.
Namun, tanpa banyak usaha, Anda biasanya dapat merekonstruksi suara yang hilang.
Orang cenderung menunjukkan restorasi fonemik: Mereka dapat mengisi fonem yang hilang, dengan
menggunakan makna kontekstual sebagai isyarat (Conway et al., 2010).
Dalam sebuah penelitian klasik, Warren dan Warren (1970) menunjukkan bahwa orang terampil
menggunakan makna kalimat untuk memilih kata yang tepat dari beberapa pilihan. Mereka memutar
rekaman beberapa kalimat untuk peserta penelitian mereka:
1. Ditemukan *belut berada pada porosnya.

2. Ditemukan *belut ada di sepatu.
3. Ditemukan *belut ada di atas jeruk.
Para peneliti menyisipkan suara batuk pada lokasi yang ditunjukkan oleh aster-isk. Kalimat-
kalimat yang diucapkan ini identik dengan satu pengecualian: Kata yang berbeda disambungkan ke
akhir setiap kalimat. Hasil penelitian menunjukkan bahwa orang biasanya mendengar “kata” *belut
sebagai roda pada kalimat pertama, tumit pada kalimat kedua, dan kupas pada kalimat ketiga. Maka
dalam penelitian ini, orang dapat merekonstruksi kata yang hilang berdasarkan isyarat konteks di
akhir kalimat, yang muncul empat kata kemudian!
Perhatikan bahwa restorasi fonemik adalah sejenis ilusi. Orang mengira mereka mendengar
sebuah fonem, padahal getaran suara yang benar tidak pernah sampai ke telinga mereka. Restorasi
telepon-mikrofon adalah fenomena yang terdokumentasi dengan baik, dan telah dibuktikan dalam
banyak penelitian (Liederman et al., 2011; Samuel, 2011; Warren, 2006). Kemampuan kita untuk
memahami sebuah kata berdasarkan konteksnya juga memungkinkan kita mengatasi pengucapan
yang ceroboh dari pembicara, masalah yang telah kita sebutkan sebelumnya.
Salah satu penjelasan penting mengenai pengaruh konteks terhadap persepsi adalah pemrosesan
dari atas ke bawah, meskipun para peneliti telah memberikan penjelasan tambahan (Foley & Matlin,
2010; Grossberg dkk., 2004; Plack, 2005). Pendekatan pemrosesan top-down berpendapat bahwa kita
menggunakan pengetahuan kita tentang bahasa untuk memfasilitasi pengenalan, baik saat kita melihat
objek atau mendengarkan ucapan.
Memahami bahasa bukan sekadar proses pasif di mana kata-kata mengalir ke telinga kita,
menyediakan data untuk pemrosesan dari bawah ke atas. Sebaliknya, kita secara aktif menggunakan
pengetahuan kita tentang bahasa untuk menciptakan ekspektasi tentang apa yang mungkin kita
dengar (Brown, Salverda, Dilley, & Tanenhaus, 2011; Dahan & Tanenhaus, 2004; Kleinschmidt &
Jaeger, 2015; Magnuson et al., 2008).
Isyarat Visual sebagai Bantuan Persepsi Ucapan. Cobalah Demonstrasi 2.6 bila Anda memiliki
kesempatan. Latihan sederhana ini menggambarkan bagaimana isyarat visual berkontribusi terhadap
persepsi ucapan (Gazzaniga et al., 2009; Smyth et al., 1994). Informasi dari
Persepsi Ucapan 69
bibir dan wajah pembicara membantu mengatasi ambiguitas dari sinyal ucapan. Demikian
pula, Anda dapat mendengar percakapan dengan lebih akurat ketika Anda mengamati bibir
pembicara dengan cermat, dibandingkan mendengarkan percakapan melalui telepon (Massaro
& Stork, 1998). Bahkan dengan koneksi telepon yang bagus, Anda melewatkan isyarat bibir
yang memberi tahu Anda apakah pembicara sedang membicarakan Harry atau Mary.
Demonstrasi 2.6
Isyarat Visual dan Persepsi Ucapan

Lain kali Anda berada di ruangan yang terdapat televisi dan radio, cobalah
latihan ini. Alihkan perangkat TV ke berita atau program lain di mana seseorang
berbicara langsung ke kamera; jaga volumenya tetap rendah. Sekarang
nyalakan radio Anda dan setel di antara dua stasiun, sehingga menghasilkan
suara mendesis. Keraskan volume radio sampai Anda kesulitan memahami
apa yang dikatakan orang di televisi. “White noise” radio seharusnya hampir
menutupi suara pembicara. Hadapi layar TV dan pejamkan mata Anda;
mencoba memahami kata-kata yang diucapkan. Lalu buka matamu. Apakah menurut Anda persepsi ucapan kin
Sumber: Berdasarkan Smyth dkk., 1987.
Para peneliti telah menunjukkan bahwa kita mengintegrasikan isyarat visual dengan
isyarat pendengaran selama persepsi bicara—meskipun kita tidak menyadari kegunaan isyarat
visual ini (Nicholls et al., 2004). Hasil ini telah direplikasi untuk penutur bahasa Inggris,
Spanyol, Jepang, dan Belanda (Massaro, 1998; Massaro et al., 1995).
Penelitian McGurk dan MacDonald (1976) memberikan ilustrasi klasik tentang kontribusi
isyarat visual terhadap persepsi ucapan. Para peneliti ini menunjukkan kepada partisipan
video seorang wanita yang bibirnya mengeluarkan suku kata sederhana, seperti “gag.”
Sementara itu, para peneliti menyajikan informasi pendengaran yang berbeda (berasal dari
mesin yang sama), seperti “bab.”
Ketika para pengamat diminta untuk melaporkan apa yang mereka rasakan, tanggapan
mereka biasanya mencerminkan kompromi antara dua sumber informasi yang berbeda tersebut.
Dalam kasus ini, pendengar biasanya melaporkan mendengar kata “ayah”. Efek McGurk
mengacu pada pengaruh informasi visual terhadap persepsi ucapan, ketika individu harus
mengintegrasikan informasi visual dan pendengaran (Beauchamp et al., 2010; Rosenblum,
2005; Samuel, 2011).
Michael Beauchamp dan rekan-rekannya (2010) telah mengidentifikasi lokasi di dalam
korteks serebral yang menimbulkan efek McGurk. Daerah ini disebut sulkus temporal superior
(pada Gambar 2.1, daerah ini terletak di sisi kanan alur horizontal di sepanjang bagian tengah
lobus temporal korteks). Penemuan ini masuk akal, karena penelitian sebelumnya menunjukkan
bahwa wilayah ini bertanggung jawab atas tugas-tugas lain yang memerlukan integrasi
penglihatan dan suara (Hein & Knight, 2008).
Singkatnya, kita berhasil mempersepsikan ucapan dengan mengatasi masalah stimulus
ucapan yang kurang ideal. Kita melakukannya dengan mengabaikan variabilitas fonem
pengucapan dan dengan menggunakan konteks untuk menyelesaikan fonem yang ambigu. Jika kita
dapat mengamati pembicara yang menghasilkan alur pembicaraan, informasi visual dari bibir pembicara
memberikan petunjuk tambahan yang berguna.
Teori Persepsi Ucapan

Pendekatan teoretis terkini terhadap persepsi ucapan terbagi dalam dua kategori.
Beberapa ahli teori percaya bahwa kita manusia harus memiliki mekanisme khusus dalam sistem saraf
kita yang menjelaskan kemampuan kita yang mengesankan dalam persepsi ucapan. Yang lain
mengagumi keterampilan manusia dalam persepsi ucapan, namun mereka berpendapat bahwa
mekanisme umum yang menangani proses kognitif lainnya juga menangani persepsi ucapan.
Sebelumnya dalam bab ini, kita menguji dua teori persepsi pola visual.
Sayangnya, para peneliti belum mengembangkan teori terperinci mengenai persepsi ucapan. Salah
satu penyebab masalah ini adalah manusia adalah satu-satunya spesies yang dapat memahami bahasa
lisan. Akibatnya, ahli saraf kognitif memiliki pilihan teknik penelitian yang terbatas.
Pendekatan Mekanisme Khusus. Menurut pendekatan mekanisme khusus (juga disebut

pendekatan wicara-is-khusus), manusia dilahirkan dengan perangkat khusus yang memungkinkan
kita memecahkan kode rangsangan wicara (Samuel, 2011). Hasilnya, kita memproses bunyi ucapan
lebih cepat dan akurat dibandingkan rangsangan pendengaran lainnya, seperti musik instrumental.
Pendukung pendekatan mekanisme khusus berpendapat bahwa manusia memiliki modul fonetik
(atau modul bicara), suatu mekanisme saraf tujuan khusus yang spesifik -
dengan cepat memproses semua aspek persepsi ucapan; ia tidak dapat menangani jenis persepsi
pendengaran lainnya. Modul fonetik ini kiranya akan memungkinkan pendengar memahami fonem-
fonem ambigu secara akurat. Hal ini juga akan membantu Anda untuk mensegmentasi aliran informasi
pendengaran yang kabur yang mencapai telinga Anda, sehingga Anda dapat memahami fonem dan
kata yang berbeda (Liberman, 1996; Liberman & Mattingly, 1989; Todd et al., 2006).
Pendekatan mekanisme khusus terhadap persepsi ucapan menunjukkan bahwa otak diatur
dengan cara yang tidak biasa. Secara khusus, modul yang menangani persepsi ucapan tidak akan melakukan hal tersebut
mengandalkan fungsi kognitif umum yang dibahas dalam buku ini—fungsi seperti mengenali objek,
mengingat peristiwa, dan memecahkan masalah (Trout, 2001). Perhatikan bahwa pendekatan modular
ini tidak konsisten dengan Tema 4 buku teks ini, yang berpendapat bahwa proses kognitif saling terkait
dan bergantung satu sama lain.
Salah satu argumen yang mendukung modul fonetik dianggap sebagai persepsi kategoris.
Peneliti awal meminta orang untuk mendengarkan serangkaian suara yang ambigu, seperti suara di
tengah-tengah antara a b dan a p. Orang yang mendengar suara-suara ini biasanya menunjukkan
persepsi kucing-egois; mereka mendengar bunyi b yang jelas atau p yang jelas , bukan bunyi di tengah-
tengah antara a b dan a p (Liberman & Mattingly, 1989), tetapi lihat McMurray dkk. (2002) untuk mencari
bukti yang bermasalah bagi pandangan dunia persepsi ucapan kategoris ini.
Ketika pendekatan mekanisme khusus pertama kali diusulkan, para pendukung berpendapat
bahwa orang-orang menunjukkan persepsi kategoris terhadap bunyi-bunyi ujaran, namun mereka
mendengar bunyi-bunyi nonucapan sebagai sebuah kontinum yang mulus. Namun, penelitian
menunjukkan bahwa manusia juga menunjukkan persepsi kategoris untuk beberapa suara nonucapan yang kompleks (Es
Persepsi Ucapan 71
Pendekatan Mekanisme Umum. Meskipun beberapa masih mendukung pendekatan

mekanisme khusus (Trout, 2001), sebagian besar ahli teori sekarang lebih menyukai salah satu
pendekatan mekanisme umum (misalnya, Cleary & Pisoni, 2001; Conway et al., 2010; Holt & Lotto,
2008; Toscano et al., 2010;Wolfe dkk., 2009). Pendekatan mekanisme umum berpendapat bahwa
kita dapat menjelaskan persepsi ucapan tanpa mengusulkan modul fonetik khusus apa pun.
Orang-orang yang mendukung pendekatan ini percaya bahwa manusia menggunakan mekanisme
saraf yang sama untuk memproses bunyi ujaran dan bunyi nonucapan (Foley & Matlin, 2010).
Oleh karena itu, persepsi ucapan merupakan kemampuan yang dipelajari—bahkan merupakan kemampuan belajar
yang sangat mengesankan—tetapi sebenarnya tidak “istimewa”.
Penelitian saat ini tampaknya mendukung pendekatan mekanisme umum. Seperti yang baru
saja kita catat, manusia menunjukkan persepsi kategoris terhadap bunyi nonucapan yang
kompleks. Penelitian lain yang mendukung sudut pandang mekanisme umum menggunakan potensi terkait peristiwa (ERP).
Penelitian ini menunjukkan bahwa orang dewasa menunjukkan urutan pergeseran potensial listrik
otak yang sama, baik saat mereka mendengarkan ucapan atau musik (Patel et al., 1998).
Bukti lain yang menentang modul fonetik adalah bahwa penilaian orang mengenai fonem
benar-benar dipengaruhi oleh isyarat visual, seperti yang kita lihat dalam pembahasan efek
McGurk (Beauchamp dkk., 2010; Rosenblum, 2005; Samuel, 2011). Jika persepsi ucapan dapat
dipengaruhi oleh informasi visual, maka kita tidak dapat berargumentasi bahwa modul fonetik
khusus menangani semua aspek persepsi ucapan.
Para peneliti telah mengembangkan beberapa teori mekanisme umum persepsi ucapan yang
berbeda (misalnya, Fowler & Galantucci, 2005; McQueen, 2005; Todd et al., 2006). Teori-teori ini
cenderung berpendapat bahwa persepsi ucapan berlangsung secara bertahap dan bergantung
pada proses kognitif yang sudah dikenal seperti pengenalan fitur, pembelajaran, dan pengambilan keputusan.
Singkatnya, kemampuan kita untuk memahami bunyi ujaran sangat mengesankan. Namun,
kemampuan ini mungkin dapat dijelaskan oleh kemampuan persepsi kita secara umum—
dikombinasikan dengan kemampuan kognitif kita yang lain—dan bukan karena mekanisme bicara
bawaan yang khusus. Kita berhasil membedakan bunyi ujaran dengan cara yang sama seperti kita
mengelola berbagai macam keterampilan kognitif yang kompleks.
1) Dalam sebagian besar percakapan biasa, batas akustik antara kata-kata yang berdekatan
adalah:
a) jelas dan berbeda. b)
biasanya tidak terlalu berbeda.

c) dipisahkan dengan jeda saat pembicara menarik napas. d)
ditandai dengan ekspresi wajah yang berbeda.
2) Bunyi ujaran memberikan informasi kepada pendengar yang kurang sempurna. Utama
temuan saya tentang persepsi bicara adalah bahwa orang-orang:
a) namun demikian memahami ucapan dengan akurasi yang luar

biasa. b) sangat tidak akurat dalam mengidentifikasi bunyi ujaran.
c) harus menerima pelatihan ekstensif agar dapat memahami ucapan secara

akurat. d) mampu mengidentifikasi bunyi ujaran yang ambigu hanya jika tidak ada isyarat kontekstual atau visua
disediakan.
3) Menurut buku teks Anda, efek McGurk:

a) menunjukkan bahwa informasi visual dapat mempengaruhi persepsi ucapan kita.
b) mirip dengan kontur ilusi, hanya saja terjadi selama persepsi ucapan.
c) menggambarkan bahwa kita sering berpikir kita mendengar batas antar kata, bahkan ketika
kata-kata tersebut disusun bersamaan.
d) menunjukkan bahwa fonem-fonem tidak diucapkan secara konsisten.
4) Menurut pendekatan mekanisme khusus terhadap persepsi bicara:

a) korteks motorik otak sangat aktif selama persepsi bicara.
b) konteks sangat penting dalam persepsi ucapan.
c) kita mempersepsikan ucapan dengan cara yang sama kita memandang rangsangan pendengaran lainnya.
d) persepsi ucapan memerlukan semacam modul fonetik, selain modul kita

proses kognitif umum.
Poin Ringkasan Bagian
GAMBARAN UMUM PENGENALAN OBJEK VISUAL
1. Persepsi menggunakan pengetahuan sebelumnya untuk mengumpulkan dan menafsirkan

rangsangan yang dicatat oleh indera; dalam pengenalan objek, kita mengidentifikasi susunan
rangsangan sensorik yang kompleks.
2. Informasi visual dari retina ditransmisikan ke korteks visual primer; daerah lain di korteks
aktif ketika kita mengenali objek yang kompleks.
3. Menurut prinsip gestalt, orang cenderung mengatur persepsi mereka, bahkan ketika
mereka menghadapi rangsangan gambar-dasar yang ambigu dan bahkan dalam
rangsangan kontur ilusi, ketika tidak ada batas yang benar-benar memisahkan gambar
dari latar belakang.
4. Teori analisis fitur merupakan salah satu teori pengenalan objek; Hal ini didukung oleh
penelitian yang menunjukkan bahwa orang memerlukan lebih banyak waktu untuk
membuat keputusan tentang dua huruf dalam alfabet ketika huruf-huruf tersebut memiliki
banyak fitur penting. Teori ini juga didukung oleh penelitian ilmu saraf.
5. Teori pengenalan berdasarkan komponen berpendapat bahwa objek direpresentasikan
dalam bentuk susunan bentuk 3-D sederhana yang disebut “geon”. Lebih jauh lagi,
menurut pendekatan yang berpusat pada penampil, kami juga menyimpan beberapa
tampilan alternatif dari bentuk 3-D ini, jika dilihat dari sudut yang berbeda.
Persepsi Ucapan 73
PEMROSESAN TOP-DOWN DAN PENGENALAN OBJEK VISUAL
1. Pemrosesan bottom-up menekankan pentingnya stimulus dalam pengenalan objek; sebaliknya,

pemrosesan top-down menekankan bagaimana konsep, harapan, dan ingatan seseorang
memengaruhi pengenalan objek. Kedua proses tersebut bekerja sama untuk memungkinkan kita
mengenali objek.
2. Saat kita membaca, konteks dapat memudahkan pengenalan; misalnya, efek keunggulan kata
menunjukkan bahwa kita dapat mengidentifikasi sebuah huruf dengan lebih akurat dan lebih cepat
bila huruf tersebut muncul dalam sebuah kata yang bermakna dibandingkan jika huruf tersebut
muncul dengan sendirinya atau dalam rangkaian huruf yang tidak bermakna.
3. Selama membaca, konteks kalimat mempengaruhi cara kita mengidentifikasi sebuah kata
kalimat itu.
4. Pemrosesan top-down yang terlalu aktif juga dapat mendorong kita untuk melakukan dua jenis
kesalahan: (a) kebutaan perubahan, atau kesalahan dalam mengenali bahwa suatu objek telah berubah—
misalnya, orang lain kini membawa sebuah pintu; dan (b) kebutaan yang tidak disengaja, atau tidak
menyadari bahwa ada benda baru yang muncul—misalnya, seekor gorila tiba-tiba muncul di
pertandingan bola basket.
PROSES PENGENALAN VISUAL KHUSUS
1. Masyarakat dapat dengan cepat mengenali wajah orang yang dikenalnya; sepertinya kita sedang memproses
wajah dalam kaitannya dengan gestaltnya, atau bentuk dan strukturnya secara keseluruhan.
2. Berbagai metode ilmu saraf—termasuk penelitian pada orang yang menderita prosopagnosia,
penelitian pada monyet, dan teknik fMRI—telah menunjukkan bahwa sel-sel di korteks inferotemporal
berperan dalam mengamati wajah.
3. Penelitian terapan menunjukkan bahwa orang tidak terlalu akurat dalam menilai apakah sebuah foto
cocok dengan wajah pemegang kartu. Selain itu, orang tidak terlalu akurat dalam menilai apakah
foto orang asing cocok dengan orang dalam video yang mereka lihat sebelumnya.
4. Individu dengan skizofrenia dapat mengidentifikasi emosi wajah seakurat orang-orang dalam kelompok
kontrol, ketika kedua kelompok tersebut cocok dalam hal usia, jenis kelamin, dan kecerdasan,
meskipun individu dengan skizofrenia biasanya membutuhkan waktu lebih lama untuk mengambil
keputusan.
PERSEPSI PIDATO
1. Persepsi ucapan adalah proses yang sangat rumit; ini menunjukkan bahwa manusia dapat dengan
cepat melakukan tugas-tugas kognitif yang sangat kompleks.
2. Bahkan ketika stimulus akustik tidak mengandung jeda yang jelas, orang-orang sangat akurat dalam
menentukan batas-batas antara kata-kata yang berdekatan.
3. Pengucapan suatu fonem tertentu sangat bervariasi, tergantung pada karakteristik vokal penuturnya,
ketidaktepatan pengucapannya, dan variabilitas yang disebabkan oleh koartikulasi.
4. Ketika ada suara yang hilang dari ucapan, pendengar sering kali mendemonstrasikan pemulihan
mikrofon telepon, menggunakan konteks untuk membantu mereka memahami suara yang hilang tersebut.
5. Orang menggunakan isyarat visual untuk memfasilitasi persepsi ucapan, seperti yang diilustrasikan
oleh efek McGurk; sulkus temporal superior adalah bagian dari korteks yang mengintegrasikan
penglihatan dan suara, dan integrasi ini juga membantu menjelaskan efek McGurk.
6. Menurut pendekatan mekanisme khusus terhadap persepsi ucapan, manusia memiliki perangkat
(atau modul) otak khusus yang memungkinkan kita memahami fonem lebih cepat dan akurat
dibandingkan suara nonucapan.
7. Bukti yang ada saat ini mendukung pendekatan mekanisme umum terhadap persepsi ucapan,
dibandingkan mekanisme khusus; penelitian menunjukkan bahwa manusia mempersepsikan bunyi
ujaran dengan cara yang sama seperti kita mempersepsikan bunyi nonucapan.
PERTANYAAN ULASAN BAB

1. Pikirkan seseorang yang Anda kenal baik, yang belum pernah mengikuti kursus psikologi kognitif.
Bagaimana Anda menggambarkan persepsi orang ini? Sebagai bagian dari uraian Anda, berikan
contoh dua tugas visual dan dua tugas pendengaran yang sering dilakukan orang ini. Berikan
rincian yang relevan, menggunakan istilah-istilah dari daftar kunci untuk bab ini.
2. Bayangkan Anda sedang mencoba membaca nomor yang ditulis sembarangan di catatan kelas
seorang teman. Anda menyimpulkan bahwa ini adalah angka 8, bukan angka 6 atau 3. Mengapa
pendekatan analisis fitur menjelaskan hal ini lebih baik daripada pendekatan yang memerlukan
pencocokan angka dengan templat tertentu?
3. Carilah dari buku Anda dan perhatikan dua benda di dekatnya. Jelaskan karakteristik masing-
masing “gambar”, berbeda dengan “dasar”. Bagaimana teori pengenalan berdasarkan komponen
Biederman menjelaskan cara Anda mengenali objek-objek ini?
4. Bedakan antara pemrosesan bottom-up dan top-down, sehubungan dengan visi. Jelaskan bagaimana
pemrosesan top-down dapat membantu Anda mengenali huruf-huruf alfabet dalam kata “alfabet”.
Bagaimana efek superioritas kata akan bekerja jika Anda mencoba mengidentifikasi satu huruf
dalam kata “alfabet”, jika kata yang dicetak ini disajikan dengan sangat cepat di komputer Anda?
Jika Anda mencoba membaca tulisan tangan seorang teman yang hampir tidak terbaca, apakah
pemrosesan top-down Anda akan bertambah atau berkurang, dibandingkan dengan membaca kata
yang tercetak di layar komputer Anda?
5. Bab ini menekankan pada pengenalan objek secara visual dan auditori, namun dapat juga diterapkan
pada indera lainnya. Bagaimana pemrosesan top-down (misalnya, pengetahuan sebelumnya)
beroperasi ketika Anda mencium wewangian tertentu dan mencoba mengidentifikasinya? Kemudian
jawab pertanyaan ini untuk rasa dan sentuhan.
Kata kunci 75
6. Berdasarkan materi dalam bab ini, pengenalan wajah terkesan “istimewa”, dan mungkin
berbeda dengan tugas pengenalan visual lainnya. Diskusikan pernyataan ini dengan
menyebutkan penelitian tentang perbandingan antara wajah dan rangsangan visual lainnya.
Pastikan untuk menjelaskan materi dari penelitian ilmu saraf tentang topik ini.
7. Kami memeriksa penelitian yang membandingkan orang dengan skizofrenia dan tanpa
skizofrenia, sehubungan dengan identifikasi ekspresi wajah. Apa yang ditemukan dalam
penelitian ini? Mengapa hasil penelitian ini mungkin berbeda dengan hasil penelitian
sebelumnya tentang skizofrenia?
8. Dunia visual dan dunia pendengaran kita sangat rumit. Jelaskan beberapa cara yang
menantang kompleksitas rangsangan proksimal, ketika kita mencoba menentukan rangsangan
distal yang “sebenarnya”. Bagaimana pendekatan gestalt membantu menjelaskan persepsi
visual? Faktor-faktor apa yang membantu kita mengatasi kesulitan dalam mengenali
pembicaraan sehari-hari?
9. Bukti apa yang mendukung pendekatan mekanisme umum terhadap persepsi ucapan?
Bandingkan pendekatan ini dengan pendekatan mekanisme khusus.
Bagaimana pendekatan mekanisme khusus dapat diterapkan pada keterampilan kita dalam
mengamati wajah?
10. Sepanjang buku ini, kami akan menekankan bahwa penelitian dari psikologi kognitif dapat
diterapkan pada berbagai situasi sehari-hari. Misalnya, Anda mempelajari beberapa aplikasi
praktis dari penelitian tentang persepsi wajah. Telusuri bab ini dan jelaskan setidaknya lima
penerapan praktis lainnya dari penelitian tentang pengenalan visual dan pendengaran.
KATA KUNCI
persepsi kontur subyektif prosopagnosia

pengenalan objek templat fMRI
pengenalan pola teori analisis fitur efek inversi wajah
rangsangan distal ciri khas perbedaan individu
stimulus proksimal teori pengakuan-oleh- skizofrenia
retina komponen persepsi bicara
memori sensorik geon fonem
memori ikonik pendekatan yang berpusat pada pemirsa koartikulasi
memori sensorik visual pemrosesan dari bawah ke atas restorasi fonemik
korteks visual primer pemrosesan dari atas ke bawah Efek McGurk
psikologi gestalt efek superioritas kata pendekatan mekanisme khusus
menurutku mengubah kebutaan pendekatan pidato-adalah-khusus
tanah kebutaan yang tidak disengaja modul fonetik
hubungan antara figur dan latar validitas ekologis modul pidato
belakang yang ambigu holistik (pengakuan) persepsi kategoris
kontur ilusi isyarat pendekatan mekanisme umum
76
BACAAN YANG DIREKOMENDASIKAN
Chabris, CF, & Simons, DJ (2010). Gorila yang tidak terlihat Goldstein, EB (Ed.). (2010). Ensiklopedia persepsi. Thousand
dan cara-cara lain yang ditipu oleh intuisi kita. New York: Oaks, CA: Sage. Sumber daya dua jilid ini membahas
Mahkota. Buku ini, yang ditulis untuk khalayak umum, berbagai macam topik, menyediakan beberapa halaman
memberikan rincian mengenai temuan-temuan yang pada setiap entri. Topik-topiknya mencakup banyak hal
berlawanan dengan intuisi yang dibahas di bagian yang dijelaskan dalam bab ini, namun juga topik-topik
mendalam (hlm. 50–53) bab ini. menarik yang mungkin belum Anda pertimbangkan, seperti
Gazzaniga, MS, Ivry, RB, & Mangun, GR (2009). agnosia pendengaran, persepsi tubuh, dan sensasi anggota tubuh hantu.
Ilmu saraf kognitif: Biologi pikiran (Edisi ke-3rd). Henderson, JM (Ed.). (2005). Persepsi adegan dunia nyata.
New York: Norton. Inilah buku luar biasa yang memberikan Hove, Inggris: Pers Psikologi. Sebagian besar bab di buku
banyak detail tentang ilmu saraf yang berkaitan dengan teks Anda berfokus pada cara kita memandang objek yang
kognisi. Buku ini juga mencakup topik-topik di luar cakupan terisolasi. Buku menarik ini membahas pertanyaan-
buku teks Anda, seperti emosi dan neuroanatomi pertanyaan yang lebih rumit tentang bagaimana kita
perkembangan mental. memandang pemandangan di dunia sehari-hari.
JAWABAN DEMONSTRASI 2.4
Untuk menemukan ciri yang berbeda pada kedua foto berwarna ini, lihatlah gadis kecil dengan atasan hitam dan celana pendek
oranye. Dalam salah satu versi, Anda bisa melihat bagian kaus kaki putih di pergelangan kaki kirinya. Pada versi lain, bagian
kaus kaki ini berwarna hitam.

Margaret W. Matlin, Thomas A-Persepsi

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Margaret W. Matlin, Thomas A-Persepsi

Diunggah oleh

Hak Cipta:

Format Tersedia

Machine Translated by Google

Visual dan Auditori

Ikhtisar Pengenalan Objek Visual

Pemrosesan Top-Down dan Pengenalan Objek Visual

Proses Pengenalan Visual Khusus

40 BAB 2 Pengenalan Visual dan Auditori

GAMBARAN UMUM PENGENALAN OBJEK VISUAL

Persepsi menggunakan pengetahuan sebelumnya untuk mengumpulkan dan menafsirkan rangsangan

Ikhtisar Pengenalan Objek Visual 41

42 BAB 2 Pengenalan Visual dan Auditori

Pengakuan Langsung terhadap Objek

Lobus frontal Lobus parietal

44 BAB 2 Pengenalan Visual dan Auditori

Organisasi dalam Persepsi Visual

Ikhtisar Pengenalan Objek Visual 45

Efek Wajah Vas: Contoh Hubungan Gambar-Tanah yang Ambigu.

Contoh Kontur Ilusi.

46 BAB 2 Pengenalan Visual dan Auditori

Teori Pengenalan Objek Visual

Ikhtisar Pengenalan Objek Visual 47

Dua teori lainnya—analisis fitur dan pengenalan berdasarkan komponen—

Teori Analisis Fitur. Beberapa teori analisis fitur mengusulkan pendekatan

Pendekatan Analisis Fitur

Kurva Tertutup ++ ++++

Sumber: Gibson, EJ (1969). Prinsip pembelajaran dan pengembangan persepsi. New

Hasil Hubel dan Wiesel menunjukkan bahwa setiap neuron merespons

Ikhtisar Pengenalan Objek Visual 49

Teori Pengakuan Berdasarkan Komponen. Irving Biederman dan rekan-rekannya telah

Ikhtisar Pengenalan Objek Visual 51

PERTANYAAN KUIS LATIHAN

1) Informasi visual yang dicatat oleh reseptor sensorik retina diketahui

52 BAB 2 Pengenalan Visual dan Auditori

5) Pendekatan analisis fitur:

PEMROSESAN TOP-DOWN DAN PENGENALAN OBJEK VISUAL

Pemrosesan Bottom-Up Versus Top-Down

Pemrosesan Top-Down dan Pengenalan Objek Visual 53

Pengenalan Konteks dan Pola

Pemrosesan dan Pembacaan Top-Down

54 BAB 2 Pengenalan Visual dan Auditori

Pemrosesan Top-Down dan Pengenalan Objek Visual

70% penjaga kebun binatang

Fitur stimulus (digunakan pada kata bea-s)

56 BAB 2 Pengenalan Visual dan Auditori

“Kesalahan Cerdas” dalam Pengenalan Objek

Pemrosesan Top-Down dan Pengenalan Objek Visual 57

Mendeteksi Perbedaan Antara Dua Gambar

58 BAB 2 Pengenalan Visual dan Auditori

Proses Pengenalan Visual Khusus 59

PERTANYAAN KUIS LATIHAN

a) pemrosesan dari bawah ke

atas. b) pemrosesan dari atas

ke bawah. c) pemrosesan bottom-up dan top-down. d)

proses selain pemrosesan bottom-up dan top-down.

PROSES PENGENALAN VISUAL KHUSUS

60 BAB 2 Pengenalan Visual dan Auditori

Mengenali Wajah Versus Mengenali Objek Lain

Penelitian Ilmu Saraf tentang Pengenalan Wajah

Proses Pengenalan Visual Khusus 61

62 BAB 2 Pengenalan Visual dan Auditori

Penelitian Terapan tentang Pengenalan Wajah

Keyakinan Peserta Tentang Pernah Melihat Orang Sasaran di Video Tadi,

profesor profesor profesor

64 BAB 2 Pengenalan Visual dan Auditori