Anda di halaman 1dari 6

EKSPERIMEN SKINNER (Operant Conditioning)

Operant Conditioning
Dalam salah satu eksperimennya, Skinner menggunakan seekor tikus yang
ditempatkan dalam sebuah peti yang disebut dengan Skinner Box. Kotak Skinner ini berisi
dua macam komponen pokok, yaitu manipulandum dan alat pemberi reinforcement yang
antara lain berupa wadah makanan. Manipulandum adalah komponen yang dapat
dimanipulasi dan gerakannya berhubungan dengan reinforcement. Komponen ini terdiri dari
tombol, batang jeruji, dan pengungkit.
Dalam eksperimen tadi mula-mula tikus itu mengeksplorasi peti sangkar dengan cara
lari kesana kemari, mencium benda-benda yang ada disekitarnya, mencakar dinding, dan
sebagainya. Tingkah laku tikus yang demikian disebut dengan ‘’ emmited behavior ” (tingkah
laku yang terpancar), yakni tingkah laku yang terpancar dari organism tanpa memedulikan
stimulus tertentu. Kemudian salah satu tingkah laku tikus (seperti cakaran kaki, sentuhan
moncong) dapat menekan pengungkit. Tekanan pengungkit ini mengakibatkan munculnya
butir-butir makanan ke dalam wadahnya.
Butir-butir makanan yang muncul merupakan reinforce bagi tikus yang disebut
dengan tingkah laku operant yang akan terus meningkat apabila diiringi reinforcement, yaitu
penguatan berupa butiran-butiran makanan kedalam wadah makanan.
Teori belajar operant conditioning ini juga tunduk pada dua hukum operant yang
berbeda lainnya, yaitu law operant conditioning dan law extinction. Menurut hukum operant
conditioning, jika suatu tingkah diriingi oleh sebuah penguat (reinforcement), maka tingkah
laku tersebut meningkat. Sedangkan menurut hukum law extinction, jika suatu tingkah laku
yang diperkuat dengan stimulus penguat dalam kondisioning, tidak diiringi stimulus penguat,
maka tingkah laku tersebut akan menurun atau bahkan musnah. Kedua hukum ini pada
dasarnya juga memiliki kesamaan dengan hukum pembiasaan klasik (classical conditioning).

Skinner membedakan perilaku atas :

1.  Perilaku alami (innate behavior), yang kemudiandisebut juga sebagai clasical


ataupun respondent behavior, yaitu perilaku yangdiharapkan timbul oleh stimulus
yang jelas ataupun spesifik, perilaku yangbersifat refleksif.
2. Perilaku operan (operant behavior), yaitu perilakuyang ditimbulkan oleh stimulus
yang tidak diketahui, namun semata-mataditimbulkan oleh organisme itu sendiri
setelah mendapatkan penguatan.

Skinner yakin jika kebanyakan perilaku manusia dipelajari lewat Operant Conditioning
atau pengkondisian operan, yang kuncinya adalah penguatan segera terhadap respons.
Operant Conditioning adalah suatu proses penguatan perilaku yang dapatmengakibatkan
perilaku tersebut dapat berulang kembali atau menghilang sesuaidengan keinginan.
Skinner membuat mesin untuk percobaanya dalam Operant Conditioning yang dinamakan
dengan"Skinner Box" dan tikus yang merupakan subjek yang sering digunakandalam
percobaanya.
Dalam percobaannya tersebut yang dilakukan oleh Skinner dalam Laboratorium, seekor
tikus yang lapar diletakkan dalam Skinner Box, kemudian binatang tersebut akan
akanmenekan sebuah tuas yang akan membukakan dulang makanan, sehingga
diperolehpenguatan dalam bentuk makanan. Di dalam setiap keadaan, seekor binatang
akanmemperlihatkan bentuk perilaku tertentu; tikus tadi misalnya, akanmemperlihatkan
perilaku menyelidik pada saat pertama kali masuk kedalam Box,yaitu dengan mencakar-
cakar dinding dan membauinya sambil melihat-lihat kesekelilingnya. Secara kebetulan,
dalam perilaku menyelidik tersebut tikusmenyentuh tuas makanan dan makanan pun
berjatuhan. Setiap kali tikus melakukanhal ini akan mendapatkan makanan; penekanan tuas
diperkuat dengan penyajian makanan tersebut, sehingga tikus tersebut akan menghubungkan
perilaku tertentudengan penerimaan imbalan berupa makanan tadi. Jadi, tikus tersebut
akanbelajar bahwa setiap kali menekan tuas dia akan mendapatkan makanan dan
tikustersebut akan sering kali mengulangi perilakunya, sampai ada proses pemadamanatau
penghilangan dengan menghilangkan penguatannya.
Dalam eksperimen Skinner tersebut terdapat istilah Penguatan atau dapat disebut sebagai
reinforcementyaitu, setiap kejadian yang meningkatkan ataupun mempertahankan
kemungkinan adanya respon terhadap kemungkinan respon yang diinginkan. Biasanya
yangberupa penguat adalah sesuatu yang dapat menguatkan dorongan dasar (basicdriver,
seperti makanan yang dapat memuaskan rasa lapar atau air yang dapatmenuatkan rasa haus)
namun tidak harus selalu demikian.
Pada manusia, penguatan sering salah sasaran sehingga pembelajaran menjadi tidak
effisien. Masalah lain dengan pengkondisian manusia adalah penentuan
manakahkonsekuansi-konsekuensi yang menguatkan dan manakah yang melemahkan.
Karena bergantung pada sejarah individu, penguatan dan disiplin terkadang dapatmenjadi
penguatan sedangkan ciuman dan pujian dapat menjadi hukuman.
Dalam penguatantersebut dibedakan antara pengutan positif dan negatif.

 Penguatan positif adalah stimulus yang apabila diberikan sesudah terjadinya respon,
meningkatkan kemungkinan respon tersebut.

-> Respon 1
/
S (Rangsang) ---> Respon 2 --> Penguatan
\
-> Respon 3
Menjadi :

S(Rangsang) --> Respon 2 berulang-ulang

 Penguatan negatif adalah stimulus yang dihapuskan sesudah responnyatimbul,


meningkatkan kemungkinan adanya respon; shock elektrik dan bunyi
yangmenyakitkan digolongkan sebagai penguat negatif dan sebagai penguat
negatifjika penguat itu dapat ditiadakan ketika timbul respon yang diinginkan.

-> Respon 1 --> Shock elektrik


/
S (Rangsang) --> Respon2
\
-> Respon3 --> Shock elektrik
Menjadi :

S (Rangsang) --> Respon2


Adapun Jenis-Jenis Penguat Skinner dikategorikan, sbb;

1. Penguat utama (Primary reinforcers) adalah penguat yang memengaruhi perilaku


tanpa perlu belajar, seperti: makanan, minuman, seks. Ini disebut penguat alami.
2. Penguat sekunder (Secondar reinforcers). Adalah penguat yang membutuhkan
tenaga penguat karena sudah diasosiasikan dengan penguat utama, seperti memuji
seseorang.

Tadi telah diuraikan bahwa bagaimana seekor tikus dalam Skinner Box yang menekan
tuas akan menerima butir-butir makanan setiap kali tikus tersebut melakukannya. Apabila
kita menghentikan pemberian penguatan ini, perilaku penekanan tuas pun secara bertahap
akan menghilang, biasanya hanya beberapa menit setelahpenghentian penguatan. Apa yang
membuat Operant Conditioning ini penting untuk menjelaskan belajar adalah pengembangan
jadwal penguatan yang dilakukanoleh Skinner. Jadwal ini merupakan bentuk lain dari
penyajian penguatan yang dihasilkannya perbedaan pada taraf respons (respons rate), yaitu
taraf penekanan tuas oleh tikus tadi, maupun pada taraf penghapusan (extinctionrate), yaitu
terhapusnya perilaku penekanan tuas. Jadwal penguatan inilahyang membuat Operant
Conditioning menjadi bentuk belajar yang sangatFleksibel. Setiap respons yang pada suatu
saat dapat dibiasakan dan dapat juga diakhiri sesuai dengan keinginan kita, dan ini tercapai
dengan melalui beragam jadwal pengautan.
Penguatan dapat dialakukkan kepada perilaku entah melalui jadwal yang
berkesinambungan atau sebentar-sebentar. Dalam jadwal-penguatan-berkesinambungan
(continous schedule), organisme diperkuat untuk setiap responnya. Jenis penjadwalan ini
dapat meningkatkan frekuensi respons sekalipun pemakaian penguat kadang-kadang tidak
efisien. Skinner kemudian mengusulkan jadwal-penguatan sebentar-sebentar (intermittent
schedules) yang bukan hanya lebih effisien menggunakan penguat, tetapi juga menghasilkan
respons yang lebih resisten terhadap pemadaman. Melaui intermittent schedule Skinner
mengidentifikasi dua macam penguatan yaitu penguatan berjangka (Interval reinforcement )
dan penguatan berbanding ( ratio reinforcement).
 Interval reinforcement adalah penguatan yang dijadwalkan atau yang muncul pada
interval waktu yang telah ditentukan. Contoh: seseorang memutuskan untuk memberikan
permen hanya jika orang tersebut tetap diam selama lima menit. Setelah itu baru diberikan
permen, tidak ada penguatan tambahan yang diberikan sampai berlalu lima menit berikutnya.

 Ratio reinforcement adalah penguatan yang muncul setelah sejumlah respon tertentu.
Contoh: seseorang akan memberikan permen pada seoranganak apabila anak tersebut
menampilkan perilaku patuh, setelah anak tersebutpatuh kemudian diberikan permen tersebut
dan terus seperti itu sehingga anaktersebut benar-benar patuh.
Penjadwalan tersebut terbagi lagi menjadi 4 jenis penguatan jadwal, yakni :

 Rasio tetap (Fixed ratio), dimana penguatan tergantungpada sejumlah respon yang
terbatas. Artinya, mengatur pemberian reinforcement sesudah respon yang
dikehendaki muncul yang kesekian kalinya. Misalnya, Pekerja diberikan bonus
apabila mampu menghasilkan produk sesuai target dengan kualitas produk yang
sesuai dengan standar (mampu mengikuti prosedur)
Tujuan , membentuk perilaku bekerja yang efektif dan dengan tetap memperhatikan
kualitas
Reinforcement, bonus
 Rasio yang dapat berubah (variable ratio), dimana sejumlah respon yang
dibutuhkan untuk penguatan yang berbeda-berbeda dari satu penguatan ke penguatan
berikutnya. Misalnya, Pemberian bonus pada pekerja dilakukan secara acak
yaknipada periode tertentu pekerja diberikan bonus apabila mampu memberikan
performa kerja yang ramah dan menghasilkan produk berjumlah 1000 unit, namun
pada periode yang lain pekerja diberikan bonus apabila telah mampu menghasilkan
produk 2000 unit, dan pada waktu yang lain pekerja mendapatkan bonus saat mampu
menghasilkan produk 2500 unit.
Tujuan, membentuk perilaku bekerja dengan tidak selalu bergantung kepada bonus
karena bonus akan diberikan sewaktu-waktu sehingga pekerja cenderung akan
menampilakan performa kerjanya yang paling maksimal.
Reinforcement, bonus

 Interval tetap (fixed interval), dimana suatu responmenghasilkan penguatan setelah


jangka waktu tertentu (khusus).Misalnya, Ujian tengah semester diberikan pada
pertengahan semester (waktu telah ditentukan). Mahasiswa akan belajar lebih
sungguh-sungguh saat menjelang ujian agar mendapat nilai yang baik.
Tujuan, membentuk perilaku belajar.Reinforcement, nilai yang baik (A)

 Interval yang dapat berubah (variable interval), dimana penguatan tergantung


pada waktu dan suatu respon, tetapiwaktu antara penguatan berbeda-beda. Artinya,
reinforcement diberikkan dalam waktu yang tidak menentu, tetapi jumlah atau rata-
rata penguat yang diberikkan sama dengan pengaturan tetap.Misalnya, dosen yang
memberikan kuis tiba-tiba dalam perkuliahan sehingga mahasiswa diharapkan selalu
belajar agar apabila diadakan kuis mendadak mereka akan siap dan dapat meraih nilai
yang baik
Tujuan, membentuk perilaku belajar mahasiswa
Reinforcement, nilai yang baik (A)

/--> Fixed Ratio


Ratio
/ \ --> Variable Ratio
/
Reinfocement
\
\ /--> Fixed interval
Interval
\--> Variable Interval

Extinction (pemadaman)
Meskipun sudah dipelajari, respons masih dapat padam karena empat alasan berikut :

1. Respons bisa dilupakkan dalam beberapa waktu


2. Respons dapat hilang jika ada campur tangan dari proes pembelajaran lain sebelum
atau sesudahnya
3. Respon dapat hilang akibat penghukuman
4. Kecenderungan respon yang sudah diperoleh sebelumnyauntuk menjadi progresif dan
melemahkan respon sesudahnya yang sudah tidak lagimendapatkan penguatan
Prinsip dari extinction dalampengkondisian operan adalah penahanan pemberian
reinforcement atau penghentian pemberian reinforcement, artinya bila respon yang
diinginkanterjadi, maka respon tersebut tidak diikuti dengan pemberian reinforcement. Pada
percobaan Skinner diatas, penekanan tuas tidak lagi diikuti dengan munculnya makanan,
maka secara bertahap perilaku menekan tuas pada tikus akan hilang Generalisasi
Stimulus
Unconditional Response dalam pengkondisian klasikal, cenderung untuk muncul bila
dihadapkan pada US (Unconditioned Stimulus) yang mirip.
Demikian juga halnya dengan Pengkondisian Operan. Bila stimulus atau event yang
mengawali suatu respon itu mirip, maka perilaku (respon) yang sama cenderung
untukmuncul. Contohnya dapat kita lihat dalam penelitian Skinner terhadap seekor burung
merpati dalam kotak. Dalam kotak tersebut ada "kunci" yangdapat diterangi oleh lampu. Saat
lampu dinyalakan (dan menerangi"kunci") burung mematuk "kunci" tersebut, maka makanan
akanmengalir dari lubang di bawah kunci. Untuk kepentingan penelitian generalisasi
stimulus, lampu yang menerangi "kunci" diubah-ubah intensitasnya.Besar kecilnya
peningkatan tergantung dari kedekatan atau kemiripan stimulus atau situasi yang
menimbulkan respon.
Stimulus Diskriminasi
Diskriminasi stimulus bertujuan agar subjek dapat melakukan perbedaan terhadap
stimulus atausituasi yang dihadirkan agar subjek hanya melakukan respon terhadap
stimulusatau situasi yang sesuai. Dalam pengkondisian operan, diskriminasi stimulus
dilakukan dengan pemberian reinforcement terhadap respon yang diinginkan dalam suatu
situasi atau stimulus yang sesuai dan tidak memberikan reinforcement bila respon tersebut
muncul dalamsituasi yang tidak sesuai. Contohnya pada percobaan burung merpati tadi.
Makanan sebagai reinforcer hanya diberikan bila yang menyala lampu hijau. Sedangkan bila
yang menyala lampu merah, reinforcer tidak diberikan. Pemasangan lampu merah dan hijau
ini dilakukan secara berturut-turut, hijau-merah-hijau-merah, dst, atau makanan-tidakada-
makanan-tidak ada, dst. Oleh karena itu teknik ini disebut dengan prosesdikriminasi "go-no-
go".
Reinforcement Negative dan Escape Learning
Escapelearning adalah prosesbelajar yang didasarkan pada pengkondisian operan
dengan teknik pemberianreinforcer negatif. Contohnya dapat kita lihat melalui penelitian
terhadapseekor tikus di dalam kotak percobaan yang terdiri dari sebuah kandang
yangmemiliki dua tingkat tempat tikus berdiri. Bila tikus turun dari tingkat keduake tingkat
pertama, maka tikus akan mengalami kejutan listrik. Oleh sebab itu tikus berusaha untuk naik
kembali ke tingkat dua. Perilaku seperti itulah yangdisebut dengan proses belajar escape
(melarikan diri) yangdidasarkan pada pemberian reinforcer negatif pada pengkondisian
operan.
Avoidance Learning
Avoidance learning adalah proses belajar untuk menghindari reinforcement negatif.
Caranya dengan menghadirkan suatu stimulus sebelum pemberian reinforcer negatif. Pada
contoh percobaan di atas, tikus diberi sebuah bel atau buzzer sebelumdiberi kejutan listrik.
Setelahterjadi proses belajar, dengan mendengar buzzer saja tikus sudah berusaha naik ke
tingkat dua agar tidak terkena kejutan listrik. Oleh karena itu proses belajar yang demikian
disebut dengan avoidance learning (proses belajar untuk menghindarkan diri dari reinforcer
negatif)
Punishment
Punisher adalah stimulus atau kejadian dimana jika diberikan pada suatu respon akan
menurunkan kemungkinan respon tersebut akan muncul kembali.
Punishment adalah penggunaan punisher untuk menekan atau menghentikan suatu
trespon agar tidak muncul kembali.
Positive Punishment (juga disebut "Hukuman dengan rangsangan tidak terduga")
muncul ketika suatu prilaku (respon) diikuti oleh suatu rangsangan tidak menyenangkan,
sepertimemperkenalkan setruman atau suara keras, menghasilkan prilaku yang tidak
diinginkan berkurang atau seseorang dipukul karena salah.
Negative Punishment (juga disebut "Hukuman dengan pengambilan tidakterduga"
muncul ketika suatu perilaku (respon) diikuti dengan membuang rangsangan yang
menyenangkan, seperti mengambil mainan anak-anak bersama perilaku yang tidak
diinginkan, menghasilkan perilaku yang tidak diinginkan berkurang, pemotongan uang jajan.

Anda mungkin juga menyukai