Operant Conditioning
Dalam salah satu eksperimennya, Skinner menggunakan seekor tikus yang
ditempatkan dalam sebuah peti yang disebut dengan Skinner Box. Kotak Skinner ini berisi
dua macam komponen pokok, yaitu manipulandum dan alat pemberi reinforcement yang
antara lain berupa wadah makanan. Manipulandum adalah komponen yang dapat
dimanipulasi dan gerakannya berhubungan dengan reinforcement. Komponen ini terdiri dari
tombol, batang jeruji, dan pengungkit.
Dalam eksperimen tadi mula-mula tikus itu mengeksplorasi peti sangkar dengan cara
lari kesana kemari, mencium benda-benda yang ada disekitarnya, mencakar dinding, dan
sebagainya. Tingkah laku tikus yang demikian disebut dengan ‘’ emmited behavior ” (tingkah
laku yang terpancar), yakni tingkah laku yang terpancar dari organism tanpa memedulikan
stimulus tertentu. Kemudian salah satu tingkah laku tikus (seperti cakaran kaki, sentuhan
moncong) dapat menekan pengungkit. Tekanan pengungkit ini mengakibatkan munculnya
butir-butir makanan ke dalam wadahnya.
Butir-butir makanan yang muncul merupakan reinforce bagi tikus yang disebut
dengan tingkah laku operant yang akan terus meningkat apabila diiringi reinforcement, yaitu
penguatan berupa butiran-butiran makanan kedalam wadah makanan.
Teori belajar operant conditioning ini juga tunduk pada dua hukum operant yang
berbeda lainnya, yaitu law operant conditioning dan law extinction. Menurut hukum operant
conditioning, jika suatu tingkah diriingi oleh sebuah penguat (reinforcement), maka tingkah
laku tersebut meningkat. Sedangkan menurut hukum law extinction, jika suatu tingkah laku
yang diperkuat dengan stimulus penguat dalam kondisioning, tidak diiringi stimulus penguat,
maka tingkah laku tersebut akan menurun atau bahkan musnah. Kedua hukum ini pada
dasarnya juga memiliki kesamaan dengan hukum pembiasaan klasik (classical conditioning).
Skinner yakin jika kebanyakan perilaku manusia dipelajari lewat Operant Conditioning
atau pengkondisian operan, yang kuncinya adalah penguatan segera terhadap respons.
Operant Conditioning adalah suatu proses penguatan perilaku yang dapatmengakibatkan
perilaku tersebut dapat berulang kembali atau menghilang sesuaidengan keinginan.
Skinner membuat mesin untuk percobaanya dalam Operant Conditioning yang dinamakan
dengan"Skinner Box" dan tikus yang merupakan subjek yang sering digunakandalam
percobaanya.
Dalam percobaannya tersebut yang dilakukan oleh Skinner dalam Laboratorium, seekor
tikus yang lapar diletakkan dalam Skinner Box, kemudian binatang tersebut akan
akanmenekan sebuah tuas yang akan membukakan dulang makanan, sehingga
diperolehpenguatan dalam bentuk makanan. Di dalam setiap keadaan, seekor binatang
akanmemperlihatkan bentuk perilaku tertentu; tikus tadi misalnya, akanmemperlihatkan
perilaku menyelidik pada saat pertama kali masuk kedalam Box,yaitu dengan mencakar-
cakar dinding dan membauinya sambil melihat-lihat kesekelilingnya. Secara kebetulan,
dalam perilaku menyelidik tersebut tikusmenyentuh tuas makanan dan makanan pun
berjatuhan. Setiap kali tikus melakukanhal ini akan mendapatkan makanan; penekanan tuas
diperkuat dengan penyajian makanan tersebut, sehingga tikus tersebut akan menghubungkan
perilaku tertentudengan penerimaan imbalan berupa makanan tadi. Jadi, tikus tersebut
akanbelajar bahwa setiap kali menekan tuas dia akan mendapatkan makanan dan
tikustersebut akan sering kali mengulangi perilakunya, sampai ada proses pemadamanatau
penghilangan dengan menghilangkan penguatannya.
Dalam eksperimen Skinner tersebut terdapat istilah Penguatan atau dapat disebut sebagai
reinforcementyaitu, setiap kejadian yang meningkatkan ataupun mempertahankan
kemungkinan adanya respon terhadap kemungkinan respon yang diinginkan. Biasanya
yangberupa penguat adalah sesuatu yang dapat menguatkan dorongan dasar (basicdriver,
seperti makanan yang dapat memuaskan rasa lapar atau air yang dapatmenuatkan rasa haus)
namun tidak harus selalu demikian.
Pada manusia, penguatan sering salah sasaran sehingga pembelajaran menjadi tidak
effisien. Masalah lain dengan pengkondisian manusia adalah penentuan
manakahkonsekuansi-konsekuensi yang menguatkan dan manakah yang melemahkan.
Karena bergantung pada sejarah individu, penguatan dan disiplin terkadang dapatmenjadi
penguatan sedangkan ciuman dan pujian dapat menjadi hukuman.
Dalam penguatantersebut dibedakan antara pengutan positif dan negatif.
Penguatan positif adalah stimulus yang apabila diberikan sesudah terjadinya respon,
meningkatkan kemungkinan respon tersebut.
-> Respon 1
/
S (Rangsang) ---> Respon 2 --> Penguatan
\
-> Respon 3
Menjadi :
Tadi telah diuraikan bahwa bagaimana seekor tikus dalam Skinner Box yang menekan
tuas akan menerima butir-butir makanan setiap kali tikus tersebut melakukannya. Apabila
kita menghentikan pemberian penguatan ini, perilaku penekanan tuas pun secara bertahap
akan menghilang, biasanya hanya beberapa menit setelahpenghentian penguatan. Apa yang
membuat Operant Conditioning ini penting untuk menjelaskan belajar adalah pengembangan
jadwal penguatan yang dilakukanoleh Skinner. Jadwal ini merupakan bentuk lain dari
penyajian penguatan yang dihasilkannya perbedaan pada taraf respons (respons rate), yaitu
taraf penekanan tuas oleh tikus tadi, maupun pada taraf penghapusan (extinctionrate), yaitu
terhapusnya perilaku penekanan tuas. Jadwal penguatan inilahyang membuat Operant
Conditioning menjadi bentuk belajar yang sangatFleksibel. Setiap respons yang pada suatu
saat dapat dibiasakan dan dapat juga diakhiri sesuai dengan keinginan kita, dan ini tercapai
dengan melalui beragam jadwal pengautan.
Penguatan dapat dialakukkan kepada perilaku entah melalui jadwal yang
berkesinambungan atau sebentar-sebentar. Dalam jadwal-penguatan-berkesinambungan
(continous schedule), organisme diperkuat untuk setiap responnya. Jenis penjadwalan ini
dapat meningkatkan frekuensi respons sekalipun pemakaian penguat kadang-kadang tidak
efisien. Skinner kemudian mengusulkan jadwal-penguatan sebentar-sebentar (intermittent
schedules) yang bukan hanya lebih effisien menggunakan penguat, tetapi juga menghasilkan
respons yang lebih resisten terhadap pemadaman. Melaui intermittent schedule Skinner
mengidentifikasi dua macam penguatan yaitu penguatan berjangka (Interval reinforcement )
dan penguatan berbanding ( ratio reinforcement).
Interval reinforcement adalah penguatan yang dijadwalkan atau yang muncul pada
interval waktu yang telah ditentukan. Contoh: seseorang memutuskan untuk memberikan
permen hanya jika orang tersebut tetap diam selama lima menit. Setelah itu baru diberikan
permen, tidak ada penguatan tambahan yang diberikan sampai berlalu lima menit berikutnya.
Ratio reinforcement adalah penguatan yang muncul setelah sejumlah respon tertentu.
Contoh: seseorang akan memberikan permen pada seoranganak apabila anak tersebut
menampilkan perilaku patuh, setelah anak tersebutpatuh kemudian diberikan permen tersebut
dan terus seperti itu sehingga anaktersebut benar-benar patuh.
Penjadwalan tersebut terbagi lagi menjadi 4 jenis penguatan jadwal, yakni :
Rasio tetap (Fixed ratio), dimana penguatan tergantungpada sejumlah respon yang
terbatas. Artinya, mengatur pemberian reinforcement sesudah respon yang
dikehendaki muncul yang kesekian kalinya. Misalnya, Pekerja diberikan bonus
apabila mampu menghasilkan produk sesuai target dengan kualitas produk yang
sesuai dengan standar (mampu mengikuti prosedur)
Tujuan , membentuk perilaku bekerja yang efektif dan dengan tetap memperhatikan
kualitas
Reinforcement, bonus
Rasio yang dapat berubah (variable ratio), dimana sejumlah respon yang
dibutuhkan untuk penguatan yang berbeda-berbeda dari satu penguatan ke penguatan
berikutnya. Misalnya, Pemberian bonus pada pekerja dilakukan secara acak
yaknipada periode tertentu pekerja diberikan bonus apabila mampu memberikan
performa kerja yang ramah dan menghasilkan produk berjumlah 1000 unit, namun
pada periode yang lain pekerja diberikan bonus apabila telah mampu menghasilkan
produk 2000 unit, dan pada waktu yang lain pekerja mendapatkan bonus saat mampu
menghasilkan produk 2500 unit.
Tujuan, membentuk perilaku bekerja dengan tidak selalu bergantung kepada bonus
karena bonus akan diberikan sewaktu-waktu sehingga pekerja cenderung akan
menampilakan performa kerjanya yang paling maksimal.
Reinforcement, bonus
Extinction (pemadaman)
Meskipun sudah dipelajari, respons masih dapat padam karena empat alasan berikut :