Thursday, September 3, 2009

Burrhus Frederic Skinner



Sejarah Singkat Kehidupan Skinner

Lahir di Susquehanna, Pennsylvania
Pendidikan
- BA di Hamilton College, New York, dengan minat utama bahasa Inggris
- Master di Harvard University pada tahun 1930
- PhD di Harvard University pada tahun 1931

Karir
Saat di Hamilton, Skinner pernah menulis sebuah buku. Hal ini terjadi karena ia tertarik pada Robert Frost – seorang pujangga yang terkenal
Saat Skinner frustasi karena tidak bisa menjadi penulis, ia menjadi seorang bohemian selama 6 bulan di Greenwich Village-New York Citi
Setelah itu, ia pergi ke Harvard untuk kuliah psikologi
Setelah lulus dari Harvard, Skinner memutuskan untuk menjadi pengajar di Minnesota mulai 1936-1945
Menjadi dekan fakultas psikologi di Universitas Indiana pada tahun 1945
Sejak 1945 sampai meninggal 1990, kembali lagi ke universitas Harvard

Buku-buku yang pernah ditulis
- The Behavior Organism – 1938
- Walden Two – 1948
- The Science of Learning and The Art of Teaching – 1954
- Teaching Machine – 1958
- Pigeons in a Pelican – 1960
- The Analysis of Behavior – 1961 (ditulis bersama temannya – Holland)
- Beyond Freedom and Dignity – 1971

Eksperimen Skinner
Pada dasarnya, teori Skinner bermula dari eksperimen di bawah ini. Adapun materi dari eksperimen Skinner adalah :



a. The Skinner Box
The Skinner Box adalah suatu ruang percobaan kecil – pemberian Thorndike. Adapun isi dari Skinner Box adalah grid floor (lantai berjaring listrik), tuas, feeder mechanism dan mangkok makanan. Perabot-perabot tersebut disusun sedemikian rupa sehingga jika binatang menekan tuas maka feeder mechanism akan bergerak (berbunyi) sebagai tanda keluarnya makanan yang dialirkan ke mangkok makanan, seperti yang tampak dalam gambar di bawah ini.

b. The Cumulative Recording
The cumulative recording adalah suatu alat yang dapat mencatat perilaku bintang di dalam Skinner Box, dimana alat ini akan bekerja sesuai dengan garis x atau garis y seperti dalam suatu grafik. Garis x menunjukkan bahwa binatang tidak melakukan respon; sebaliknya garis y menunjukkan bahwa binatang melakukan respon. Gambar the cumulative recording dan grafik yang menunjukkan respon binatang dapat dilihat di bawah ini.

c. Conditioning the Lever-Pressing Response
Belajar menekan tuas, terdiri dari tiga tahap yaitu :
1. Deprivation
Sebelum binatang dimasukkan dalam Skinner Box, binatang dibuat deprivasi (kekurangan), lapar atau haus. Binatang tidak diberi makanan selama 23 jam supaya lapar, atau tidak diberi minum selama 23 jam supaya haus. Setelah dibuat deprivasi, binatang dimasukkan dalam Skinner Box.

2. Magazine training
Magazine training adalah suatu latihan untuk menjauhi mangkok makanan sebelum feeder mechanisme berbunyi dan dilatih untuk mendekati makanan setelah feeder mechanism berbunyi. Dalam hal ini, diharapkan binatang bisa menghubungkan antara feeder mechanism (sebagai secondary reinforcement) dengan makanan (sebagai primary reinforcement).

3. Lever pressing
Lever pressing adalah suatu respon yang harus dilakukan oleh binatang saat ia lapar, dengan cara menekan tombol yang ada di dalam Skinner Box. Jika binatang langsung mendekati makanan sebelum feeder mechanism berbunyi, maka makanan tidak akan keluar; tetapi jika binatang menjauhi mangkok makanan sebelum feeder mechanism berbunyi dan mendekati mangkok makanan setelah mangkok makanan berbunyi maka makanan akan keluar.



Menurut prinsip operant conditiong, perilaku yang direinforce (contoh menekan tuas) akan cenderung untuk diulang; dan jika pengulangan perilaku tersebut juga mendatangkan reinforce maka perilaku tersebut akan diulang lagi dan seterusnya. Hal ini bisa dilihat dalam kurve disamping ini, perbedaan antara tikus yang memiliki dorongan kuat dan tukus yang memiliki dorongan lemah.



Kurve Kumulatif selama Pemerolehan
Gambar ini menunjukkan adanya perbedaan kurva respon kumulatif untuk dua tikus selama pemerolehan respon menekan tuas. Tikus A mengalami deprivasi selama 30 jam, dan tikus mengalami deprivasi selama 10 jam. Perbedaan dorongan pada kedua tikus nampak pada lajur respon
Berdasarkan percobaan diatas, maka Skinner membuat:

Pandangan Teoritis Utama :
Respondent and Operant Behavior
Ada dua macam perilaku, yaitu :
a. Respondent Behavior, adalah perilaku yang dimunculkan oleh stimulus yang dikenali
Contoh : refleks menarik tangan saat kena api, pupil melebar jika berada di dalam kondisi gelap, atau pupil mengecil jika kena sinar terang, air liur keluar waktu melihat makanan enak.
b. Operant Behavior, yaitu adalah perilaku yang dimunculkan oleh stimulus yang tidak dikenali dan hanya dimunculkan oleh organisme. Dalam hal ini operant behavior tidak berhubungan dengan stimulus yang tidak dikenali, tampaknya spontaneous.
Contoh : bersiul saat dikamar mandi, berdiri dan berjalan menghampiri jendela,

Kebanyakan, perilaku manusia dalam kehidupan sehari-hari berupa operant behavior. Menurut Skinner, stimulus yang menyebabkan perilaku tidak diketahui dan tidak perlu/penting untuk diketahui. Tidak seperti respondent behavior yang tergantung pada stimulus, maka operant behavior dikontrol oleh konsekwensi dari perilaku itu sendiri.

Type S And Type R Conditioning (Pembelajaran)
Sejalan dengan dua macam perilaku di atas, ada dua macam conditioning, yaitu :
a. Type S Conditioning = Respondent Conditioning (=Classical Conditioning) adalah conditioning yang menekankan pada pentingnya stimulus untuk menimbulkan respon yang diinginkan.
Dalam hal ini, kekuatan conditiong ditentukan oleh magnitude of the conditioned response
Tambahan : Type S ini sama dengan Classical Conditiong dari Pavlov
b. Type R Conditioning = Operant Conditioning adalah conditioning yang mencakup operant behavior. Dimana kekuatan conditioning dalam dilihat dari response rate.
Tambahan : Type R ini sama dengan instrumental conditioning dari Thorndike

Catatan : Ada sejumlah perbedaan antara Skinner dengan Thorndike
- Thorndike mengukur belajar melalui berapa lama belajar terjadi (time of solution).
- Skinner mengukur belajar melalui kecepatan membuat respon (rate of responding). Dimana focus dari teori Skinner adalah “how reinforcement mempengaruhi terulangnya perilaku.

Operant Conditioning Principles
Ada dua prinsip yang berhubungan dengan Type R Conditioning, yaitu :
1. Repon yang diikuti oleh reinforcing stimulus cenderung untuk diulang;
2. Reinforcing stimulus adalah segala sesuatu yang dapat meningkatkan kecepatan (rate) terjadinya operant response.



Skinner (1953) tidak menyediakan sejumlah hukum untuk menerangkan tentang efektivitas reinforcer; tetapi ia berpendapat bahwa sesuatu disebut reinforcing atau bukan tergantung dari efeknya terhadap perilaku :
In dealing with our fellow men in everyday life and in the clinic and laboratory, we may need to know just how reinforcing a specific event is. We often begin by noting the extent to which our own behavior is reinforced by the same event. This practice frequently miscarries; yet it is still commonly believed that reinforcers can be identified apart from their effects upon a particular organism. As the term is used here, however, the only defining characteristic of a reinforcing stimulus is that it reinforces.

Fokus operant conditioning adalah perilaku dan konsekwensinya; dimana organisme harus merespon stimulus dengan cara tertentu sehingga dapat menghasilkan reinforcing stimulus. Proses ini, sekaligus, menerangkan contingent reinforcement, dimana pemerolehan reinforcer adalah contingent (dependent) pada munculnya stimulus tertentu dari organisme.

Prinsip-prinsip operant conditioning dapat diterapkan pada berbagai situasi, antara lain :
Modifikasi perilaku., caranya :
o Cari reinforcer yang dapat mereinforce organisme (yang perilakunya akan dimodifikasi)
o Tunggu sampai perilaku yang diinginkan muncul
o Setelah perilaku yang diinginkan muncul, organimse langsung diberi reinforcer.
o Jika hal ini dilakukan, maka rate of responding akan meningkat.

Pengembangan Kepribadian
Menurut Skinner : “we are what we have been reinforced for being”. Dimana personality adalah pola-pola perilaku yang konsisten yang merupakan kesimpulan dari pengalaman reinforcement. Misalnya : Ani mampu berbahasa Inggris, karena setiap hari ia mendengar percakapan-percakapan dengan menggunakan bahasa Inggris.

Skinner (1971) berpendapat bahwa :
The evidence for a crude environmentalism is clear enough. People are extraordinarily different in different places, and possibly just because of the places. The nomad on horseback in Outer Mongolia and the astronaut in outer space are different people, but, as far as we know, if they had been exchanged at birth, they would have taken each outher’s place. (The expression “change places” shows how closely we identify a person’s behavior with the environment in which it occurs). But we need to know a great deal more before that fact becomes useful. What is it about the environment that produces a Hottentot ? What would need to be changed tool produce an English conservative instead ?

Skinner mendefinisikan culture (budaya) sebagai sekumpulan reinforcement contingencies. Budaya yang berbeda akan mereinforce pola-pola perilaku yang berbeda. Kenyataany harus dipahami dengan hati-hati, sebelum dikembangkan teknology perilaku yang sesuai. Skinner (1971), berkata :
The environment is obviously important, but its role has remained obscure. It does not push or pull, it selects, and this function is difficult to discover and analyze. The role of natural selection in evolution was formulated only a little more than a hundred years ago, and the selective role of the environment in shaping and maintaining the behavior of the individual is only beginning to be recorgnized and studied. As the interaction between organism and environment has come to be understood, however, effects once assigned to states of mind, feeling, and traits are beginning to be traced to accessible conditions, and a technology of behavior may therefore become available. It will not solve our problems, however, until it replaces traditional prescientific views, and these are strongly entreched.

Jika seseorang dapat mengontrol reinforcement, maka ia juga mampu mengontrol perilaku. Tetapi pernyataan in tidak perlu dianggap sebagai pernyataan negatif, karena perilaku selalu dipengaruhi oleh reinforcement, meskipun disadari atau tidak.
Ada beberapa langkah yang bisa dilakukan oleh orang tua, untuk mengembangkan kepribadian anaknya, yaitu :
1. Decide the major personality characteristics you want your child to possess as an adult. Let’s say, for example, you want the child to grow up to be a creative adult.
2. Define these goals in behavioural terms. In this case you ask, “What is a child doing when he or she is being creative?”
3. Reward behavior that is in accordance with these goals. With this example, you would reward instances of creativity as they occurred.
4. Provide consistency by arranging the major aspects of the child’s environment so that they too reward the behavior you have deemed important.

Tanpa memahami prinsip ini, orang tua dapat mudah salah menerapkan prinsip ini tanpa mengetahuinya. Skinner (1951), berpendapat :
The mother may unwillingly promotic the very behavior she does not want. For example, when she is busy she is likely not to respond to a call or request made in a quiet tone of voice. She may answer the child only when it raises its voice. The average intensity of the child’s vocal behavior therefore moves up to another level ….. Eventually the mother gets used to this level and again reinforces only louder instances. This vicious circle brings about louder and louder behavior …………. The mother behaves, in fact, as if she has been given the assignment of teaching the child to be annoying.

Shaping
Ada dua komponen dalam shaping, yaitu :
a. Differential Reinforcement, yaitu suatu kondisi di mana respon yang dibuat tidak selalu direinforce.
b. Succesive Approximation, dimana reinforce hanya diberikan jika ada peningkatan respon yang mengarah respon atau perilaku yang diinginkan

Extinction
Suatu kondisi dimana suatu respon tidak muncul setelah beberapa saat tidak mendapatkan reinforce.
Contoh : setelah beberapa kali menekan tuas dan tidak mendapatkan makanan, maka respon binatang eksperimen semakin lama semakin rendah dan terakhir sejajar dengan garis x.
Setelah extinction, kecepatan respon binatang eksperimen kembali seperti respon sebelum direinforce. Kecepatan baseline adalah frekuensi dimana respon yang terjadi secara natural dalam kehidupan binatang tanpa reinforcement (=operant level for response).

Spontaneous Recovery
Peningkatan frekuensi respon setelah extinction tanpa ada latihan.

Superstitious Behaviour
Suatu perilaku yang dipercaya harus dilakukan sebelum mendapatkan reinforcement; dimana perilaku ini merupakan hasil dari noncontingent reinforcement.
Contoh : binatang percobaan menggerakkan kepalanya, mengelilingi lingkaran, berdiri dengan kedua kakinya, dan lain-lain.

Discriminative Operant
Penelitian Skinner tentang binatang percobaan yang dilatih untuk melakukan sesuatu sebelum ia memperoleh makanan; dimana penelitian tersebut disusun sedemikian rupa sehingga lebih kompleks atau lebih rumit. Binatang dilatih untuk menekan tuas pada saat lampu menyala sehingga ia akan memperoleh makanan; jika ia menekan tuas pada saat lampu padam maka ia tidak akan memperoleh makanan. Kondisi dimana binantang menekan tuas pada saat lampu menyala dan tidak menekan tuas pada saat lampu padam. Kondisi ini disebut dengan discriminative stimulus (SD).
Dengan kata lain, bahwa discriminative stimulus adalah sebuah signal atau tanda yang menunjukkan operant response dibuat maka akan direinforce
• Lampu menyala didefinisikan sebagai kondisi SD ,sedangkan lampu padam didefinisikan sebagai kondisi SΔ (Δ = delta)
• Dalam hal ini peneliti telah mengembangkan discriminative operant, dimana operant response hanya dilakukan pada satu rangkaian situasi bukan pada rangkaian situasi yang lain.

Operant behavior adalah perilaku yang muncul, tetapi menurut Skinner (1953) bahwa :
Most operant behavior …. Acquires important connections with the surrounding world. We may show how it does so in our pigeon experiment by reinforcing neck-stretching when a signal light is on and allowing it to be extinguished when the light is off. Eventually stretching occurs only when the light is on. We can then demonstrate a stimulus-response connection which is roughly comparable to a conditioned or unconditioned reflex; the appearance of the light will be quickly followed by an upward movement of the head. But the relation is fundamentally quite different. It has a different history and different current properties. We describe the contingency by saying that a stimulus (the light) is the occasion upon which a response (stretching the neck) is followed by reinforcement (with food). We must specify all three terms. The effect upon the pigeon is that eventually the response is more likely to occur when the light is on. The process through which this comes about is called discrimination. Its importance in a theoretical analysis, as well as in the practical control of behavior, is obvious; when a discrimination has been established, we may alter the probability of a response instantly by presenting or removing the discriminative stimulus.

Ada beberapa discriminative operant dalam kehidupan sehari-hari, misalnya :
- Hari Rabu (SD), harus pergi ke kampus jam 09.00 (R), untuk kuliah praktikum (SR).
- JJS, naik mobil ketemu lampu merah (SD), harus berhenti (R), supaya tidak kena tilang (SR).
- JJS ke Mal, ketemu orang yang dibenci (SD), langsung balik arah (R), menghindar pertemuan dengannya (SR).

Secondary Reinforcement
Secondary Reinforcement adalah stimulus netral yang mengiringi primary reinforcement, sehingga mampu menjadi reinforcing.
Keller dan Schoenfeld (1950), menyimpulkan ciri-ciri dari secondary reinforcement :
1. A stimulus that occasions or accompanies a reinforcement acquires thereby reinforcing value of its own, and may be called a conditioned, secondary, or derived reinforcement. A secondary reinforcement may be extinguished when repeatedly applied to a response for which there is no ultimate primary reinforcement.
2. A secondary reinforcement is positive when the reinforcement with which it is correlated is positive, and negative when the latter is negative
3. Once established, a secondary reinforcement is independent and nonspecific, it will not only strengthen the same response which produced the original reinforcement but it will also condition a new and unrelated response. Moreover, it will do so even in the presence of a different motive
4. Through generalization, many stimuli besides the one correlated with reinforcement acquire reinforcing value-positive or negative

Generalized Reinforcers
A Generalized Reinforcer adalah secondary reinforcer yang dipasangkan dengan lebih dari satu primary reinforcer.
ex : uang, yang dapat menjadi generalized reinforcer, karena uang dihubungkan dengan sejumlah primary reinforcer.
Keuntungan dari generalized reinforcer adalah tidak tergantung pada suatu kondisi deprivasi supaya menjadi efektif
ex : makanan, yang dapat mereinforce jika organisme dalam keadaan lapar. Tetapi uang dapat digunakan sebagai reinforce, terlepas apakah organisme tersebut lapar atau tidak.

Lebih lanjut menurut Skinner (1953),
Eventually generalized reinforcers are effective even though the primary reinforcers upon which they are based no longer accompany them. We play games of skill of skill for their own sake. We get attention or approval for its own sake. Affection is not always followed by a more explicit sexual reinforcement. The submissiveness of others is reinforcing even though we make no use of it. A miser may be so reinforced by money that he will starve rather than give it up.
(Komentar Skinner di atas, sama dengan konsep Gordon tentang Functional Autonomy)

Chaining
Chaining adalah proses dimana satu respon akan membawa organisme untuk merespon pada suatu stimuli, dimana respon tersebut berfungsi sebagai SD untuk respon lain, dan seterusnya.
Chaining ini tidak hanya untuk respon tertentu, tetapi cara berpikir tertentu dapat berfungsi sebagai SD. Hal ini sesuai dengan pendapat Skinner (1953) :
A response may produce or alter some of the variables which control another response. The result is a “chain”. It may have little or no organization. When we go for a walk, roaming the countryside or wandering idly through a museum or store, one episode in our behaviour generates conditions responsible for another. We look to one side and are stimulated by an object which causes us to move in its direction. In the course of this movement, we receive aversive stimulation from which we beat a hasty retreat. This generates a condition of satiation or fatigue in which, once free of aversive stimulation we sit down to rest. And so on. Chaining need not be the result of movement in space. We wander or roam verbally, for example, in a casual conversation or when we “speak our thoughts” in free association.

Positive and Negative Reinforcers
• Primary Positive Reinforcement adalah segala sesuatu yang secara alamiah dapat mereinforce organisme, dimana sesuatu itu berhubungan dengan survival, seperti makanan atau air.
• Secondary Positive Reinforcement adalah stimulus netral yang selau mengiringi primary positive reinforcement, sehingga mempunyai kemampuan untuk menjadi reinforcer positif
• Primary Positive Reinforcement adalah segalah sesuatu yang secara alamiah dapat membahayakan (harmful) organisme, seperti : suara yang memekakkan telinga atau sengatan listrik.
• Secondary Negative Reinforcement adalah stimulus netral yang selalu mengiringi primary negatif reinforcer, sehingga mempunyai kemampuan menjadi reinforcer negatif.

Lebih lanjut Skinner (1953), mengatakan bahwa tidak ada kekaburan antara negative reinforcement dengan punishment,
Events which are found to be reinforcing are of two sorts. Some reinforcements consist of presenting stimuli, of adding something – for example, food, water, or sexual contact – to the situation. These we call positive reinforcers. Others consist of removing something – for example, a loud noise, a very bright light, extreme cold or heat, or electric shock – from the situation. These we call negative reinforcers. In both cases the effect of reinforcement is the same – the probability of response is increased. We cannot avoid this distinction by arguing that what is reinforcing in the negative case is the absence of the bright light, loud noise, and so on; for it is absence after presence which is effective, and this is only another way of saying that the stimulus is removed. The difference between the two cases will be clearer when we consider the presentation of a negative reinforcer or the removal of a positive. These are the consequences which we call punishment.

Punishment
Punishment terjadi jika sesuatu yang menimbulkan sesuatu positif diambil atau ditarik kembali, atau sesuatu yang negatif diberikan.
Secara harafiah (awam berbicara), punishment adalah penarikan kembali /pengambilan sesuatu yang diinginkan oleh organisme atau pemberian sesuatu yang tidak diinginkan oleh organisme
Thorndike dan Skinner, sama-sama mengakui keefektivitasan punishment, dimana punishment tidak mengurangi kemungkinan respon. Meskipun punishement menekan respon selama punishment tersebut diberlakukan, tetapi punishment tidak memperlemah habit. Hal ini sesuai dengan pendapat Skinner (1971)
Punishment is designed to remove awkward, dangerous, or otherwise unwanted behaviour from a repertoire on the assumption that a person who has been punished is less likely to behave in the same way again. Unfortunately, the matter is not that simple. Reward and punishment do not differ merely in the direction of the changes inclined to continue; and a man who has been imprisoned for violent assault is not necessarily less inclined toward violence. Punished behavior is likely to reappear after the punitive contingencies are withdrawn.

Menurut Skinner, bahwa punishment tidak efektif jika diterapkan pada waktu yang lama. Secara sederhana, punishment menekan perilaku, dan jika ancaman punishment dihilangkan, kemungkinan terjadi perilaku yang dipunishment akan kembali seperti semula. Jadi punishment akan berhasil jika diterapkan pada waktu-waktu tertentu.

Ada beberapa argumen yang menentang punishment, antara lain :
1. It causes unfortunate emotional by products. The punishment organism becomes fearful and this fear generalizes to a number of stimuli related to those present as the punishment was occurring.
2. It indicates what the organism should not do, not what it should do. Compared to reinforcement, punishment conveys virtually no information to the organism. Reinforcement indicates that what was done is effective in the situation; therefore, no additional learning is required. Very often punishment informs the organism only that the punished response is one that will not work to bring reinforcement in a given situation, and additional learning is acquired to hit on a response that will work.
3. It justifies inflicting pain on others. This, of course, applies to the use of punishment in child rearing. When children are spanked, the only thing they may be learning is that under some circumstances it is justifiable to inflict pain on others.
4. Being in a situation where previously punished behavior could be engaged in without being punished may excuse a child to do so. Thus, in the absence of a punishing agent, children around, and so on. These children have learned to suppress these behaviors when they could lead to punishment, but in the absence of a punishing agent, there is no reason to avoid engaging in these activities.
5. Punishment elicits aggression toward the punishing agent and others. Punishment causes the punished organism to become aggressive, and this aggression may cause additional problems. For example, our penal institutions, which use punishment as their major means of control, are filled with highly aggressive individuals who will continue to be aggressive as long as punishment or the threat of punishment is used to control their behavior.
6. Punishment often replaces one undesirable response with another undesirable response. For example, a child who is spanked for making a mess may now cry instead, just as a person punished for stealing may now become aggressive and commit even more crimes when he or she has the opportunity.

Sears, Maccoby dan Levin (1957) melakukan penelitian pada 379 ibu-ibu yang tinggal di daerah pinggiran diNew England, tentang bagaimana ibu-ibu tersebut membesarkan anaknya dari mulai lahir sampai sekolah taman kanak-kanak. Kesimpulandari penelitian tesebut, adalah sebagai berikut :
In our discussion of the training process, we have contrasted punishment with reward. Buth are techniques used for changing the child’s habitual ways of acting. Do they work equally well ? The answer is unequivocally “no”, but to be truly unequivocal, the answer must be understood as referring to the kind of punishment we were able to measure by our interview method. We could no, as one can with laboratory experiments on white rats or pigeons, examine the effects of punishment on isolated bits of behavior. Our measures of punishment, whether of the object-oriented or love-oriented variety, referred to Levels of Punitiveness in the mothers. Punitiveness, in contrast to rewardingness, was a quite ineffectual quality for a mother to inject into her child training.
The evidence for this conclusion is overwhelming. The unhappy effects of punishment have run like a dismal thread through our findings. Mothers who punished toilet accidents severely ended up with bedwetting children. Mothers who punished dependency to get rid of it had more dependent children than mothers who did not punish. Mothers who punished aggressive behavior severely had more aggressive children than mother who punish lightly. They also had more dependent children. Harsh physical punishment was associated with high childhood aggressiveness and with the development of feeding problems.
Our evaluation of punishment is that it is ineffectual over the long term as a technique for eliminating the kind of behavior toward which it is directed.

Tetapi mengapa punishment banyak digunakan ? Skinner menjawab (1953)
Severe punishment unquestionably has an immediate effect in reducing a tendency to act in given way. This result is not doubt responsible for its widespread use. We “instinctively” attack anyone whose behavior displeases us – perhaps not an physical assault, but with criticism, disapproval, blame, or ridicule, whether or not there is an inherited tendency to do this, the immediate effect of the practice is reinforcing enough to explain its currency. In the long run, however, punishment does not actually eliminate behavior from a repertoire, and its temporary achievement is obtained at tremendous cost in reducing the over-all effieciency and happiness of the group.
(Catatan : Selama hidupnya Skinner tidak pernah mendapat hukuman fisik dari ayahnya, tetapi ia pernah dihukum oleh ibunya dengan cara dicuci mulutnya dengan sabun supaya bersumpah)

Alternatives to Punishment
Skinner membuat daftar altenatif untuk menghindari punishment, yaitu :
a. dengan cara mengubah situasi yang menimbulkan perilaku yang tidak diingikan, sehingga mengubah perilaku.
misal : memindahkan guci china yang ada di ruang tamu, sehingga dapat menghindari pecah karena perilaku anak-anak
b. membiarkan organisme untuk berbuat sampai kelelahan/bosan
misal : membiarkan bermain korek api sampai bosan atau terkena api; membiarkan makan permen sampai sakit gigi
Tambahan : Menurut Skinner bahwa jika perilaku yang tidak diinginkan merupakan fungsi dari suatu tahap perkembangan, sebaiknya ditunggu sampai organisme tumbuh/berkembang. Dimana menurut Skinner : “It is not always easy to put up with the behavior until this happens, especially under the condition of the average household, but there is some consolation if we know that by carrying the child through a socially unacceptable stage we spare him the later complications arising from punishment”.)
c. membiarkan perilaku itu berlalu, meskipun pendekatanini membutuhkan waktu yang sangat panjang. Kebiasaan sulit untuk dilupakan.
d. mereinforce lawan dari perilau yang tidak diinginkan
misal : jika anak bermain korek api – tidak direinforce; tetapi jika anak membaca buku-buku pelajaran – diberi reinforce
Tambahan : Menurut Skinner cara terbaik untuk menurunkan kebiasaan yang tidak diinginkan adalah dengan menjauhinya/mengabaikannya

Menurut Skinner (1953) :
The best effctive alternative process (to punishment) is probably extinction. This takes time but is much more rapid than allowing the response to be forgotten. The technique seems to be relatively free of objectionable by-products. We recommend it, for example, when we suggest that a parent “pay no attention” to objectionable behavior on the part of his child. If the child’s behavior is strong only became it has been reinforced by “getting a rise out of” the parent, it will disappear when this consequence is no longer forthcoming.

Schedules of Reinforcement
Pavlov telah membuat partial reinforcement dengan menggunakan classical conditioning. Meskipun demikian, Skinner telah meneliti topik secara keseluruhan. Skinner telah membuat mempublikasikan data tentang efek partial reinforcement saat Humprey (yang telah mengejutkan dunia psikologi) menunjukkan proses extinction terjadi setelah diikuti continous reinforcement (reinforcement 100%), sedangkan proses extinction tidak secepat itu pada partial reinforcement.



• Jika organisme selalu menerima reinforcer setiap melakukan tingkah laku tertentu, maka organisme akan membuat tingkah laku yang tepat selama proses belajar; tetapi saat ditidak diberi reinforcer, maka perilakunya akan cepat hilang – jika dibandingkan jika selama proses belajar ia direinforce pada waktu-waktu tertentu.
• Dengan kata lain, partial reinforcement lebih dapat mempertahankan keberadaan perilaku terhadap extinction, daripada continuous atau 100 percent reinforcement. Kondisi ini disebut dengan partial reinforcement effect (PRE)
• Skinner mempelajari partial reinforcement effect secara mendalam, dimana hasil studinya ini ditulis dalam Schedules of Reinforcement (1957) bersama Ferster.

Tujuh schedule of reinforcement yang terkenal adalah sebagai berikut :
1. Continous Reinforcement Schedule (CRF)
CRF adalah reinforcer yang diberikan setiap respon (yang benar muncul) selama proses belajar.
Biasanya, binatang percobaan diberi CRF setelah itu baru diganti dengan partial reinforcement, karena sulit untuk membelajari binatang jika langsung menggunakan partial reinforcement.

2. Fixed Interval Reinforcement Schedule (FI)
FI adalah reinforcer yang diberikan setelah organisme melakukan respon selama beberapa waktu tertentu, misal : setiap 3 menit, binatang diberi makanan.
Biasanya diawal belajar, binatang lambat/tidak membuat respon sama sekali. Di akhir belajar, binatang secara berangsur-angsur menunjukkan respon yang semakin cepat; kelihatan jika binatang mengantisipasi pemberian reinforcement. Respon ini menghasilkan pola pada cumulative recording yang diberi nama fixed-interval scallop.
Kadang-kadang perilaku manusia mirip dengan perilaku binatang di atas, misalnya perilaku saat berhadapan dengan deadline. Misalnya : jika dirasa deadline tugas masih lama, maka manusia cenderung untuk membiarkan sementara waktu; tetapi setelah mendekati deadline/batas waktu, maka ia akan buru-buru untuk mengerjakannya.

3. Fixed Ratio Reinforcement Schedule (FR)
FR adalah reinforcer yang diberikan setiap organisme melakukan beberapa respon (nth response) misal : FR-5 berarti setiap kali binatang melakukan respon lima kali, ia baru diberi respon.
Dalam hal ini, faktor yang paling penting dalam menentukan kapan direinforce adalah jumlah respon yang dibuat. Secara teoritis, binatang yang ada pada FR schedule ini dapat hanya membuat satu respon di akhir interval dan direinforce setiap kali melakukan respon. Tetapi alam FR schedule, kondisi ini tidak mungkin terjadi; karena binatang harus melakukan sejumlah respon sebelum di reinforce.
Tambahan :
Baik FI dan FR reinforcement schedule, respon-respon yang direinforce selalu diikuti oleh depresi/penurunan kecepatan respon. Kondisi ini disebut dengan postreinforcement pause.

Ada beberapa spekulasi, tentang mengapa pause ini timbul :
mungkin binatang telah belajar, bahwa respon yang diikuti oleh reinforcer, maka respon selanjutnya tidak akan direinforce
Jika menggunakan argumen di atas, maka yang perlu diperhatikan bahwa scallop yang ada FI tidak muncul di FR. FR schedule biasanya menimbulkan a steplike cumulative recording, dimana binatang tidak melakukan respon sama sekali setelah mendapat reinforcer; setelah itu membuat respon dengan cepat.

4. Variable Interval Reinforcement Schedule (VI)
VI adalah reinforcer yang diberikan diakhir waktu yang bervariasi
misal : binatang diberi reinforcement setelah 3 menit; kemudian setelah 5 menit atau 10 menit, dsb
Schedule ini dapat menimbulkan respon yang kuat/kokoh/tetap atau respon yang kecepatannya rata-rata; selain itu schedule ini dapat mengurangi/menghilangkan efek scalloping seperti yang ada di FI schedule.

5. Variable Ratio Reinforcement Schedule (VR)
VR adalah reinforcer yang diberikan pada sejumlah respon yang bervariasi.
Salah satu contoh dari VR schedule adalah penjudi. Semkain cepat menarik tombol mesin, semkain sering akan direinforce.
VR ini dapat mengurangi steplike cumulative responding seperti yang ada di FR schedule, dan dapat menghasilkan respon yang kecepatannya paling tinggi (dibandingkan schedule yang lain).

Kesimpulannya :
CRF schedule menghasilkan ketahanan perilaku yang paling rendah dan kecepatan respon yang paling rendah selama proses belajar
Partial reinforcement menghasilkan ketahanan perilaku yang lebih besar dan kecepatan respon yang lebih besar selama proses belajar.
VR schedule menghasilkan kecepatan respon yang paling tinggi; setelah disusul FR schedule; VI schedule; FI schedule dan terakhir CRF.

Verbal Behaviour
Skinner percaya bahwa verbal behavior (language) dapat dijelaskan dengan menggunakan teori reinforcement. Talking dan listening adalah respon-respon yang dipengaruhi oleh reinforcement seperti halnya respon lainnya. Misalnya : ungkapan akan diulang jika direinforce. Skinner mengklasifikasikan verbal responses dalam istilah “how they were related to reinforcement” (bagaimana bahasa itu berhubungan dengan reinforcement). Dalam hal ini, apa yang harus dilakukan untuk mendapatkan reinforcer.

Klasifikasi di atas, terdiri dari :
1. Mand
Menurut Skinner (1957), mand adalah :
A mand is characterized by the unique relationship between the form of the response and the reinforcement characteristically received in a given verbal community. It is sometimes convenient to refer to this relation by saying that a mand “specifies” its reinforcement. Listen ! Look ! Run ! Stop ! and Say yes ! specify the behavior of a listener; but when a hungry diner calls Bread ! or More soup ! he is specifying the ultimate reinforcement. Frequently both the behavior of the listener and the ultimate reinforcement are specified. The mand pass the salt specifies an action (pass) and an ultimate reinforcement (the salt)

2. Tact
Menurut Skinner (1957), tact adalah :
This type of operant is exemplified, in the presence of a doll, a child frequently achieves some sort of generalized reinforcement by saying doll; or when a teleost fish or picture thereof, is the occasion upon which the student of zoology is reinforced when he says teleost fish. There is no suitable term for this type of operant. “Sign”, “symbol”, and more technical terms from logic and semantics commit us to special schemes of reference and stress the verbal response itself rather than the controlling relationship. The invented term “tact” will be used here. The term carries a mnemonic suggestion of behavior which “makes contact with” the physical world. A tact may be defined as a verbal operant in which a response of given form is evoked (or at least strength by showing that in the presence of the object or event, a response of that form is characteristically reinforced in a given verbal community.

3. Echoic Behavior
Echoic behavior adalah perilaku verbal yang direinforce dimana respon verbal lain dari seseorang diulang secara kata-kata.
Biasanya echoic behavior merupakan syarat untuk mencapai perilaku verbal yang lebih kompleks. Misalnya : anak kecil meniru kata-kata sebelum ia belajar bagaimana kata-kata tersebut digabung dengan kata-kata lain atau digabung untuk kejadian lain. Jadi mengulang kata-kata lain dari orang lain adalah reinforce, dan saat respon ini dipelajari, memungkinkan speaker belajar hubungan verbal yang lebih kompleks.

4. Autoclitic Behavior
• Menurut Skinner (1957), istilah “autoclitic” adalah perilaku yang berdasarkan atau tergantung pada perilaku verbal lain.
• Fungsi utama autoclitic adalah mengkualifikasi respon, menggambarkan hubungan dan memberikan kerangka grammatical untuk perilaku verbal.

Programmed Learning
Sama halnya Thorndike, Skinner tertarik untuk menerapkan teori belajarnya pada proses pendidikan.
Menurut Skinner, efektivitas belajar dapat terjadi jika :
1. informasi (pelajaran) diberikan secara tahap demi tahap
2. pelajar diberi feedback (secara langsung) tentang hasil belajarnya (apakah yang telah ia pelajari sudah benar/belum)
3. pelajar dapat belajar dengan caranya sendiri.

Menurut Skinner, prinsip-prinsip tersebut tidak diterapkan di kelas/oleh pengajar. Hal ini ditemui oleh Skinner, saat ia mengunjungi kelas anaknya pada tahun 1953. Lebih lanjut Skinner berkata : “On November 11, as a visiting father, I was sitting in the back of the room in an arithmetic class. Suddenly the situation seemed perfectly absurd. Here were twenty extremely valuable organism. Through no fault of her own, teacher was violating almost everything we know about the learning process.

Yang perlu dicatat, kebanyakan teknik mengajar adalah lecture (perkuliahan) dan teknik lecture merusak semua prinsip di atas. Skinner mengajukan beberapa teknik alternatif yang diberi nama programmed learning, yang disesuaikan dengan ketiga prinsip di atas. Alat yang dibuat untuk menyajikan programmed material (materi yang telah diprogam) disebut teaching machine. Keuntungan dari teaching machine adalah sebagai berikut :
The machine itself, of course, does not teach. It simply brings the student into contact with the person who composed the material it presents. It is a labor-saving device because it can bring one programmer into contact with an indefinite number of students. They may suggest mass production, but the effect upon each student is surprisingly like that of a private tutor. The comparison holds in several respects,
1. There is a constant interchange between program and student. Unlike lectures, text-books, and the usual audio visual aids. The machine induces sustained activity. The student is always alert and busy.
2. Like a good tutor, the machine insists that a given point be thoroughly understood, either frame-by-frame or set-by-set, before the students moves on. Lectures, textbooks, and their mechanized equivalents, on the other hand, proceed without making sure that the student understands and easily leave him behind.
3. Like a good tutor, the machine presents just that material for which the student is ready. It asks him to take only that step which he is at the moment best equipped and must likely to take.
4. Like a skilful tutor, the machine helps the student to come up with the right answer. It does this in part through the orderly construction of the program and in part with techniques of hinting, prompting, suggesting, and so on, derived from an analysis of verbal behavior ……….
5. Lastly, of course, the machine, like the private tutor, reinforces the student for every correct response, using this immediate feedback not only to shape his behavior most efficiently but to maintain it in strength in a manner which the laymen would describe as “holding the student’s interest”.

Contingency Contracting
Contingency contracting adalah pengembangan dari konsep Skinner. Singkatnya, contingency contracting meliputi susunan buatan sehingga orang dapat memperoleh sesuatu yang diinginkan jika ia berperilaku dalam cara tertentu.
Ada beberapa susunan yang sederhana, sehingga dapat diikuti dengan mudah. Misalnya guru berkata pada muridnya : ”jika kamu dapat duduk dengan tenang selama beberapa menit, maka kamu dapat bermain di luar. Ada susunan lain yang lebih rumit dan membutuhkan waktu lebih lama untuk melakukannya. Misalnya : A memiliki masalah berat badan dan ia merasa kesulitan untuk mengurangi berat badan, maka berharap untuk menyusun lingkungan sedemikian rupa sehingga ia dapat mengurangi berat badannya.

Skinner’s Attitude Toward Learning Theory
Skinner percaya bahwa tidak perlu membuat teori yang rumit/komplek untuk mempelajari perilaku menusia, serta tidak penting untuk mengetahui hubungan fisiologis dengan perilaku. Sebaiknya perilaku dijelaskan melalui sesuatu yang berpengaruh langsung terhadap perilaku; oleh sebab itu secara logis tidak konsiten jika menerangkan perilaku melalui kejadian-kejadian fisiologis. Karena alasan itulah, maka metode penelitian-nya Skinner dinamakan “empty organism approach”.
Skinner berpendapat bahwa teori belajar yang kompleks (seperti teori belajar-nya Hull) menghabiskan waktu dan tidak bermanfaat. Mungkin suatu saat, suatu teori dapat bermanfaat untuk psikologi, tetapi tidak dapat mengumpulkan banyak data. Oleh sebab itu, Skinner berusaha untuk menemukan hubungan antara kelompok stimulus dan kelompok respon. Sehingga, penggunaan teori untuk mempelajari proses belajar tidak dibenarkan (Skinner, 1950)
Research design with respect to theory is also likely to be wasteful. That a theory generates research does not prove its value unless the research is valuable. Much useless experimentation results from theories, and much energy and skill are absorbed by them. Most theories are eventually overthrown, and the greater part of the associated research is discarded. This could be justified if it were true that production research requires a theory – as is, of course, often claimed. It is argued that research would be aimless and disorganized without a theory to guide it. The view is supported by psychological texts which take their cue from the logicians rather than empirical science and describe thinking as necessarily involving stages of hypothesis, deduction, experimental test, and confirmation. But this is not the way most scientists actually work. It is possible to design significant experiments for other reason, and the possibility to be examined is that such research will lead more directly to the kind of information which a science usually accumulates

Pendekatan Skinner (1953) untuk penelitian adalah menggunakan functional analysis antara stimulating events dan measurable behavior (stimulus dan perilaku yang dapat diukur) :
The external variable of which behavior is a function provide for what may be called a causal or functional analysis. We undertake to predict and control the behavior of the individual organism. This is our “dependent variable” – the effect for which we are to find the cause. Our “independent variables” – the causes of behavior – are the external conditions of which behavior is a function. Relations between the two – the “cause-and-effect relationship” in behavior – are the laws of a science. A synthesis of these laws expressed in quantitative terms yield a comprehensive picture of the organism as a behaving system.

The Need for a Technology of Behaviour
Skinner berpendapat bahwa teknologi manusia yang dilaksanakan dengan baik akan dapat memecahkan masalah manusia; tetapi manusia juga akan berhadapan dengan kepercayaan tentang diri kita sendiri terutama sebagai manusia yang rasional, bebas dan bermartabat. Skinner (1971) percaya bahwa kepercayaan ini mengganggu solusi masalah utama manusia dan menghambat perkembangan alat yang dapat menyelesaikan masalah-masalah manusia tersebut.
What we need is a technology of behavior. We could solve our problems quickly enough if we could adjust the growth of the world’s population as precisely as we adjust the course of spaceship, or improve agriculture and industry with some of the confidence with which we accelerate high-energy particles, our move toward a peaceful world with something like the steady progress with which physics has approached absolute zero (even though both remain presumably out of reach). But a behavior technology comparable in power and precision to physical and biological technology is lacking and those …………………………………understanding human issues in the sense in which physics and biology understand their fields, and how far we are from preventing the catastrophe toward which the world seems to be inexorably moving.

Lebih lanjut Skinner (1953) berpendapat :
The traditional view of human nature in Western culture is well known. The conception of a free, responsible is embedded in our language and pervades our practices, codes, and beliefs. Given an example of human behavior, most people can describe it immediately in terms of such a conception. The practice is so natural that it is seldom examined. A scientific formulation, on the other hand, is new and strange. Very few people have any notion of the extent to which a science of human behavior is indeed possible. In what way can the behavior of the individual or of group of individuals be predicted and controlled ? What are lows of behavior like ? What over-all conception of the human organism as a behaving system emerges ? It is only when we have answered these questions, at least in a preliminary fashion, that we may consider the implication of a science of human behavior with respect to either a theory of human nature or the management of human affair.

Dalam bukunya yang berjudul “What is Wrong with Daily Life in Western World ?” Skinner (1986) memperbaharui dalihnya tentang penggunaan teknologi perilaku untuk menyelesaikan masalah manusia. Dalam artikel ini, Skinner berpendapat bahwa ada lima masalah budaya yang mengurangi kekuatan efek reinforcement contingencies. Masalah-masalah budaya tersebut adalah :
1. Alienating workers from the consequences of their work;
2. Helping those who could help themselves;
3. Guiding behavior with rules rather than supplying reinforcing consequences;
4. Maintaining aversive sanctions of government and religions with long-deferred benefits for the individual
5. Reinforcing looking, listening, reading, gambling, and so on, while strengthening few other behaviors