Operant Conditioning: Definition, egenskaper och exempel

Operant konditionering eller Instrumentell konditionering är en typ av lärande där beteendet styrs med konsekvenser.

Det bygger på idén om att förstärkande beteenden tenderar att dyka upp vid flera tillfällen, medan beteenden som straffas släcks.

Vad är skillnaden mellan operantkonditionering och klassisk konditionering? Vid operant konditionering följs ett frivilligt svar av en förstärkare. På detta sätt kommer det frivilliga svaret (till exempel att studera för en tentamen) sannolikt att uppstå i framtiden. Tvärtom, i klassisk konditionering aktiverar en stimulans automatiskt ett ofrivilligt svar.

Operant konditionering kan beskrivas som en process som försöker modifiera beteende genom användning av positiv och negativ förstärkning. Genom operant konditionering gör en individ en koppling mellan ett visst beteende och en konsekvens. Exempel:

  • Föräldrar belönar bra betyg för ett barn med godis eller något annat pris.
  • En lärare belönar de elever som är lugna och utbildade. Studenter inser att genom att uppträda så här får de fler poäng.
  • En mat ges till ett djur varje gång en hävarm pressas.

BF Skinner (1938) utgjorde termen operant konditionering. Skinner identifierade tre typer av svar eller operander som kan följa beteendet:

  • Neutrala operatörer : Svar från miljön som inte ökar eller minskar sannolikheten för att ett beteende upprepas.
  • Förstärkare : Svar från miljön som ökar sannolikheten för upprepning av ett beteende. Förstärkare kan vara positiva eller negativa.
  • Straff : Svar från miljön som minskar sannolikheten för att ett beteende upprepas. Straffet försvagar beteendet.

Antecedents of operant condition

Thorndike var först med att erkänna att denna konditionering innehåller mer än bara ett svar och en förstärkare. Svaret ges i närvaro av vissa stimuli, med tanke på tre händelser: stimulans, svaret och konsekvensen av svaret eller förstärkaren.

Denna struktur underlättar utvecklingen av olika bindningar, såsom sambandet mellan stimulansen och svaret, vilket var för Thorndike nyckeln till formuleringen av effektlagen. Genom detta bekräftade han att de svar som följs av förstärkande konsekvenser kommer att bli mer benägna att uppstå när stimulansen återkommer.

Tvärtom kommer de svar som följs av negativa konsekvenser att ha en lägre sannolikhet för förekomst när stimulansen återkommer. Effektlagstiftningen är den antecedent av operativ konditionering eller instrumentell konditionering, som den heter av Thorndike.

Men för Skinner, en psykolog av behaviorism, var konditionering förstärkning av beteenden enligt de konsekvenser som tidigare skulle ha erhållits.

I denna linje finns det två former av konditionering:

  • Den klassiska eller Pavlovian: den är baserad på föreningen av okonditionerade och betingade stimuli, som svaren kontrolleras av antecedent stimuli.
  • Operant konditionering: Följande eller förstärkning stimuli för att ett visst beteende ska utfärdas. Skinner förklarar att om beteendet följs av en positiv förstärkare skulle det öka sannolikheten för att sådant beteende utfärdas i framtiden. Tvärtom, om ett svar inte följs av en förstärkare eller att förstärkaren är negativ, blir sannolikheten att utfärda beteendet i framtiden lägre.

Grundläggande begrepp operant konditionering

uppbackning

Det är ansvaret för utfärdandet av svar, det vill säga sannolikheten för att de kommer att hända, oavsett om det är större eller mindre i framtiden. Det är en förstärkning och konsekvent stimulans, eftersom det inträffar när svaret har inträffat.

Det är omöjligt att veta om en given förstärkare påverkar beteendet tills det presenteras ett försvar med ett svar och det är verifierat att beteendet ändras som en följd av förstärkaren.

Det finns två typer av förstärkning: positiva och negativa. Båda har samma syfte att öka sannolikheten för att svaret kommer att utfärdas i framtida situationer. För Skinner förstärkare definieras dessutom beteenden som är observerbara och mätbara.

Positiv förstärkning

Positiv förstärkning förstärker ett beteende genom att ge en konsekvens att en individ finner belöning.

Negativ förstärkning

Avlägsnandet av en obehaglig förstärkare kan också stärka ett beteende. Detta kallas negativ förstärkning eftersom det är eliminering av ett negativt stimulans som är "givande" för djuret eller personen. Negativ förstärkning förstärker beteendet eftersom det stannar eller eliminerar en obehaglig upplevelse.

Primär förstärkare

Det skulle vara alla grundläggande förstärkare som inte behöver någon historia av tidigare konditionering för att fungera som sådan. Några exempel skulle vara vatten, mat och sex.

Sekundära förstärkare

De sekundära förstärkarna om de skulle baseras på tidigare historier av konditionering tack vare föreningen med okonditionerade stimuli. Några exempel skulle vara pengar och kvalifikationer.

Beredskap om tre villkor

Det är den grundläggande modellen för operant konditionering och består av tre komponenter: diskriminerande stimulans, svaret och förstärkande stimulans.

En diskriminerande stimulans skulle vara den som kommer att indikera på ämnet att förstärkaren är tillgänglig, vilket indikerar att om han utför ett visst beteende kan han få förstärkaren. Däremot har vi delta stimulans eller stimuli som indikerar att beteendet inte leder till att någon typ av förstärkare erhålls.

Svaret skulle vara det beteende som ämnet kommer att utföra, vars genomförande leder eller inte kommer att få den förstärkande stimulansen.

En förstärkande stimulans, som nämnts ovan, är ansvarig för utsläppet av beteendet eftersom tack vare dess utseende kommer sannolikheten att utfärda ett svar öka eller minska i framtiden.

Begrepp att vara kända om operantkonditionering

straff

Straffet mäts också av dess effekter på ämnets beteende. Å andra sidan, till skillnad från förstärkning, är det som är avsedd att minska eller undertrycka ett visst beteende.

Ett straff minskar sannolikheten för att utföra ett beteende i senare situationer. Det eliminerar emellertid inte svaret eftersom om hotet om straff minskar kan beteendet återfå.

I straff är det också två olika typer eller förfaranden, positivt straff och negativt straff.

Positiv bestraffning

Detta innebär att en aversiv stimulans presenteras efter utförandet av ett visst beteende. Det ges tillfälligt mot svaret från ämnet.

Negativ bestraffning

Det består i att eliminera en stimulans till följd av ett visst beteende, det vill säga består det av att ett positivt stimulans avlägsnas efter utförandet av ett visst beteende.

utrotning

Vid utrotningen stoppas ett svar eftersom förstärkaren inte längre visas. Denna process bygger på att inte tillhandahålla motsvarande förstärkare som förväntas uppnås och det har orsakat att beteendet upprätthålls över tiden.

När ett svar släckes blir den diskriminerande stimulansen en utrotnings stimulans. Denna process bör inte förväxlas med att glömma, vilket ges när kraften hos ett beteende minskar när det inte har utfärdats under en tidsperiod.

generalisering

Som svar på en specifik situation eller stimulans är ett svar konditionerat, vilket kan förekomma före andra stimuli eller liknande situationer.

diskriminering

Denna process är motsatsen till generalisering, där den svarar annorlunda beroende på stimulans och sammanhanget.

Förstärkningsprogram

Skinner etablerade också flera förstärkningsprogram, inklusive kontinuerliga förstärkningsprogram och intermittenta förstärkningsprogram.

Kontinuerliga förstärkningsprogram

De är baserade på den ständiga förstärkningen av svaret varje gång det presenteras, det vill säga varje gång personen utför det önskade beteendet, kommer han eller hon att få en förstärkning eller positiv stimulans.

Intermittenta förstärkningsprogram

Däremot erhåller subjektet inte alltid förstärkaren när man utför det önskade beteendet. Dessa definieras utifrån antalet svar som ges eller tidsintervallen mellan svaren, vilket ger upphov till olika förfaranden.

Fastighetsprogram

I dessa program tillhandahålls förstärkaren när motivet genererar fasta och konstanta svar. I ett program med förhållande 10 erhåller personen exempelvis förstärkaren efter att ha gjort tio svar när stimulansen presenteras.

Program av variabel anledning

Detta är konstruerat som det föregående, men i detta fall är antalet svar som ämnet måste ge för att få förstärkaren variabel.

Förstärkaren skulle fortsätta att bero på antalet svar som emitteras av ämnet men av varierande skäl, tack vare vilket ämnet förhindras att förutsäga när förstärkaren kommer att erhållas.

Fasta intervallprogram

I intervallprogrammen beror inte förstärkaren på antalet svar som ämnet ger, men bestäms av den tid som förflutit. Följaktligen förstärks det första svaret som framställts efter att ha gått en viss tidsperiod.

I de fasta intervallprogrammen är tiden mellan förstärkare och förstärkare alltid densamma.

Variabla intervallprogram

I dessa program erhålls förstärkaren efter ett tag, även om tiden är annorlunda för varje mottagen förstärkare.

Behavioral förändring

Efterföljande approximationer eller formning

Formningen består av beteendeförändringen genom formning av beteenden eller differentialförstärkning av successiva approximationer.

En serie steg följs för att forma ett konkret beteende. För det första identifieras det ursprungliga beteendet som är avsett att formas för att veta vilken du vill nå.

Därefter avgränsas de möjliga förstärkare som ska användas, och processen separeras i steg eller steg för att nå det slutgiltiga beteendet, förstärka varje steg eller successivt tillvägagångssätt tills den når den sista.

Med denna dynamiska procedur förvandlas både beteenden och deras konsekvenser. I detta avseende förstärks de successiva tillvägagångssätten mot ett objektivt beteende.

För att kunna genomföras är det dock nödvändigt att starta från ett tidigare beteende som ämnet redan utför, för att gradvis förstärka sitt beteende tills de når målet.

konkatenering

Med det bildas ett nytt beteende från sönderdelningen till enklare steg eller sekvenser, förstärkning av varje svar som ges i varje steg för att leda till inrättandet av ett mer komplext svar i ämnets beteenderepertoar.

Långa kedjor av svar kan bildas med hjälp av konditionerade förstärkare, anta en funktionell enhet vars etablering leder till förvärv och definition av en viss färdighet.