Condizionamento operante

Lo studio sul condizionamento operante inizia con Thorndike alla fine del XX secolo. Lo studioso osserva come attraverso prove d’errore gli animali possono giungere a mettere in atto comportamenti che provocano conseguenze positive. Questo processo viene chiamato “legge dell’effetto”.

Skinner successivamente riprende in maniera più sistematica gli studi di Thorndike e arriva a definire il condizionamento operante come l’aumento della probabilità di emissione di un comportamento se questo è seguito da un rinforzo.

I rinforzi sono divisibili in due macro categorie: rinforzi positivi e rinforzi negativi.

Il rinforzo positivo descrive un comportamento che messo in atto produce uno stimolo appetivo. Ad esempio se fare un regalo al vostro partner lo rende particolarmente affettuoso allora sarete incentivati a elargire regali.

Il rinforzo negativo descrive un comportamento che previene o allontana uno stimo lo avversivo. Ad esempio se telefonare al vostro partner allontana sentimenti di gelosia nei suoi confronti sarete incentivati a telefonare ogni volta che proverete quei sentimenti.

I rinforzi sono più efficaci tanto più sono prossimi al comportamento. Per questo motivo è difficile, ad esempio, aumentare il comportamento di studio di un bambino se un voto positivo (rinforzo) viene dato a distanza di settimane.

condizionamento operante

Il paradigma del condizionamento operante prevede, simmetricamente ai rinforzi, il concetto di punizione. La punizione è l’opposto del rinforzo ovvero, è il processo attraverso il quale la somministrazione di uno stimolo avversivo o l’eliminazione di uno stimolo appetivo riduce l’emissione del comportamento. Nel primo caso si parla di punizione vera e propria mentre nel secondo di addestramento all’omissione.

La punizione è la presentazione di uno stimolo avversivo a seguito di un comportamento. Ad esempio se quando regalate dei dolci al vostro partner lui si lamenta del fatto che lo volete far ingrassare smetterete di regalargli dolci.

L’addestramento all’omissione è un comportamento che previene o allantana uno stimolo appetivo. Ad esempio se il vostro partner diviene meno affettuoso quando uscite con gli amici allora le volte in cui uscirete con gli amici si ridurranno.

In generale il rinforzo produce un esito “favorevole” o mediante l’aggiunta di qualcosa che desideriamo (rinforzo positivo) o attraverso l’eliminazione di qualcosa che non desideriamo (rinforzo negativo). La punizione produce qualcosa di “sfavorevole” o mediante l’aggiunta di qualcosa che non vogliamo (punizione) o attraverso l’eliminazione di qualcosa che desideriamo (addestramento all’omissione).

Modellamento: quando la risposta che volete rinforzare è insolita diventa difficile aspettare che il soggetto la metta in atto spontaneamente. In questo caso si ricorre al modellamento, processo che consiste nel rinforzare tutti i comportamenti che vanno nella direzione desiderata. Questo incentiva la messa in atto di comportamenti sempre più prossimi a quello desiderato. Si procede con il rinforzare gradualmente comportamenti via via più simili a quello finale aumentando di pari passo la precisione del rinforzo. Ad esempio se vogliamo insegnare a un piccione a beccare un cerchio per ottenere del cibo, nelle prime fasi dovremo rinforzare l’animale anche quando becca altra figura presenti nella sua gabbietta. Gradualmente le figure più lontane dal cerchio non verranno più rinforzate a favore di quelle più prossime. In questo modo alla fine potremo rinforzare selettivamente il piccione solo quando becca il cerchio. Questa tecnica viene utilizzata infatti per insegnare agli animali a mettere in atto comportamenti complessi.

Rinforzi condizionati: possiamo suddividere i rinforzi in primari e secondari. I rinforzi primari sono quelli associati alla soddisfazione di un bisogno fondamentale come ad esempio il cibo mentre i rinforzi secondari sono quelli associati ai rinforzi primari ma intrinsecamente neutri. Negli esperimenti sugli animali si è visto come sia possibile associare alla distribuzione del cibo un suono. In questo modo l’animale attraverso un condizionamento di tipo classico impara ad associare due stimoli e il suono finisce con l’ottenere il ruolo di rinforzo anche in assenza di cibo. Negli umani gli esempi più eclatanti di rinforzi condizionati (secondari) sono i soldi e le lodi.

Programmi di rinforzo.

Rinforzo parziale: una volta che il comportamento è stato acquisito può essere rinforzato di tanto in tanto. Se una risposta viene mantenuta con il rinforzo parziale ci vuole molto più tempo prima che cada in estinzione. La cadenza con cui un comportamento viene rinforzato può variare nelle quattro modalità descritte:

Programma a rapporto fisso: si ottiene un rinforzo dopo un numero fisso di risposte. L’esempio potrebbe essere quello di un impiegato pagato dopo ogni 10 pratiche svolte. Un effetto saliente di questo tipo di rinforzo è la pausa della risposta che si verifica immediatamente dopo il rinforzo. L’impiegato dopo 10 pratiche svolte non comincerà subito la sesta bensì avrà un periodo di latenza.

Programma a rapporto variabile: si riceve un rinforzo dopo un numero imprevedibile di risposte. In questo tipo di rinforzo non c’è pausa ed è ben esemplificato dalle slot machineche pagano dopo un numero variabile di giocate.

Programma a intervallo fisso: un comportamento viene rinforzato dopo che è passato un certo tempo dall’ultima risposta rinforzata. Le risposte date all’interno di quell’intervallo non contano. Un effetto di questo tipo di rinforzo è l’aumento del numero di risposte all’approssimarsi del rinforzo. Se un sito internet che seguiamo aggiorna i suoi contenuti quotidianamente, appena i contenuti sono stati aggiornati non si va nuovamente alla ricerca di nuovi aggiornamenti ma quando si avvicina lo scadere del giorno si comincia di nuovo a controllare.

Programma a intervallo variabile: il rinforzo accorre dopo un certo intervallo di tempo che però varia in modo imprevedibile. In questo caso il soggetto attua il comportamento con frequenza elevata e uniforme senza inflessioni. È il caso il cui troviamo un telefono occupato e riproviamo insistentemente fino a quando il telefono non suona libero.

Bibliografia

Atkinson, R.C., & Hilgard, E.R., (2006). Introduzione alla Psicologia. Piccin: Padova

Meccacci, L., (2001). Manuale di Psicologia Generale. Giunti: Firenze