Aller au contenu

Principes et procédures en ABA

Calendrier de renforcement

Calendrier de renforcement

Pour qu'un comportement rentre dans le répertoire comportemental d'un individu, il doit être renforcé.

Pour apprendre un nouveau comportement à une personne, nous devons donc lui apporter le renforcement nécessaire. Toutefois, personne ne nous dit "super" après chaque comportement que nous émettons. Il est donc essentiel d'estomper le renforcement pour arriver à une situation naturelle, renforçante en soit, sans mettre le comportement appris en extinction.

Pour cela, il est essentiel de se baser sur un "calendrier de renforcement" pour permettre un apprentissage rapide, efficace et résistant à l'extinction. En effet, la fréquence de renforcement va jouer sur la vitesse d'apprentissage et sur sa résistance à l'extinction.

Il est donc important de maîtriser ces concepts pour mettre en place des apprentissages efficaces.

Les calendriers de renforcement sont donc des protocoles que l'intervenant doit suivre pour favoriser à la fois la vitesse d'apprentissage puis sa résistance à l'extinction.

renforcement continu (CRF)

Le renforcement continu consiste à renforcer toutes les occurrences du comportement cible.

Ce type de renforcement permet un apprentissage rapide, il est donc utilisé pour mettre en place ou pour renforcer un comportement, mais le comportement reste très sensible à l'extinction. Il est donc souvent utilisé en début d'apprentissage.

Il est nécessaire d'estomper ce renforcement (quand le critère déterminé est atteint) en passant à un renforcement intermittent.

ex:

essai 1:  réponse cible → renforcement
essai 2:  réponse cible → renforcement
essai 3:  réponse cible → renforcement
essai 4:  réponse cible → renforcement
essai 5:  réponse cible → renforcement
essai 6:  réponse cible → renforcement
essai 7:  réponse cible → renforcement
essai 8:  réponse cible → renforcement
essai 9:  réponse cible → renforcement
essai 10: réponse cible → renforcement

renforcement intermittent

Les renforcements intermittents servent à maintenir un comportement déjà établi et à le rendre plus résistant à l'extinction.

Les renforcements intermittents peuvent se décrire suivant deux variables:

soit le nombre d'occurrences du comportement ou un intervalle de temps

soit la variable précèdente est fixe, ou variable

nombre de réponses

Le renforcement est délivré après un certain nombre d'occurrences du comportement. Les calendriers de renforcement par nombre de réponses permettent un taux de réponses plus important que les calendriers de renforcement par intervalle de temps.

ratio fixe (FR)

Le nombre de réponses reste le même entre chaque renforcement. Donc un FR3 équivaut à délivrer le renforcement toutes les trois réponses, un FR100 toutes les 100 réponses.

Note: FR1=CRF=renforcement continu, on renforce chaque occurrence.

ex: FR3

essai 1:  réponse cible → non-renforcement
essai 2:  réponse cible → non-renforcement
essai 3:  réponse cible → renforcement
essai 4:  réponse cible → non-renforcement
essai 5:  réponse cible → non-renforcement
essai 6:  réponse cible → renforcement
essai 7:  réponse cible → non-renforcement
essai 8:  réponse cible → non-renforcement
essai 9:  réponse cible → renforcement

ratio variable (VR)

Le nombre de réponse varie de manière aléatoire mais respecte une moyenne.

Ils produisent un taux important et stable de réponse, rendant le comportement plus résistant à l'extinction.

Donc un VR3 consiste à délivrer le renforcement en moyenne toutes les trois réponses, un VR100 en moyenne toutes les 100 réponses.

ex: VR2

essai 1:  réponse cible → renforcement
essai 2:  réponse cible → non-renforcement
essai 3:  réponse cible → non-renforcement
essai 4:  réponse cible → renforcement
essai 5:  réponse cible → non-renforcement
essai 6:  réponse cible → renforcement
essai 7:  réponse cible → renforcement
essai 8:  réponse cible → non-renforcement
essai 9:  réponse cible → renforcement
essai 10: réponse cible → non-renforcement

Intervalle de temps

Le renforcement est délivré à la première occurrence apparaissant après un certain temps

intervalle fixe (FI)

La quantité de temps reste la même.

Après le renforcement, une pause du comportement se produit. Ceci est suivi d'une augmentation graduelle de plus en plus forte du taux de réponse du comportement jusqu'à la délivrance du nouveau renforcement.

intervalle variable (VI)

La quantité de temps varie de manière aléatoire mais respecte une moyenne.

Ils produisent une augmentation modérée (voir faible) mais stable du taux de réponses.

espace limité (LH)

C'est une condition supplémentaire qui peut être ajoutée au FI ou au VI.

Il s'agit d'une restriction placée dans l'intervalle de temps où l'occurrence du comportement doit arriver dans un temps donné suivant l'intervalle prédéfini.

Renforcement non contingent (Calendrier basé sur le temps)

Ce ne sont pas à proprement parler des calendriers de renforcement, car le renforcement n'est pas délivré de manière contingente à la réponse mais il est délivré à un moment donné sans exigence de réponse. Ils ont pour effet de rompre les effets des contingences en place.

L'intervalle de temps peut là aussi être fixe ou variable.

Exemple: le renforcement arrivera toutes les 5 minutes peu importe la réponse.

Renforcement diffèrentiel

Les renforcements diffèrentiels permettant de modifier la fréquence d'apparition d'un comportement sont des calendriers de renforcement:

DRH

DRL

DRD

réf:

-Alternative fixed-ratio fixed-interval schedules of reinforcement. Journal of Experimental Analysis of Behavior. Rider 1980

-Generating Variable and Random Schedules of Reinforcement Using Microsoft Excel Macros. Journal of Applied Behavior Analysis. Bancroft & Bourret 2008

Chainage

Chainages

Les chainages sont des procédures utilisées pour l'apprentissage de tâches complexes composées de comportements simples.

Les comportements simples doivent s'enchainer, chaque comportement simple devant avoir comme réponse le comportement simple suivant.

L'analyse de tâche

L'analyse de tâche consiste à décomposer la tâche complexe en toutes ces composantes simples.

ex: lavage des dents —→

1 Ouvrir le robinet

2 Prendre le verre

3 Remplir le verre

4 Poser le verre

5 Prendre la brosse à dents

6 Humidifier la brosse à dents

7 Fermer le robinet

8 Poser la brosse à dents

9 Prendre le tube dentifrice

10 Ouvrir le tube

11 Poser le bouchon

12 Prendre la brosse à dents

13 Mettre le dentifrice sur la brosse

14 Poser le tube

15 Brosser les dents de devant (haut-bas)

16 Brosser les dents à droite (haut-bas)

17 Brosser les dents à gauche (haut-bas)

18 Brosser les dents de devant (derrière)

19 Poser la brosse à dents

20 Prendre le verre

21 Rincer la bouche

22 Cracher

23 Poser le verre

24 Ouvrir le robinet

25 Rincer la brosse à dents

26 Ranger la brosse

27 Fermer le robinet

28 Fermer le tube de dentifrice

29 Ranger le tube

30 Essuyer la bouche

Chaque analyse de tâche doit être propre à la personne, par rapport à ce qu'elle sait déjà faire, à son environnement, et ses habitudes de vie.

chainage. pdf

Chainage avant

On apprend à la personne la première étape de la chaine que l'on renforce immédiatement.

Ensuite, la première et la deuxième puis on renforce.

Ensuite, la première, la deuxième et la troisième puis on renforce.

Jusqu'à l'ensemble de la tâche.

Chainage arrière

On apprend à la personne la dernière étape de la tâche.

On guide l'ensemble de la chaine jusqu'à la dernière réponse puis on renforce.

On guide l'ensemble de la chaine sauf la dernière étape qui est effectuée seule puis on renforce.

On guide l'ensemble de la chaine sauf les deux dernières étapes qui sont effectuées seules puis on renforce.

On guide l'ensemble de la chaine sauf les trois dernières étapes qui sont effectuées seules puis on renforce.

l'ensemble de la chaine est réalisée seul.

Total task chaining

On guide l'ensemble de la tâche, en estompant petit à petit les guidances sur chaque comportement simple en fonction des progrès de la personne.

Le renforcement est donné à la fin de chaine.

Il existe encore d'autres types de chainage.

pour aller plus loin:

  • The effects of errorless learning and backward chaining on the acquisition of internet skills in adults with developmental disabilities. Journal of Applied Behavior Analysis. Jerome, Frantino & Sturmey 2007
  • Treating total liquid refusal with backward chaining and fading. Journal of Applied Behavior Analysis. Hagopian, Farrell & Amari 1996.
  • An assessment of the efficiency of and child preference for forward and backward chaining. Journal of Applied Behavior Analysis. Slocum & Tiger 2011.

Choix comportementaux

Choix comportementaux

Nous sommes souvent confrontés dans notre vie à devoir faire des choix plus ou moins simples.

Les choix comportementaux que nous faisons ne se font pas par hasard, mais interviennent en fonction de diffèrents facteurs, qu'il est important de maîtriser lorsque nous souhaitons comprendre pourquoi un comportement continue à se produire, pour mettre en place un renforcement diffèrentiel, etc.

Nous verrons ici:

Matching Law

Quantité et qualité de renforcement

Délai de renforcement

Effort de réponse

Matching law- loi de correspondance

La loi de correspondance (matching law), mise en lumière par Herrnstein en 1961, explique de manière comportementale comment un organisme choisit d'effectuer un comportement plutôt qu'un autre en fonction de son taux de renforcement.

En effet, le taux d'occurrence d'un comportement par rapport à l'occurrence d'un autre comportement concurrent correspond à son taux relatif de renforcement par rapport au taux relatif de renforcement de l'autre comportement.

R1/(R1+R2)=F1/(F1+F2)

R1 = nombre d'occurrence du comportement 1

R2 = nombre d'occurrence du comportement 2

F1 = taux de renforcement du comportement 1

F2 = taux de renforcement du comportement 2

C'est un concept extrêmement important pour comprendre et déterminer la fréquence d'apparition d'un comportement, et à lier directement avec les calendriers de renforcement.

un exemple pour être plus clair:

j'ai une chance sur deux de gagner un chocolat si je dis A et une chance sur trente de gagner un chocolat si je dis B… Je dirai donc beaucoup plus souvent A (si j'aime le chocolat)

ref:

  • Relative and Absolute. Strength of response as function of frequency of reinforcement. Journal of Experimental Analysis of Behavior. Herrnstein 1961
  • Basketball and matching law. Behavioral Technology Today. Bourret & Vollmer 2003
  • The Matching Law: A Tutorial for Practitioners. Behavior Analysis in Practice. Reed & Kaplan 2011

Qualité et quantité du renforcement

La qualité du renforcement est en relation directe avec le choix du comportement à émettre.

En effet, plus un renforcement sera appétitif, plus on choisira le comportement qui lui est lié.

ex:

  • si je reçois 1€ à chaque fois que je lève la main gauche et 10€ à chaque fois que je léve la main droite… Je lèverai beaucoup plus souvent la main droite (si l'argent est renforçant).
  • si je reçois une super voiture toute neuve si je lève la main gauche et que je reçois un vieux tacot sans moteur si je lève la main droite… Il y a plus de chance que je lève la main gauche (si je préfère la nouvelle voiture au tacot).

ref:

  • The effects of magnitude and quality of reinforcement on choice responding during play activities. Journal of Applied Behavior Analysis. Hoch, McComas, Johnson, Faranda & Guenther 2002

Délai de renforcement

Le délai de renforcement est aussi une donnée importante dans les choix que nous faisons. En effet, plus un renforcement sera rapide, plus on choisira le comportement qui lui est lié.

ex:

  • A pizza équivalente, j’aurai plus de chance d’appeler le livreur qui me livre en 3 minutes, que celui qui met 3h12m33s

Effort de réponse

L'effort de réponse, ou coût de la réponse, est aussi un critère primordial dans nos choix. En effet, si un comportement nécessite un effort plus important qu’un autre comportement pour obtenir un même renforcement, il sera moins choisi que le comportement amenant le même renforcement plus facilement

ex:

-Deux magasins identiques, le premier à 5min à pied, le second à 300km dans des routes de campagne… il y a de fortes chances que vous retourniez plus souvent dans le premier

ref:

  • An investigation of differential reinforcement of alternative behavior without extinction. Journal of Applied Behavior Analysis. Athens & Vollmer 2010

Conditionnement répondant

Il y a plein d'idées préconçues sur le conditionnement répondant. On oppose souvent le conditionnement opérant et le conditionnement répondant, il y aurait un "bon" et un "mauvais" conditionnement. Or, s'ils sont diffèrents, ces deux conditionnements sont des processus naturels d'apprentissages indispensables, aucun n'est ni bon, ni mauvais… juste diffèrents, avec des applications diffèrentes.

Si l'ABA est en très grande partie basée sur le conditionnement opérant (skinnérien), la maîtrise des concepts du conditionnement répondant est indispensable à tout bon analyste du comportement.

liens rapides:

La découverte du conditionnement répondant

Les découvreurs

Principes et procédures du conditionnement répondant

Principe général du conditionnement répondant

Réflexes inconditionnés

Conditionné / conditionneur

Conditions du conditionnement répondant

Phénomènes liés au conditionnement répondant (généralisation, discrimination, habituation, potentiation, extinction, sensibilisation, adaptation, retour spontané)

Modèle Rescorla-Wagner

La découverte du conditionnement répondant

La découverte du conditionnement répondant date du début du XXe siècle.

Il marque un tournant majeur de la psychologie. En effet, cette découverte et ces découvreurs sont à la base de la psychologie objective, en opposition avec d'anciennes visions de la psychologie plus subjectives comme le structuralisme et faisant appel à l'introspection.

Ces travaux serviront de bases à John B. Watson pour la rédaction du célèbre "Manifeste Behavioriste" en 1913, point de départ du behaviorisme… base de l'ABA.

Les découvreurs

Edwin B. Twitmyer

Le psychologue américain, Edwin B. Twitmyer, est un grand oublié de la psychologie malgré qu'il soit le premier à publier des travaux sur le conditionnement répondant en 1902, devançant ainsi la publication des travaux de Pavlov d'un an.

La découverte de Twitmyer se fit par hasard, comme pour Pavlov. En effet, lors de ces travaux sur le réflexe patellaire, il associa une cloche pour prévenir le sujet de la délivrance du coup de marteau. Un jour, la clochette tintât par inadvertance et Twitmyer remarque que le tintement déclencha la même réponse du sujet que le coup de marteau sur le tendon rotulien.

Il répliqua de nombreuses fois son expérience, ce fut la première description du conditionnement répondant, de plus chez l'humain.

réf: Knee jerks without simulation of the patellar tendon. Psychological Bulletin. Twitmyer, E. B. (1905).

Vladimir Bekhterev

Vladimir Bekhterev est un neurologue russe.

Il fut le premier à ouvrir un laboratoire de psychologie expérimentale en Russie (1886).

Les travaux de Bekhterev sur les "réflexes d'association" (nom donné par Bekhterev à ce que nous appelons aujourd'hui "réflexes conditionnés") portaient sur l'association de stimuli neutres avec des chocs électriques provoquant des réflexes de retrait.

Les travaux de laboratoire sur les réflexes d'association furent publiés en 1908.

Bekhterev est à l'origine d'un ouvrage important sur la psychologie objective en trois volumes: "Объективная психология" (1907-1910) ("psychologie objective").

Bekhterev a aussi travaillé dans diffèrents domaines comme le sommeil, la psychiatrie, la neurologie (notamment le fonctionnement et la description du système cérébro-spinal)

Bekhterev mourut mystérieusement empoisonné en 1927, après avoir diagnostiqué une paranoïa sévére deux jours auparavant à Joseph Staline.

L'apport de Bekhterev au behaviorisme est primordial, car même si Watson utilise le terme de "réflexe conditionné" et s'appuie sur les travaux de Pavlov, il utilise des protocoles plus proches des travaux de Bekhterev, utilisant notamment les techniques de chocs électriques de ce dernier. De plus, ses conclusions et théories sont aussi beaucoup plus proches de celles de Bekhterev.

Ivan Pavlov

Ivan Pavlov est un médecin et physiologiste russe.

Il est surtout reconnu pour sa description du conditionnement répondant, souvent appelé en son honneur "conditionnement pavlovien".

Les travaux de Pavlov portaient à l'origine sur la salivation et la digestion chez le chien. Il prit l'habitude de distribuer la nourriture à ses chiens dans le même lieu et dans les mêmes conditions. La présentation de la nourriture causait l'activation du réflexe de salivation chez les chiens.

Or, un jour, il remarqua que les chiens se mettaient maintenant à saliver dés que les chiens rentraient dans la pièce ou voyait le plat ou la personne donnant à manger.

Cela servira de base à ses nouveaux travaux lui permettant d'établir les lois fondamentales d'acquisition et de perte des réflexes conditionnés.

Même si Pavlov est surtout connu pour son travail sur le conditionnement répondant, il reçut le prix Nobel en 1904, non pour son travail sur le conditionnement, mais sur la démonstration d'un contrôle hormonal lors de l'émission des sécrétions digestives.

Principe et procédures du conditionnement répondant

Principe général du conditionnement répondant

Soit un stimulus dit neutre, noté Sn, n'entrainant pas de réponse.

Soit un stimulus inconditionné(non appris), noté Si, entrainant une réponse inconditionnée (non apprise), notée Ri.

Alors, la présentation répétée de Sn en présence de Si entraînera que ce stimulus, précèdemment neutre, provoquera une réponse conditionnée (apprise), notée Rc, semblable à Ri, et sera donc devenu un stimulus conditionné, noté Sc.

Le Sc prend alors les caractéristiques du Si et peut lui même conditionné un autre Sn à devenir un nouveau Sc.

Réflexes inconditionnés

Un réflexe inconditionné est la relation entre un stimulus inconditionné (sans apprentissage) et une réponse inconditionnée (sans apprentissage).

Les réflexes sont dirigés par le système nerveux végétatif (ortho et parasympathique) et non pas par le système nerveux central.

Les réflexes inconditionnés sont innés et ne dépendent pas de l'apprentissage. Certains réflexes peuvent disparaitre au fur et à mesure du développement (certains réflexes présents chez les bébés disparaissent au cours du temps) mais la plupart demeurent durant toute la vie de l'organisme.

Les réponses sont émises de manière involontaires, et sont invariantes dans leurs formes.

Il existe un grand nombre de réflexe chez l'humain:

  • réflexe patellaire (le genou et le marteau chez le médecin)
  • respiration (en fonction de la pression d'aire dans les poumons)
  • clignement des yeux (lors d'un fort bruit soudain ou en recevant de l'air sur la cornée)
  • le réflexe pupillaire (en fonction de la luminosité)
  • défécation (en présence de féces dans le rectum)
  • accommodation (mise au point de la vision vers un item)
  • vasodilatation, miction, réflexe plantaire, de Moro, myotatique, succion, tremblement… et beaucoup d'autres! !!

Conditionné / conditionneur

L'association d'un stimulus neutre avec un stimulus inconditionné entraînera la transformation du stimulus neutre en stimulus conditionné, c'est à dire qu'il provoquera une réponse semblable (réponse conditionnée) à la réponse inconditionnée. Il se créera donc un réflexe conditionné. Le stimulus inconditionné, ici, sera un conditionneur.

De plus, le stimulus conditionné pourra lui-même conditionner un nouveau stimulus neutre à entraîner une réponse semblable. Le stimulus conditionné sera donc lui aussi un conditionneur potentiel.

ex:

Conditions du conditionnement

Le conditionnement répondant peut se mettre en place en fonction de certains critères, notamment la temporalité dans la présentation des stimuli. Si ces critères sont réunis dans l'environnement, le conditionnement peut se mettre en place. Il est donc présent dans la nature, tous les jours, ou peut être mis en place pour répondre à un objectif donné (voir applications).

Délai court

Dans cette condition, le début de présentation du stimulus neutre précède dés le début de présentation du stimulus inconditionné d'un temps de 1 à 2 secondes ( maximum atteint pour 1/2 seconde). L'arrêt de présentation du stimulus neutre précède l'arrêt du stimulus inconditionné. Il y a donc un chevauchement des stimuli.

Cette condition est reconnue comme étant très efficace.

Délai long

Dans cette condition, le début de présentation du stimulus neutre précède dés le début de présentation du stimulus inconditionné et l'arrêt de présentation du stimulus neutre précède l'arrêt du stimulus inconditionné. Il y a un chevauchement des stimuli.

Ce qui le diffère du délai court, c'est le délai entre la présentation des stimuli qui est plus important (peut être beaucoup plus important, plus de 30 secondes).

Cette condition est reconnue comme étant efficace.

Simultanéité

Dans cette condition, le début de présentation du stimulus neutre arrive au même moment que le début de présentation du stimulus inconditionné.

Cette condition n'est pas reconnue comme étant efficace.

Attention:

  • la présentation simultanée de deux stimuli neutres avec un délai pour la présentation du stimulus inconditionné est efficace pour conditionner les deux stimuli neutres.
  • la présentation simultanée d'un stimulus neutre et d'un stimulus, précèdemment conditionné avec notre stimulus inconditionné, avec un délai pour la présentation du stimulus inconditionné n'est pas efficace pour conditionner le stimulus neutre.

Trace

Dans cette condition, la fin de présentation du stimulus neutre précède dés le début de présentation du stimulus inconditionné. Il n'y pas de chevauchement des stimuli.

Cette condition est reconnue comme étant potentiellement efficace (si le délai est inférieur à 5 secondes).

Conditionnement arrière

Dans cette condition, le début de présentation du stimulus inconditionné précède dés le début de présentation du stimulus neutre.

Cette condition est inefficace, hormis, quoique rarement, avec un stimulus aversif.

Dans cette condition le stimulus conditionné peut être appris comme un prédicteur de la cessation du stimulus inconditionné et acquérir des propriétés inhibitrices qui empêchent une réponse comportementale.

Conditionnement temporel

Dans cette condition, le stimulus inconditionné est présenté à intervalle régulier sans présentation d'un stimulus neutre.

Pour fonctionner, cette procédure de conditionnement a besoin que l'intervalle soit fixe.

Autres conditions

D'autres facteurs sont aussi à prendre en compte:

le nombre d'essai

l'intensité du stimulus neutre et du stimulus inconditionné (plus le stimulus inconditionné est intense plus le conditionnement est rapide)

la durée du stimulus neutre et du stimulus inconditionné (ni trop long, ni trop court)

Phénomènes liés au conditionnement répondant

Généralisation et discrimination

La généralisation du stimulus est ici un phénomène qui décrit comment une réponse conditionnée est émise avec un stimulus similaire au stimulus conditionné provoquant cette réponse conditionnée. Au plus le stimulus diffère du stimulus conditionné, au plus la réponse diffère de la réponse conditionnée (perte de puissance).

La discrimination est le contraire de la généralisation, la réponse n'est émise qu'avec le stimulus conditionné et n'apparaît pas en présence du stimuli proche.

La généralisation et la discrimination peuvent se visualiser par le gradient de généralisation qui montre la relation entre le degré de changement entre le stimulus conditionné original et la puissance de réponse.

Généralisation

Habituation

Il s'agit d'une réduction transitoire de la réponse réflexe.

Cette réduction temporaire est due à la présentation répétée dans un laps de temps relativement court du stimulus (qui peut être un stimulus inconditionné ou un stimulus conditionné) déclenchant la réponse réflexe

Potentiation

Il s'agit d'une augmentation transitoire de la réponse réflexe.

Cette augmentation temporaire résulte de la présentation répétée d'un stimulus (qui peut être un stimulus inconditionné ou un stimulus conditionné) généralement aversif déclenchant la réponse réflexe.

Adaptation

Il s'agit d'une réduction de la réponse réflexe (en fréquence et/ou en intensité).

Cette réduction est due à une exposition prolongée au stimulus (inconditionné ou conditionné), cet effet n'est pas transitoire.

Sensibilisation

Il s'agit de l'augmentation généralement transitoire d'une réponse réflexe à un stimulus par la présentation initiale d'un autre stimulus provoquant cette réponse réflexe.

Si habituellement S2→X, alors si S1→R1, par sensibilisation S2→R1 de manière transitoire.

Extinction

L'extinction en conditionnement répondant est la perte de la valeur du stimulus conditionné pour l'émission de la réponse conditionnée par la présentation répétée du stimulus conditionné seul (sans son conditionneur).

Après extinction, le stimulus conditionné n'entraine plus la réponse conditionnée.

Retours d'extinction

Après une extinction, un stimulus conditionné peut récupérer ses propriétés de précurseur de réponse:

par réacquisition: le stimulus inconditionné est réappairé avec le stimulus inconditionné. Ce conditionnement est généralement plus rapide que lors du premier conditionnement.

par retour spontané: à la suite d'un délai de non-présentation du stimulus conditionné après l'extinction, le stimulus conditionné peut provoquer de nouveau la réponse, d'une manière toutefois plus faible que les réponses émises avant l'extinction.

Modèle de Rescorla-Wagner

Les recherches sur le conditionnement répondant sont encore nombreuses et donc en constante évolution.

En 1972, deux chercheurs, Robert A. Rescorla de l'université de Pennsylvanie et Allan R. Wagner de l'université de Yale, propose un modèle mathématique modifiant les modèles "d'opérateurs linéaires " de Bush et Mosteller (1955).

Ce modèle permet d'expliquer comment se produit le conditionnement répondant en décrivant les changements des forces associatives entre le signal (stimulus conditionné) et le stimulus ultérieur (stimulus inconditionné) d'une procédure de conditionnement.

Même si ce modèle peut avoir quelques insuffisances, il est tout de même très efficace et très utile de par son pouvoir de prédiction vérifié par l'expérience, de par le peu de variables indépendantes et surtout… il est pour le moment le modèle le plus efficace.

Ce modèle peut se formaliser de cette manière:

réf:

-Learning 5th Edition, Catania 2013 ISBN-10: 1597380237ISBN-13: 978-1597380232

-Concepts and Principles of Behavior Analysis, Jack L. Michael 2004 ISBN-10: 0976160714 ISBN-13: 978-0976160717

-Introduction aux neurosciences comportementales, Descamps & Darcheville 2009 EAN13: 9782100524426

-Learning and complex behavior, Danahoe & Palmer ISBN 0-9762371-0-5

-http: //www. scholarpedia. org/article/Rescorla-Wagner_model

  • The Rescorla-Wagner Model, Simplified W. J. Wilson Albion College
  • Peut-on s'arréter au conditionnement Pavlovien? Molet, Craddock & Leconte-Lambert. Acta comportementalia 2004

Contingences ABA

L'émission d'un comportement est en lien avec son environnement. Le maintien, l'augmentation ou la diminution de l'émission d'un comportement est aussi en lien avec l'environnement et avec les interactions qu'il entretient avec celui-ci.

Nous verrons:

Les termes de la contingence

antécédent

comportement-behavior

conséquence

opérations motivationnelles (MO)

contingences à quatre termes

Les termes de la contingence

Antécédent

On appelle "antécédent" les événements environnementaux (stimuli) existant avant l'émission de la réponse comportementale.

Nous pouvons retrouver à cet endroit:

Les Opérations Motivationnelles

Les stimulus discriminatifs (SD): événement de l'environnement prévenant qu'une réponse particulière sera renforcée.

Les stimulus delta (SΔ): événement de l'environnement prévenant qu'une réponse particulière ne sera pas renforcée.

Comportement – Behavior

Un comportement est l'interaction d'un organisme vivant avec son environnement qui peut être à la fois observable et mesurable par autrui ou par lui même.

Une réponse équivaut à l'émission du comportement à un moment unique ( on émet trois réponses d'un comportement )

Un comportement peut se définir par ses dimensions et sa topographie ( la durée, la latence, son apparence, sa force…)

Un comportement est émis pour remplir une fonction.

Pour savoir si ce que nous définissons est bien un comportement, on peut appliquer le "dead man test": si un mort peut le faire, alors ce n'est pas un comportement

ex: "ne pas obéir"-→un mort peut le faire (un mort ne fait jamais ce qu'on lui demande...)--------→ ce n'est pas un comportement

"marcher"——→ un mort ne peut pas le faire————————————————————-→ c'est un comportement

Conséquence

On appelle "conséquence" les événements environnementaux (stimuli) existant après l'émission de la réponse comportementale.

Ces événements pourront soit maintenir, soit augmenter, soit diminuer la fréquence d'apparition d'un comportement en fonction qu'ils remplissent ou non la fonction du comportement

Opérations motivationnelles (MO)

Les opérations motivationnelles sont des antécédents qui modifient la valeur de la conséquence.

Par exemple, j'aurai plus de chance de prendre un morceau de chocolat en le voyant si j'ai faim que si je n'ai pas faim.

Elles peuvent soit augmenter la valeur de la conséquence, Establishing Operation (EO); ou la diminuer, Abolishing Operation (AO).

Contingences à quatre termes

C'est diffèrents termes interragissent ensemble, un dessin valant des fois mieux qu'un long texte, voici un schéma expliquant ses relations:

ref: – Matching-to-sample performance is better analyzed in terms of a four-term contingency than in terms of a three-term contingency. Journal of the Experimental Analysis of Behavior. Jones & Elliffe 2013

  • Equivalence relations and the reinforcement contingency. Journal of the Experimental Analysis of Behavior. Sidman 2000
  • The application of establishing operations. The Behavior Analyst. Sundberg 1993

Évaluation fonctionnelle du comportement

Lors de l'émission d'un comportement défi, les réponses les plus souvent données sont des réprimandes, l'isolement de la personne, ou de lui faire la morale… Toutefois, ces approches sont relativement inefficaces car même si la personne répond sur l'instant aux conséquences données aux comportements, cela n'a qu'une efficacité à court terme car cela ne permet pas d'apprendre un comportement adapté à la personne.

Il est important de comprendre le "pourquoi" du comportement, sa fonction et les contingences qui le maintiennent, pour pouvoir mettre en place un plan d'intervention comportemental efficace… il faut donc procéder à une évaluation fonctionnelle.

Comment conduire une évaluation fonctionnelle:

recherche des informations:

-interview et/ou questionnaire: Cela permet de définir le problème de comportement rencontré, il est recommandé d'interroger au moins 2 personnes ayant observer le comportement.

ex:

EEF. pdf

Functional Assessment and Program Development for Problem Behavior: A Practical Handbook. O'Neill, Albin, Storey, Horner, Sprague 1996

ISBN-13: 978-0534260224 ISBN-10: 0534260225

QABF fr. pdf

A validity study on the questions about behavioral function (qabf) scale: predicting treatment success for self-injury, aggression, and stereotypies. Research in Developmental Disabilities. Matsona, Bamburga, Cherrya, Paclawskyj 1999

FAST traduit. pdf

Reliability and validity of the Functional Analysis Screening Tool. Journal of Applied Behavior Analysis. Iwata, DeLeon & Roscoe 2013

observation directe

L'observation directe permet de collecter et de mesurer de manière objective le comportement cible.

L'analyse de la séquence

Cela permet d'enregistrer la séquence du comportement (Antecedent-Behavior-Consequence——→ antécédent-comportement-conséquence—→ ABC), il est nécessaire de recueillir un maximum de données (un seul enregistrement du comportement est insuffisant).

Pour ce faire, il peut être utilisé les grilles dites ABC vierges, des grilles pré-rempli (à cocher) ou grille d'évaluation fonctionnelle par observation (o'neill&al 90). ex:

FAO fr. pdf

grille abc. pdf

La fréquence d'apparition

permet de connaitre le nombre de fois où le comportement apparaît et de déterminer le nombre de fois où il apparaît par unité de temps, pour cela nous pouvons utiliser une grille dite de dispersion.

ex:

dispersion. pdf

La durée et la latence

Il est aussi important de mesurer la durée et la latence (temps avant l'apparition) du comportement.

Pour mesurer la fréquence, la durée et la latence, nous utilisons une application que nous avons développé pour récolter ces données (image de l'application)

Si la fonction du comportement n'est toujours pas évidente, et que la sévérité du comportement le permet (PAS DE MISE EN DANGER! !!), nous passons à:

manipulation expérimentale, l'analyse fonctionnelle ( Iwata 82/94)

Cette procédure permet de tester empiriquement les fonctions du comportements en notant dans quelle condition le comportement apparaît le plus souvent.

Il est donc nécessaire de tester l'apparition du comportement dans toutes les conditions en rapport avec les fonctions des comportements.

Il faut donc procéder aux 3 conditions correspondant aux 3 fonctions et à une condition contrôle

SEULE: on laisse la personne seule sans stimulation; permet de tester l'AUTOSTIMULATION

SOCIAL: on place la personne avec des stimulations à disposition, puis l'examinateur se place à un coin de la piéce en ignorant la personne. Une réponse est donnée par l'expérimentateur après l'apparition de chaque comportement (fais pas ça, tu veux ça, attention tu vas te faire mal, etc.); pemet de tester la DEMANDE D'ATTENTION

ACADEMIQUE: on donne à la personne des tâches éducatives, sélectionner en fonction de son évaluation de compétences, à réaliser qui ont peu de probabilité d'être réalisé; permet de tester l'ECHAPPEMENT/EVITEMENT

JEUX NON-STRUCTURE: condition CONTROLE

Des résultats de cette évaluation fonctionnelle, dépendra le plan d'intervention comportemental mis en oeuvre pour traiter le comportement défi.

functional analysis iwata 94. pdf

Extinction et renforcement diffèrentiel

L'extinction est une procédure importante et très efficace. Toutefois, elle est souvent mal comprise, mal interprétée ou mal appliquée… et donc n'apporte pas les résultats escomptés.

Il est important de noter que l'extinction, si elle diminue la fréquence d'apparition d'un comportement, n'apprend pas de comportement alternatif répondant à la fonction du comportement. Il est important de toujours renforcer les comportements adéquats à coté de l'extinction. Il existe pour cela des procédures: les renforcements diffèrentiels.

L'extinction

Une procédure d'extinction: suite à un comportement pré-défini préalablement renforcé dans le passé, il ne se produit aucun changement dans l'environnement.

Cette procédure est utile pour réduire la fréquence d'appartion d'un comportement. En effet, le comportement ne remplissant plus sa fonction, il diminuera en fréquence car il deviendra inutile pour l'organisme.

"L'extinction en tant que procédure se produit lorsque le renforcement d'un comportement préalablement renforcé est interrompu; par conséquent, la fréquence de ce comportement diminue dans le futur. "

Heward, Heron, Neef, Peterson, Sainato, Cartledge, et al. (Eds.). (2005). Focus on behavior analysis in education: Achievements, challenges, and opportunities. Upper Saddle River, NJ: Prentice Hall/Merrill. ISBN 0-13-111339-9.

ATTENTION: l'extinction n'est pas un retrait d'attention! !! Le retrait d'attention est une punition négative (s'il fait diminuer la fréquence d'apparition du comportement). En effet, on enlève un stimulus (ici, l'attention) pour réduire le comportement, il y a donc un changement dans l'environnement.

De plus, si le comportement ne sert pas à obtenir de l'attention, le retrait d'attention ne fonctionnera pas. Le retrait d'attention n'est donc pas la stratégie à utiliser pour tous les comportements défis! !!

Il est donc important de procéder à une évaluation fonctionnelle pour déterminer la stratégie à mettre en place.

ref: – What makes extinction work: an analysis of procedural form and function. Journal of Applied Behavior Analysis. Iwata, Pace, Cowdery & G Miltenberger 1994

Le pic d'extinction

Il est important de noter que lors d'une mise en place d'une procédure d'extinction, il se produit ce que l'on nomme un pic d'extinction.

Le pic d'extinction est une augmentation en fréquence et en intensité du comportement, il est important d'y être préparé car il peut être important et il peut laisser à penser que la procédure ne fonctionne pas alors que ce pic est une réaction normale et attendue.

Il est aussi à noter qu'il peut y avoir ensuite des récupérations spontanées qui doivent s'arrêter si la procédure est continuée.

ref: – Side effects of extinction: prevalence of bursting and aggression during the treatment of self-injurious behavior. Journal of Applied Behavior Analysis. Lerman, Iwata & Wallace 1999

Un exemple connu de tous les parents pour un joli pic d'extinction

Les renforcements diffèrentiels (DR)

Le renforcement diffèrentiel est un principe fondamental en ABA.

En effet, si l'extinction permet de réduire la fréquence d'apparition d'un comportement, elle n'apprend pas de comportement alternatif adapté. Il peut donc apparaître de nouveaux comportements répondant à la fonction initiale qui peuvent être encore plus problématiques que le comportement mis en extinction.

L'extinction ne doit donc jamais se faire seule, mais doit être accompagnée d'une procédure permettant la mise en place de comportements alternatifs adaptés qui rentreront, en plus, en compétition avec le comportement mis en extinction ce qui rendra la procédure d'extinction d'autant plus efficace.

Il existe plusieurs types de renforcement diffèrentiel:

Pour remplacer un comportement cible:

DRA

Renforcement diffèrentiel des comportements alternatifs

Le Differential Reinforcement of Alternative Behavior (DRA – Renforcement diffèrentiel des comportements alternatifs) consiste en la délivrance du renforcement lorsque des comportements alternatifs adaptés sont émis.

Le comportement cible est mis en extinction.

ref: – An investigation of differential reinforcement of alternative behavior without extinction. Journal of Applied Behavior Analysis.

Athens & Vollmer 2010

DNRA

Renforcement négatif diffèrentiel des comportements alternatifs

Le Differential Negative Reinforcement of alternate behaviors (DNRA – Renforcement négatif diffèrentiel des comportements alternatifs) consiste au retrait du stimulus aversif lorsque des comportements alternatifs adaptés sont émis.

Le comportement cible est mis en extinction.

ref: – Preliminary comparison of two negative reinforcement schedules to reduce self-injury. Journal of Applied Behavior Analysis. Roberts, Mace & Daggett 2013

DRI

Renforcement diffèrentiel des comportements incompatibles

Le Differential Reinforcement of Incompatible Behavior (DRI – Renforcement diffèrentiel des comportements incompatibles) est une variation du DRA, il consiste en la délivrance du renforcement lorsque des comportements alternatifs adaptés et incompatibles topographiquement avec le comportement cible sont émis.

Le comportement cible est mis en extinction.

ref: – Functional analysis and treatment of inappropriate verbal behavior. Journal of Applied Behavior Analysis. Dixon, Benedict & larson 2001

DNRI

Renforcement négatif diffèrentiel des comportements incompatibles

Le Differential Negative Reinforcement of Incompatible Behaviors (DNRI – Renforcement négatif diffèrentiel des comportements incompatibles) consiste au retrait du stimulus aversif lorsque des comportements incompatibles adaptés sont émis.

Le comportement cible est mis en extinction.

ref: – Contingency Space Analysis: An Alternative Method for Identifying Contingent Relations from Observational Data. Journal of Applied Behavior Analysis. Martens, DiGennaro, Reed, Szczech & Rosenthal 2008

DRC ou FCT

Renforcement diffèrentiel des comportements de communication ou entraînement à la communication fonctionnelle

Le Differential reinforcement of communication behaviors (DRC – Renforcement diffèrentiel des comportements de communication) ou Functional Communication Training (FCT – entraînement à la communication fonctionnelle) est une variation du DRI, il consiste en la délivrance du renforcement lorsqu'un comportement de communication est émis à la place du comportement mis en extinction et en remplit la même fonction.

Le comportement cible est mis en extinction.

ref: – Establishing discriminative control of responding using functional and alternative reinforcers during functional communication training. Journal of Applied Behavior Analysis. Fisher, Kuhn & Thompson 1998

Pour l'absence d'un comportement cible:

DRO

Renforcement diffèrentiel des autres comportements

Le Differential Reinforcement of Other Behaviors (DRO – Renforcement diffèrentiel des autres comportements) consiste en la délivrance du renforcement lorsque le comportement de la cible n'a pas eu lieu au cours d'une période de temps spécifique. Le DRO fournit le renforcement en l'absence ou l'omission d'un comportement cible et renforce donc tous les autres comportements..

Le comportement cible est mis en extinction.

ref: – DRO contingencies: an analysis of variable-momentary schedules. Journal of Applied Behavior Analysis. Lindberg, Iwata, Kahng & DeLeon 1999

  • A comparison of response cost and differential reinforcement of other behavior to reduce disruptive behavior in a preschool classroom. Journal of Applied Behavior Analysis. Conyers, Miltenberger, Maki, Barenz, Jurgens, Sailer, Haugen & Kopp 2004
  • The effect of rules on differential reinforcement of other behavior. Journal of Applied Behavior Analysis. Watts, Wilder, Gregory, Leon & Ditzian 2013

DNRO

Renforcement négatif diffèrentiel des autres comportements

Le Differential Negative Reinforcement of Other Behaviors (DNRO – Renforcement négatif diffèrentiel des autres comportements) consiste au retrait du stimulus aversif lorsque le comportement cible n'a pas eu lieu au cours d'une période de temps spécifique. Le DNRO fournit le renforcement par retrait du stimulus aversif en l'absence ou l'omission d'un comportement cible.

ref: – Preliminary comparison of two negative reinforcement schedules to reduce self-injury. Journal of Applied Behavior Analysis. Roberts, Mace & Daggett 2013

pour modifier la fréquence d'apparition d'un comportement cible (comportement adapté à une certaine fréquence mais non-adapté si trop ou trop peu):

DRH

Renforcement diffèrentiel de taux élevés de comportement

Le Differential Reinforcement of High Rates of Behavior (DRH – Renforcement diffèrentiel de taux élevés de comportement) consiste en la délivrance du renforcement lorsque le comportement cible se produit un nombre supérieur de fois à un critère prédéterminé sur un intervalle de temps donné.

Full Session DRH: Un renforçateur est donné si, pendant toute une session le comportement cible apparaît un certain nombre de fois.

Interval DRH: Un comportement est renforcé s'il apparaît au moins un certain nombre de fois pendant une période de temps donnée.

Spaced-Responding DRH: Un comportement est renforcé seulement si moins d'un laps de temps préétabli s'est écoulé depuis la dernière occurrence du comportement.

Il n'y a pas de renforcement si le comportement cible se produit moins de fois que le critère.

ref: – Effects Of Histories Of Differential Reinforcement Of Response Rate On Variable-interval Responding. Journal of the Experimental Analysis of Behavior. Ono & Iwabuchi 1997

DRL

Renforcement diffèrentiel à bas taux

Le Differential Reinforcement of Low Rates of Behavior (DRL – Renforcement diffèrentiel à bas taux de comportement) consiste en la délivrance du renforcement lorsque le comportement cible se produit un nombre inférieur de fois à un critère prédéterminé sur un intervalle de temps donné.

Full Session DRL: Un renforçateur est donné si, pendant toute une session durant laquelle le problème de comportement a lieu, l'apparition du comportement ne dépasse pas un certain nombre de fois.

Interval DRL: Un comportement est renforcé s'il apparaît moins d'un certain nombre de fois pendant une période de temps donnée.

Spaced-Responding DRL: Un comportement est renforcé seulement si plus d'un laps de temps préétabli s'est écoulé depuis la dernière occurrence du comportement.

Il n'y a pas de renforcement si le comportement cible se produit plus de fois que le critère.

ref: – Using differential reinforcement of low rates to reduce children's request for teacher attention. Journal of Applied Behavior Analysis. Austin & Bevan 2011

DRD

Renforcement diffèrentiel des taux régressifs de réponses

Le Differential Reinforcement of Diminishing Rates (DRD – Renforcement diffèrentiel des taux régressifs de réponses) est une variation procédurale du DRL où l'on diminue systématiquement le nombre d'apparition du comportement cible.

ref: – Cooper, Heron & Heward (2007). Applied Behavior Analysis, 2nd ed. ISBN: 0-1-142113-1 (livre)

Façonnement

Le façonnement est une technique d’apprentissage par un renforcement diffèrentiel.

En effet, nous renforçons les approximations de plus en plus proche du comportement cible tout en mettant en extinction les approximations précèdentes plus éloignées du comportement cible, jusqu'à l'obtention du comportement cible.

Le façonnement implique l’augmentation progressive du niveau d’exigence quant à la topographie du comportement cible. Il est donc nécessaire de partir d'un comportement approximatif du comportement cible (starting behavior).

Il est nécessaire de suivre et noter avec attention les changements vers le comportement cible pour savoir avec précision où nous nous trouvons dans le façonnement.

Selon M. Sundel et S. Sundel (2004), les étapes suivantes doivent être respectées pour façonner un comportement:

Spécifier la réponse souhaitée

Spécifier le renforcement positif à utiliser

Spécifier les réponses initiales et intermédiaires

Renforcer la réponse initiale à chaque fois qu'elle se produit et retenir le renforcement des autres réponses jusqu'à ce que la réponse initiale soit réalisée de manière cohérente

Décaler le critère pour l'obtention du renforcement, de la réponse initiale à une réponse intermédiaire

Renforcer la réponse intermédiaire jusqu'à ce qu'elle soit réalisée de manière cohérente, puis déplacer le critère pour renforcer progressivement les autres réponses intermédiaires qui sont de plus en plus proches de la réponse souhaitée

Renforcer la réponse souhaitée quand elle est performée

Pourquoi?

Le façonnement peut être utilisé pour:

créer un nouveau comportement qui ne peut être acquis en une seule fois

rétablir un comportement préalablement utilisé par la personne

changer une dimension d'un comportement existant

Exemple: Apprendre à dire « maman ». On commence par renforcer le comportement « mmm », puis on augmente l’exigence et on ne renforce plus que « ma »… puis « mama », « maman »…

ref: – Evaluating stimulus-stimulus pairing and direct reinforcement in the establishment of an echoic repertoire of children diagnosed with autism (exp3). The Analysis of Verbal Behavior. Esch, Carr & Michael 2005

  • Behavior change in the human services (chapitre 5: Shaping and Response Differentiation). Sundel & Sundel 2004
  • A day of great illumination: B. F. Skinner's discovery of shaping. Journal of the Experimental Analysis of Behavior. Peterson 2004

Fonction du comportement

Tout comportement émis remplit une fonction.

"The function of a behavior refers to the source of environmental reinforcement. "

Tarbox et al 2009

"La fonction d'un comportement se réfère à la source de renforcement de l'environnement. "

Tarbox et al 2009

"A behaviour that a person engages in repeatedly will typically serve some kind of purpose or fonction for them"

O'Neill et al 1997

"Un comportement qu'une personne engage à plusieurs reprises sert généralement une sorte de but ou de fonction pour eux. "

O'Neill et al 1997

Les comportements sont émis et maintenus par le renforcement.

Le renforcement peut être de deux types:

-renforcement positif (ajout d'un stimulus)

-renforcement négatif (retrait d'un stimulus)

Les fonctions du comportement sont donc remplis par l'un ou l'autre de type de renforcement.

par renforcement positif:

-obtenir de l'attention (possiblement pour demander un item ou une activité)

-obtenir une stimulation

par renforcement négatif:

-obtenir le retrait ou éviter d'un stimulus

Nous pouvons donc voir apparaître 3 fonctions principales:

Demande d'attention:

Le comportement est émis dans le but d'obtenir l'attention ( qui peut être de n'importe quelle nature) d'une ou plusieurs personnes:

dans un but social

dans le but d'obtenir un item ou une activité.

Autostimulation:

Le comportement est émis pour obtenir une stimulation interne par renforcement automatique.

Echappement/Evitement:

Le comportement est émis pour obtenir le retrait ou éviter la confrontation à un stimulus particulier.

Avant toute intervention sur un comportement, il est nécessaire de connaître sa fonction pour comprendre ce qui le maintient.

Pour cela, il est nécessaire de procéder à une évaluation fonctionnelle.

ref: – The functions of self-injurious behavior: an experimental-epidemiological analysis. Journal of Applied Behavior Analysis. Iwata & al 1994

Guidance

Les guidances sont un outil d'apprentissage important utilisé en analyse appliquée du comportement.

Les guidances sont des aides qui permettent d'augmenter la probabilité d'une réponse correcte d'un individu quand les antécédents ordinaires ne suffisent pas à engendrer le comportement.

Quand délivrer la guidance

La guidance doit intervenir entre l'antécédent, qui deviendra le stimulus discriminatif, et le comportement émis.

Les diffèrents types de guidances

Il existe diffèrents types de guidances, comme par exemple:

les guidances verbales:

Mot, phrase ou consigne qui donne au sujet une information sur le comportement à émettre.

ATTENTION: elles sont très difficiles à estomper et rendent dépendant, A EVITER.

Guidance de réponse.

Ex: "pour faire cela, tu dois prendre le… "

les guidances visuelles:

On place dans l'environnement des indices visuels pour aider l'enfant.

Guidance de stimulus.

Ex: Dessiner sur un set de table une assiette, un verre, des couverts pour que l'enfant apprenne à mettre la table.

les guidances gestuelles:

Il s'agit de faire des gestes qui vont aider à diriger l'attention de l'enfant sur la réponse correcte à donner.

Guidance de stimulus.

Ex: Pointer, montrer du doigt.

les guidances modèles:

On montre le comportement à faire.

Guidance de réponse.

Ex: On boit un verre pour que la personne boive un verre.

les guidances physiques:

On va aider physiquement la personne à émettre un comportement, elle peut être facile à estomper dans certains apprentissages, mais son choix dépend de la compétence, du contexte, du risque d’erreur, du consentement et de la facilité d’estompage.

Guidance de réponse.

Ex: prendre la main et moduler physiquement le comportement d'écrire, de boire…

les guidances tactiles:

Toucher la personne ou ses vêtements pour impulser la réalisation du comportement.

Guidance de réponse.

Ex: Toucher le manteau pour que l’enfant l’enlève

les guidances environnementales:

Aménagement de l’environnement physique pour induire le comportement désiré.

Guidance de stimulus.

Ex: Mettre un objet en plastique pour tenir correctement un crayon

Estompage (fading)

L'estompage est un ensemble de stratégies utilisées en ABA permettant qu'une compétence en apprentissage rentre dans le répertoire comportemental de la personne et pour qu'elle puisse l'utiliser de manière autonome.

Il s'agit donc d'estomper les guidances pour les rendre inutiles et surtout de NE PAS RENDRE LA PERSONNE DEPENDANTE A LA GUIDANCE! !! !

"most to least" et "least to most"

"Most to least"

Pour les nouveaux apprentissages

On commence par la guidance la plus forte, puis on estompe vers la moins forte

minimise les erreurs (utilisation dans l'apprentissage sans erreur)

attention au risque de dépendance aux guidances

"Least to most"

Pour rendre l'apprentissage plus indépendant

On augmente la guidance en cas d'erreur ou de non réponse

erreurs possible

moins de risque de dépendance aux guidances

Time delay

On allonge progressivement la durée avant d’introduire la guidance (favorise la production spontanée de la réponse).

Stimulus fading

On réduit l’intensité, la force, la luminosité ou la fréquence, etc… d'une propriété de l’environnement.

Stimulus shapping

On modifie les caractéristiques du stimulus mais sur plus d'une dimension (Ex. passer d’une guidance tactile à un pointage simple).

Transfer trial

On guide immédiatement le premier, puis on estompe et renforce le 2ième essai moins guidé.

ex: intervenant: qu’est-ce que c'est? une balle

élève: une balle

intervenant: qu’est-ce que c'est?

élève: une balle

—→renforcement

ATTENTION

Il est nécessaire de faire très attention de ne pas émettre des guidances involontaires ou accidentelles. Elles pourraient laisser croire à la réussite de l'apprentissage, alors que la réalisation ne sera possible qu'avec cette guidance involontaire et donc l'apprentissage ne sera pas généralisable et il ne sera pas produit par le bon stimulus.

Pour aller plus loin:

  • Comparison of simultaneous prompting and no-no prompting in two choice discrimination learning with children with autism. Journal of Applied Behavior Analysis. Leaf, Sheldon & Sherman 2010
  • A comparison of time delay and decreasing prompt hierarchy strategies in teaching banking skills to students with moderate handicaps. Journal of Applied Behavior Analysis. Donnell & Ferguson 1989
  • Prompts and prompt fading-strategies for people with autism. McDuff, Krantz & McClannahan
  • Prompting and stimulus shaping procedures for teaching visual-motor skills toretarded children. Journal of Applied Behavior Analysis. Mosk & Bucher 1984
  • A Comparison of Most-to-Least and Least-to-Most Prompting on the Acquisition of Solitary Play Skills. Behavior Analysis in Practice. Libby, Weiss, Bancroft & Ahearn 2008

Opérants verbaux

Les comportements verbaux peuvent être émis de multiples sortes (vocalement, par geste, images…).

Toutefois, les comportements verbaux sont toujours complexes, c'est pourquoi il est utile de savoir les découper en petites unités, pour mieux les comprendre, et les apprendre.

Le découpage comportemental des comportements verbaux ne se fait pas en mot, phrase, etc. mais en petites unités de comportements verbaux appelés les opérants verbaux.

Les opérants verbaux sont des comportements maintenus par la médiation d'autrui et qui se définissent en fonction de l'antécédent, de la forme de la réponse et de la conséquence.

Mand

Le Mand est déclenché par une opération motivationnelle (MO) et a une conséquence spécifique et directement efficace.

Le mand peut être une demande, une commande, etc.

ex:

antécédent------------------------------------------→comportement-------------------------------------------------------------→ conséquence
faim---------------------------------------------------→dit "chocolat"--------------------------------------------------→obtient un carré de chocolat

Tact

Le Tact est déclenché par un stimulus non verbal et a en conséquence un renforcement social non spécifique

Le tact peut être de nommer, de décrire

ex:

antécédent------------------------------------------→comportement-------------------------------------------------------------→ conséquence
voit un morceau de chocolat --------------------→dit "chocolat"-------------------------------------------------→reçoit: "oui, super, c'est ça! !"

Duplic

Le Duplic est déclenché par un stimulus verbal et a en conséquence un renforcement social non spécifique.

La réponse correspond point pour point au stimulus déclencheur et présente avec lui une similarité formelle.

Il en existe donc plusieurs sortes:

Echoïc

L'echoïc est déclenché par stimulus vocal et a en conséquence un renforcement social non spécifique

ex:

antécédent------------------------------------------→comportement-------------------------------------------------------------→ conséquence
entend "chocolat" --------------------------------→dit "chocolat"--------------------------------------------------→reçoit "oui, super, c'est ça! !"

Copying a text

Le copying a text est déclenché par stimulus écrit et a en conséquence un renforcement social non spécifique

ex:

antécédent------------------------------------------→comportement-------------------------------------------------------------→ conséquence
voit écrit le mot chocolat ------------------------→ écrit chocolat-----------------------------------------------→reçoit "oui, super, c'est ça! !

Mimetic

Le mimetic est déclenché par stimulus de mouvement physique non vocal et a en conséquence un renforcement social non spécifique

ex:

antécédent------------------------------------------→comportement-------------------------------------------------------------→ conséquence
voit un signe de salutation ----------------→renvoie le signe en question-------------------------------------→début d'une conversation

Codic

Le Codic est déclenché par un stimulus verbal et a en conséquence un renforcement social non spécifique

La réponse correspond point pour point au stimulus déclencheur mais ne présente pas de similarité formelle avec lui.

Il en existe donc plusieurs sortes:

Textual

Le textual est déclenché par un stimulus écrit et a en conséquence un renforcement social non spécifique

ex:

antécédent------------------------------------------→comportement-------------------------------------------------------------→ conséquence
voit écrit le mot chocolat ----------------------→ dit "chocolat"-------------------------------------------------→reçoit "oui, super, c'est ça! !

Transcript

Le transcript est déclenché par un stimulus vocal, est une réponse motrice non vocal et a en conséquence un renforcement social non spécifique

ex:

antécédent------------------------------------------→comportement-------------------------------------------------------------→ conséquence
entend "chocolat "--------------------------------→ écrit chocolat-------------------------------------------------→reçoit "oui, super, c'est ça! !

Intraverbal

L'Intraverbal est déclenché par un stimulus verbal et a en conséquence un renforcement social non spécifique

La réponse ne correspond pas point pour point au stimulus déclencheur et ne présente pas de similarité formelle avec lui.

ex:

antécédent------------------------------------------→comportement-------------------------------------------------------------→ conséquence

"comment tu t'appelles? —————————→ "Laurent"—————————————————–→début de conversation

ATTENTION:

Les opérants peuvent être sous un « contrôle multiple » (multiple causes)

Il peut donc y avoir des: Mand-tact, Tact-echoic, etc.

Autoclitic

Les Autoclitic affectent le médiateur (la personne recevant le message) en lui indiquant soit une propriété du comportement de l‘émetteur ou les circonstances responsables de cette propriété. Il augmente donc la probabilité que le médiateur va se comporter de manière appropriée.

C’est un comportement verbal qui est basé sur ou qui dépend d'un autre comportement verbal

Il en existe de multiples sortes.

Réceptif

Il s'agit ici d'une réponse à un comportement verbal, et non d'un opérant verbal comme précèdemment.

Le comportement est ici émis par le médiateur et donne la conséquence à l’émetteur.

ex:

antécédent------------------------------------------→comportement-------------------------------------------------------------→ conséquence
MAND "donne moi le rouge"-----------------→ donne la carte rouge-----------------------------------------------------→reçoit "bravo! !! "

Dans le réceptif, nous pouvons trouver le RFFC (Receptive by Feature, Function or Class = réceptif par caractéristique, fonction ou classe) qui permet de définir un item en fonction de ces caractéristiques, fonctions ou classes, permettant la généralisation des apprentissages.

ref:

  • Skinner (1957). Verbal Behavior. ISBN-10: 1626540136 ISBN-13: 978-1626540132
  • A review of recommendations for sequencing receptive and expressive language instruction. Journal of Applied Behavior Analysis. Ingeborg Petursdottir & Carr 2011
  • A Common Language: Using B. F. Skinner’s Verbal Behavior for Assessment and Treatment of Communication Disabilities in SLP-ABA. Journal of Speech and Language Pathology – Applied Behavior Analysis. Frost & Bondy 2006
  • The functional independence of mands and tacts. Journal of Experimental Analysis of Behavior. Lamarre & Holland 1985

Pairing

Qu’est-ce que c'est?

Le pairing est un processus d'association entre deux stimuli.

Si un stimulus neutre est associé à un stimulus appétitif, il deviendra lui même appétitif (ex: Vous vous rendez pour la première fois dans une boutique, vous êtes accueilli avec le sourire, un grand bonjour et des personnes serviables,…alors vous serez heureux d'y retourner une autre fois et vous aurez même envie d'y retourner)

Si un stimulus neutre est associé à un stimulus aversif, il deviendra aversif (ex: Vous vous rendez pour la première fois dans une boutique, vous êtes mal accueilli, des personnes désagréables et vous ne parvenez pas à obtenir les renseignements que vous souhaitez,… alors vous n'aurez aucune envie d'y retourner une autre fois, ou cela sera pénible pour vous)

Le pairing peut donc être effectué avec des objets, des activités, des lieux… ou des personnes! !!

Quand a-t-il lieu?

En fait, tout le temps! !!

Cela se passe dans la vie de tous les jours comme nous avons pu le voir dans les exemples précèdents.

Dans le cadre d'une intervention en analyse appliquée du comportement, le pairing est utilisé pour introduire de nouveaux items en tant qu'agents renforçateurs.

Il est utilisé pour introduire de nouveaux apprentissages ou compétences (grâce à la délivrance du renforcement), ce qui permettra d'augmenter la motivation de la personne.

Il est aussi utilisé pour que la personne soit motivée et heureuse de travailler avec la personne qui l'accompagne ( et donc permettre un travail plus efficace). C'est pourquoi, en début de prise en charge et aux cours des interventions, beaucoup de temps est occupé à la mise en place et au maintien du pairing.

Comment?

Dans un premier temps, il faut déterminer les stimuli appétitifs pour la personne.

Le pairing commence sans contrainte ni consigne. On laisse la personne se diriger vers ce qu'elle souhaite et on introduit le stimulus neutre (un objet ou… une personne) en même temps. Il est nécessaire que l'association soit répétée et que l'on observe activement les réactions de la personne.

C'est pour cela qu'il faut TOUJOURS associer un renforcement social (félicitation) aux renforçateurs tangibles, cela permettra d'accéder à des renforcements de plus en plus naturels.

Renforçateur et renforcement

Important: un renforçateur ne se définit pas par son attractivité supposée, mais par son effet réel sur le comportement observé.

Le renforcement positif est l'augmentation de la fréquence d'apparition d'un comportement par l'obtention d'un stimulus qui sera appétitif pour la personne (le renforçateur).

Le renforcement permet donc d'apprendre et de maintenir dans le temps un comportement.

C'est donc le comportement qui est renforcé et non la personne.

Les principes pour le renforcement

Pour que les procédures de renforcements fonctionnent, elles doivent répondre à certains principes:

-Le principe de contiguïté: Le renforcement doit être octroyé immédiatement après l’émission du comportement escompté.

-Le principe de répétition: Il faut plusieurs couplages entre la réponse et sa conséquence.

-L’effet de taille: Il faut une quantité suffisante pour qu’il y ait une incidence sur le comportement.

-L’effet des préférences: Les individus ont une sensibilité variée pour les éléments de l’environnement. Le choix des agents renforçateurs doit tenir compte des préférences.

Les agents renforçateurs

"un renforçateur ne se définit pas par la perception qu'ont les gens de ses qualités, mais bien par son pouvoir de reproduire le comportement qui le déclenche. "

Maurice, Green & Luce. intervention behaviorale auprès des jeunes enfants autistes (2006)

ISBN-13: 978-2804151898 ISBN-10: 2804151891

L'agent renforçateur est le stimulus appétitif qui interviendra à la suite du comportement et qui permettra l'augmentation de sa fréquence d'apparition.

Les renforçateurs doivent être:

-Individualisés

-Appropriés à l’âge de la personne

-Ayant un intérêt pour la personne

-Reliés à des capacités permettant le développement

Nous pouvons classer les agents renforçateurs de diffèrentes façons:

Les renforçateurs primaires:

Ce sont les besoins vitaux. Ce sont des stimuli aux propriétés renforçantes intrinsèques, indépendantes de toute histoire d’apprentissage.

(ex: nourriture, boisson…)

Les renforçateurs secondaires ou conditionnés:

Ce sont des stimuli qui acquièrent un pouvoir renforçant, parce qu’ils ont été associés à un renforçateur primaire (pairing).

Ils peuvent être de diffèrentes sortes:

-Agents renforçateurs sociaux

Ex: Bisous, câlins, sourires, regards, félicitations, chatouilles.

-Les renforçateurs intermédiaires: Ils peuvent être: épargnés ou échangés contre d’autres renforçateurs.

Ex: Les bons points, les jetons, les notes, les diplômes, l’argent.

-Les activités renforçantes: Activités que la personne entreprend spontanément, dont le plaisir procuré provient de la réalisation de l’activité elle même.

Ex: Ecouter de la musique, faire un puzzle, …

Comment administrer le renforçateur

Immédiatement

Souvent

Avec enthousiasme

En précisant pourquoi

En variant l'agent renforçateur

important:

Effet de satiété:

Le pouvoir renforçant d’un stimulus est réduit si la personne y a eu accès avant même que cet agent renforçateur ne soit utilisé.

ex: J'adore le chocolat, mais si j'en ai mangé 10 kg avant de travailler, je ne serais pas renforcer si l'on m'en donne à la suite de mon travail.

Effet de déprivation:

Le pouvoir renforçant d’un stimulus va être maximal si la personne n’y a pas eu accès pendant un certain temps avant que cet agent renforçateur ne soit utilisé.

ex: J'adore le chocolat, mais si je n'en pas ai mangé pas depuis 1 an, je serais fortement renforcer si l'on m'en donne à la suite de mon travail.

Comment choisir le bon agent renforçateur:

Il doit être facilement contrôlable, il doit avoir une fin, être adapté à l’âge. Il est possible dans un premier temps d'utiliser des stéréotypies comme renforçateur.

L'agent renforçateur doit être propre à la personne, il faut donc procéder à une évaluation des préférences pour déterminer le bon agent renforçateur.

ref: – Using a choice assessment to predict reinforcer effectiveness. Journal of Applied Behavior Analysis. Piazza, Fisher, Hagopian, Bowman & Tool 1996

Évaluation de préférences

Méthode indirecte

Questionnaire à l’entourage ou questionnaire à la personne concernée (formel ou informel), cela permet de trouver des pistes d'agent renforçateur. Ces évaluations sont rapides mais peu fiables.

  • Preference testing: a comparison of two presentation methods. Research in Developmental Disabilities. Windsor, Piche, & Locke. 1994

raisd fr. pdf

Observation directe

Il s'agit de l'enregistrement du temps passé par l'individu avec les élèments que l'individu peut potentiellement apprécier placés dans son environnement et laissés en accès libre, sans demande, contrainte ou restriction. Plus le temps passé avec l'activité ou passé avec l'élément est important, plus la préfèrence à celui-ci sera présumé. En outre, l'affect positif avec ces éléments et activités pourraient être notés (ex: rire, sourire). L'observation directe se traduit généralement par des informations plus précises concernant les préférences que les méthodes indirectes, mais il faudra aussi plus de temps et d'efforts.

Évaluation du renforcement par observation directe. pdf

Évaluation systématique

L'évaluation systématique consiste à présenter les objets et les activités dans un ordre préétabli à l'individu pour révéler une hiérarchie des préférences. Cette méthode nécessite le plus d'efforts, mais c'est la plus précise. Il existe de nombreuses méthodes d'évaluations de préférences diffèrentes, qui toutes entrent dans l'un des formats suivants: un seul article, jumelé, et à choix multiples (Cooper, Heron, et Heward, 2006).

Single item: L'évaluation d'un seul article de préférence (ou "successive choice") est la méthode la plus rapide et la plus simple. Les objets et activités sont présentées un à la fois et chaque article est présenté à plusieurs reprises dans un ordre aléatoire. Après chaque présentation, les données sont enregistrées sur la durée de l'engagement à chaque objet ou activité.

Évaluation du renforcement single item. pdf

Paired method ou “forced-choice”: Cette évaluation implique la présentation simultanée de deux articles ou activités en même temps. Tous les articles sont jumelés systématiquement avec tous les autres éléments dans un ordre aléatoire. Pour chaque paire d'éléments, l'individu est invité à en choisir un. Cette méthode prend beaucoup plus de temps que la méthode unique élément, mais sera classé par ordre des préférences les plus fortes aux préférences les plus faibles.

Évaluation du renforcement paired method. pdf

ref: – Reinforcer assessment for children with developmental disabilities and visual impairments. Journal of Applied Behavior analysis. Paclawskyj & Vollmer 1995

  • Assessment of stimulus preference and reinforcer value with profoundly retarded individuals. Journal of Applied Behavior Analysis. Pace, Ivancic, Edwards, Iwata & Page 1985
  • A comparison of two approaches for identifying reinforcers for persons with severe and profound disabilities. Journal of Applied Behavior Analysis. Fisher, Piazza, Bowman, Hagopian, Owen & Slevin 1992

Multiple choice method

Ce procédé est une extension de la méthode appariée avec trois item ou plus. Il existe deux variantes de cette méthode: avec et sans remplacement. Dans le choix multiple avec la méthode de remplacement, quand un objet est sélectionné, tous les autres objets sont remplacés dans le prochain essai. Dans la méthode sans remplacement, les autres objet ne sont pas remplacés et il n'y a pas de nouveaux éléments disponibles.

ref: – Évaluation of a multiple-stimulus presentation format for assessing reinforcer preferences. Journal of Applied Behavior Analysis. DeLeon & Iwata 1996

Il est important de procéder réguliérement à l'évaluation des renforçateurs.

Il est important durant l'évaluation de dissocier l'alimentaire du reste lors de l'évaluation, parce que la nourriture tend à motiver les individus plus que les autres items ou activités.

ref: – On the displacement of leisure items by food during multiple-stimulus preference assessments. Journal of Applied Behavior Analysis. Bojak & Carr 1999

  • Displacement of leisure reinforcers by food during preference assessments. Journal of Applied Behvior Analysis. DeLeon, Iwata & Roscoe 1997

Renforcement/punition positif/négatif

Il y a souvent une diffèrence dans l'utilisation de ces termes en ABA et dans la vie de tous les jours. Cela peut entraîner des quiproquos et des incompréhensions… et donc entraîner des erreurs sur la compréhension de l'analyse appliquée du comportement.

En fait, l'utilisation de ces termes en ABA est quelque chose de très clair et très concret:

Renforcement: augmentation de la fréquence d'apparition d'un comportement

Punition: diminution de la fréquence d'apparition d'un comportement

Positif: ajout d'un stimulus

Négatif: retrait d'un stimulus

tableau récapitulatif:

Renforcement positif

Le renforcement positif est donc le fait de hausser la fréquence d'apparaîtion d'un comportement en ajoutant en conséquence à celui-ci un stimulus appétitif pour la personne.

ex: comportement————————————–→conséquence

Le bébé qui secoue un hochet—————→Bruit du hochet

Sheldon utilisant le renforcement positif sur Penny

Renforcement négatif

Le renforcement négatif est donc le fait de hausser la fréquence d'apparaîtion d'un comportement en retirant en conséquence à celui-ci un stimulus aversif pour la personne.

ex: comportement————————————–→conséquence

Ouvrir le parapluie lorsqu'il pleut———————————-→Ne pas être mouillé

Punition positive

La punition positive est donc le fait de baisser la fréquence d'apparaîtion d'un comportement en ajoutant en conséquence à celui-ci un stimulus aversif pour la personne (ex: hausse du coût de la réponse, over-correction)

ex: comportement—————————————–→conséquence

Je suis pressé je grille le feu rouge -----------------------------------------→Le policier me donne une amende

La douleur ajoutée par le scotch enlevé est ici un exemple de punition positive

Punition négative

La punition négative est donc le fait de baisser la fréquence d'apparaîtion d'un comportement en retirant en conséquence à celui-ci un stimulus appétitif pour la personne (ex: time out exclusif, time out semi exclusif)

ex: comportement—————————————–→conséquence

Je crie trop fort devant un match de foot à la télé————————-→Ma femme coupe la télé

Le retrait de la soupe de George par le restaurant constitue une punition négative

attention: ce sont des exemples valables que si ils modifient le comportement dans le sens voulu, cela peut donc être diffèrent d'une personne à une autre, ex: le chocolat peut généralement être considéré comme appétitif… mais aversif si on y est allergique.

Attention: la punition peut entraîner des effets secondaires indésirables. Son usage doit être encadré, justifié fonctionnellement, documenté, proportionné, et associé à l’enseignement et au renforcement de comportements adaptés.

Extinction

Pour l'extinction, se référer au chapitre "extinction"

Récupération

Un comportement augmente malgré l'absence de conséquence pour éviter l'apparition d'un élèment punisseur potentiel.

ex: Un joueur de foot a reçu un carton rouge lors d'un match précèdent, il fait attention en début de match, puis ne recevant pas de cartons il fait de plus en plus de fautes.