Dieser Artikel wurde am 2. Juni 2014 aktualisiert und auf den neuesten Stand gebracht!
Während Thorndike den Lernerfolg eher dem Zufall überließ und untersuchte, wie dies das Lernverhalten der Versuchstiere beeinflusste, beschäftigte sich ab etwa 1930 ein weiterer Psychologe mit diesem damals noch unerforschten Phänomen. Der Psychologe Burrhus F. Skinner versuchte dabei, das Verhalten der Versuchtstiere ganz bewusst in eine bestimmte Richtung zu lenken und zu kontrollieren, in dem er dem Verhalten Konsequenzen folgen ließ – angenehme oder unangenehme. Das Verhalten wurde daraufhin wahrscheinlicher oder unwahrscheinlicher.
Ein bekannter Versuch war die so genannte Skinner-Box, die ähnlich wie die Puzzle-Box von Thorndike aufgebaut war. Skinner sperrte dabei hungrige Ratten in Käfige, welche auf bestimmte Art und Weise modifiziert waren. Nach einer Weile zeigten die Ratten verschiedene Verhaltensweisen und operierten so mit ihrer Umwelt. So war ein Käfig z. B. mit einem Hebel ausgestattet, der bei Berührung Futter auswarf. Sehr schnell konnte beobachtet werden, dass die Ratte nach einer zufälligen Berührung mit dem Hebel nach dem Auslöser für das Futter suchte und das Verhalten, das Drücken des Hebels, immer häufiger auftrat, bis es sicher gezeigt wurde. Stoppte die Futterzufuhr jedoch, nahm das Verhalten wieder ab, da die Handlung nicht mehr belohnt wurde. Eine weitere Ratte wurde in einen Käfig gesperrt, dessen Boden unter Strom stand. Nachdem die Ratte einige Zeit panisch herumgerannt war, hockte sie sich still in eine Ecke und ließ es über sich ergehen, statt weiterhin sinnlos Energie zu verschwenden. Sie hatte gelernt, dass sie dem unangenehmen Reiz nicht entfliehen kann. Hätte der Strom beim Hinsetzen aufgehört zu fließen, hätte sie hingegen schnell gelernt, wie sie den Strom abstellen kann.
Anhand dieser Versuchsreihen definierte Skinner das heutige Modell der operanten Konditionierung, welches das von uns genutzte Lernsystem darstellt. Bei der operanten Konditionierung bestimmt die Konsequenz das Verhalten. Abhängig davon, ob die Konsequenz angenehm oder unangenehm ist, wird ein Verhalten wahrscheinlicher oder unwahrscheinlicher.
Wir unterscheiden dabei zwischen Verstärkung und Bestrafung. Während eine Verstärkung dafür sorgt, dass die Auftrittswahrscheinlichkeit eines Verhaltens erhöht wird, sorgt Strafe dafür, dass diese abnimmt. Um das Ganze noch ein wenig komplizierter zu machen, unterscheiden wir hierbei noch zwischen positiver und negativer Verstärkung und zwischen positiver und negativer Strafe. Sicher fragen Sie sich jetzt, wie Strafe denn positiv sein kann. Zu Recht! Natürlich ist Strafe keinesfalls angenehm für das Pferd. Bei der Bezeichnung positiv und negativ handelt es sich um eine mathematische Ordnung, man könnte stattdessen auch additive und subtraktive Verstärkung sagen.
Wir unterscheiden bei der operanten Konditionierung insgesamt vier Formen von Verstärkung und Strafe, die so genannten Quadranten der operanten Konditionierung.
Positive BestärkungAngenehmes wird hinzugefügt Bei der positiven Verstärkung wird als Konsequenz auf ein Verhalten etwas Angenehmes, also eine Belohnung, hinzugefügt. Die Wahrscheinlichkeit, dass das Verhalten auftritt, wird damit erhöht. |
Negative BestärkungUnangenehmes wird entfernt Bei der negativen Verstärkung wird als Konsequenz auf ein Verhalten ein unangenehmer Reiz, z. B. körperlicher Druck, entfernt. Die Wahrscheinlichkeit, dass das Verhalten auftritt, wird auch hier erhöht. |
Positive StrafeUnangenehmes wird hinzugefügt Bei der positiven Strafe wird als Konsequenz auf ein Verhalten ein unangenehmer Reiz hinzugefügt. Die Auftrittswahrscheinlichkeit des Verhaltens nimmt dadurch ab. |
Negative StrafeAngenehmes wird entfernt Bei der negativen Strafe wird als Konsequenz auf ein Verhalten ein angenehmer Reiz entfernt. Die Auftrittswahrscheinlichkeit des Verhaltens nimmt dadurch ab. |
Diese Fakten sorgt regelmäßig für kontroverse Diskussionen, selbst unter Fachleuten. Denn natürlich behauptet jeder von sich, er arbeite mit positiver Verstärkung und kaum jemand würde von sich sagen, dass sein Trainingswerkzeug die negative Verstärkung ist. Denn die Bezeichnungen positiv und negativ wecken in fast jedem zunächst einmal emotionale Wertvorstellungen, während es sich eigentlich um eine sachliche Beschreibung der Trainingsform handelt. Zwar wird bei der negativen Verstärkung durchaus mit einem unangenehmen Reiz gearbeitet, das heißt jedoch nicht, dass diese Form der Verstärkung grundsätzlich abzulehnen ist, genauso wie die positive Verstärkung nicht grundsätzlich auch nur angenehm für das Pferd sein muss. Vielmehr gilt es, die Formen der operanten Konditionierung zu verstehen und das Training so entsprechend zu gestalten, damit das Lernen so angenehm wie möglich gestaltet werden kann.
[…] » Weiter zu Teil 5 – Operante Konditionierung – Was negative Verstärkung mit Mathe zutun hat […]
[…] warum ich das Thema Lernverhalten nicht schon früher verstanden habe. Natürlich kannte ich die vier Quadranten, aber begriffen hatte ich es irgendwie nicht. Es gab da diesen einen Spaziergang, an dem ich mein […]