Im Pferdetraining liegt der Fokus meist auf positiver Verstärkung. Doch manchmal zeigen Pferde Verhaltensweisen, die nicht erwünscht sind, und es stellt sich die Frage, wie man sie beeinflussen kann, ohne auf positive Strafe zurückzugreifen. Zwei Methoden, die in diesem Zusammenhang häufig diskutiert werden, sind negative Strafe und Löschung. Beide basieren darauf, dass ein Verhalten nicht mehr zum Erfolg führt und dadurch seltener gezeigt wird.

Negative Strafe (P-) und Löschung im Pferdetraining: Definition, Anwendung und Abgrenzung

Lerntheoretisch gesehen ist negative Strafe (P-) eine Methode der operanten Konditionierung, bei der etwas Angenehmes entzogen oder vorenthalten wird, um die Wahrscheinlichkeit eines unerwünschten Verhaltens zu verringern. Im Gegensatz zur positiven Strafe (P+), die weitaus häufiger Anwendung im Pferdetraining  bei der ein unangenehmer Reiz hinzugefügt wird, z. B. ein Klaps mit der Gerte, nimmt negative Strafe dem Pferd eine bereits erhaltene Verstärkung oder die Möglichkeit, eine Verstärkung zu bekommen. Damit das funktioniert, muss das Pferd sich tatsächlich in Erwartung eines Verstärkers befinden oder bereits Zugriff auf diesen haben. Ist das nicht der Fall – beispielsweise weil das Pferd satt ist oder eine Pause ohnehin als angenehm empfindet – hat der Entzug oder das Vorenthalten keine Konsequenz und das Verhalten wird sich entsprechend nicht verändern. Die Veränderung des Verhaltens, dass sich also das bestrafte Verhalten verringert, ist dabei die Grundvoraussetzung, dass eine definierte Strafe auch tatsächlich eine Strafe im lerntheoretischen Kontext ist. Andernfalls verhält es sich wie bei der positiven Strafe – das Pferd findet die Maßnahme möglicherweise unangenehm – aber nicht so unangenehm, dass es bereit ist, deshalb sein Verhalten anzupassen. 

Ein ganz wesentlicher Unterschied zwischen positiver und negativer Strafe, der unbedingt herausgestellt werden muss: Während positive Strafe ganz klar darauf abzieht, ein unerwünschtes Verhalten durch Bestrafung zu beenden oder zu unterbinden, ist das Mindset von negativer Strafe vor allem, zu verhindern, dass ein unerwünschtes Verhalten verstärkt wird.

Negative Strafe – Vorenthalten oder Entzug eines Verstärkers

Wie jede Form der Strafe, ist auch negative Strafe für das Pferd kein angenehmes Erlebnis. Im Gegensatz zur positiven Strafe, bei der als Konsequenz auf ein Verhalten etwas Unangenehmes hinzufügt wird, wirkt sich negative Strafe weniger hemmend auf das gesamte Verhalten wirken. Sie bietet dem Pferd Handlungsspielraum für alternative Verhaltensweisen, während positive Strafe häufig dazu führt, dass das Pferd sich unsicher fühlt und weniger experimentiert.

Obwohl negative Strafe nicht direkt unangenehmen Konsequenzen wie Schmerz oder Furcht bzw. Angst verbunden ist, kann sie große Frustration auslösen und dadurch ähnliche Folgen haben wie positive Strafe. Insbesondere wenn das Pferd nicht versteht, warum es eine Belohnung verliert oder eine Verstärkung ausbleibt, es keine Idee für ein Alternativverhalten hat oder das gewünschte Verhalten in dieser Situation nicht gezeigt werden kann. Wenn ein Mangel des Bedürfnisses vorliegt (z. B. starker Hunger oder Mangel an Sozialkontakt) oder der Verstärker besonders hochwertig ist, kann es auch hier zu unangenehmen Seiteneffekten kommen, wie z. B. gegen den Menschen gerichtete Aggression oder Übersprungsverhalten, dass für den Menschen unangenehme Folgen haben kann.

Negative Strafe: Response Cost und Time-Out

Arten der negativen Strafe

Negative Strafe umfasst zwei Hauptarten: Response Cost und Time-Out, die sich in ihrer Wirkungsweise und ihrem Einsatzbereich unterscheiden. Während Response Cost eine bereits erhaltene Belohnung entzieht, verhindert Time-Out, dass es überhaupt zur Verstärkung kommt. In der Praxis werden diese Methoden jedoch oft unbewusst kombiniert, ohne dass eine klare Trennung erfolgt. Dennoch lohnt es sich, die Unterschiede bewusst wahrzunehmen, um je nach Trainingssituation die effektivste und pferdefreundlichste Strategie gezielt anzuwenden.

Response Cost – Entzug eines bereits erhaltenen Verstärkers

Response Cost bedeutet, dass das Pferd eine bereits erhaltene Verstärkung wieder verliert, weil es ein unerwünschtes Verhalten zeigt. Dabei geht es nicht darum, einen zukünftigen Verstärker vorzuenthalten, sondern einen bereits erhaltenen Verstärker wieder zu entziehen. Diese Methode dient dazu, ein Verhalten direkt zu bestrafen, das andernfalls durch den Zugang zur Verstärkung weiter gefördert werden würde. Es besteht also bestenfalls für das Pferd ein klarer Ursache-Wirkung-Zusammenhang.

Praxisbeispiele:

  • Ein Pferd frisst Heu in einem Futterstand und beginnt dann, nach dem Nachbarpferd zu schlagen. Als Folge dessen, wird es aus dem Futterstand geschickt und dieser für das Pferd versperrt.
  • Ein Pferd wird als Verstärkung für ruhiges Stehen gekrault. Als das Pferd anfängt, herumzuzappeln, hört der Mensch auf es zu Kraulen und beginnt erst wieder, wenn das Pferd ruhig steht.
  • Ein Pferd wird auf dem Podest gefüttert oder genießt das Stehen auf dem Podest.  Als es beginnt, auf dem Podest zu scharren, wird es vom Podest heruntergeführt, um zu verhindern, dass sich das Scharren lohnt.

Response Cost ist besonders geeignet, wenn das Pferd eine Verstärkung bereits erhalten hat und dann ein unerwünschtes Verhalten zeigt, um zu verhindern, dass dieses Verhalten oder nachfolgende Verhaltensweisen ungewollt verstärkt wird. Durch Wiederholung des Szenarios und konsequente Anwendung, versteht es den Entzug des Verstärkers als Konsequenz auf sein (unerwünschtes) Verhalten.

Time-Out – Entzug der Möglichkeit zur Verstärkung

Das Time-Out dient dazu, dass es gar nicht erst zur Verstärkung kommt. Hier wird dem Pferd nicht ein bereits vorhandener Verstärker entzogen, sondern es wird vorübergehend von der Möglichkeit ausgeschlossen, sich eine Verstärkung zu verdienen. Diese Methode wird angewendet, wenn das Pferd ein unerwünschtes Verhalten zeigt, bevor eine Belohnung gegeben wurde.

Praxisbeispiele:

  • Das Pferd schlägt in Erwartung des Futters gegen die Stallwand. Der Mensch mit dem Futtereimer bleibt außer Reichweite oder entfernt sich wieder, bis das Pferd ruhig steht.
  • Das Pferd soll ein Target mit der Nase berühren. Als der Mensch das Target präsentieren will, schlägt es mit dem Kopf und drückt gegen den Zaun. Der Mensch entfernt das Target und wartet, bis das Pferd ruhig steht, bevor er es erneut präsentiert.
  • Das Pferd bettelt und bedrängt den Menschen. Der Mensch verlässt den Trainingsbereich und beginnt erst wieder mit dem Training, wenn das Pferd ruhig und weniger gestresst ist.

Time-Out ist besonders geeignet, wenn ein unerwünschtes Verhalten auftritt, bevor eine Verstärkung gegeben wurde. Es verhindert, dass das Verhalten versehentlich belohnt wird und unterbricht die Möglichkeit zur Verstärkung. Durch wiederholte Anwendung in vergleichbaren Situationen versteht das Pferd, dass sein Verhalten nicht zum gewünschten Erfolg führt, wodurch es seltener gezeigt wird.

Kombination von Response Cost und Time-Out in der Praxis

In der Praxis werden Response Cost und Time-Out häufig kombiniert, ohne dass genau unterschieden wird, welche Methode gerade angewendet wird.

Beispiele für Kombinationen:

  • Das Pferd soll ein Target mit der Nase berühren. Während der Trainingssession wird es zunehmend unruhig, bedrängt den Menschen und schlägt mit dem Kopf. Der Mensch entfernt das Target und verlässt den Trainingsbereich. Hier wird sowohl der Verstärker entzogen als auch die Möglichkeit, diesen zu erlangen.
  • Beim Training für ruhiges Stehen wird das Verhalten durch „Dauerfüttern“ verstärkt. Als das Pferd beginnt zu Scharren, hört der Mensch auf zu füttern und verlässt den Trainingsbereich. Die Konsequenz auf das Scharren wird in diesem Fall durch die Kombination beider Techniken ggf. sogar noch erweitert.

Obwohl der Unterscheidung insbesondere im praktischen Training oft wenig Bedeutung zuteilwird und nicht immer klar ist, ob es sich um Response Cost oder ein Time-Out handelt, kann es sinnvoll sein, die Unterschiede zu verstehen, um die richtige Strategie für die jeweilige Situation zu wählen. Response Cost eignet sich besonders dann, wenn das Pferd bereits eine Belohnung hatte und sich dann unangemessen verhält, während Time-Out nützlich ist, wenn ein Verhalten unterbrochen werden soll, bevor eine Verstärkung erfolgt. Bei der Anwendung von Response Cost kann außerdem ein zügiger Wiedereinsatz des Verstärkers erfolgen, z. B. wenn ein Verhalten gezielt und in hoher Frequenz verstärken soll. Time-Out hingegen eignet sich besser für längere Trainingsunterbrechungen, weil das Pferd sich z. B. nicht mehr konzentrieren kann oder gestresst ist. Die bewusste Wahl der Strategie kann helfen, das Training klarer und effektiver zu gestalten.

Hufe auskratzen als Beispiel für saubere Verhaltensketten im Training

Löschung als eigenständige Methode

Während negative Strafe einen bereits erwarteten oder erhaltenen Verstärker vorenthält bzw. entzieht, wird bei der Löschung (Extinktion) jegliche Verstärkung eines zuvor verstärkten Verhaltens gestoppt. Das Pferd erfährt, dass ein bestimmtes Verhalten nicht mehr zum Erfolg führt, und wird es mit der Zeit seltener zeigen. Hierbei muss es nicht unbedingt die Konsequenz seines Handelns verstehen, da das Verhalten auch ohne die Einsicht nicht mehr verstärkt wird und damit nicht zum Erfolg führt. In diesem Fall kommt und die Verhaltensökonomie zur Hilfe – ein Verhalten, dass sich nicht mehr lohnt, wird weniger häufig und später gar nicht mehr gezeigt.

Löschung kann besonders frustrierend für das Pferd sein, wenn es das Verhalten zuvor oft erfolgreich eingesetzt hat. Daher kommt es während des Trainings häufig zum sogenannten Löschungstrotz, bei dem das Pferd das Verhalten vorübergehend verstärkt (häufiger oder intensiver) zeigt, in der Hoffnung, dass doch noch eine Verstärkung erfolgt. Das ist zu vergleichen mit einem Menschen, der die Fernbedienung zunächst fester drückt, weil der Fernseher nicht reagiert, bis er feststellt, dass er mit dem Verhalten keinen Erfolg hat und darüber nachdenkt, was die Alternative sein könnte. Genau wie auch der Mensch, steigt der Frust zunächst an und sinkt dann rapide, so dass es bestenfalls zu einer (überlegten) Alternativhandlung führt.

Auch nach der erfolgreichen Löschung kann es zur spontanen Erholung kommen, das bedeutet, dass das Verhalten nach einiger Zeit plötzlich wieder auftritt. Wird es in diesem Moment wieder verstärkt, wird es „löschungsresistenter“ und schwerer abzutrainieren, da das Verhalten in diesem Fall variabel verstärkt wird.

Auch sollte darüber nachgedacht werden, dass „keine Konsequenz“ nicht immer

Löschung hat gegenüber positiver und negativer Strafe den Vorteil, dass sie ein Verhalten nachhaltig reduziert, indem sie ihm seinen Zweck nimmt, statt es nur zu unterdrücken.

Unterscheidung zwischen negativer Strafe und Löschung

Obwohl negative Strafe und Löschung beide darauf abzielen, ein Verhalten weniger häufig auftreten zu lassen, unterscheiden sie sich grundlegend in ihrer Anwendung und Wirkung. Negative Strafe ist eine bewusste Entscheidung, bei der eine bereits erhaltene oder erwartete Belohnung entzogen wird, um das Verhalten unattraktiver zu machen. Löschung hingegen ist ein passiver Prozess, bei dem jegliche Verstärkung für das Verhalten ausbleibt, sodass es langfristig an Bedeutung verliert.

Während negative Strafe dem Pferd eine direkte Konsequenz vermittelt, kann Löschung oft zu starker Frustration und Löschungstrotz führen. Deshalb sollte man gut überlegen, ob Löschung konsequent und vollständig durchführbar ist. Falls das Verhalten gefährlich für Pferd oder Mensch wird, ist es keine Option, es einfach zu ignorieren. Wird das Verhalten in solchen Momenten doch unterbrochen oder unbewusst verstärkt, lernt das Pferd, dass es nur lange oder intensiv genug dranbleiben muss, um doch noch Erfolg zu haben – ähnlich wie ein Kind, das immer lauter und hartnäckiger bettelt, bis es sein Eis oder Spielzeug bekommt.  Zudem besteht die Gefahr der spontanen Erholung, bei der ein Verhalten nach einer gewissen Zeit plötzlich wieder auftritt. Wird es in diesem Moment verstärkt, kann es noch widerstandsfähiger gegen zukünftige Löschversuche werden.

Gegenüberstellung der Methoden

Diese Tabelle hilft, die wesentlichen Unterschiede zwischen den Methoden zu erkennen und ihre Vor- und Nachteile besser einzuschätzen. Es sollte jedoch beachtet werden, dass hierfür die korrekte Anwendung der jeweiligen Maßnahme entscheidend ist.

Merkmal Positive Strafe (P+) Response Cost (P-) Time-Out (P-) Löschung (Extinktion)
Definition Ein unangenehmer Reiz wird hinzugefügt, um Verhalten zu reduzieren. Eine bereits erhaltene Verstärkung wird entzogen, um Verhalten zu reduzieren. Die Möglichkeit zur Verstärkung wird vorübergehend entzogen, um Verhalten zu reduzieren. Jegliche Verstärkung eines Verhaltens wird gestoppt, um es zu eliminieren.
Ziel Verhalten beenden, unterdrücken oder verringern. Vermeidung von unerwünschter Verstärkung. Verhalten reduzieren, indem es sich nicht mehr lohnt. Vermeidung von unerwünschter Verstärkung. Verhalten reduzieren, indem es sich nicht mehr lohnt. Verhalten über längere Zeit auslöschen.
Wann erfolgt die Maßnahme? Nachdem oder während das Verhalten aufgetreten ist. Während das Verhalten gezeigt wird und das Pferd Zugriff auf den Verstärker hat, das Verhalten also gerade verstärkt wird. Während das Verhalten gezeigt wird, aber noch bevor das Verhalten verstärkt wurde. Über einen längeren Zeitraum hinweg, indem jegliche Verstärkung ausbleibt.
Beispiel Das Pferd schnappt, der Mensch gibt ihm einen Hieb mit der Gerte. Das Pferd zeigt agressives Verhalten, während es Futter erhält und das Futter wird entfernt. Das Pferd schlägt in Erwartung des Futters gegen die Stallwand und der Mensch entfernt sich mit dem Futter wieder vom Pferd. Das Pferd scharrt am Anbinder, aber niemand schenkt ihm Aufmerksamkeit.
Wirkung Das Verhalten wird unterdrückt, kann jedoch erneut auftreten, wenn keine Strafe zu erwarten und der Auslöser noch vorhanden ist. Verhalten wird seltener, weil es sich nicht mehr lohnt. Verhalten wird seltener, weil es sich nicht mehr lohnt. Das Verhalten nimmt über die Zeit ab, weil es nicht mehr zum Erfolg führt / nicht effektiv ist.
Risiken/Nachteile Kann Angst oder Unsicherheit auslösen, führt nicht zur Erlernung eines Alternativverhaltens. Kann Frustration verursachen, wenn nicht mit Alternativverhalten gearbeitet wird. Kann Frustration oder Unsicherheit auslösen, wenn das Pferd nicht versteht, warum es keine Verstärkung erhält. Kann zu Löschungstrotz führen, so dass das Verhalten kurzfristig intensiver gezeigt wird. Verhalten wird weiter gefestigt durch unbeabsichtigte Verstärkung.
Nachhaltigkeit Kann kurzfristig effektiv sein, führt aber oft nicht zu einer dauerhaften Verhaltensänderung, da das Verhalten unterdrückt, aber nicht verlernt wird. Funktioniert langfristig, wenn konsequent angewendet und mit Alternativverhalten kombiniert wird. Kann nachhaltige Verhaltensänderung bewirken, wenn das Pferd lernt, sich auf andere Weise eine Verstärkung zu verdienen. Verhalten wird langfristig reduziert, wenn keine Verstärkung erfolgt.

Anwendung und Grenzen

In der Praxis haben beide Methoden – negative Strafe und Löschung – ihre Berechtigung, aber auch klare Grenzen. Keine dieser Varianten vermittelt dem Pferd, welches Verhalten es stattdessen zeigen soll. Sie dienen lediglich dazu, ein unerwünschtes Verhalten zu reduzieren, können aber, wenn sie falsch oder unbedacht eingesetzt werden, zu Frustration, Stress und Unsicherheit führen.

Daher sollte der Fokus im Training nicht darauf liegen, Verhalten konsequent zu bestrafen oder zu ignorieren, sondern darauf, dem Pferd eine positive und klare Anleitung zu geben. Eine zentrale Überlegung dabei ist, warum das unerwünschte Verhalten für das Pferd lohnender erscheint als das gewünschte. Pferde machen keine Fehler – sie zeigen stets das Verhalten, das aus ihrer Perspektive funktional ist.

Der pferdefreundlichste Weg ist nicht immer der, der augenscheinlich am sanftesten erscheint. So kann beispielsweise Löschung für das Pferd mit erheblichem Stress verbunden sein, wenn es mehrfach frustriert feststellt, dass ein zuvor verstärktes Verhalten keinen Erfolg mehr bringt. In solchen Fällen kann eine klar eingesetzte negative Strafe manchmal fairer sein, da sie unerwünschte Verstärkung verhindert und eine schnelle Klarheit schafft. Statt zu Warten, bis das Pferd die Fernbedienung sinngemäß an die Wand wirft, kann man sie ihm auch einfach wegnehmen und mit zwei frischen Batterien zurückgeben.

Statt sich also nur mit Methoden zur Verhaltensunterdrückung zu beschäftigen, sollte der Fokus darauf liegen, Trainingsmöglichkeiten gezielt für ein planvolles „Reset“ zu kombinieren. Ein Time-Out als bewusste Trainingsunterbrechung bietet nicht nur dem Pferd die Möglichkeit, sich neu zu sortieren, sondern auch dem Menschen wertvolle Zeit zur Reflexion und Anpassung seines Trainingsplans. Letztendlich sollte jedes Training so aufgebaut sein, dass es dem Pferd nicht nur zeigt, was unerwünscht ist, sondern vor allem verständlich macht, welches Verhalten sich wirklich lohnt.

Die effektivste und pferdefreundlichste Trainingsstrategie ist eine durchdachte Kombination aus klarer Kommunikation, Vermeidung unerwünschter Verstärkung und konsequenter positiver Verstärkung für erwünschtes Verhalten.

Signale funktionieren durch Konsequenzen

I put a lot of heart and time into writing my articles to provide valuable information about positive reinforcement and horse-friendly training. If you enjoyed this article, I would be absolutely thrilled if you shared it – as a small thank you and to help more people benefit from this knowledge! 😊