Startseite > Clickerlexikon

Negative Strafe oder negative Bestrafung (P-, negative Punishment) bedeutet, dass etwas Angenehmes entzogen oder vorenthalten wird, um die Wahrscheinlichkeit eines unerwünschten Verhaltens zu verringern. Das Pferd verliert eine bereits erhaltene Belohnung oder die Möglichkeit, eine erwartete Verstärkung zu bekommen. Dadurch soll es erkennen, dass das Verhalten sich nicht lohnt.

Negative Bestrafung zeigt dem Pferd nur, was nicht funktioniert, aber nicht, welches Verhalten erwünscht ist. Wenn sie häufig angewendet wird, kann das Pferd unsicher oder frustriert werden. Deshalb sollte sie gezielt und immer in Kombination mit positiver Verstärkung (R+) eingesetzt werden. Ihr Zweck ist nicht die wiederholte Bestrafung eines Verhaltens, sondern das Training so zu gestalten, dass das Pferd gar nicht erst ins unerwünschte Verhalten kommt. Sie kann genutzt werden, um das Training kurzzeitig zu unterbrechen, sollte aber dazu dienen, danach mit einem besseren Plan weiterzumachen, der das Lernen für das Pferd verständlicher macht.

Arten der negativen Bestrafung

Negative Bestrafung kann auf zwei unterschiedliche Weisen erfolgen: Response Cost und Time-Out. Der Unterschied liegt darin, wann die Verstärkung entzogen wird und ob das Pferd eine bereits erhaltene Belohnung verliert oder nur die Möglichkeit, eine Belohnung zu bekommen.

  • Response Cost – Entzug einer bereits erhaltenen Belohnung.
    Beispiel: Ein Pferd bekommt Futter aus einem Eimer, aber weil es scharrt, nimmt der Mensch ihm das Futter wieder weg. Das Pferd hatte bereits Zugriff auf den Verstärker, der als Konsequenz wieder entzogen wird.
  • Time-Out – Entzug der Möglichkeit zur Verstärkung
  • Beispiel: Das Pferd wartet auf sein Futter und beginnt zu Scharren, als es den Menschen sieht. Der Mensch dreht um und entfernt sich. Das Pferd verliert die Option auf den Verstärker, noch bevor es ihn erhalten hat

In der Praxis werden die beiden Arten der negativen Strafe oft nicht so deutlich differenziert eingesetzt und/oder miteinander vermischt. Während Response Cost vor allem dann eingesetzt wird, wenn es einen klare Ursache-Wirkung-Zusammenhang gibt, weil das Pferd zum Beispiel Fehlverhalten zeigt, kommt ein Time-Out häufig dann zum Einsatz, wenn das Training bewusst unterbrochen werden soll. Es können jedoch auch beide Arten kombiniert werden: Das Pferd wird durch Kraulen für ruhiges Stehen belohnt, beginnt dann aber zu drängeln. Der Mensch entfernt sich aus dem Trainingsbereich (Time-Out) und beendet gleichzeitig die Interaktion (Response Cost), bevor er nach einer kurzen Pause wieder auf das Pferd zugeht.

Abgrenzung zu anderen Methoden:

  • Positive Bestrafung (P+): Ein unangenehmer Reiz wird hinzugefügt (z. B. ein Schreckreiz oder Druck).
  • Löschung (Extinktion): Das Verhalten wird ignoriert und nicht mehr verstärkt, sodass es allmählich verschwindet.
  • Negative Verstärkung (R-): Ein unangenehmer Reiz wird entfernt, wenn das Pferd das gewünschte Verhalten zeigt (z. B. Druck wird gelöst, wenn das Pferd rückwärts geht).