Title (deu)
Richtig belohnen beim Klicker-Training
Vergleich und Literaturübersicht der Vor- und Nachteile regelmäßiger und unregelmäßiger Verstärkung des Klickers
Author
Vera Brundo
Assessor
Viranyi Zsofia
Degree supervisor
Claudia Bieber
Description (deu)
Bachelorarbeit - Veterinärmedizinische Universität Wien - 2023
Abstract (deu)
Beim Klicker-Training handelt es sich um eine Trainingsmethode basierend auf positiver Ver-stärkung, die zeitlich optimal und neutral (unabhängig von der Person) eingesetzt werden kann. Dabei wird das Tier zunächst mit positiver Verstärkung (meist Belohnung durch Futter als primärer Verstärker) auf den „Klick“ konditioniert, anschließend wird dann das Zeigen eines gewünschten Verhaltens durch diesen „Klick“ markiert (sekundärer Verstärker). Um die positive Verbindung des Klicks aufrecht zu erhalten, wird z.B. direkt nach dem Klick wieder mit Futter belohnt. Die Meinungen über die richtige Belohnungsweise in diesem Zusammenhang gehen auseinander: Ist eine kontinuierliche oder eine gelegentliche Futtergabe nach dem Klick sinn-voller? In der vorliegenden Studie wurde zunächst eine Aufarbeitung der Grundlagen zur Konditionierung von Verhalten in Form einer Literaturübersicht verfasst. Was sind die Vorteile intermittierender, bzw. kontinuierlicher Verstärkung? Anschließend wurde geschaut, wie sich die Belohnungen nach dem Klick in der Öffentlichkeit (Kreis Tiertrainer:innen) darstelle. Dazu wurden 50 Trainings-Videos mit Pferden in Bezug auf den Zeitpunkt der Verabreichung der Belohnung in Zusammenhang mit dem Klick ausgewertet. Die Auswertung von 50 Videos zeigte, dass in nur einem Fall nicht kontinuierlich nach jedem Klick mit Futter verstärkt wurde. Die Strategie der kontinuierlichen Belohnung (Futter nach jedem Klick) hat sich also sehr stark durchgesetzt. Nach Einschätzung der Verfasserin der vorliegenden Arbeit verlief das Training in 84 % der Videos gut und ohne größere Fehler. In 8 % der Videos wurden Fehler im Training von Seiten des/der Trainer:in gemacht (im falschen Moment geklickt). In weiteren 8 % der Videos verlief das Training laut Verfasserin weder gut noch schlecht. Der Belohnungsplan ist als nur ein Aspekt des Trainings anzusehen, die korrekte zeitlich und klare Ausführung scheint besonders wichtig. In der Literatur zeigt sich, dass grundsätzlich eine kontinuierliche Verstärkung zu einem schnellen Lernerfolg führt. Demgegenüber zeigt die gelegentliche Verstärkung eine langsamere Lern-kurve, das Erlernte bleibt aber länger ohne Belohnungen erhalten. Grundsätzlich sind also beide Strategien erfolgreich. In der Diskussion wurden mögliche Gründe für die starke Verbreitung der kontinuierlichen Verstärkung nach jedem Klick im Training angesprochen. Dies scheint nach Kenntnis der Lern-physiologie nicht unbedingt nötig, speziell, wenn das Tier schon länger im Training ist. Weitere Argument, die für die kontinuierliche Belohnung sprechen, sind aber sehr wohl vorhanden. So wurde in einer neuen Studie untersucht, wie sich die regelmäßige oder unregelmäßige Verstärkung auf das Wohlbefinden des Tieres auswirkt. Es wurde dabei davon ausgegangen, dass das Tier die kontinuierliche Belohnung erwartet (der Klick ist die Ankündigung der Belohnung) und ein Weglassen des Verstärkers einer negativen Bestrafung ähnelt und zu Frustration führt. Tatsächlich zeigten sich unregelmäßig verstärkte Hunde weniger motiviert. Dabei hatte die Persönlichkeit des Tieres einen Einfluss. Die alleinige Betrachtung der Lernphysiologie der Tiere scheint daher nicht ausreichend, um einen Belohnungsplan zu erstellen. Weiters sollten auch Aspekte der Anwendbarkeit berücksichtigt werden. Eine regelmäßige Verstärkung ist leichter anwendbar und trägt vermutlich auch zum Wohlbefinden des/der Trainers:in bei. Diese Aspekte, speziell der des Tierwohls, rechtfertigen die Anwendung der regelmäßigen Verstärkung.
Abstract (eng)
Bachelor thesis - University of Veterinary Medicine Vienna - 2023
Abstract (eng)
Clicker training is a training method based on positive reinforcement that can be used in an optimal and neutral way (independent of the person). In this technique, the animal is first conditioned to the "click" with positive reinforcement (usually food reward as the primary reinforcer), followed by marking the display of a desired behavior with this "click" (secondary reinforcer). To maintain the positive association of the click, the animal is rewarded immediately after the click, for example with food. Opinions differ on the right way to reward in this context: Is it more useful to feed continuously or occasionally after the click? In the following study, a review of the basics of the conditioning of behavior was first written in the form of a literature review with focus on the advantages of intermittent or continuous reward. Subsequently, it was analyzed which method of reward is used more frequently in horse training. For this purpose, 50 YouTube videos were evaluated regarding the time of administration of the reward in connection with the click. The evaluation of 50 videos showed that in only one case the reinforcement method was irregular. So, the strategy of continuous reward (food after each click) has become very popular. According to the author, the training went well and without major errors in 84 % of the videos. In 8 % of the videos, mistakes were made in training by the trainer (for example clicked at the wrong moment). In another 8 % of the videos, the training was neither good nor bad, according to the author. Thus, the reward schedule is only one aspect in the clicker training. The general correct use of the clicker (e.g., timing) is very important, too. The literature shows that, in general, continuous reinforcement leads to rapid learning success. In contrast, occasional reinforcement shows a slower learning curve, but what is learned is retained longer without rewards. Basically, both strategies are successful. Possible reasons for the proliferation of continuous reinforcement after each click were dis-cussed at the end. According to the knowledge of learning physiology a continuous reward does not seem to be necessary, especially if the animal already knows its tasks. There may be other arguments that favor continuous reinforcement. A new study examined how regular or irregular reinforcement affects the well-being of the animal. It was assumed that the animal expects the continuous reward (the click is the announcement of the reward) and that omission of the reinforcer resembles negative punishment and leads to frustration. In fact, irregular reinforced dogs were less motivated. The personality of the animal had an influence on its stress resistance. Therefore, solely considering the learning psychology of the animals does not seem to be sufficient. Aspects of applicability should also be considered. The procedure of always giving food after the click is easy to convey to trainers. It is also conceivable that the trainer considers it unfair not to always reward the animal when it has performed well. These aspects, especially that of animal welfare, justify the use of regular reinforcement.
Type (eng)
Language
[deu]
Persistent identifier
https://phaidra.vetmeduni.ac.at/o:3946
AC number
Number of pages
56
Date issued
2023
Citable links
Content
Details
Object type
PDFDocument
Format
application/pdf
Created
20.03.2025 10:14:55
This object is in collection
Metadata
Veterinärmedizinische Universität Wien (Vetmeduni) | Veterinärplatz 1 | 1210 Wien - Österreich | T +43 1 25077 1414 | Web: vetmeduni.ac.at