+3548539763 info@deniseweber.se

Negativ vs positiv förstärkning

Det finns många tillvägagångssätt att träna en häst, många metoder och filosofier. Jag tränar mina hästar genom negativ förstärkning och till viss del även positiv förstärkning. Kanske låter lite konstigt att jag tränar mest genom negativ förstärkning och inte positiv förstärkning. Men vad är egentligen negativ förstärkning och varför använda det? – Man skulle kunna beskriva negativ förstärkning som en metod att förstärka ett önskvärt beteende hos hästen genom att ta bort något något. Som vetenskaplig term betyder ordet negativ i detta sammanhang ”något man tar bort”. Positiv förstärkning är en metod där man förstärker ett önskvärt beteende genom att tillföra något. Det kan t.ex. vara godis, det kan även vara att belöna genom rösten eller att beröra/smeka. Orden positiv respektive negativ är inte värdeladdade utan betyder bara något man tillför eller tar bort. Det är dock inte ovanligt att folk förknippar negativ förstärkning med bestraffning, just för att ordet negativ kan uppfattas som värdeladdat.

Negativ förstärkning i praktiken

Varför använder jag till mestadels negativ förstärkning när jag tränar hästarna, varför inte bara positiv förstärkning så som man gör med t.ex. hundar? – Hästar är växtätare och flyktdjur, hundar däremot är köttätare och rovdjur. Hunden har ett födosöksbeteende som är kopplat till jaktinstinkten = hunden drivs av att jobba för mat och därför är det effektivt att belöna deras beteende med godis. Hästen har ingen jaktinstinkt, de har visserligen en födoinstinkt (och det går att motivera dem genom att belöna med godis), men denna är inte lika stark som deras flyktinstinkt.

Förutom att hästen är ett flyktdjur, så är den även en s.k ”comfort seeker” vilket innebär att den alltid kommer söka sig till den behagligaste tillvaron den kan se för ögonblicket. Hästen kommer alltså alltid välja det mest behagliga alternativet och den lättaste vägen.

Hästens största drivkraft är alltså flyktinstinken, och den kommer alltid söka efter det som är mest behagligt. Därför använder vi oss av negativ förstärkning, där vi tillför något ”obehagligt”, en form av stimlu, som vi så kan ta bort. Detta stimuli kan t.ex. vara skänkeln eller tygeln. Säg att jag vill att hästen ska flytta bakdelen åt sidan. Då tillför jag ett stimuli/obehag i form av min skänkel. Hästen kommer söka en väg för att bli av med detta, och när den svarar rätt tar jag bort skänkeln/stimulit/obehaget och hästen lär sig att det är behagligare för den att flytta sig när detta stimuli kommer.

Timing är ALLT

För att denna metod ska fungera, för att hästen ska lära sig vad diverse stimuli (våra hjälper) betyder, är det alltså otroligt viktigt att belöningen (=vi tar bort obehaget/slutar ge en hjälp) kommer vid rätt tillfälle. ”Pressure motivates, the release teaches” – Det är inte själva obehaget/vår hjälp som lär hästen, utan ögonblick då vi tar bort obehaget/vår hjälp. Ta exemplet igen med att flytta bakdelen. Jag tillför min skänkel, ett obehag, hästen motiveras till att göra något, något för att komma till något behagligare d.v.s. ett läge då skänkeln inte är an. Hästen kommer prova olika saker för att bli av med obehaget, kanske är en sak att flytta sig till sidan (det jag var ute efter = det beteendet jag vill belöna). Jag tar av min skänkel-hjälp och hästen lär sig ”om jag flyttar mig när hon gör så, får jag vara i fred vilket är behagligt. Jag gillar behagligt”. Men detta fungerar bara om belöningen kommer innanvid ca 3 sekunder. Detta eftersom hästen inte kan koppla ihop händelser tidsmässigt längre ifrån varandra än ca 3 sekunder. Hästen lever här och nu.

En hjälp – ett svar – en belöning.

Positiv förstärkning i praktiken

Eftersom timing är allt när det kommer till belöning, så kanske det inte är så effektivt att ge godis. Helst ska blöningen komme någon sekund efter önskevärt beteende. Bara att ta fram godiset när hästen visat önskevärt beteende, tar några sekunder och stunden då hästen lär sig har ”gått förlorad”. Därför har t.ex. clicker träning blivit så populärt även vid träning av hästarna, då det är lättare att ge belöningen i exakt rätt ögonblick. Men det är ett annat ämne för ett annat tillfälle.

Jag ger mina hästar godis, gärna samtidigt som jag använder något positivt ord såsom ”duktig, fin, bra”. Jag använder även gärna dessa ord samtidigt som jag smeker eller kliar hästen. På så sätt kopplar jag ihop godiset med vissa ord, och själva ordet blir något positivt. Belöning med rösten eller beröring är alltså något jag använder dagligen, och detta är också former för positiv förstärkning. Jag tillför något efter hästen visat ett önskevärt beteende. Genom att klia eller smeka hästen så utnyttjar vi hästens flockinstinkt. Hästar i en flock umgås gärna genom att klia varandra. Ett sto kommer smeka sitt föl omsorgfullt med mulen för att lugna det.

Lägg märke till att jag använder ord såsom smeka och klia, inte klappa. Man kan klappa en häst på olika sätt. Det sättet man ofta ser på tv, ni vet när en häst utfört en fin hopprunda eller ett bra dressyrprogram, och ryttaren klappar (/slår) hästen på halsen, är inte belöning. Om man tittar på hästens reaktion vid denna form av ”belöning” så lägger den oftast bak öronen, tittar lite spänt bakåt eller spänner upp halsen. Inte ett beteenden som påvisar behag. Det finns även studier på att när ryttaren klappar hästen lätt på detta sätt så höjs hjärtfrekvens och blodtryck. När man däremot smeker hästen med hårremmen har det visat sig ha motsatt effekt, d.v.s. hjärtfrekvens och blodtryck sjunker.

Som en godispåse

Jag blandar alltså negativ och positiv förstärkning i träningen av mina hästar. Negativ förstärkning är det jag huvudsakligen använder mig av, jag använder olika hjälper (sits, skänkel, tygel etc.) för att motivera hästen att göra det jag vill. Men jag tvekar inte att använda mig frikostigt av att prata med hästen under ett träningspass, och jag smeker och kliar den gärna ofta efter en välgenomförd uppgift!

I min godispåse finns det alltså inte bara en sorts godis (ett tillvägagångssätt) utan jag blandar! Jag tror stenhårt på att ”En riktigt hästaman/kvinna doftar alltid av hästgodis” och att genom att belöna med vår röst kommer vi skapa bättre stämning i träningen. Orden i sig spelar inte så stor roll, utan hur vi säger dem. Prova själv att säga ”Braaa, duuktiiiig!” med glad ton, som att du eller din häst just vunnit VM – och kom så och säg att det inte fick dig le eller KÄNNA glädje? Vår sinnesstämning kommer avspegla sig på hästarna. Därför kan belöning med rösten ha sån positiv effekt på träningen. Om vi dessutom ibland bjuder på godis, ja då kommer vi vara rikigt populära!

Hittills har denna kombination fungerat bra för mig och de jag känner som jobbar i samma branch. Jag skulle vilja påstå att Oddsstadir är rätt välkänt för sina fina och välridna hästar. Våra hästar har sällan skador, de håller i många år och de är arbetsvilliga. Glada hästar som håller länge känns som ett kvitto på bra träning – eller vad säger du?

Negative vs positive reinforcement

There are many ways to train horses, many methods and philosophies. I use negative reinforcement and to some extent also positive reinforcement. It may sound strange that I mostly use negative reinforcement and not positive reinforcement. But what exactly is negative reinforcement and why use it? – You could describe negative reinforcement as a method to reinforce a wanted behavior in the horse by stopping or removing something. As a scientific term the word negative in this case means “something you remove”. When it comes to riding, it is the removal of the rider’s aid. Positive reinforcement is a method where you reinforce a wanted behavior by adding something. It can for example be a treat, but also reward with voice praise or by touch/petting. The words positive vs negative are not valued-charged, they simply mean that either you add or remove something. It’s not uncommon that people associate negative reinforcement with punishment, since the word ‘negative’ can be comprehended as valued-charged.

Negative reinforcement in pratice

Why do I use negative reinforcement when I train the horses, why not just positive reinforcement as you do when training dogs for example? – Horses are herbivores and pray animals, dogs on the other hand are carnivores and predators. The dog has a foraging behavior that is linked to its hunting instinct = dogs are driven by working for food and therefore it’s effective to reward their behavior with candy/treats. The horse doesn’t have a hunting instinct, they do have a food instinct (and it is possible to motivate them with candy), but this instinct isn’t as strong as their escape instinct.

Except for the horse being a pray animal, it’s also a so called “comfort seeker”, meaning that it will always seek for the most comfortable surrounding possible for the moment. The horse will therefore always choose the most comfortable and easy way.

So, the horse´s biggest” driving force” is the escape instinct, and it will always look for whatever’s most comfortable. That’s why we use negative reinforcement, where we add something “uncomfortable”, a form of stimuli that we later can remove. This stimulus can for example be the leg- or rein aid. Say that I want the horse to move its hind to the side. I add a stimuli/discomfort in form of my leg aid. The horse will look for a way to get rid of this discomfort, and when it answers right by moving to the side, I will remove my leg/the stimuli/discomfort and the horse learns that it’s more comfortable to move when this stimulus comes.

Timing is EVERYTHING

In order for this method to work, for the horse to learn what different kinds of stimuli (or aids) means, it is crucial that the praise (=the removal of our aid) comes at the right moment. “Pressure motivates, the release teaches” – It’s not the discomfort/our aid that teaches the horse, rather the moment we remove the discomfort/our aid.

Let’s take the example once again where we move the horse´s hind. I add my leg aid, a discomfort, the horse is motivated to do something, something that will lead to a place more comfortable, that is: a situation where the leg aid is no longer on. The horse will try different things to get rid of this discomfort, maybe one of these things is to move to the side (which was the answer I was looking for = that’s the behavior I want to reward). I will therefore remove my leg aid and the horse learns that “if I move when she does that, I get left alone which is comfortable. I like comfortable”. But this only works if the reward, the release, happens within ca 3 seconds. This is because the horse can’t connect events in time further apart than ca 3 seconds. The horse lives here and now.

One aid – one answer – one reward.

Positive reinforcement in practice

Since timing is everything when it comes to rewarding, it’s not that effective to give candy. The reward should preferably come a few seconds after the wanted behavior. Simply reaching for the candy in your pocket when the horse has showed the wanted behavior, takes a few seconds and the moment where the horse learns has “gone lost”. Therefore, clicker training has become quite popular when training horses, since it’s easier to reward the horse in the exact right moment. But this is another subject for another time.

I do however give my horse´s candy, preferably at the same moment at using some word of praise, such as “good, fine, well done”. I also preferably use these words at the same time as I stroke or scratch the horse. In that way I connect candy with a word, and the word becomes something positive. In other words, rewarding by voice or touch is something I use daily, and these are also forms of positive reinforcement. I add something once the horse has showed a wanted behavior. By scratching or stroking the horse we’re using the horse´s herd instinct. Horse´s in a herd will interact by scratching each other. A mare will softly stroke her foal with her muzzle to sooth it.

Notice that I use words such as stroke and scratch, not pat. You can pat the horse in different ways. You do however usually see riders in TV pat their horse quite hard, you know after a successful jumping round or dressage program. This is not praise. If you look closely on the horse´s reaction to this form of “praise”, it usually put its ears back, it looks backward a little anxiously or raise it neck. That’s not a behavior that shows comfort. There is also a study that shows that when the rider pats the horse on the neck, heartrate and blood pressure increases. The same study also shows how the heartrate and blood pressure will decrease when the rider gently strokes its neck.  

Like a bag of candy

To sum it up, I mix both negative and positive reinforcement when training my horses. Negative reinforcement being the main method that I use, since I use different aids (seat, leg, rein etc.) to motivate the horse to do the things I want. I do however not hesitate to praise the horse a lot during a training session by using my voice/words, and I often scratch the horse after a job well done!

In my bag of candy there’s not just one kind of candy (one method/approach), because I mix it up! I’m a true believer of the fact that” A real horseman/woman always has the smell of horse-candy/treat” and by using our voice to praise the horse, we can create a better mood in the training. What words we use doesn’t matter as much as how we use them. Try it yourself, say” Goood, well dooone!” with a happy tone, as if you or your horse just won the world championship – now don’t come tell me that, that didn’t make you smile or FEEL joy? Our mindset will get mirrored in the horse. That’s why praise by voice can have such a great impact on the training. If we in addition to that sometimes give treats, well, then we’ll get really popular!

So far, this combination has worked well for me and the people I know who works in the same business. I would like to claim that Oddsstadir is quite well known for nice and well-ridden horses. Our horses rarely have injuries, they stay fit for many years and a willing to work. Happy horses that last feels like a receipt on good training – wouldn’t you say?