TEORIA
O que leva um animal a fazer um comportamento?
Como já sabemos, um comportamento é determinado das suas conseqüências; portanto, dependendo das conseqüências, haverá mais ou menos probabilidade de que o comportamento se repita.
Por exemplo, se a consequência for negativa, a probabilidade que o comportamento seja feito de novo diminuirá , pelo contrário, se a consequência for positiva, a probabilidade de apresentação de um comportamento aumentará.
O condicionamento operante inclui várias técnicas, mas vamos-nos concentrar no uso do reforço positivo, onde encontramos dois tipos:
- Reforços primários: tudo o que tem um valor intrínseco, por natureza auto-reforçador. Esses reforços podem ser a comida, temperatura, água, sexo ...
- Reforços secundários: também chamados de reforços condicionados, o seu valor é dado por uma história de associação com um reforço primário. Reforços secundários podem ser as festinhas, jogos, brinquedos, etc. Recordem-se que o bridge também é um reforço secundário.
Acreditamos que é importante manter um equilíbrio dos dois tipos de reforço num programa de treino. Por exemplo, se um animal não quiser comer ou estiver doente, a sessão poderá não ser muito bem-sucedida se tivermos apenas reforço primário, mas se pelo contrário tivermos condicionado bem outros tipos de reforço, teremos mais variabilidade e oportunidade de interagir com os nossos animais e terminar a sessão com sucesso.
O que é um programa de reforço?
Deve haver algumas regras num programa de reforço que ajudem a determinar como o reforço se relaciona com as respostas ao comportamento. A apresentação do reforço pode depender de vários fatores, como: número de respostas, tempo, etc.
Os programas de reforço mais comuns no treino de animais são:
- Reforço contínuo: onde todos os comportamentos corretos são reforçados. Normalmente, é o sistema mais utilizado pelos treinadores para treinar novos comportamentos, pois gera mais motivação e constância.
- Reforço variável: é o sistema que gera o maior sucesso na aprendizagem e ajuda a evitar a extinção de um comportamento. É caracterizado pelo fato de que apenas algumas das respostas corretas sãoreforçadas.
- Proporção fixa: o reforço aparece sempre após o mesmo número determinado de respostas. Por exemplo: reforçamos cada dois comportamentos corretos.
- Proporção variável: reforçamos após um número variável de respostas. Por exemplo, um golfinho salta e reforçamos após o primeiro salto, o segundo salto, o quarto salto, etc.
- Intervalo fixo: o reforço aparece após o mesmo período de tempo. Por exemplo:
independentemente do que esteja a fazer, o animal é reforçado a cada 60 segundos.
- Intervalo variável: o animal é reforçado após um período de tempo. Por exemplo, um animal faz um comportamento e o reforço aparece após 5 segundos ou 10 ou 20 em um intervalo de tempo definido por nós em fase de planificação.
Reforço positivo vs. reforço negativo
Apesar do que muitas pessoas pensam, reforço positivo e reforço negativo não significa "bom" e "ruim". O reforço positivo ocorre quando adicionamos um estímulo apreciado pelo animal no seu meio ambiente. Por ser apreciado, aumentará a probabilidade de um comportamento ocorrer novamente. O reforço positivo mais eficaz é a comida.
Por sua vez, reforço negativo é quando removemos um estímulo indesejado do meio ambiente do animal para criar comportamento. Com este processo, aumentamos a probabilidade de que o comportamento desejado aumente.
Os cães pastor por exemplo. O cão persegue as ovelhas e ladra (adiciona um estímulo indesejado que é o ladrar e persegue-as) quando as ovelhas começam a andar na direção do curral e entram, o cão recua e as ovelhas entram com o sistema de reforço negativo. Ou seja o cão deixou de ladrar e seguilas porque criou o comportamento desejado , que era fazê-las entrar no curral.
Outro exemplo bem conhecido nas nossas vidas diariamente é o sinal acústico no carro quando não usamos cinto de segurança. Uma vez que o cinto é posto, o estímulo indesejado (o bip) acaba.
Realizamos este comportamento através de reforço negativo.
Esse tipo de reforço é uma das muitas técnicas disponíveis, mas recomendamos usá-la apenas para momentos muito específicos e somente se for realizado por treinadores com experiência.
Basear o nosso programa de treino no uso de reforço positivo gera uma história muito mais confiável, positiva e segura e, portanto, estimulante para o animal.
Reforço diferencial
O processo de reforço no qual apenas os comportamentos desejados e a ausência de reforço nos comportamentos indesejados, esse processo é conhecido como reforço diferencial.
É uma técnica muito útil em que a quantidade de reforço é usada para criar uma relação direta com a qualidade da resposta de um comportamento específico que um animal nos oferecerá.
Em outras palavras, quanto maior o reforço que um animal obtém para uma determinada resposta, melhor e mais preciso será o seu comportamento no futuro.
Essa diferenciação da quantidade de reforço também é chamada de "jackpot" e é usada para destacar uma ótima resposta do animal.
No entanto, alguns treinadores, consciente ou inconscientemente, usam esse tipo de reforço diferencial executando uma prática que não é recomendada. Muitos variam o tom do bridge (apito, voz) ou, se o comportamento é muito bom, o bridge ( apito, voz) é mais agudo ou o tom de voz mais longo do que em uma situação normal.
Nós do WeZooit respeitamos qualquer técnica que não comprometa o bem-estar animal, mas consideramos esta última prática um pouco confusa, inútil e impraticável em qualquer programa de treinamento.
Finalmente, na nossa opinião, o esquema de reforço variável (não apenas num intervalo de tempo e comportamento, mas também no tipo de reforço) é o que tem mais sucesso, porque, sendo imprevisível, mantém sempre alta a motivação do animal.
E lembrem-se, se se pode ...WeZooit!