A diversificação entre condicionamento e extinção que vimos discutindo conduz a uma área extremamente interes sante. O refprçamento regular de uma resposta não é regra universal; e algumas propriedades importantes do comportamento deverão aparecer em períodos de extinção interrompidos por reforçamentos ocasionais. De fato, a pesquisa de laboratório mostrou que isto se verifica. Exa- minar-se-á a seguir alguns dos resultados obtidos pela repetição sistemática de condicionamento e extinção.
Um desses procedimentos que mostrou ser um valioso instrumento de pesquisa baseia-se no uso de reforços sin gulares periodicamente apresentados no decorrer da sessão experimental. O esquema pode ser de dois tipos: em um, os reforços são separados por um intervalo de tempo fixo; no outro, são separados por um determinado número de respostas não reforçadas. Vamos considerá-los em ordem.
Recondicionamento periódico em intervalos fixos
Para ilustrar o primeiro procedimento, tome-se um rato faminto e a resposta representativa, de pressão à barra fi xando três minutos como intervalo entre os reforçamentos. A primeira resposta do animal à barra é recompensada com uma pequena bolinha de alimento, mas não se permite que nenhuma das respostas nos três minutos seguintes seja acompanhada de reforço. A primeira resposta depois do intervalo ê reforçada, e as emitidas nos três minutos se-
EXTINÇÃO E REOONDICION AMENTO
99
guintes novamente não serão reforçadas. E assim por diante, durante tantos ciclos de reforçamento e não refor- çamento quantos se desejar. (O intervalo de extinção de resposta não é, precisamente “fixado”, pois o rato nem sempre responde no momento exato em que as peque nas bolinhas de alimento são apresentadas, mas um atraso excessivo é muito raro devido à constante alta fre quência de resposta que geralmente se desenvolve.) Se formos pacientes e não interrompermos o procedimento muito cedo, obtemos um conjunto de modificações interes santes. A curva acumulada de resposta passa por três estágios.
1. A princípio, os intervalos entre respostas não re forçadas tendem a conter pequenas curvas que se dobram, na realidade, pequenas curvas de extinção. Cada novo reforçamento acarreta algumas respostas, mas não muitas, e elas diminuem durante o intervalo. A Figura 18-A repro duz um registro obtido nessas condições. Como se observa, as pequenas curvas se somam para emprestar uma tendência positivamente acelarada em toda a curva.
2. Quando se continua o recondicionamento por um certo tempo, a aceleração positiva deixa de aparecer, e a frequência dentro dos intervalos se transforma num fluir constante de respostas. Os reforçamentos espaçados no tempo são suficientes para manter uma intensidade cons tante de respostas que é responsável pela aparência de linha reta do registro acumulado. O começo de tal fre quência pode ser visto na última porção da Figura 18-A, e na Figura 18-B.
3. Depois de várias sessões de recondicionamento, as curvas de resposta durante os intervalos de três minutos adquirem a aparência de bicos opostos ao do estágio 1. Logo depois do reforçamento, o animal atrasa a resposta por um tempo, mas, à medida que passam os segundos, recomeça novamente, devagar no princípio e depois mais depressa até que o intervalo termina e o próximo reforça mento é recebido. Isto mostra que se formou uma discri minação temporal. Logo depois de comido o alimento as respostas são reduzidas porque nunca são reforçadas, en quanto que as respostas que aparecem mais tarde são fortalecidas porque é quando aparece depois o reforço. O animal chega a "saber” quando a resposta tem mais possi
100
PRINCÍPIOS DE PSICOLOGIAbilidade de ser bem sucedida. Como neste caso o recon- dicionamento é pertodico, é inevitável ocorrer um certo grau de discriminação temporal. A curva na Figura 18-C, obtida depois de dezessete sessões de uma hora de recondicionamen- to periódico mostra isso claramente. Pode-se notar a se melhança essencial desses resultados com aqueles descritos no tratamento do reflexo de traço no Capítulo 2. Na for mação do reflexo de traço, a salivação diante do estímulo condicionado é bastante atrasada até vir a aparecer um pouco antes do reforço.
Um exame mais pormenorizado das curvas, como o acima feito, é um exemplo do distinguir pequenos porme nores, ocupação que pagou altos dividendos na história da ciência. Vamos então considerar um outro exemplo. (Por comodidade vamos adotar a prática de usar “P — R” para recondicionamento periódico). A Figura 19 apresenta uma curva de P — R superposta do mesmo animal que forneceu as curvas para as Figuras 18-B e 18-C. Dá-nos uma visão geral da frequência de respostas durante 24 horas experi mentais. Deixando-se de lado os pormenores, uma outra tendência emerge. (Isto pode ser visto melhor levantando o livro no plano horizontal e olhando para a curva a partir do seu fim mais próximo). Com a continuação do treina mento a curva se inclina ligeiramente para a frente, à medida que o número de respostas não reforçadas diminui. Isto não é diferente da redução de frequência da resposta, mencionada anteriormente em conexão com a extinção em “uma tentativa”, mas é muito menos acentuada. Aparen temente a discriminação temporal que controla o número
Legenda da Fig. 18
Fic. 18. A, Primeiro estágio de treino de PR (recondicionamento pe
riódico) para um rato branco. Os sinais verticais na curva marcam os reforçamentos. Notar a forma da curva de resposta acumulada semelhante à extinção em alguns dos primeiros minutos, e a sugestão
posterior de uma frequência constante.
B. Registro de respostas acumuladas praticamente linear obtido no
segundo estágio nà resposta em PR. O intervalo PR foi de trés mi nutos, e esta porção do registro foi obtida depois de cerca de 60
reforços.
C. Terceiro estágio da resposta em PR mostrando a presença de uma
discriminação temporal. O registro é do mesmo rato que em B, e foi obtido depois de 17 dias de treino (uma hora, ou 20 reforços por
102
PRINCÍPIOS DE PSICOLOGIAde resposta, nesse caso, se forma lentamente. Pode-se dizer que é mais difícil “saber quando” o próximo reforçamento aparece do que "saber que” não aparecerá mais. Mesmo reforçamentos singulares, adequadamente espaçados, man têm alta, por um Jongo tempo, a força da resposta.
Fic. 19, Curva de resposta acumulada depois de três minutos P-R durante um período extenso dc tempo. Notar a aceleração negativa geral lenta que provavelmente mostra o controle sobre as respostas, gradualmente adquirido pela discriminação temporal. Figura 18-B e 18-C são porções aumentadas dessa curva. (Segundo Skinner, 1938).
EXTINÇÃO E RECONDICIONAMENTO