• Nenhum resultado encontrado

Na maioria das pesquisas discutidas até aqui, o alvo tinha a mesma probabilidade de aparecer em qualquer ponto dentro do display visual e, assim, a busca era essencialmen- te aleatória. Isso é muito diferente do mundo real. Suponha que você está no jardim pro- curando seu gato. A sua busca visual seria altamente seletiva – você iria ignorar o céu e focalizar principalmente o chão (e talvez as árvores). Dessa forma, sua busca envolveria processos top-down com base em seu conhecimento de onde é mais provável que gatos sejam encontrados.

Ehinger e colaboradores (2009) estudaram processos top-down na busca visual. Eles registraram as fixações dos olhos dos observadores procurando uma pessoa em inúmeras cenas externas no mundo real. Em geral, os observadores fixavam o olhar nas regiões provavelmente mais relevantes de cada cena (p. ex., nas calçadas) e ignoravam regiões irrelevantes (p. ex., céu, árvores) (ver Fig. 5.11). Os observadores também fi- xaram o olhar em localizações que diferiam consideravelmente das regiões contíguas e áreas contendo características distintivas de uma figura humana.

Como podemos explicar esses achados e os discutidos anteriormente? Wolfe e colaboradores (2011b) apresentaram o modelo da via dupla (ver Fig. 5.12). Existe um caminho seletivo de capacidade limitada (indicado pelo gargalo) no qual os objetos são selecionados individualmente para reconhecimento. Esse caminho tem sido objeto da maioria das pesquisas até recentemente.

Também há um caminho não seletivo no qual é processado o “cerne” ou a essência de uma cena. Esse processamento pode, então, ajudar a direcionar ou orientar o pro- cessamento dentro da via seletiva (representado pela flecha denominada “Orientação”). Essa via é muito mais usada no mundo real do que nas pesquisas laboratoriais tradicio- nais. Ela nos permite aproveitar nosso conhecimento armazenado do ambiente (p. ex., a aparência típica de uma cozinha).

Achados

Wolfe e colaboradores (2011a) compararam a busca visual de objetos apresentados no con- texto de uma cena ou em localizações aleatórias contra um fundo branco. Conforme previs- to, a velocidade da busca era muito maior no contexto da cena (10 ms por item vs. 40 ms por item, respectivamente). Eles explicaram essa diferença em termos do que denominaram “ta- manho do conjunto funcional” – a busca visual nas cenas é eficiente porque os observadores podem eliminar a maioria das regiões, pois é muito improvável que contenham o objeto.

(a) (b)

Figura 5.11

As primeiras três fixações do olhar feitas pelos observadores que procuravam pedestres. Como se pode ver, a maioria das fixações era em regiões nas quais mais provavelmente seriam encontrados pedestres. As fixações do olhar dos observadores foram muito mais semelhantes na foto da esquerda do que na da direita, porque existem menos regiões na da esquerda.

182 PARTE I Percepção visual e atenção

Foi relatado forte apoio para a noção do tamanho do conjunto funcional por Võ e Wolfe (2012) em um estudo no qual os observadores detectavam objetos dentro de cenas (p. ex., um pote de geleia em uma cozinha). O principal achado foi que 80% de cada cena raramente era fixado pelos observadores. Por exemplo, eles não olhavam para a pia ou para as portas dos armários quando procuravam um pote de geleia.

Os achados de Võ e Wolfe (2012) mostram que podemos usar nosso conheci- mento geral das cenas para facilitar a busca visual. Hollingworth (2012) investigou se o conhecimento específico das cenas também a tornaria melhor. Seus participantes realizaram uma tarefa de busca visual de objetos em cenas. Alguns as haviam visto previamente com instruções para decidir qual objeto era menos provável de aparecer em uma cena daquele tipo. A busca visual foi significativamente mais rápida quando as cenas específicas usadas haviam sido vistas previamente, indicando, assim, a utilidade desse conhecimento.

Mais evidências de que a aprendizagem de onde os alvos provavelmente serão encontrados com frequência desempenha um papel importante na busca visual foram reportadas por Chukoskie e colaboradores (2013). Um alvo invisível foi apresentado em localizações aleatórias dentro de uma área relativamente pequena de uma tela em bran- co. Os observadores eram recompensados ouvindo um sinal sonoro quando fixavam o olhar no alvo. Ocorreu um forte efeito de aprendizagem – as fixações foram inicialmente distribuídas por toda a tela, mas, de modo rápido, se tornaram cada vez mais fixadas na área dentro da qual o alvo poderia estar presente (ver Fig. 5.13).

Avaliação

Nosso conhecimento a respeito das localizações prováveis e improváveis de um ob- jeto em uma cena é o determinante mais importante da busca visual no mundo real.

Visão inicial Episódica Semântica Orientação Cor Características Ligação e reconhecimento Orientação Tamanho Profundidade Movimento Etc. Via seletiva

Via não seletiva

Figura 5.12

Um modelo de duas vias da busca visual. A via seletiva tem capacidade limitada e pode unir características do estímulo e reconhecer objetos. A via não seletiva processa o essencial das cenas. Os processamentos seletivo e não seletivo ocorrem em paralelo para produzir uma busca visual efetiva.

CAPÍTULO 5 Atenção e desempenho 183

O modelo da via dupla é um avanço em relação à maioria das teorias anteriores da bus- ca visual uma vez que reconhece plenamente a importância do conhecimento da cena. A noção de que o conhecimento da cena facilita a busca visual reduzindo o tamanho do conjunto funcional é uma contribuição teórica importante que tem recebido muito apoio.

Quais são as limitações do modelo da via dupla? Em primeiro lugar, os pro- cessos envolvidos no uso extremamente rápido do conhecimento essencial de uma cena para reduzir a área de busca permanecem pouco claros. Em segundo, há um foco insuficiente nos processos de aprendizagem que facilitam enormemente a busca visual. Por exemplo, especialistas em diversas áreas detectam informações-alvo mais rapidamente e com maior precisão do que não especialistas (ver Gegenfurtner et al., 2011; ver também Cap. 12). O modelo precisaria ser mais desenvolvido para explicar esses efeitos.