• Nenhum resultado encontrado

4.4. Análise de Imagem

4.4.1. A Localização da Face e dos Olhos

4.4.1.1. A Localização da Face

A localização dos limites da face é a primeira etapa da análise das imagens. Embora se parta do princípio que a imagem contém a face de uma pessoa a sua localização é incerta. Visto ser pretendida uma grande resolução nos olhos a face terá dimensões consideráveis, o que poderá resultar que esta não se encontre totalmente visível na imagem. Além disso, há uma certa liberdade para a posição da face relativamente à câmara, o que leva a que a face não esteja centrada na maior parte das situações.

Assim, foi necessário desenvolver um método que garantia a localização exacta da face mesmo em situações em que um dos limites laterais da face não estivesse visível, ou noutras em que o limite superior da imagem não incluísse a parte superior do rosto.

Tal análise permite tornar o sistema mais robusto e mais flexível, não impondo restrições adicionais ao posicionamento correcto da face e permitindo utilizar um maior factor de zoom na objectiva, o que aumenta a versatilidade do método.

O ponto de partida é uma imagem da face do utilizador, obtida com a câmara posicionada por baixo do monitor (Fig. 34). As dimensões das imagens utilizadas foram fixas, de 576 por 768 pixels. Estas dimensões foram impostas pela placa de aquisição utilizada.

Fig. 34 - Imagem Original

De seguida calcularam-se os módulos dos gradientes vertical e horizontal da imagem (Fig. 35/Fig. 36). Estes gradientes foram calculados aplicando o operador de

Sobel com janelas de 3x3 pixels. Embora este método não seja dos que garantem maior

exactidão na detecção de contornos, nesta fase do processo apenas se quer obter uma estimativa dos limites, e a utilização de métodos mais precisos (como os métodos de

Canny ou Shen-Castan [1]) aumentaria significativamente o tempo de processamento,

Fig. 35 - Gradiente com Orientação Vertical Fig. 36 - Gradiente com Orientação Horizontal

Seguidamente, estas imagens foram binarizadas utilizando um nível de binarização fixo, que gerou bons resultados com todas as imagens utilizadas (Fig. 37/Fig. 38).

Fig. 37 - Gradiente Vertical Binarizado Fig. 38 - Gradiente Horizontal Binarizado

Através destas imagens pretende-se determinar qual a zona da imagem a seleccionar (excluindo todas as outras zonas) para a posterior detecção dos olhos.

Na fase seguinte obtiveram-se a projecção segundo a direcção vertical dos pontos brancos da imagem do gradiente vertical e a projecção segundo a direcção horizontal dos pontos brancos da imagem do gradiente horizontal (Fig. 39). Tal permite obter dois sinais cujos máximos de cada um correspondem à localização das colunas e das linhas da imagem onde os contornos são mais acentuados.

Como a análise destes sinais irá influenciar a determinação dos limites de região de interesse, convém que estes se encontrem o mais livres de ruído e oscilações bruscas possível, de modo a aproximarem-se ao máximo dos padrões procurados. Para tal usaram -se filtros passa-baixo simples, com janelas flutuantes de média e mediana cuja dimensão tem em conta a dimensão do sinal. A escolha da dimensão destas é importante, para se obter uma boa suavização sem destruir as características principais do sinal.

Fig. 39 - Projecções dos Gradientes

A projecção vertical evidencia os limites laterais da face. Na projecção horizontal (onde os valores do eixo horizontal correspondem às linhas da imagem) são nítidos os máximos correspondentes ao início do cabelo, sobrancelhas e olhos.

Para determinar os limites laterais da imagem (Fig. 40) procurou-se o primeiro e o último valor da projecção horizontal que ultrapassassem uma determinada percentagem fixa do máximo. Contudo, se um dos limites da face não for visível na imagem (caso em que o primeiro e o último máximo estã o muito próximos um do outro) identifica -se o lado em falta e não se efectua corte no lado da imagem correspondente.

Fig. 40 - Limites Horizontais de Corte

Para determinar os limites superior e inferior de corte a abordagem será obviamente diferente. O objectivo será eliminar tudo o que estiver para baixo dos olhos, pois elementos como a boca, barba e as narinas dificultam a posterior detecção dos olhos. A existência de cabelo não é prejudicial, como se verá adiante. Assim, esta fase

consistia fundamentalmente na obtenção de um bom limite inferior da região de interesse (ROI).

O melhor método que se testou foi analisar os máximos da projecção horizontal. Ao identificar o máximo correspondente aos olhos resolve-se o problema. Contudo, devido à liberdade que se deu quanto à posição da face, não se sabe quantos máximos existem no sinal antes do máximo correspondente ao olho, pois o cimo da imagem pode ser o cabelo (ou a ausência deste), a testa do utilizador ou mesmo o fundo por detrás dele. Desta forma os máximos correspondentes aos olhos não podem ser identificados pelo seu número.

Neste método usou-se apenas os primeiros 80% da projecção horizontal (Fig. 41). Tal deveu-se ao facto de se saber antecipadamente que os olhos não se encontram nesta zona da imagem, e também porque a parte final do sinal poderia ocasionar erros na detecção caso apanhasse os ombros do indivíduo (apareceria um pico muito alto na projecção).

Fig. 41 - Projecção do Gradiente Horizontal (80%)

De seguida fez-se uma procura e etiquetagem de máximos e mínimos do sinal, usando as funções de análise de projecções descritas anteriormente. Depois de saber a localização de cada um dos extremos procedeu-se a uma análise de modo a detectar o padrão “sobrancelhas -olhos” (os dois máximos no centro do sinal).

Para o efeito procurou-se os primeiros três mínimos “adjacentes” (contêm exactamente dois máximos entre o primeiro e o terceiro mínimo) que obedeçam às seguintes condições:

• a diferença de amplitude do 1º para o 3º mínimo não pode exceder 25% da amplitude máxima;

• as amplitudes dos 2 máximos para o mínimo do meio devem diferir um certo valor mínimo (para evitar detectar pequenas oscilações não retiradas após o processo de suavização);

• um dos máximos deve ser superior a 70% do valor máximo do sinal. Com estes testes o padrão Sobrancelha/Olho foi detectado a maior parte das vezes. O limite inferior da ROI será durante a descida do segundo máximo para o terceiro mínimo (70% da descida mais uma margem de segurança).

O limite superior será o topo da imagem, excepto em casos em que a diferença entre os limites superior e inferior seja bastante elevado, sendo nestes casos o limite superior determinado um valor fixo acima do inferior.

A Fig. 42 mostra a projecção horizontal juntamente com os limites verticais da região de interesse.

Fig. 42 - Limites Verticais da Região de Interesse

Este método não funcionou nos casos em que o olho e a sobrancelha se encontravam “juntos” num só pico. Desta forma a detecção do padrão falhava. Para contornar estes casos considerou-se que o máximo do sinal corresponderia a este pico. Assim determinou-se o limite inferior de corte a 70% da descida deste máximo para o mínimo seguinte (mais uma margem de segurança).

O processo de detecção do limite inferior de corte não é simples, e este método foi o que proporcionou melhores resultados (Fig. 43). Contudo, muitos outros foram testados (e posteriormente rejeitados). O grande problema prende-se com o facto de não se saber quantos máximos terá a projecção, e nem sequer se saber a que zona da cara corresponderá o maior máximo. Faces com barba, com pouco cabelo ou com sobrancelhas finas originarão certamente projecções muito diferentes, e daí a dificuldade desta etapa.

Refira-se, a título de exemplo, que outras técnicas que não resultaram. Todos aqueles que se baseassem na procura do maior máximo para identificação da zona da cara não eram de confiança. A procura de “vales” no sinal também não resultou bem, pois a sua extensão é muito variável e tanto o mínimo acima da sobrancelha como o mínimo abaixo do olho têm por vezes amplitudes não muito baixas.

Fig. 43 - Padrão “Sobrancelha-Olho” na Projecção Horizontal de várias imagens

Tendo os quatro limites determinados pode -se efectuar a definição da ROI, obtendo a seguinte imagem (Fig. 44) que será objecto de processamento em fases posteriores.

Fig. 44 - Imagem após o Corte Inicial

Documentos relacionados