Exercícios * - Processamento Digital de Imagens 3ªEd

*2.1 Utilizando as informações apresentadas na Seção 2.1 e

pensando puramente em termos geométricos, estime o diâmetro do menor ponto impresso que o olho é capaz de discernir se a página na qual o ponto foi impresso estiver a 0,2 metros de distância dos olhos. Suponha, para fins de simplificação, que o sistema visual deixe de detectar o ponto quando a imagem do ponto na fóvea ficar menor do que o diâmetro de um receptor (cone) nessa área da retina. Suponha também que a fóvea possa ser modelada em um arranjo matricial quadrado de dimensões 1,5 mm × 1,5 mm e que os cones e es- paços entre eles sejam distribuídos uniformemente ao longo desse arranjo.

2.2 Quando você entra em uma sala de cinema escura em

um dia claro, leva um tempo antes de conseguir enxergar bem o suficiente para encontrar um lugar vago. Quais dos processos visuais explicados na Seção 2.1 ocorrem nessa situação?

*2.3 Apesar de não ser mostrado na Figura 2.10, a corrente

alternada com certeza faz parte do espectro eletromag- nético. A corrente alternada comercial nos Estados Unidos tem uma frequência de 60 Hz. Qual é o com- primento de onda em quilômetros desse componente do espectro?

2.4 Você foi contratado para desenvolver um dispositivo de

entrada de um sistema de aquisição de imagens para estudar os formatos dos contornos de células, bactérias, vírus e proteínas. O dispositivo de entrada consiste, neste caso, na(s) fonte(s) de iluminação e câmera(s) de aquisição de imagens correspondente(s). Os diâmetros dos círculos necessários para incluir espécimes individuais em cada uma dessas categorias são 50; 1; 0,1; e 0,001 μm, respectivamente.

(a) Você consegue solucionar os aspectos relativos à

aquisição de imagens desse problema com um úni- co sensor e câmera? Se a sua resposta for sim, especifique a banda do espectro eletromagnético (em comprimentos de onda) da iluminação e o tipo de câmera necessário. Por “tipo” queremos dizer a banda do espectro eletromagnético à qual a câme- ra é mais sensível (por exemplo, o infravermelho).

(b) Se a sua resposta para (a) for não, que tipo de fontes

de iluminação e sensores correspondentes de aqui- sição de imagens você recomendaria? Especifique as fontes de luz e câmeras como solicitado na parte (a). Utilize o número mínimo de fontes de ilumina- ção e câmeras necessário para resolver o problema. Por “resolver o problema”, queremos dizer conseguir detectar detalhes circulares de diâmetro 50; 1; 0,1; e 0,001 μm, respectivamente.

2.5 Um chip de câmera CCD de dimensões 7 × 7 mm con- tém 1.024 × 1.024 elementos e se concentra em uma área plana e quadrada, localizada a 0,5 m de distância. Quantos pares de linha por mm essa câmera será capaz de resolver? A câmera está equipada com lentes de 35 mm. (Dica: modele o processo de aquisição de imagens como na Figura 2.3, com a distância focal das lentes da câmera substituindo a distância focal do olho.)

*2.6 Um fabricante de automóveis está automatizando as

substituições de alguns componentes dos para-choques de uma linha de edição limitada de carros esportivos. Os componentes são coordenados de acordo com as cores, de forma que os robôs precisam saber a cor de cada carro para selecionar o componente apropriado dos para- -choques. Os carros são fabricados em apenas quatro cores: azul, verde, vermelho e branco. Você foi contratado para propor uma solução baseada na aquisição de imagens. Como solucionaria o problema de determinar automati- camente a cor de cada carro, tendo em mente que o custo é o fator mais importante na sua escolha dos componentes?

2.7 Suponha que uma área plana com centro em (x₀, y₀) seja iluminada por uma fonte de luz com distribuição de intensidade

i(x, y) = Ke–[(x–x0)2 + (y–y0)2]

Suponha, para fins de simplificação, que a refletância da área seja constante e igual a 1,0 e que K = 255. Se a imagem resultante for digitalizada com k bits de resolu- ção de intensidade e o olho puder detectar uma mudança súbita de oito níveis de intensidade entre pixels adjacen- tes, qual valor de k causará um falso contorno visível?

2.8 Esboce a imagem do Exercício 2.7 para k = 2.

*2.9 Uma medida comum de transmissão de dados digitais

é o baud rate, definido como o número de bits transmi- tidos por segundo. Em geral, a transmissão é feita em pacotes consistindo em um bit de início (start bit, que marca o início da transmissão), um byte (8 bits) de in- formação e um bit de parada (stop bit, que indica o fim da transmissão).

Dados esses fatos, responda as seguintes perguntas:

(a) Quantos minutos levaria para transmitir uma ima-

gem de 1.024 × 1.024 com 256 níveis de cinza utilizando um modem de 56K bauds?

(b) Quanto tempo levaria em 3.000K bauds, uma ve-

locidade representativa de uma linha telefônica do tipo DSL (Digital Subscriber Line)?

2.10 Uma televisão de alta definição (HDTV) gera imagens

com 1.125 linhas horizontais de TV entrelaçadas (onde o campo das linhas pares e das linhas ímpares são pin- tados alternadamente na entrada do tubo, e cada campo tem 1/60 segundos de duração). A proporção largu- ra por altura da imagem (razão de aspecto) é de 16:9. O fato de o número de linhas horizontais ser fixo deter- mina a resolução vertical das imagens. Uma empresa

*_{Soluções detalhadas dos exercícios marcados com um asterisco}

podem ser encontradas no site do livro. O site também contém projetos sugeridos com base no conteúdo deste capítulo.

projetou um sistema de captura de imagens que gera imagens digitais a partir de imagens de HDTVs. A reso- lução de cada linha da TV (horizontal) nesse sistema é proporcional à resolução vertical, com a proporção sen- do a razão de aspecto das imagens. Cada pixel na imagem colorida tem 24 bits de resolução de intensidade, 8 bits para cada imagem componente de cor: vermelha, verde e azul. Essas três imagens “primárias” formam uma imagem colorida. Quantos bits seriam necessá- rios para armazenar um filme de 2 horas em HDTV?

*_{2.11 Considere os dois subconjuntos de imagens, S}

1 e S2 mostrados na figura a seguir. Para V = {1}, determine se esses dois subconjuntos são (a) adjacentes-4, (b) ad- jacentes-8 ou (c) adjacentes-m. 0 0 0 0 0 0 1 0 0 0 1 0 0 1 1 1 0 0 1 1 0 0 1 1 1 0 0 1 1 0 1 0 0 1 1 0 0 0 0 0 1 0 0 1 0 0 0 0 1 1 S1 S2

*_{2.12 Desenvolva um algoritmo para converter um caminho-8}

de 1 pixel de espessura em um caminho-4.

2.13 Desenvolva um algoritmo para converter um cami-

nho-m de 1 pixel de espessura em um caminho-4.

2.14 Releia a discussão no final da Seção 2.5.2, na qual

definimos o fundo como (R_u)c_{, que é o complemen-}

to da união de todas as regiões de uma imagem. Em algumas aplicações, é vantajoso definir o fundo como o subconjunto de pixels (R_u)c_{que não são “buracos”}

(pense, informalmente, nos buracos como conjuntos de pixels de fundo cercados de pixels de região). Como você modificaria a definição para excluir os pixels nu- los de (R_u)c _{? Uma resposta do tipo “o fundo é o sub-}

conjunto de pixels de (R_u)c_{que não são buracos” não é}

aceitável. (Dica: use o conceito de conectividade.)

2.15 Considere o segmento de imagem mostrado.

*_{(a) Se V}_{= {0, 1}, calcule os comprimentos dos cami-}

nhos −4, −8 e −m mais curtos entre p e q. Se um caminho específico não existir entre esses dois pontos, explique por quê.

(b) Faça o mesmo para V = {1, 2}

3 1 2 1 2 2 0 2 1 2 1 1 1 (p) (q) 0 1 2

_2.16*_{(a) Defina a(s) condição(ões) sob as quais a distância}

D₄ entre dois pontos p e q é igual ao caminho-4

mais curto entre esses pontos.

(b) Esse caminho é único?

2.17 Repita o Exercício 2.16 para a distância D₈.

*_{2.18 No próximo capítulo, abordaremos dois operadores}

cuja função é calcular a soma dos valores de pixels em uma pequena área de subimagem, S. Demonstre que estes são operadores lineares.

2.19 A mediana, ζ , de um conjunto de números é tal que

a metade dos valores do conjunto está abaixo de ζ e a

outra metade está acima dela. Por exemplo, a mediana do conjunto de valores {2, 3, 8, 20, 21, 25, 31} é 20. Demonstre que um operador que calcula a mediana de uma área de subimagem, S, é não linear.

*_{2.20 Prove a validade das equações 2.6-6 e 2.6-7. [Dica: co-}

mece com a Equação 2.6-4 e use o fato de que o valor esperado de uma soma é a soma dos valores esperados.]

2.21 Considere duas imagens de 8 bits cujos níveis de cinza

cobrem todo o intervalo de 0 a 255.

(a) Discuta o efeito limitador de subtrair repetidamen-

te a imagem (2) da imagem (1). Suponha que o

resultado também seja representado em 8 bits.

(b) Inverter a ordem das imagens levaria a um resulta-

do diferente?

*_{2.22 A subtração de imagens costuma ser utilizada em apli-}

cações industriais para detectar componentes faltantes na montagem de um produto. A metodologia é armazenar uma imagem “ótima” que corresponda à montagem correta; essa imagem é então subtraída das imagens do mesmo produto. Teoricamente, as di- ferenças serão zero se os novos produtos forem mon- tados corretamente. As imagens da diferença para os produtos com componentes faltantes seriam diferen- tes de zero na área onde diferem da imagem ótima. Quais condições você acha que deveriam ser atendi- das na prática para esse método funcionar?

2.23 *_{(a) Consultando a Figura 2.31, esboce o conjunto (A}_∩ B) ∪ (A ∪ B)c_.

(b) Dê as expressões para os conjuntos mostrados em

cinza na figura a seguir em termos dos conjuntos A,

B e C. As áreas em cinza em cada figura constituem

um conjunto, de forma que cada uma das três fi- guras deve ter uma expressão correspondente.

B C

2.24 Quais seriam as equações análogas às equações 2.6-24

e 2.6-25, que resultariam da utilização de regiões trian- gulares em vez de quadriláteras?

2.25 Prove que os kernels de Fourier nas equações 2.6-34 e

2.6-35 são separáveis e simétricos.

*_{2.26 Mostre que transformadas bidimensionais com kernels}

separáveis e simétricos podem ser determinadas (1) calculando as transformadas unidimensionais ao longo das linhas (colunas) individuais da entrada e depois (2) calculando as transformadas unidimensionais ao longo das colunas (linhas) do resultado do passo (1).

2.27 Uma fábrica produz uma linha de quadrados de polí-

meros miniaturizados e translúcidos. Rigorosos padrões de qualidade requerem 100% de inspeção visual e a gerente da fábrica percebe que a utilização de inspeto- res humanos é cada vez mais dispendiosa. A inspeção é semiautomatizada. Em cada estação de inspeção, um mecanismo robótico posiciona cada quadrado de polí- mero sobre uma luz localizada abaixo de um sistema ótico que produz uma imagem ampliada do quadrado. A imagem preenche completamente o monitor de imagem, de dimensões 80 × 80 mm. Os defeitos aparecem como borrões circulares escuros e o trabalho do inspetor é olhar para a tela e rejeitar qualquer amostra que tenha um ou mais desses borrões escuros com diâmetro igual ou maior do que 0,8 mm, de acordo com a medida de uma régua na tela. A gerente acredita que, se conseguir encontrar uma maneira de automatizar completamente o processo, ela aumentará os lucros em 50%. Ela tam- bém acredita que o sucesso desse projeto a ajudará a

subir na pirâmide corporativa da empresa. Depois de muita investigação, a gerente decide que a forma de solucionar o problema é visualizar cada tela de inspe- ção com uma câmera CCD de TV e alimentar a saída da câmera com um sistema de processamento de imagens capaz de detectar os borrões, medir seu diâmetro e ativar os botões aceitar/rejeitar que antes eram ope- rados por um inspetor. Ela consegue encontrar um sistema capaz de realizar o trabalho, contanto que o menor defeito ocupe uma área de pelo menos 2 × 2 pixels na imagem digital. A gerente contrata você para ajudá-lo a escolher o sistema de câmera e lentes, mas requer que você utilize componentes que já estão fora de linha. Para as lentes, presuma que essa restrição implique qualquer múltiplo inteiro de 25 mm ou 35 mm, até 200 mm. Para as câmeras, a limitação significa resoluções de 512 × 512, 1.024 × 1.024 ou 2.048 × 2.048 pixels. Os elementos in-

dividuais de aquisição de imagens dessas câmeras são qua-

drados medindo 8 × 8 μm e os espaços entre os elementos são de 2 μm. Para essa aplicação, as câmeras custam muito mais do que as lentes, de forma que o problema deve ser solucionado com a câmera de menor resolução possível, com base na escolha das lentes. Como consul- tor, você deve fornecer uma recomendação por escrito, demonstrando com razoável nível de detalhes a análise que levou à sua conclusão. Utilize a mesma geometria de aquisição de imagens sugerida no Exercício 2.5.

Faz toda a diferença enxergar a escuridão através da luz ou a claridade através das sombras.

David Lindsay

Capít

ulo

3

Transformações de intensidade

e filtragem espacial

3.1 Fundamentos

3.1.1 Os fundamentos das transformações de

intensidade e filtragem espacial

Todas as técnicas de processamento de imagem dis- cutidas nesta seção são implementadas no domínio espa-

cial, que, como sabemos com base na análise da Seção

2.4.2, se trata simplesmente do plano contendo os pixels de uma imagem. Como observado na Seção 2.6.7, as téc- nicas de domínio espacial atuam diretamente nos pixels de uma imagem em oposição, por exemplo, ao domínio de frequência (o tópico do Capítulo 4), no qual as operações são realizadas na transformada de Fourier de uma imagem, e não na própria imagem. Como veremos ao longo

Apresentação

A expressão domínio espacial se refere ao próprio plano imagem, e os métodos de processamento de ima- gens nessa categoria se baseiam na manipulação direta de pixels em uma imagem. Isso se contrasta com o processamento de imagens em um domínio da transformada, que, como vimos rapidamente na Seção 2.6.7 e discutiremos em mais detalhes no Capítulo 4, envolve primeiro transformar uma imagem no domínio da transformada, realizar o processamento nesse domínio e obter a transformada inversa para retornar os resultados ao domínio espacial. As duas principais categorias do processamento espacial são transformações de intensidade e filtragem espacial. Como veremos neste capítulo, as transformações de intensidade ope- ram individualmente nos pixels de uma imagem, principalmente para fins de manipulação de contraste e limiarização de imagem. A filtragem espacial lida com a realização de operações como o realce de imagens, trabalhando na vizinhança de cada pixel de uma imagem. Nas seções a seguir, discutiremos várias técnicas “clássicas” de transformações de intensidade e filtragem espacial. Também veremos em alguns detalhes téc- nicas fuzzy (difusas) que nos permitem incorporar informações imprecisas, baseadas em conhecimento, na formulação de algoritmos de transformações de intensidade e filtragem espacial.

do livro, algumas tarefas de processamento de imagens são mais fáceis ou fazem mais sentido se implementadas no domínio espacial, ao passo que outras são mais ade- quadas para outras abordagens. Em geral, as técnicas no domínio espacial são computacionalmente mais eficien- tes e requerem menos recursos de processamento para serem realizadas.

Os processos no domínio espacial que discutiremos neste capítulo podem ser expressos por:

g(x, y) = T[f(x, y)] (3.1-1)

onde f(x, y) é a imagem de entrada, g(x, y) é a imagem de saída, e T é um operador em f definido em uma vizi- nhança do ponto (x, y). O operador pode ser aplicado a

uma única imagem (nosso principal foco neste capítulo) ou a um conjunto de imagens, como no procedimento de soma pixel por pixel de uma sequência de imagens para a redução de ruídos, como discutimos na Seção 2.6.3. A Figura 3.1 mostra a aplicação básica da Equação 3.1-1 em uma única imagem. O ponto (x, y) mostrado é uma po- sição arbitrária na imagem, e a pequena região contendo o ponto é uma vizinhança de (x, y), como explicado na Seção 2.6.5. Em geral, a vizinhança é retangular, centra-

da em (x, y) e tem tamanho muito menor que a imagem.*

O processo ilustrado na Figura 3.1 consiste em mo- ver a origem da vizinhança de um pixel ao outro e aplicar o operador T aos pixels na vizinhança para gerar a saída nessa posição. Dessa forma, para qualquer posição especí- fica (x, y), o valor da imagem de saída g nessas coordenadas é igual ao resultado da aplicação de T à vizinhança com origem em (x, y) na imagem f. Por exemplo, suponha que a vizinhança seja um quadrado de tamanho 3 × 3 e que o operador T seja definido como “calcular a intensidade média da vizinhança”. Considere uma posição arbitrária em uma imagem, digamos (100, 150). Supondo que a origem da vizinhança seja no seu centro, o resultado,

g(100, 150), nessa posição é calculado como a soma de f(100, 150) e seus vizinhos-8, dividida por 9 (isto é, a

intensidade média dos pixels contidos na vizinhança).

A origem da vizinhança é, então, movida para a próxima posição e o procedimento é repetido para gerar o próximo valor da imagem de saída g. Normalmente, o processo tem início no canto superior esquerdo da imagem de entrada e avança pixel por pixel em uma varredura horizontal, uma linha por vez. Quando a origem da vizinhança se localizar na borda da imagem, parte da vizinhança ficará fora dela. O procedimento consiste em ignorar os vizi- nhos externos nos cálculos especificados por T ou preencher a imagem com uma borda de 0s ou outros valores de intensidade predefinidos. A espessura da borda de preen- chimento depende do tamanho da vizinhança. Retoma- remos esse ponto na Seção 3.4.1.

Como discutiremos em detalhes na Seção 3.4, o procedimento que acabamos de descrever é chamado de fil-

tragem espacial, no qual a vizinhança, acompanhada de

uma operação predefinida, é chamada de filtro espacial (também denominada máscara espacial, kernel, template ou

janela). O tipo de operação realizada na vizinhança deter-

mina a natureza do processo de filtragem.

A menor vizinhança possível tem tamanho 1 × 1. Nesse caso, g depende apenas do valor de f em um único ponto (x, y), e T na Equação 3.1-1 se torna uma função de

transformação de intensidade (também chamada de função de transformação de níveis de cinza ou de função de mapea- mento) da forma:

s = T(r) (3.1-2)

onde, para simplificar a notação, s e r são variáveis que indicam, respectivamente, a intensidade de g e f em qual- quer ponto (x, y). Por exemplo, se T(r) tiver a forma da Figura 3.2(a), o efeito da aplicação da transformação a cada pixel de f para gerar os pixels correspondentes em g seria produzir uma imagem de maior contraste do que a original, escurecendo os níveis de intensidade abaixo de

k e clareando os níveis acima de k. Nessa técnica, algumas

vezes chamada de alargamento de contraste (veja a Seção 3.2.4), os valores de r menores que k são comprimidos pela função de transformação em uma faixa estreita de

s, na direção do nível mais escuro. O oposto se aplica a

valores de r maiores que k. Observe como um valor de

intensidade r₀ é mapeado para obter o valor correspon-

dente s₀. No caso limite mostrado na Figura 3.2(b), T(r)

produz uma imagem de dois níveis (binária). Um mape- amento dessa forma é chamado de função de limiarização (thresholding). Algumas metodologias de processamento relativamente simples, ainda que poderosas, podem ser formuladas com base nas funções de transformação de intensidade. Neste capítulo, utilizaremos as transforma-

Origem Vizinhança 3 × 3 de (x, y) (x, y) Imagem f Domínio espacial y x

Figura 3.1 Uma vizinhança 3 × 3 ao redor de um ponto (x, y) em uma imagem no domínio espacial. A vizinhança é movida pixel a pixel na imagem para gerar uma imagem de saída.

*_{Outros formatos de vizinhança, com aproximações digitais de cír-}

culos, por vezes são utilizados, mas os formatos retangulares são os mais comuns por serem muito mais fáceis de serem implemen- tados computacionalmente.

ções de intensidade principalmente para o realce de imagens. No Capítulo 10, elas são utilizadas na segmentação de imagens. Procedimentos cujos resultados dependem somente da intensidade em um ponto são, por vezes, chamadas de técnicas de processamento ponto a ponto, em oposição a técnicas de processamento por vizinhança, discu- tidas anteriormente nesta seção.

3.1.2 Sobre os exemplos deste capítulo

Apesar de as transformações de intensidade e filtragem espacial cobrirem uma ampla variedade de aplicações, a maioria dos exemplos apresentados neste capítulo é de aplicações para o realce de imagens. Realce é o pro- cesso de manipular uma imagem de forma que o resultado seja mais adequado do que o original para uma aplicação específica. A palavra específica é importante neste contexto, porque reconhece desde o início que as técnicas de realce são orientadas ao problema. Dessa forma, por exemplo, um método bastante útil para realçar imagens de raios X pode não ser a melhor técnica para realçar imagens de satélite capturadas na banda infravermelha do espectro eletromagnético. Não existe uma “teoria” geral para o realce de imagens. Quando uma imagem é processada para a interpretação visual, o observador é o juiz em relação ao desempenho de um método particular. Ao lidar com a percepção por máquina, é mais fácil quan- tificar uma determinada técnica. Por exemplo, em um sistema de reconhecimento automático de caracteres, o método de realce mais apropriado é aquele que resulta na melhor taxa de reconhecimento, desconsiderando outros fatores, como os requisitos computacionais de um método em relação a outro.

Independentemente da aplicação ou do método uti- lizado, contudo, o realce de imagens é uma das áreas mais visualmente interessantes do processamento de imagens. Por sua própria natureza, os iniciantes no processamento de imagens costumam considerar as aplicações de realce interessantes e de compreensão relativamente simples.

Dessa forma, utilizar exemplos de realce de imagens para

No documento Processamento Digital de Imagens 3ªEd (páginas 83-88)