• Nenhum resultado encontrado

4.1 MODELO MATEMÁTICO DE UMA CÂMERA

4.1.1 Modelo de Câmera de Pinhole

Uma câmera de pinhole é um dispositivo simples, na forma de uma caixa fechada, que possui um pequeno orifício em um de seus lados. A luz do mundo exterior entra na câmera através do orifício, o que possibilita a formação de uma imagem correspondente no lado oposto da caixa (Hartley e Zisserman, 2004) (veja Figura 4.1). A geometria da câmera de pinhole é comumente utilizada para composição de um modelo básico de câmera, chamado modelo de câmera de pinhole. Este modelo é empregado para representação aproximada de câmeras mais complexas atuais, como aquelas que utilizam sensores CCD (Charge-coupled device) (Weng, Cohen et al., 1992).

Figura 4.1 - Ilustração de uma câmera de pinhole. A luz que entra na câmera pelo orifício permite a formação de uma imagem no lado oposto da caixa.

O modelo de câmera de pinhole especifica a relação matemática entre as coordenadas de um ponto no espaço (3D) e sua projeção no plano de imagem da câmera (2D). Vale ressaltar que o modelo não inclui alguns elementos presentes em câmeras atuais, como lentes e suas distorções, sendo ele utilizado como uma aproximação para o mapeamento real (Hartley e Zisserman, 2004; Ivekovic, Fusiello et al., 2006).

Fundamentação Teórica 34

A câmera de pinhole é definida pelo seu centro óptico C, que também é conhecido como

centro de projeção da câmera, e pelo plano da imagem PI. Em uma câmera de pinhole real, o centro óptico corresponde à abertura (ou furo) que permite a passagem da luz e o plano da imagem é localizado atrás do centro óptico, como na Figura 4.1. Entretanto, para uma análise teórica conveniente e mais simples, é comum considerar o plano de imagem da câmera como um plano virtual localizado na frente do centro óptico, como mostra a Figura 4.2(a). Esta simplificação não traz prejuízos para a modelagem matemática da câmera e é considerada deste ponto em diante.

A distância do centro óptico ao plano da imagem corresponde à distância focal f. A reta que se origina no centro óptico e é perpendicular ao plano da imagem é denominada eixo principal ou eixo óptico. O eixo principal intercepta o plano da imagem no ponto principal P e o plano paralelo ao plano da imagem que contém o centro óptico é chamado plano principal ou plano focal da câmera. Todos esses elementos são apresentados na Figura 4.2(a).

(a) (b)

Figura 4.2 - Geometria da câmera de pinhole. (a) Visão em perspectiva. (b) Visão no plano YZ. A coordenada vertical do ponto projetado m no plano de imagem pode ser calculada por semelhança de triângulos, ou seja: f/z = v’/y, logo v’ = f∙y/z. O mesmo processo pode ser empregado para o cálculo da coordenada horizontal de m no plano de imagem. Figuras baseadas em (Ivekovic, Fusiello et al., 2006). A relação entre as coordenadas 3D de um ponto no espaço e as coordenadas de sua projeção no plano da imagem pode ser definida pela projeção perspectiva. Um ponto 3D é projetado no plano de imagem da câmera pela reta contendo o ponto e o centro

Z u C M X Y P m Plano principal Plano da imagem Eixo principal Ponto principal Centro óptico v Y Z M y v’=f∙y/z f Coord. z de M m C Plano da imagem

Fundamentação Teórica 35

óptico. Considerando o centro óptico como a origem de um sistema de coordenadas Euclidiano de referência, onde o eixo Z coincide com o eixo principal, é possível visualizar, por semelhança de triângulos, que um ponto (x,y,z) do mundo é mapeado no ponto (f∙x/z, f∙y/z, f) do plano da imagem (veja a Figura 4.2(b)). Na Figura 4.2(a), o ponto M do espaço é mapeado no ponto m pertencente ao plano da imagem. A Figura 4.2(b) ilustra a mesma situação, mas no plano YZ, onde é possível verificar a semelhança de triângulos empregada para calcular a posição do ponto projetado m.

Ignorando a última coordenada de (f∙x/z, f∙y/z, f), obtemos um ponto relativo ao plano da imagem. Dessa forma, o mapeamento pode ser escrito como:

(4.1) ⁄ ⁄

A Equação (4.1) especifica o mapeamento linear central das coordenadas do mundo para as coordenadas no plano da imagem (Hartley e Zisserman, 2004).

Matriz de Projeção e Matriz de Calibração da Câmera

Se os pontos são representados por coordenadas homogêneas, então a projeção perspectiva representada pela Equação (4.1) pode ser definida como uma multiplicação de matrizes:

(4.2) ( ) = [

] ( ) .

A matriz 3x4 da expressão anterior descreve o mapeamento e é denominada matriz de

projeção da câmera (P). Esta equação também pode ser escrita de forma resumida como (4.3) =

onde = são as coordenadas homogêneas do ponto 3D e = são as coordenadas homogêneas do ponto no plano da imagem.

O mapeamento definido na Equação (4.1) considera que a origem do sistema de coordenadas do plano da imagem coincide com o ponto principal. Na prática, entretanto, isto geralmente não acontece e as coordenadas do ponto principal precisam ser incorporadas no mapeamento. Assim, a Equação (4.1) é atualizada para:

Fundamentação Teórica 36

(4.4) ⁄ ⁄

onde (px, py) são as coordenadas do ponto principal. Esta equação também pode ser escrita como uma multiplicação de matrizes utilizando coordenadas homogêneas. A expressão obtida é:

(4.5) ( ) = [

] ( ), que pode ser escrita de maneira concisa como:

(4.6) = onde (4.7) = [ ]. A matriz é denominada matriz de calibração da câmera. Câmeras CCD

O modelo de câmera de pinhole considera as coordenadas no plano da imagem como coordenadas Euclidianas tendo a mesma escala em ambos os eixos. No caso das câmeras que utilizam sensores CCD (Charge-coupled device), as coordenadas na imagem são comumente medidas em pixels e é possível que o sensor de imagem empregue pixels não quadrados (Hartley e Zisserman, 2004). Logo, o mapeamento da Equação (4.4) pode ser ajustado para expressar a transformação das coordenadas do mundo para as coordenadas no plano da imagem, em pixels:

(4.8) ⁄ ⁄

onde bx e by correspondem ao número de pixels por unidade de distância nas direções x e y, respectivamente. Os termos e são as coordenadas do ponto principal em pixels, onde = e = . A representação do mapeamento

Fundamentação Teórica 37

anterior utilizando coordenadas homogêneas e multiplicação de matrizes é dada na Equação (4.9).

(4.9) ( ) = [

] ( ).

Para resgatar as coordenadas em pixels (u, v) do ponto projetado na imagem a partir das coordenadas homogêneas, devemos encontrar o fator s que quando multiplicado às coordenadas resulta em um ponto da forma (u, v, 1). Assim, o mapeamento pode ser representado como na Equação (4.10).

(4.10) ( ) = ( ) = [

] ( ) Sistema de Coordenadas de Referência

As formulações anteriores consideram um único sistema de coordenadas de referência, localizado no centro óptico da câmera e com o eixo z na direção do eixo óptico. Esse sistema é denominado de sistema de coordenadas da câmara. Na prática, todavia, os pontos no espaço são comumente representados em termos de outro sistema de coordenadas, conhecido como sistema de coordenadas do mundo. Assim, para mapear um ponto M do espaço em um ponto m no plano da imagem, é necessário, primeiramente, converter as coordenadas do ponto M (dado com relação ao sistema de coordenadas do mundo) para o sistema de coordenadas da câmera. Esta conversão é ilustrada na Figura 4.3.

Figura 4.3 – Ilustração da mudança do sistema de coordenadas do mundo para o sistema de coordenadas da câmera. As coordenadas de um ponto são convertidas mediante aplicação de uma operação de rotação e uma de translação.

𝑋𝐶𝑎𝑚 C O 𝑌𝐶𝑎𝑚 𝑍𝐶𝑎𝑚 𝑋𝑀𝑢𝑛𝑑𝑜 𝑌𝑀𝑢𝑛𝑑𝑜 𝑍𝑀𝑢𝑛𝑑𝑜 R, t

Fundamentação Teórica 38

Como os dois sistemas estão relacionados por uma operação de rotação e uma de translação, a conversão pode ser feita por meio de operações utilizando a matriz adequada de rotação (R) e a matriz adequada de translação (t):

(4.11) ( ) = ( ) onde = [ ], = [ ].

Além de possibilitar a mudança de coordenadas, as matrizes R e t podem ser usadas para descrever a posição e orientação da câmera com relação ao sistema de coordenadas do mundo. A Equação (4.11) pode ser reescrita como:

(4.12) ( ) = [ ] ( ).

Utilizando a Equação (4.10) e a Equação (4.12), pode-se definir uma equação geral para descrever o mapeamento de um ponto no espaço, dado no sistema de coordenadas do mundo, para o plano da imagem de uma câmera CCD, em pixels:

(4.13) ( ) = [ ] [ ] ( ).

A equação anterior é comumente escrita de maneira reduzida como:

(4.14) = .

Repare que a matriz K apresenta 5 graus de liberdade, correspondentes aos parâmetros f, , , e . Como esses parâmetros descrevem características internas da câmera, eles são comumente denominados parâmetros intrínsecos da

câmera, ou simplesmente parâmetros internos. As matrizes R e t possuem 3 graus de liberdade cada, que são correspondentes aos três ângulos de rotação em torno dos eixos e aos três valores de translação. Como R e t estão relacionadas com o

Fundamentação Teórica 39

posicionamento e orientação da câmera, os seis parâmetros que as definem são chamados de parâmetros extrínsecos da câmera, ou simplesmente parâmetros externos. Considerando o mapeamento geral expresso pela Equação (4.14), a matriz P resultante da multiplicação de K por terá um total de 11 graus de liberdade e é denominada de matriz de projeção da câmera (veja a Equação (4.15)).

Documentos relacionados