DOCUMENTO TÉCNICO
Hikvision Advanced Image Signal Processing
Página 2 Hikvision Advanced Image Signal Processing
Ampla Faixa Dinâmica (WDR)
1. Faixa dinâmica
A luminância de imagem de um objeto de monitoramento depende principalmente da intensidade da iluminação que irradia ou reflete do objeto captado pelo sensor.
A unidade de medição para a intensidade de iluminação é representada em unidades Lux. No caso do objeto de monitoramento de uma fonte que não seja de luz, a intensidade do reflexo também é afetada pela iluminação circundante, índice de reflexão e outros fatores.
Em uma situação real, a iluminação de partes diferentes pode diferir muito mesmo na mesma cena de vigilância. Por exemplo, na área externa de um dia brilhante e ensolarado, a iluminação circundante pode atingir 100.000 lux, enquanto a iluminação no ambiente interno de um escritório é aproximadamente 1.000 lux e, para a parte de sombra embaixo da mesa do escritório, o valor é tão baixo quanto 10 lux. Supondo que essas áreas tenham uma capacidade de reflexo similar, o índice de reflexão da área de sombra interna, a área de iluminação normal e a área externa são 1: 100: 10.000.
Se desejar conservar, pelo menos, 5 na escala de cinza na área escura de forma a diferenciar entre objetos com diferente refletividade, a diferença do tamanho dos dados exigidos para captar as informações da imagem das três partes mencionadas acima é 10.000 / 0,2 = 50.000 vezes, o que corresponde à faixa dinâmica de 16 bits (94 db); no entanto, grande parte desses sensores de imagem comuns não consegue chegar a esse valor. A faixa dinâmica do atual sensor CMOS comum é cerca de 12 bits, ou seja, 72 db. Se o sensor CMOS for utilizado dessa forma em uma cena, os detalhes da imagem tanto em áreas claras quanto escuras serão perdidos.
Figura 1: A imagem está superexposta ou pouco exposta em uma cena de ampla faixa dinâmica.
2. Imagens de WDR
Foram tentadas várias abordagens para ampliar a faixa dinâmica do sensor de imagem e, atualmente, a Multiple Exposure (Exposição Múltipla) e a Per-pixel
Exposure (Exposição por Pixel) são geralmente utilizadas para controlar a intensidade
da exposição.
A ideia da Exposição Múltipla é utilizar duas ou mais exposições com uma duração diferente em uma cena para obter dados suficientes para gerar uma única imagem, enquanto a Exposição por Pixel pode obter os mesmos resultados de imagem ao configurar uma sensibilidade diferente para pixels adjacentes no sensor. Em uma cena de faixa dinâmica de 94 db, conforme mencionado acima, a técnica de exposição múltipla utiliza o sensor de imagem de 12 bits (72 db) para realizar uma primeira exposição com o tempo de exposição de 1/50 s, o que permite que o sensor da câmera consiga detalhes suficientes na área mais escura, mesmo que a imagem na área mais clara esteja superexposta; o sensor realiza uma segunda exposição de 1/800 s para enfraquecer a intensidade da exposição na área mais clara para 1/16, embora a imagem na área mais escura esteja menos exposta. A imagem resultante contem a imagem subsequente sobreposta sobre a original, atingindo uma faixa dinâmica de 16 bits (96 db), que é 16 vezes de 12 bit (72 db) com a exposição única. A Exposição por Pixel visa atingir a mesma imagem resultante ao conceber a sensibilidade dos pixels de alta sensibilidade para 16 vezes àquela dos pixels de baixa sensibilidade.
Página 4 Hikvision Advanced Image Signal Processing
full range
long exposure short exposure
Bright det ail captur ed Dark detai l lost Bright detai l lost
Dark detail captur ed
long exposure capture range
short exposure capture range
Figura 2: Estender a faixa dinâmica por exposição múltipla
No entanto, embora a faixa dinâmica de sensibilidade da imagem possa ser efetivamente aumentada pela exposição múltipla e pela exposição por pixel, elas não são perfeitas. A exposição múltipla causará um pouco de efeito fantasma na borda do objeto em movimento devido a uma pequena diferença existente em cada exposição e a exposição por pixel poderá reduzir diretamente a resolução da imagem.
3. Mapeamento de tons
Assim como os dispositivos de exibição como monitores LCD, computadores e projetores, todos tem uma faixa dinâmica limitada inadequada para reproduzir a faixa total de intensidades de luz presentes em cenas naturais; o mapeamento de tons pode ser aplicado para representar a faixa dinâmica como um todo ao mesmo tempo em que retém cores realistas e o contraste.
O mapeamento de tons pode ser principalmente dividido em dois tipos principais: mapeamento de tons global e local. O método de mapeamento de tons global é similar à curva gama na fotografia, já que cada pixel na imagem é mapeado da mesma forma ao consultar uma tabela não linear. Quando a taxa da curva diminui na tabela Gama, que é frequentemente utilizada para o mapeamento dinâmico, a faixa de saída será reduzida se os dados de entrada forem grandes.
Figura 3: Mapeamento de tons global
A técnica de mapeamento de tons global é simples e rápida, pois cada pixel na imagem com o mesmo brilho será mapeado da mesma forma; no entanto, ela pode causar um contraste insuficiente ou a perda de contraste na área mais clara etc. O mapeamento de tons local pode alterar o brilho em cada pixel de acordo com as características extraídas dos parâmetros circundantes da imagem. Os pixels localizados em partes diferentes na imagem são mapeados em resultados diferentes mesmo se tiverem o mesmo brilho e esse método pode proporcionar um forte contraste e mais detalhes na imagem resultante.
4. WDR digital (Wide Dynamic Range, Ampla Faixa Dinâmica
(WDR))
De acordo com o texto acima, a técnica de ampla faixa dinâmica deve conter, pelo menos, duas fases: imagens de ampla faixa dinâmica e mapeamento de tons. No caso das câmeras, a aplicação real das imagens de ampla faixa dinâmica deve ser suportada pelo sensor de imagem profissional. Atualmente, outra técnica, que é quase sempre chamada de ampla faixa dinâmica digital (WDR digital), é adotada usando o mapeamento de tons local em vez das imagens de ampla faixa dinâmica para lidar com o aprimoramento da imagem.
A WDR digital não consegue realmente ampliar a faixa dinâmica da câmera, mas sim intensificar os detalhes em áreas mais escuras ou mais claras na imagem por meio do mapeamento de tons local e otimizar um contraste visível.
Página 6 Hikvision Advanced Image Signal Processing
Com base nos princípios de mapeamento de tons local, a Técnica de WDR da Hikvision apresenta principalmente o Luminance-adaptive Tone Mapping
(Mapeamento de tons adaptado à luminância) (LATM) e o Space-variant Contrast Enhancement (Aprimoramento de contraste em espaço variável) (SVCE).
A técnica LAT M é uma abordagem de mapeamento de tons global que pode remapear o brilho do pixel de acordo com o brilho e o contraste da cena circundante, tendo por objetivo intensificar o brilho em áreas mais escuras e simultaneamente conter a superexposição em áreas mais claras. Com a curva mapeada pela técnica LATM, os valores originais de WDR podem ser remapeados para compactar a faixa dinâmica e as áreas mais escuras na imagem podem ser efetivamente destacadas ao ajustar a distribuição da escala de cinza.
Figura 4 Mapeamento com a técnica de LATM
Ao simular as características locais do sistema de visão humana, a técnica de SVCE consegue intensificar o contraste local da imagem e reproduzir os detalhes da
Figura 5. Efeito de simulação da Técnica de WDR da Hikvision
A técnica de WDR da Hikvision podem fornecer uma reprodução completa da faixa dinâmica dos sensores de imagem e é compatível com várias larguras de bits. Atualmente, é possível alcançar uma faixa dinâmica de 20 bits/120 db. Se o sensor de imagem for compatível com as imagens de WDR, o algoritmo poderá resultar em um melhor efeito de DRC e produzirá imagens brilhantes e vívidas; se o sensor de imagem produzir dados de faixa dinâmica normal, ele simulará os olhos humanos, que são muito sensíveis a uma área escura, e adotará um algoritmo de WDR digital eficiente para intensificar o contraste e o brilho das áreas escuras na imagem.