• Nenhum resultado encontrado

Processo automático para determinação de grau de infestação de mancha bacteriana em plantações de tomate industrial

N/A
N/A
Protected

Academic year: 2022

Share "Processo automático para determinação de grau de infestação de mancha bacteriana em plantações de tomate industrial"

Copied!
56
0
0

Texto

(1)

TRABALHO DE GRADUAÇÃO

Processo Automático para Determinação de Grau de Infestação de Mancha Bacteriana em

Plantações de Tomate Industrial

Por,

Samuel Tschiedel Curado de Magalhães Guedes

Brasília, Dezembro de 2014

(2)

UNIVERSIDADE DE BRASILIA Faculdade de Tecnologia

Curso de Graduação em Engenharia de Controle e Automação

TRABALHO DE GRADUAÇÃO

Processo Automático para Determinação de Grau de Infestação de Mancha Bacteriana em

Plantações de Tomate Industrial

POR,

Samuel Tschiedel Curado de Magalhãs Guedes

Relatório submetido como requisito parcial para obtenção do grau de Engenheiro de Controle e Automação.

Banca Examinadora Prof. Dr. Díbio Leandro Borges, UnB/ CIC

(Orientador)

Prof. Dr. Marcus Vinínius Lamar, UnB/ CIC Prof. Dr. Flávio de Barros Vidal, UnB/ CIC

Brasília, Dezembro de 2014

(3)

FICHA CATALOGRÁFICA

SAMUEL TSCHIEDEL CURADO DE MAGALHÃES GUEDES

Processo Automático para Determinação de Grau de Infestação de Mancha Bacteriana em Plantações de Tomate Industrial,

[Distrito Federal] 2014.

xi, 44p., 297 mm (FT/UnB, Engenheiro, Controle e Automação, 2014). Trabalho de Graduação – Universidade de Brasília. Faculdade de Tecnologia.

1. Agricultura de Precisão 2. Processamento de Imagens 3. Automação 4. Contaminação

5. Dosagem

I. Mecatrônica/FT/UnB II. Processo Automático para Determinação de Grau de Infestação de Mancha Bacteriana em Plantações de Tomate Industrial (14/2014)

REFERÊNCIA BIBLIOGRÁFICA

GUEDES, S.T.C. de M., (2014). Processo Automático para Determinação de Grau de Infestação de Mancha Bacteriana em Plantações de Tomate Industrial. Trabalho de Graduação em Engenharia de Controle e Automação, Publicação FT.TG-nº 14/2014, Faculdade de Tecnologia, Universidade de Brasília, Brasília, DF, 44p.

CESSÃO DE DIREITOS

AUTOR: Samuel Tschiedel Curado de Magalhães Guedes.

TÍTULO DO TRABALHO DE GRADUAÇÃO: Processo Automático para Determinação de Grau de Infestação de Mancha Bacteriana em Plantações de Tomate Industrial.

GRAU: Engenheiro ANO: 2014

É concedida à Universidade de Brasília permissão para reproduzir cópias deste Trabalho de Graduação e para emprestar ou vender tais cópias somente para propósitos acadêmicos e científicos. O autor reserva outros direitos de publicação e nenhuma parte desse Trabalho de Graduação pode ser reproduzida sem autorização por escrito do autor.

____________________________

Samuel Tschiedel Curado de Magalhães Guedes SQN 408, Bloco O, Apartamento 106

70856-150 Brasília – DF – Brasil

(4)

Dedicatória Dedico este trabalho às minhas famílias, original e estendida.

Samuel Tschiedel Curado de Magalhães Guedes

(5)

Agradecimentos

Ao meu orientador, Díbio, pela paciência e liberdade dadas.

À Profa. Dra. Abadia dos Reis Nascimento, da Escola de Agronomia da UFG, por fornecer o banco de imagens e seus dados de análise, essenciais à realização desse trabalho.

A todos os amigos e familiares que se envolveram em meu longo processo de estudos, seja diretamente, ajudando onde possível, ou indiretamente, compreendendo a minha ausência.

Samuel Tschiedel Curado de Magalhães Guedes

(6)

RESUMO A avaliação do estado de contaminação de uma planta é uma etapa fundamental à automação na agricul- tura. A dosagem de pesticidas e fertilizantes, por exemplo, depende diretamente dessa análise. Tanto maior sua precisão, menores o desperdício de recursos e os efeitos colaterais, como a contaminação do solo. No entanto, por ser tarefa complexa e dependente de conhecimentos específicos, é geralmente cara e demo- rada, com uso justificável apenas em grandes escalas. Este trabalho apresenta um processo automático de avaliação do grau de saúde de uma planta de tomate industrial por meio de uma imagem digital do espé- cime em campo. Utilizando um agregado de técnicas de processamento de imagens, o sistema é capaz de fornecer análises que se mostraram equiparáveis às de especialistas, mas de maneira mais consistente e rá- pida. O processo, consolidado em um software, visa diminuir os custos operacionais da análise e ampliar a possibilidade do uso de metodologias que dela diretamente dependam, como a dosagem, em plantações de menor escala. Em aplicações que já adotam tais técnicas, a maior velocidade e precisão propiciam maior sofisticação dos métodos utilizados, com o consequente aumento de produtividade e eficiência.

Palavras-chave: Agricultura de Precisão; Processamento de Imagens; Automação; Contaminação; Do- sagem.

ABSTRACT A plant’s contamination evaluation is a key step to automation in agriculture. The dosage of pesticides and fertilizers, for example, depends directly on this analysis. The greater its accuracy, the lower waste of resources and side effects, such as soil contamination. However, because it is complex and dependent on specific knowledge, it is generally expensive and time consuming, with use justified only in large scales.

This work presents an automatic procedure for evaluating the health degree of an industrial tomato plant by means of a digital image of the specimen on-field. Using an array of image processing techniques, the system is able to provide analysis that is comparable to those of experts, but more consistently and faster.

The process, consolidated in a software, aims to reduce the operating costs of the analysis and fostering the use of methodologies that directly depend on it, such as dosage, in small-scale plantations. For applications that already adopt such techniques, the speed and accuracy allow for greater sophistication of the methods used, resulting in increased productivity and efficiency.

Keywords: Precision Agriculture; Image Processing; Automation; Contamination; Dosage.

(7)

SUMÁRIO

1 INTRODUÇÃO. . . 1

1.1 AAGRICULTURA DE PRECISÃO ... 2

1.1.1 OS ASPECTOS SOCIAIS E ECONÔMICOS DAAGRICULTURA DEPRECISÃO... 2

1.1.2 AUTILIZAÇÃO DAAGRICULTURA DEPRECISÃO NO MUNDO... 3

1.1.3 FORMALIZAÇÃO DO CRITÉRIO ECONÔMICO DAAGRICULTURA DEPRECISÃO... 3

1.2 OPAPEL DOPROCESSAMENTO DEIMAGENS NAAGRICULTURA DEPRECISÃO... 4

1.3 OTOMATE NOBRASIL ... 6

2 PROPOSTA DASOLUÇÃO. . . 9

2.1 METODOLOGIA-BASE DE AVALIAÇÃO... 9

2.1.1 OPLANTIO... 9

2.1.2 ACOLETA DAS IMAGENS ... 9

2.1.3 AAVALIAÇÃO DOS RESULTADOS... 10

2.2 AAUTOMAÇÃO DO PROCESSO ... 11

2.2.1 AARQUITETURA DO SISTEMA ... 12

2.2.2 AAQUISIÇÃO DE IMAGENS... 12

2.2.3 OPRÉ-PROCESSAMENTO... 13

2.2.4 ACLASSIFICAÇÃO ... 17

2.2.5 AAVALIAÇÃO ... 23

2.3 OSOFTWARE ... 24

2.3.1 PRINCÍPIOS DE DESENVOLVIMENTO DA INTERFACE ... 24

2.3.2 FLUXO DE TRABALHO... 25

2.3.3 CO-LOCALIZAÇÃO DE ELEMENTOS RELACIONADOS... 25

2.3.4 ESTÍMULO À EXPLORAÇÃO DOS PARÂMETROS ... 25

2.3.5 DESCRIÇÃO EXPLÍCITA E INFORMAÇÕES AUXILIARES... 27

2.3.6 AINTERFACE... 28

3 RESULTADOS EAVALIAÇÃO. . . 32

3.1 DISTRIBUIÇÃO DAS ÁREAS DE COBERTURA... 33

3.2 COMPARAÇÃO ENTRE AS AVALIAÇÕES... 34

3.3 INFLUÊNCIA DA CATEGORIA“SEM CLASSIFICAÇÃO” ... 35

3.4 TEMPO DE EXECUÇÃO... 36

4 CONCLUSÕES. . . 39

(8)

REFERÊNCIAS BIBLIOGRÁFICAS . . . 43

(9)

LISTA DE FIGURAS

1.1 Aplicação do DGCI ao espectro de cores... 5

1.2 Produção agrícola e consumo de agrotóxicos e fertilizantes químicos no Brasil ... 8

2.1 Amostra das avaliações do banco de imagens ... 11

2.2 Visão global da arquitetura do processo ... 12

2.3 Moldura branca sob o sol... 13

2.4 Etapas de pré-processamento ... 13

2.5 Linearização por meio de compensaçãogamma... 14

2.6 Visualização dos canaisLab... 15

2.7 Corte das imagens ... 17

2.8 Etapas da classificação ... 17

2.9 Exemplo de agrupamento ... 18

2.10 Exemplo de classificação ... 19

2.11 Exemplo de classificação passo-a-passo ... 20

2.12 Visualização da etapa filtragem ... 21

2.13 Comparação entre as limiarizações de Otsu e Kapur ... 22

2.14 Classificação final da imagem exemplo, figura 2.6a, e resultado da avaliação ... 23

2.15 Abas da interface ... 25

2.16 Agrupamento de elementos da interface ... 26

2.17 Exemplo de feedback imediato ... 26

2.18 Exemplo da funcionalidade deundo... 27

2.19 Exemplo de descrições explícitas... 27

2.20 Fluxo de trabalho sugerido ... 28

2.21 Aba correspondente à adição dos arquivos e aos ajustes de pré-processamento. ... 29

2.22 Aba correspondente aos ajustes da classificação. ... 29

2.23 Aba correspondente aos ajustes da filtragem... 30

2.24 Aba correspondente à execução da análise. ... 31

3.1 Distribuição das áreas absolutas saudáveis e lesionadas para o conjunto completo do banco de imagens ... 33

3.2 Distribuição das áreas sem classificação para o conjunto completo do banco de imagens ... 33

3.3 Distribuição das áreas relativas lesionadas para o conjunto completo do banco de imagens .. 34

3.4 Correlação entre a pontuação obtida pelo processo automático e pelos técnicos agrícolas... 35

(10)

3.5 Correlação entre tamanho da área de regiões consideradas não saudáveis o tamanho da área de regiões sem classificação ... 36 3.6 Distribuição do tempo, em segundos, gasto na análise das imagens ... 37 3.7 Amostra de resultados da avaliação completa do banco de imagens... 38

(11)

LISTA DE TABELAS

1.1 Quantidade produzida do tomate por Unidade da Federação ... 6

1.2 Agrotóxicos mais vendidos na cultura do tomate... 7

2.1 Escala adotada para a avaliação das imagens digitais de tomate... 10

3.1 Tabela de parâmetros adotados na execução das análises... 32

(12)

LISTA DE SÍMBOLOS

Siglas

PA Precision Agriculture AP Agricultura de Precisão VRA Variable-rate Application ATV Aplicação com Taxa Variável DSS Decision Support Systems SSD Sistema de Suporte de Decisão SSM Site-Specific Management GEL Gestão Específica ao Local DS Developmental Stage ED Estágio de Desenvolvimento TI Tecnologia da Informação DGCI Dark Green Color Index HSB Hue, Saturation and Brightness HSV Hue, Saturation and Value VR Visual Rating

RGB Red, Green, Blue

sRGB Standard Red, Green, Blue CDF Computable Document Format EPI Equipamento de Proteção Individual PNG Portable Network Graphics

CSV Comma Separated Values

(13)

Capítulo 1

Introdução

Durante a mecanização da agricultura do século 20, ocorreu uma forte pressão econômica para tratar grandes plantações com práticas de agricultura uniformes. Apesar de propiciarem um excelente retorno econômico, tais práticas mostraram-se nocivas ao meio-ambiente, causando prejuízos ecológicos e, em alguns casos, a inviabilização da própria produção agrícola (MCBRATNEY et al., 2005).

Para que seja uma atividade viável, a agricultura deve fazer uso de práticas lucrativas e socialmente aceitáveis. O tempo deixou evidente, no entanto, que, além de considerações imediatas, como taxas de retorno de investimento e índices pluviométricos, existem razões práticas para que haja preocupação, em longo prazo, com a deterioração global do clima, a poluição da água e o uso excessivo de químicos. Esse contexto compõe o núcleo da agronomia sustentável.

A Sociedade Americana de Agronomia (ASA, 1989) define agricultura sustentável como “aquela que, em longo prazo, melhora a qualidade do ambiente e a base de recursos da qual depende a agricultura;

provê necessidades humanas de comida e fibra; é economicamente viável; e melhora a qualidade de vida de fazendeiros e da sociedade como um todo”.

Segundo Hatfield (2000), um sistema agrícola é composto de elementos que podem ser classificados em:

1. Naturais, como solo e topografia;

2. Aleatórios, como chuvas, e

3. Gerenciados, como aplicações de fertilizante ou sementes.

A interferência do homem no ambiente faz-se por todos os três elementos, de forma direta e indireta.

Em curto prazo, a adição de químicos é o fator mais importante, devido a seu impacto direto e imediato na produção e na possibilidade de contaminação da água; em médio prazo, a escolha das espécies a se- rem plantadas pode determinar a depleção de determinados nutrientes do solo; em longo prazo, fatores mais indiretos, como alterações no padrão hidrológico de uma região causadas pelos padrões de irrigação, tornam-se tão importantes quanto os primeiros.

(14)

A agricultura de precisão (AP) provê ferramentas aprimoradas de gerência das entradas de um sistema produtivo agronômico. Ao invés de aplicar, indiscriminadamente, fertilizantes ou pesticidas de maneira uniforme em grandes áreas, a AP permite o uso localizado e preciso dos recursos, levando, potencialmente, a plantação em direção ao equilíbrio ecológico. A esperança da AP é que seu uso, no mínimo, diminua os prejuízos causados aos sistemas naturais pelas técnicas uniformes.

1.1 A agricultura de precisão

A Gerência Específica ao Local (GEL) é a ideologia de fazer o certo, no local e no tempo certos. Por meio de seu uso, agrônomos podem determinar taxas de fertilizante, sementes e químicos para o solo de maneira precisa e com aplicação localizada, e assim reduzir a quantidade de recursos utilizados.

Lowenberg-DeBoer e Swinton (1997) definiram o GEL como o “monitoramento e controle eletrônicos aplicados à coleta de dados, ao processamento de informações e ao suporte da tomada de decisões para a alocação temporal e espacial de recursos de entrada em um sistema de produção agrícola”.

A AP provê uma maneira de automatizar a metodologia GEL utilizando tecnologia da informação, tornando-a viável comercialmente, pois inclui todas as práticas agronômicas que utilizam a TI para coor- denar as entradas do sistema de modo a obter determinado rendimento, bem como as práticas de monito- ramento de tais rendimentos.

Além da aplicação localizada dos recursos, o conhecimento sobre aspectos temporais é determinante.

Variações ano a ano são tradicionalmente reconhecidas, mas uma mesma plantação pode conter, simulta- neamente, trechos temporalmente estáveis e instáveis. Mesmo dentro do período de um ano podem ocorrer variações, cuja detecção é essencial à otimização das entradas.

A vertente temporal da GEL determina as entradas do sistema com base em informações sobre os ciclos de vida das plantas, animais e pragas. Essa informação temporal é frequentemente denominada de informação de estágio de desenvolvimento (ED) (SWINTON, 1997). O controle integrado de pragas, por exemplo, envolve muitos casos de gerência de ED – como a prática da amostragem da safra, chamada

“crop scouting” – para avaliação da necessidade e da temporização da aplicação de pesticidas (FISHEL et al., 2012).

1.1.1 Os aspectos sociais e econômicos da Agricultura de Precisão

Ao longo dos anos, a ênfase da AP migrou da agricultura baseada no solo (ROBERT, 1993) para siste- mas de condução de veículos, passando por tecnologias de aplicação localizada. Eventualmente, evoluirá para qualidade do produto e completa gerência ambiental. Sua influência, no entanto, não se restringe somente às práticas agrícolas e ao meio ambiente.

Um dos aspectos econômicos relacionados ao impacto ambiental da agricultura diz respeito às regula- mentações ambientais, as quais se refletem na restrição das possibilidades de entradas ao sistema. Atuanto como um teto indireto de produtividade e consequente rentabilidade, as limitações quanto ao tipo e à quan- tidade de fertilizante, por exemplo, devem ser estritamente obedecidas, o que se torna mais fácil por meio

(15)

das ferramentas disponibilizadas pela AP.

A AP também pode trazer vantagem competitiva por meio da possibilidade de separação da colheita em classes de qualidade diretamente no campo. Os benefícios econômicos serão ainda mais evidentes em caso de não linearidade entre o preço e a qualidade.

Eventualmente, a AP também possibilitará o rastreamento de um produto ao longo de sua produção.

Sob uma ótica futurista, é fácil imaginar que um produto poderá ter registradas todas as operações às quais foi submetido durante o plantio e a colheita. Outra vertente desse rastreamento, talvez muito mais importante, é a fiscalização ambiental. Com um registro completo de todas as entradas do sistema, a obediência às normas de uso de químicos torna-se muito mais simples e eficaz.

1.1.2 A utilização da Agricultura de Precisão no mundo

Em novos empreendimentos agrícolas, o mapeamento espacial do rendimento e a aplicação localizada são as principais ferramentas utilizadas na redução de custos (MCBRATNEY et al., 2005).

O modelo ideal de operação, em países desenvolvidos, seria o de analistas especializados, que interpre- tariam dados, fariam recomendações e realizariam experimentos contínuos, com o auxílio das ferramentas de monitoramento de solo e clima, por exemplo, de forma a otimizar o sistema de plantio.

Em países onde há grande dependência da exportação de produtos agrícolas, como o caso do Brasil com a cana-de-açucar, a ênfase na otimização do ambiente como um todo dá lugar à vantagem competitiva, seja na quantidade ou na qualidade. As plantações de grandes extensões, no entanto, são vistas como as que têm o maior potencial para AP, ao menos inicialmente.

Em qualquer um dos casos, o desenvolvimento de sistemas de suporte à tomada de decisões ainda é um grande empecilho à adoção da AP (MCBRATNEY et al., 2005). Devemos lembrar, no entanto, que a mecanização desse gerenciamento torna-se um requisito imprescindível, a partir do momento em que a agricultura de precisão contribui de forma direta para a sustentabilidade em longo prazo na produção agrícola. Confirma-se, assim, a intuição de que a AP deve reduzir a sobrecarga ambiental ao aplicar fertilizantes e pesticidas somente onde e quando são necessários.

1.1.3 Formalização do critério econômico da Agricultura de Precisão

Formalmente, a criação de um critério de avaliação econômica da AP deve incorporar valores pes- soais e sociais (ou ambientais) (ANCEV; STOECKER; STORM, 2003). Os valores pessoais podem ser representados por uma função de lucro:

⇡ =py ccc0xxx (1.1)

em quepy é o preço recebido por unidade de uma determinada espécie de plantay,cccé um vetor do preço das entradas exxxé o vetor das entradas controladas utilizadas na produção de y

O rendimento da plantação pode ser representado poryit:

yit=fit(xxxit|E("t|"t 1, . . ."t T) ;zzzit(xxxit 1, . . . xxxit T) ;"T) (1.2)

(16)

em que o subscritoidenota um índice espacial etum índice temporal.

A equação descreve que a quantidade das entradas utilizadas é determinada pela expectância sobre os eventos aleatórios, como chuva e temperatura. Essas expectâncias, por sua vez, são condicionadas ao histórico das suas ocorrências. O rendimento ainda é dependente do vetor de entradas incontroláveis zzzit(xxxit 1, . . . xxxit T), que são influenciadas pelos cultivos anteriores. Tais entradas são características físi- cas do solo, como o pH, a salinidade e a quantidade de nutrientes. Pode-se assumir que um dos objetivos da agricultura sustentável, para o agricultor, é manter tais entradas incontroláveis dentro de níveis aceitá- veis (MCBRATNEY et al., 2005).

Baseando-se nessas equações, pode-se montar um problema de otimização que sintetiza os objetivos da Agricultura de Precisão:

maxxit

BT0= Xn i=0

X1 t=1

1 (1 +r)t

⇥ pytyit ccct0xxxit CDAt(xxxit)⇤

(1.3) em que BT é o Benefício Total advindo da empreitada e CDA é o Custo de Dano Ambiental. Em palavras, o benefício total é a soma de todos os lucros futuros, descontados a uma taxar, diminuídos do custo do dano ambiental. Deve-se maximizar tal benefício pela escolha ótima do vetor de entradasxxxa cada período t.

1.2 O papel do Processamento de Imagens na Agricultura de Precisão

Das várias vertentes de automação nessa linha de pesquisa, as mais comuns giram em torno da análise visual. A facilidade de coleta de dados, aliada ao recente aumento da qualidade e diminuição do custo dos equipamentos de aquisição de imagem, é um fator determinante nessa predominância. Mesmo técnicas mais tradicionais – como a análise de refletância espectral (MIRIK et al., 2006) – ainda têm utilidade em grandes lavouras, mas o elevado custo e a dificuldade de coleta impedem a utilização em parte significativa das plantações. Análises químicas, como a de índices de clorofila e a de aminoácidos, exigem, além do caro equipamento, o transporte das amostras a um laboratório.

Uma grande contribuição à área foi realizada por Richardson, Karcher e Purcell (2001), ao demonstrar que a simples análise digital de imagens no espectro visível é suficiente para realizar uma avaliação eficaz da qualidade de espécimes de grama. Mimetizando processos já existentes de comparação de cor com paletas padronizadas de cor de grama, eles criaram uma escala de intensidade de cor verde-escura, em inglês Dark Green Color Index (DGCI), demonstrada na figura 1.1.

Baseada na transformação matemática do espaço de cor de matiz, saturação e brilho (TKALCIC; TA- SIC, 2003), (HSV ou HSB, do inglês Hue, Saturation and Brightness), a escala DGCI converte qualquer cor em um índice, que indica a diferença entre a cor medida e a observada na grama saudável. Apesar de já existirem técnicas que seguem o mesmo preceito, essa foi a primeira a dispensar o uso de colorímetros, ao realizar a análise a partir de imagens geradas por uma câmera digital amadora.

A partir dessa escala – que fornece uma classificação acurada, objetiva e não destrutiva –, a análise digital de imagens continuou a ser aperfeiçoada. Ghali et al. (2012) mostraram que, além do índice médio,

(17)

(a) Roda de cor no espaço HSB, com matiz deter- minada pelo ângulo, saturação determinada pela dis- tância do ponto ao centro e brilho máximo.

(b) Roda de cor representada em (a) segundo o DGCI. Regiões pretas correspondem à pontuação mínima; e regiões brancas, à máxima.

(c) Matiz de120 , considerada por Richardson, Kar- cher e Purcell (2001) como a ideal para espécimes de grama, em todos os seus possíveis valores de satura- ção (ordenada) e brilho (abscissa).

(d) Figura (c) segundo o DGCI. A intensidade de branco é proporcional ao valor do índice.

Figura 1.1: A aplicação do DGCI ao espectro de cores ilustra algumas de suas particularidades. Apesar de três dos quatro quadrantes terem valor nulo, observa-se que a cor ciano recebe pontuação alta, indicando que o índice foi projetado para a utilização em imagens contendo apenas grama. Também é importante notar, em (d), que o índice DGCI máximo, na matiz verde, é obtido onde a saturação e brilho são mínimos, efetivamente o preto absoluto.

(18)

os momentos estatísticos da distribuição dos índices de cada ponto de uma imagem poderiam ser utilizados para melhor prever uma classificação visual (VR, do inglês Visual Rating).

Com as técnicas básicas amadurecidas, outras vertentes foram exploradas. Utilizando processamento de imagens baseado em descritores fractais e uma máquina de vetores de suporte (SVM, do inglês Support Vector Machine), Florindo et al. (2014) apresentaram um classificador de espécimes debrachiaria. Por sua vez, Zhou et al. (2013) detectaram a infestação do pulgão do arroz por meio de medições de dimensão fractal e C-média difusa. A maioria das abordagens, no entanto, apresenta restrições de aplicabilidade, exi- gindo a reformulação de grande parte da metodologia antes que seja possível a sua utilização em cultivares diversos dos originais.

1.3 O tomate no Brasil

A cultura do tomate (Lycorpersicon esculentun Miel) foi implantada no Brasil no início do século XX, em Pernambuco (CASTRO; BRITO, 2010). Cresceu de forma significativa entre os anos 1973 e 1975, quando a produção passou de 300 mil toneladas para 640 mil toneladas, distribuindo-se pelo País, principalmente pelo Nordeste. Em 1991, ocorreu um ataque severo da traça do tomateiro (Tuta absoluta), reduzindo a área plantada.

A partir de 1990, quando percebeu-se no Centro-Oeste características favoráveis ao seu plantio, como a baixa umidade relativa do ar e as temperaturas amenas entre março e setembro, além dos solos profundos e bem drenados e da topografia plana, houve uma maior concentração de produtores de tomate nessa região (CASTRO; BRITO, 2010).

Tabela 1.1: Quantidade produzida do tomate por Unidade da Federação, Brasil – 2002 e 2008. Fonte:

Castro e Brito (2010)

2002 2008

Brasil

e UF Quantidade

produzida (T) Participação

(%) Quantidade

produzida (T) Participação

(%) Variação

(%)

Goiás 951.410 26,0 1.148.695 29,7 20,7

São Paulo 765.990 21,0 770.804 19,9 0,6

Minas Gerais 637.219 17,4 463.571 12,0 -27,3

Paraná 168.865 4,6 289.630 7,5 71,5

Bahia 237.763 6,5 256.158 6,6 7,7

Rio de Janeiro 167.124 4,5 208.185 5,4 27,6

Pernambuco 207.736 5,7 160.688 4,2 -22,6

Espírito Santo 109.539 3,0 120.531 3,1 10,0

Santa Catarina 127.350 3,5 117.892 3,0 -7,4

Rio Grande do Sul 102.156 2,8 110.576 2,9 8,2

Outros 891.676 24,4 220.925 5,7 -75,2

Brasil 3.652.923 100,0 3.887.655 100,0 5,9

Do total de tomates produzidos, diferenciam-se dois tipos, classificados como “estaqueado” (de mesa) ou “rasteiro” (industrial), sendo este último mais utilizado na indústria por ser de porte baixo e não ne- cessitar de suporte ou estaca (CASTRO; BRITO, 2010). A tabela 1.1 apresenta a produção total desses

(19)

dois tipos de tomate. Em 2002, a produção de tomate industrial foi de, aproximadamente, 1,28 milhão de toneladas em 18,25 mil hectares, ou seja, uma produtividade média de 70 toneladas por hectare. Em 2008, o estado de Goiás era um dos maiores produtores de tomate industrial, ocasião em que a produção e consumo total do País era de cerca de 1,5 milhão de toneladas (CASTRO; BRITO, 2010).

Por sua aceitação no mercado e alto valor de remuneração, a área plantada de tomate industrial assume valores ainda mais significativos, o que enseja a busca por diferentes meios de produção que possibilitem a garantia de uma melhor qualidade do produto, como os sistemas protegidos e sistemas orgânicos (CAS- TRO; BRITO, 2010). Entretanto, seu cultivo esbarra em um grande empecilho: sua perecibilidade, de forma que ainda seja indispensável a utilização de uma grande quantidade de agrotóxicos, principalmente fungicidas e inseticidas, apesar de todos os estudos em andamento (LATORRACA et al., 2008).

Não só em quantidade, mas em toxicidade — seja por falta de informação, instrução ou mesmo ética

—, o tomate acaba contaminado por resíduos que são levados diretamente ao consumidor, comprometendo a sua saúde (LATORRACA et al., 2008). A maior incidência de intoxicação, no entanto, está naqueles que trabalham diretamente com os praguicidas, seja em sua aplicação ou produção. Isso ocorre pela falta de conhecimento sobre a importância do cuidado que se deve ter durante a aplicação e o descarte das embalagens tóxicas.

Tabela 1.2: Agrotóxicos mais vendidos para a cultura do tomate nas cidades do Goiânia (GO) e Goianápolis (G0), e seus respectivos grupos químicos e ingredientes ativos. Fonte: Latorraca et al. (2008)

Marca Comercial Formulação Ingrediente Ativo Grupo Químico Classe

Decis 25 CE EC Deltamethrin Piretróide Inseticida

Tamarom Br SL Methamidofós Organofosforado Inseticida

Lorsban 480 Br EC Chlorpyrifos Organofosforado Inseticida Folidol 600 EC Parathion-methyl Organofosforado Inseticida

Cartap Br 500 SP Cartap Ditiocarbamato Fungicida/

Inseticida

Meothrin 300 EC Fenpropathrin Piretróide Inseticida

Pouce 384 CE EC Permethrin Piretróide Inseticida

Elsan EC EC Phenthoate Organofosforado Inseticida

Daconil 500 SC Clorothalonil Isoftalonitrila Fungicida

Dithane PM WP Mancozeb Ditiocarbamato Fungicida

Recop WP Oxicloreto de cobre Inorgânico Fungicida

Alguns dos agrotóxicos tradicionais são apresentados na tabela 1.2. No Brasil, no entanto, é comum verificar-se o uso de outros agrotóxicos, não permitidos para a cultura do tomate, além do descarte indevido dos vasilhames e da não utilização da EPI (equipamento de proteção individual), tornando inevitável a contaminação dos trabalhadores (LATORRACA et al., 2008).

Constatam-se, também, relatos de sintomas de intoxicação aguda, como náuseas, tontura e dor de cabeça, muitas vezes não registrados como acidente de trabalho pela falta de conhecimento toxicológico dos médicos e pacientes.

No ano de 2007, a ANVISA avaliou o cultivo do tomate no Brasil e relatou teores de resíduos acima do permitido e o uso de agrotóxicos não autorizados. Comparando-o com outros nove produtos, o tomate esteve entre um dos três primeiros em irregularidades (LATORRACA et al., 2008). Considerando-se a

(20)

crescente utilização de agrotóxicos no Brasil, ilustrada na figura 1.2, fica evidente a importância da redução no uso de químicos na produção de tomates.

Figura 1.2: O crescimento da produção agrícola e do consumo de agrotóxicos e fertilizantes químicos nas lavouras do Brasil, a partir de 2009, começou a se dar de forma desproporcional, indicando provável influência de pressões econômicas para o aumento da produtividade. Fonte: Pignati (2013)

Os esforços de automação têm sempre como objetivo a avaliação do fruto do tomate após a co- lheita (LINO; SANCHES; FABBRO, 2008; EDAN et al., 1997; KAMARPOSHTY; ASADOLLAHI; TEY- MOORI, 2009). Devido ao volume de produção e às extensões da área, mesmo uma melhoria marginal no processo do plantio propiciaria redução significativa, em termos absolutos, do impacto ambiental e do desperdício de recursos.

Este trabalho apresenta um processo automático de avaliação do grau de saúde de uma planta de tomate industrial por meio de uma imagem digital do espécime em campo. Utilizando um agregado de técnicas de processamento de imagens, o sistema é capaz de fornecer análises que se mostraram equiparáveis às de especialistas, mas de maneira mais consistente e rápida.

O processo, consolidado em um software, visa diminuir os custos operacionais da análise e ampliar a possibilidade do uso de metodologias que dela diretamente dependam, como a dosagem, em plantações de menor escala. Em aplicações que já adotam tais técnicas, a maior velocidade e precisão propiciam maior sofisticação dos métodos utilizados, com o consequente aumento de produtividade e eficiência.

O objetivo secundário, mas não menos importante, é o de servir como ponto de partida para a aplica- ção da técnica em outros cultivares, e mesmo como estímulo ao desenvolvimento de metodologias mais sofisticadas de classificação.

(21)

Capítulo 2

Proposta da Solução

2.1 Metodologia-base de avaliação

Por objetivar a automação, e não a criação, de um processo de avaliação da qualidade de uma espécime de tomate em campo, este trabalho baseou-se na metodologia apresentada por Nascimento et al. (2013).

Nele, realizaram-se dois ensaios, compostos pela inoculação de fitopatógenos seguida de tratamento e pela avaliação da produtividade e severidade da doença nas folhas e frutos. O processo de avaliação resumiu- se a quantificar, em uma imagem digital, a proporção entre regiões indicativas de uma planta saudável e regiões indicativas de uma planta doente. Considerou-se o grau dessa razão como diretamente proporcional ao grau de incidência da doença na planta.

2.1.1 O plantio

Os dois ensaios foram realizados em uma área experimental, patrimônio da Unilever Bestfoods, loca- lizada em Goiânia-GO (16o35’12”S, 49o21’14”O, 730m de altitude), de fevereiro a junho de 2007 e abril a agosto de 2008.

Foram utilizados dois híbridos de tomate industrial, denominados Hypeel 108 e U2006, e dez tipos de tratamento químico, entre os quais hidróxido de cobre e óxido cuproso. As linhas de plantio foram subdivididas em blocos ao acaso, separadas de acordo com o tratamento utilizado e o cultivar, com três repetições para cada combinação desses dois parâmetros.

2.1.2 A coleta das imagens

Após inoculação e tratamento, 85 dias depois do transplante da muda ao campo, passou-se à coleta das imagens digitais. O fotógrafo, utilizando uma escada, posicionava-se a uma altura de 1,80m da copa e obtinha um ponto de vista majoritariamente vertical. Uma moldura branca, feita em madeira, era utilizada como referência entre fotos e como um indicador de alvo, já que uma mesma foto poderia conter mais de uma linha de plantio. Para cada bloco foram coletadas três fotos de posições contíguas.

(22)

2.1.3 A avaliação dos resultados

Terminada a coleta, as fotos foram encaminhadas a sete técnicos da área, que avaliaram as imagens de acordo com uma escala de pontuação pré-definida, apresentada na tabela 2.1. As notas das imagens foram progressivamente agregadas, compondo as notas do grupo ao qual pertencia, até que se obtivesse a nota final do tratamento. Em ordem:

1. As notas de cada avaliador foram combinadas por média aritmética, formando a nota final da ima- gem.

2. As notas finais das imagens que pertenciam a um mesmo grupo de coletas contíguas foram combi- nadas por média aritmética, formando a nota final da repetição.

3. As notas finais das três repetições foram combinadas por média aritmética, formando a nota final do híbrido.

4. As notas finais dos híbridos foram combinadas por média aritmética, formando a nota final do trata- mento.

Tabela 2.1: Escala adotada para a avaliação das imagens digitais de tomate Percentual de área foliar Nota

lesionada dentro da moldura

0% 1

25% 2

50% 3

75% 4

100% 5

Apesar de não explicitado por Nascimento et al. (2013), é razoável supor uma demora significativa entre o início de processo de coleta e o cálculo das notas finais dos tratamentos. Mesmo considerando uma situação ideal, com todos os analistas presentes na fazenda, o tempo total é da ordem de horas.

Em situações cotidianas, no entanto, dificilmente se justificaria a presença de sete analistas em uma mesma fazenda. O processo da análise, assim, se vê acrescido das etapas de distribuição das informações e coleta dos resultados. A distribuição, devido à pouca infraestrutura de comunicações presente em áreas rurais, se vê prejudicada pelo volume de dados a ser transmitido, da ordem de centenas de megabytes

— centenas de imagens de alguns megabytes cada; terminada a transmissão, deve-se ainda aguardar a disponibilidade do analista. Em conjunto, esses fatores levam o tempo da análise para a ordem de dias.

A subjetividade da avaliação do especialista também pode interferir negativamente no resultado. Dife- renças de interpretação na escala, nos indicativos de saúde e mesmo no método de avaliação contribuem para uma grande variabilidade das notas atribuídas, diminuindo a utilidade da avaliação para a tomada de decisões. A figura 2.1 ilustra uma ocorrência dessa situação, com resultados aparentemente incoerentes.

(23)

(a) Tratamento 9, Repetição 3, Espécie 1, Foto 2 (b) Tratamento 10, Repetição 2, Espécie 2, Foto 2 Figura 2.1: As duas imagens, retiradas do banco de imagens de Nascimento et al. (2013), apesar de muito semelhantes visualmente, receberam notas bastante distintas pelos avaliadores: 1.5para a figura (a) e 3.2 para a figura (b), correspondendo a 13% e 55%, respectivamente, de percentual de área foliar lesionada dentro da moldura. Tamanha diferença pode ser atribuída, por exemplo, a diferenças na interpretação da escala pelos vários especialistas, ou mesmo à utilização não intencional das informações contidas nas regiões externas à moldura de referência

2.2 A automação do processo

O processo automatizado seguiu, tanto quanto possível, a metodologia na qual se baseou. Assim como anteriormente, pode-se dizer que o processo automatizado consiste em quantificar a proporção entrepixels indicativos de uma planta saudável epixelsindicativos de uma planta doente, com o grau de incidência da doença determinado a partir dessa razão. O processo envolve, de forma geral, três grandes dificuldades:

1. Determinar o processo de aquisição da imagem,

2. Determinar em que consiste uma região saudável ou doente, e

3. Determinar a relação do grau de incidência com as métricas calculadas.

Considera-se que a metodologia-base já contempla satisfatoriamente a primeira etapa, ao estabelecer uma posição de captura vantajosa e um quadro de referência dimensional. Poder-se-iam determinar proce- dimentos mais específicos, mas as condições da coleta, em campo, impossibilitam a obediência a restrições como iluminação uniforme e tolerâncias estreitas quanto ao posicionamento. Tornou-se necessária, então, a inclusão de etapas que padronizem as imagens adquiridas e mesmo a utilização de técnicas invariantes às possíveis alterações.

A determinação do que são regiões saudáveis e doentes da imagem e da sua relação com o grau de incidência da doença, no entanto, tiveram de ser elaboradas integralmente. Criou-se um modelo que, a partir de características da cor, forma e textura da imagem, classifica umpixelda imagem entre três classes:

saudável, doente ou não-classificável. Apesar de fornecer resultados consistentes com os da metodologia- base, o modelo possui parâmetros que permitem alterar a interpretação das características presentes na imagem e, consequentemente, a quantificação da incidência de doença.

(24)

2.2.1 A arquitetura do sistema

O processo completo, sumarizado na figura 2.2, é composto, em essência, pelas etapas observadas na metodologia-base, adicionado de um conjunto de tarefas de pré-processamento, cuja principal função é de aprimorar a robustez e e repetitibilidade do sistema como um todo.

Início Aquisição

da imagem Pré-processamento Classificação Avaliação Figura 2.2: Visão global da arquitetura do processo

2.2.2 A aquisição de imagens

Como mencionado, a aquisição das imagens digitais obedece às mesmas determinações da metodologia- base, quais sejam: ponto de disparo elevado em 1.8m acima da copa das plantas, com orientação predomi- nantemente vertical, e utilização de uma moldura de referência, feita de cor de alto contraste em relação ao cultivar analisado.

É importante notar que a utilização de moldura de cor branca não é recomendada para coletas ao ar livre. Devido às diferenças do índice de reflexão, superfícies brancas tendem a enviar muito mais luz ao sensor da câmera fotográfica do que as folhas e o solo, como exemplificado na figura 2.3. A presença de um elemento muito luminoso força ofirmwareda máquina fotográfica, haja vista seu baixo alcance dinâmico de luminosidade, a diminuir o tempo de exposição da captura para evitar superexposição.

As regiões da imagem preenchidas pela moldura, no entanto, não interessam à análise. Como agra- vante, perdem-se informações das regiões mais escuras da foto com a redução do tempo de exposição.

A utilização de molduras de cores opacas e de superfícies não reflexivas, mas não menos contrastantes, combate esse efeito de maneira satisfatória.

2.2.2.1 O banco de imagens

Como a coleta em campo não traria benefícios diretos ao desenvolvimento do processo automatizado e, por seguir os mesmos princípios, forneceria resultados potencialmente equivalentes aos obtidos pela metodologia-base, optou-se por utilizar o banco de imagens coletado durante os ensaios acima descritos.

As 179 imagens, gentilmente cedidas por Nascimento et al. (2013), além de terem qualidade endossada pela utilização anterior em pesquisa científica, vêm acompanhadas do resultado das avaliações visuais de sete técnicos da área. Bastando a utilização da mesma escala de avaliação, pode-se comparar os resultados desses analistas com aqueles calculados pelo processo automático. O banco completo, ainda não publicado, pode ser diretamente requisitado ao orientador desse trabalho no endereço eletrônicodibio@unb.br.

(25)

Figura 2.3: A ausência de detalhes na região esquerda da moldura, causada por superexposição, evidencia que o alcance dinâmico da câmera fotográfica foi insuficiente e que houve possível comprometimento na obtenção de detalhes no restante da foto.

2.2.3 O pré-processamento

Conforme mencionado, as imperfeições no processo de captura exigem, do sistema, mecanismos de compensação ou minimização de defeitos, erros ou mesmo simples inadequação das imagens ao formato esperado. Alguns desses mecanismos se fazem presentes nas tarefas de pré-processamentfo das imagens, resumidas abaixo e sumarizadas na figura 2.4

Imagem

original Ajuste

gamma Conversão para o

espaço de corLAB Redimensionamento Corte Figura 2.4: Etapas de pré-processamento

2.2.3.1 Correçãogamma

A primeira tarefa consiste na correção gamma da imagem, com parâmetro ajustável, ilustrada na fi- gura 2.5. Equipamentos de aquisição de imagem, de modo a maximizar a qualidade visual do sinal, ajus- tam a luminosidade da imagem ou vídeo capturados segundo a expressão (PLATANIOTIS; VENETSA- NOPOULOS, 2000):

Vout=Vin (2.1)

(26)

ondeV é o valor de intensidade do sinal, é o parâmetro real, que pode variar de 0 a 1 para uma correção de compressão ou codificação, ou de 1 em diante para uma correção de expansão ou decodificação. Para que seja visualizado em sua forma original, um sinal com codificação gamma deve ser reajustado, na visualização, com uma correçãogammade parâmetro inverso ao da primeira.

0 0.2 0.4 0.6 0.8 1

0 0.2 0.4 0.6 0.8 1

a= 2.21

b= 2.2 Resultante

Figura 2.5: Para que seja visualizado em sua forma original, um sinal com codificaçãogamma deve ser reajustado, na visualização, com uma correçãogammade parâmetro inverso ao da primeira.

2.2.3.2 Conversão para o espaço de corLAB

Em seguida — e possivelmente a etapa mais importante —, a imagem tem seu espaço de cor, ori- ginalmente no espaço vermelho, verde e azul (RGB, do inglês Red, Green, Blue), convertido no espaço CIE Lab, ao qual correspondem três canais: uma dimensão de luminância Le duas dimensões de cores complementaresaeb. O resultado da operação é representado na figura 2.6.

O espaço de corLabfoi modelado de modo a se assemelhar à visão humana (HUNTER, 1958), e sua gama de cores excede àquelas do RGB e CMYK, espaços de cor tradicionais baseados nas propriedades físicas de seus meios de reprodução: monitores e impressoras, respectivamente (TKALCIC; TASIC, 2003).

A conversão do espaço RGB para o espaçoLabnão é trivial, pois não existe transformação direta entre essas representações (SCHANDA, 2007). É necessária uma conversão intermediária ao espaço de cor XYZ (FAIRMAN; BRILL; HEMMENDINGER, 2003), que também se baseia na visão humana. Dado os canais compandedRGBVVV, com valores pertencentes a[0,1]:

VVV 2{R, G, B}

Os canais são linearizados em relacão à energia por meio decompandinginverso, exemplificado aqui para um espaço de cor sRGB (Standard RGB).

vvv2{r, g, b}

(27)

(a) Imagem no espaço de corLab (b) Canal de luminância, com níveis ajustados para visualização

(c) Canal de cor-complementara, com níveis ajusta-

dos para visualização (d) Canal de cor-complementarb, com níveis ajusta- dos para visualização

Figura 2.6: A decomposição de uma imagemLabilustra sua característica de separação entre luminosidade e cromaticidade. As variações de luz estão, em sua maioria, restritas ao canal de luminosidade, tornando os canais de cores-complementaresaebinerentemente tolerantes a alterações de luminosidade.

vvv= 8<

:

VV V

12.92 VVV 0.04045

VV V+0.055

1.055

2.4 Otherwise

Por fim, os canais de cor normalizadosvvvsão convertidos para o espaço de cor XYZ por uma transfor- mação linear. A matriz [MMM], 3x3, é dependente das características do espaço original, como o parâmetro de ajustegammada codificação e o ponto de branco. Encontram-se, na literatura, várias dessas matrizes, para vários tipos de espaço de cor e respectivas características. Dada a seguinte matriz[MMM], utilizada para conversão de espaços sRGB com ponto de branco D65:

[MMM] = 2 64

0.4124564 0.3575761 0.1804375 0.2126729 0.7151522 0.0721750 0.0193339 0.1191920 0.9503041 3 75

(28)

pode-se realizar a conversão para o espaço de cor XYZ conforme abaixo:

2 64

X Y Z

3 75= [MMM]

2 64

r b g

3 75

Segue-se, então, a conversão do espaço de cor XYZ ao espaço de corLab:

L= 116fy 16

a= 500(fx fy) b= 200(fy fz) onde

fx = 8<

:

p3xr xr>✏

(xr+16)

116 Otherwise e

xr= X Xr

com o análogo realizado para y e z. Xr é o ponto branco de referência no espaço de cor XYZ, e os parâmetros, conforme definido pelo padrão CIE,

✏=

8<

:

0.008856 Padrão CIE efetivo

216

24389 Padrão CIE almejado

=

8<

:

903.3 Padrão CIE efetivo

24389

27 Padrão CIE almejado

Essa enredada etapa é fundamental ao processo, por desacoplar a luminosidade das cores na imagem. Por serem conceitualmente independentes, contribuindo para a classificação de maneiras diferentes, a ortogo- nalidade dimensional no espaço de cor é mais do que apropriada. A similaridade desse espaço de cor com as qualidade perceptivas da visão humana também pode ser considerada vantajosa, pois é justamente desse sentido humano que depende a metodologia-base de avaliação da primeira seção deste capítulo.

2.2.3.3 Redimensionamento

Após a conversão do espaço de cor, a imagem é reduzida, com o único propósito de diminuir as ne- cessidades computacionais e de armazenamento da operação. Apesar de a estratégia ótima ser a de coletar as imagens no tamanho exato em que serão processadas, evitando por completo artefatos de decimação (redução da resolução espacial), um banco de imagens de tamanho ligeiramente maior que o necessário pode se mostrar útil caso a resolução das imagens revele-se, no futuro, insuficiente.

(29)

2.2.3.4 Corte

A etapa final do pré-processamento, o corte das bordas, é realizada de modo a eliminar regiões externas à moldura de referência, e mesmo a própria moldura, da imagem a ser analisada. A região externa pode conter, desde grandes quantidades de solo exposto, devido ao espaçamento entre fileiras de plantio, a outros cultivares. O corte, exemplificado na figura 2.7, é realizado de forma independente e ajustável nas direções vertical e horizontal, sempre de forma simétrica, e transforma a moldura na borda efetiva da imagem, reificando sua natureza referencial.

(a) Imagem original (b) Esquema de corte (c) Resultado

Figura 2.7: O forte contraste e o conhecimento prévio da geometria da moldura facilitam o seu reconheci- mento. Em caráter excepcional, as imagens do banco foram cortadas utilizando um processo automatizado, representado em (b), baseado na identificação das bordas da moldura e no recorte da maior região retan- gular por ela compreendida. Apesar de bem sucedido em sua aplicação às imagens do banco, o processo mostrou-se pouco robusto.

Intuitivamente, esperar-se-ia que a etapa de redimensionamento fosse a primeira da sequência, de modo a maximizar a quantidade de operações beneficiadas pela redução dos requisitos de processamento e me- mória. No entanto, essa operação remove informação da imagem e pode introduzir artefatos de decimação.

Em virtude disso, conforme ilustrado na figura 2.4, o redimensionamento é realizado no último passo.

Também é importante notar que, como essas operações não são, em sua maioria, nem reversíveis nem lineares, qualquer alteração na ordem da execução implica alterações no resultado.

2.2.4 A classificação

As imagens pré-processadas têm cada um de seuspixelsclassificados como representativos de uma re- gião saudável ou não saudável da planta. Regiões sem uma categoria evidente são direcionadas, utilizando dados especializados ou heurística, às categorias existentes. Na ausência das últimas ou na impossibili- dade de se determinar com confiança a classificação, tais regiões são ditas “sem classificação". O processo completo, detalhado nas seções que seguem, é representado pela figura 2.8.

Imagem

pré-processada Segmentação

baseada em cor Classificação Filtragem Figura 2.8: Etapas da classificação

(30)

2.2.4.1 Segmentação baseada em cor

Pela inspeção visual dos canais separados sob o espaço de corLab, ficou evidente a grande distinção entre folhas saudáveis e o restante dos elementos. Apesar de não terem sido observadas distinções entre, por exemplo, os tomates expostos e o chão, optou-se por utilizar as informações desse canal como primeiro fator discriminante.

Na segmentação baseada em cor, os pixelsda imagem são quantizados segundo os valores do canal de cor-complementara, em uma quantidade ajustável de partições. O método de agrupamento utilizado é o K-Médias padrão, baseado em centróides e métrica euclidiana, conforme proposto por MacQueen et al.

(1967). O resultado da operação é representado na figura 2.9.

A quantidade de agrupamentos determina a resolução com a qual será realizada a discriminação entre as folhas saudáveis e o restante dos elementos. Os benefícios do aumento da resolução têm característica assintótica, mas a contrapartida do aumento de processamento é sempre crescente. A quantidade ótima de agrupamentos é dependente da resolução das imagens analisadas.

(a) Canala, no espaçoLab, da figura 2.6c, em sua

forma original (b) Colorização dos agrupamentos

Figura 2.9: O agrupamento divide o canal a em classes distintas independentemente da dispersão dos dados. Observa-se, em (b), a visualizacão do agrupamento dos pixels da imagem (a), em que pontos pertencentes ao mesmo grupo recebem a mesma cor. Apesar de constituídos em sua maioria por pixels contíguos, os grupos não são determinados utilizando informações de posição, mas somente da intensidade do canala.

2.2.4.2 Classificação

Após o agrupamento, resta determinar quais elementos são representados por quais partições: a classi- ficação. Como o processo de agrupamento não possui uma ordenação inerente e, mesmo que seja bastante robusto, não é determinístico, recorreu-se a um processo de classificação baseado na diferença perceptiva de cores.

Concebeu-se um método simples, em que, para cada agrupamento, calculou-se, no espaço de corLab, a distância euclidiana entre os valores do canalade cadapixele de uma cor pré-determinada como sendo a do solo (no caso, a cor marrom, composta por 60% de vermelho, 40% de verde, e 20% de azul no espaço

(31)

RGB). Agrupamentos com uma distância média inferior a um limiar também pré-determinado são consi- deradoschão. De modo a assegurar-se de que haverá ao menos um agrupamento considerado comochão, a partição com a menor distância média também é considerada como tal. O restante dos agrupamentos é classificado como folhas saudáveis. A figura 2.11 demonstra o passo-a-passo da classificação para a imagem-exemplo. O resultado dessa operação é apresentado na figura 2.10.

(a) Imagem de referência (b) Classificação das regiões em folhas saudáveis (claro) e o restante (escuro)

Figura 2.10: O procedimento de classificação distingue corretamente folhas saudáveis do restante dos elementos, mas, como se observa no canto inferior direito da imagem, existe ambiguidade entre tomates expostos e solo.

2.2.4.3 Filtragem

Conforme brevemente mencionado, o canalanão distingue satisfatoriamente regiões que contêm solo de regiões que contêm tomates expostos. Além disso, áreas onde mesmo técnicos treinados mostrariam he- sitação são classificadas indiscriminadamente. A etapa de filtragem, representada na figura 2.12, aperfeiçoa a classificação realizada, reclassificando algumas regiões, ou mesmo, em casos de ambiguidade excessiva, removendo qualquer classe anteriormente determinada.

O primeiro tipo de filtragem concerne à má qualidade de iluminação. Devido à sua natureza, os espa- ços de cor baseados em croma são numericamente sensíveis perto do espectro cinza, (preto, branco e tons de cinza), uma vez que estes são tons, por definição, acromáticos. Sob as coordenadas de cor RGB, que espelham as qualidades físicas do sensor de imagem da câmera fotográfica e da saída do monitor de ví- deo, ambos os extremos de luminosidade naturalmente convergem para o branco ou o preto, precisamente a região acromática, numericamente instável na conversão, supracitada (PLATANIOTIS; VENETSANO- POULOS, 2000, cap.1).

Como exemplo, uma variação de±0.1% nas intensidades dos canais ao redor do ponto quase branco (99.9% Vermelho, 99.9% Verde, 99.9% Azul no espaço RGB ou, no espaçoLAB, 99.9%L, 0.00a, 0.00b) pode levar a variações de±40000% nas intensidades dos canais após conversão para o espaço de corLab.

A mesma variação ao redor da cor quase verde puro (0.01% Vermelho, 99.9% Verde, 0.01% Azul ou 87.7%L, -0.860a, 0.829b) implica uma variação de apenas±0.3% no espaço de corLab, após conversão.

(32)

(a) Diferença média:0.030 (b) Diferença média:0.066 (c) Diferença média:0.133

(d) Diferença média:0.162 (e) Diferença média:0.186 (f) Diferença média:0.239

(g) Diferença média:0.287 (h) Diferença média:0.334 (i) Diferença média:0.382 Figura 2.11: Os nove primeiros agrupamentos da figura 2.9b, em ordem crescente de diferença média, no canal a, à cor marrom, composta por 60% de vermelho, 40% de verde, e 20% de azul. Os discos no canto superior esquerdo ilustram a cor média observada nospixelscontidos no agrupamento. Os primeiros cinco agrupamentos, por terem diferença menor que 0.2, são classificados comochão; o restante, folhas saudáveis.

É importante notar que variações de 0.1% estão dentro da faixa observada de ruído da grande maioria dos dispositivos amadores de aquisição digital de imagem.

Conforme mencionado, a exigência de padrões de qualidade excepcionais na captura das imagens seria impraticável, não apenas pelo custo proibitivo de lentes e câmeras profissionais, mas pelas dificuldades de aquisição em campo. As soluções aplicáveis são, então, técnicas de redução de ruído, estas já aplicadas pelos sistemas embarcados de processamento nas câmeras modernas, e, conforme realizado nessa primeira etapa de filtragem, no descarte das informações ruidosas.

Por meio de dois limiares ajustáveis, regiões com luminosidade insuficiente, chamadas subexpostas, e regiões com luminosidade excessiva, chamadas sobre-expostas, têm suas classificações anteriores removi- das, e passam a compor a classe “sem classificação", que também pode ser interpretada como “inclassifi-

(33)

(a) Filtro de sobre e subexposição combinados, ba-

seados no canala, no espaçoLab (b) Filtro cromático, baseado no canalb, no espaço Lab,

(c) Regiões, da figura 2.10b, que não foram classifi-

cadas como de folhas saudáveis (d) Regiões de (c) filtradas pela combinação dos fil- tros (a) e (b)

Figura 2.12: A inspeção das imagens (c) e (d) evidencia que a filtragem efetivamente aprimora a classi- ficação. No canto inferior direito, por exemplo, estão presentes regiões de tomate exposto corretamente reclassificadas em regiões saudáveis. No restante da imagem, em especial na faixa no canto direito da imagem, observam-se várias regiões com iluminação inadequada que foram removidas da classificação.

Estas últimas, no entanto, não serão reclassificas, mas descartadas da análise.

cável".

O segundo refinamento da classificação concerne ao agrupamento indevido de regiões contendo toma- tes expostos com regiões de solo. Um tomate próximo ao dossel é muito suscetível a ser exposto por um ponto de vista vantajoso. O solo, por sua vez, é entremeado por uma quantidade muito maior de galhos e folhas e, assim, muito menos propenso a estar sob uma linha de visão desimpedida. Considera-se, por essa razão, que, dentro da moldura de referência, um tomate exposto é menos indicativo de deficiências no desenvolvimento da planta do que uma região exposta de solo.

Em contraste com a cor do solo, a cor do tomate tem maior quantidade de amarelo em sua composição.

Considerando que tomates crescem em cachos de tamanho moderado, podem-se esperar, na imagem, áreas largas, homogêneas e bem separadas desse vermelho-amarelado. Coincidentemente, a dimensão de cor- complementar b do espaço de cor Lab representa precisamente a quantidade das cores amarelo e azul, apontando para sua utilização como o fator discriminante.

(34)

Dentre as possíveis maneiras de realizar a binarização do canalb, as mais apropriadas são a de Otsu, baseada na minimização de variação intraclasse (OTSU, 1979), e a de Kapur, baseada na maximização da entropia (KAPUR; SAHOO; WONG, 1985). Apesar de o primeiro esquema favorecer não a paridade de classificação, mas a homogeneidade entre os membros da classe — precisamente o que se espera a partir de cachos de tomate expostas —, o segundo esquema apresenta resultados mais condizentes com o objetivo do filtro de separar as regiões de tomate expostas, conforme observado na figura 2.13. A binarização também pode ser realizada utilizando um limiar pré-determinado, estabelecido empiricamente.

(a) Canal b, no espaço LAB, da imagem exemplo, figura 2.6a

0.5 0 0.5

0 2 4

·104

Númerodepixels

Kapur Otsu

(b) Histograma das intensidades do canal Canalb, no espaçoLAB, da imagem exemplo, figura 2.6a

(c) Binarização da figura (a) utilizando o limiar de

Kapur (d) Binarização da figura (a) utilizando o limiar de

Otsu

Figura 2.13: O limiar obtido pelo método de Otsu abrange praticamente todos os tomates expostos, mas às custas de muitos falsos-positivos, como regiões de solo. A limiarização de Kapur possui comparativamente mais falsos-negativos, mas acaba por ser mais apropriada para a filtragem de pele de tomate das regiões previamente identificadas como solo.

Não existe consenso, entre técnicos da área, sobre o que representa a presença de tomate exposto na vista superior de uma planta, pois o argumento do ponto de vista vantajoso é discutível. A utilização de um limiar pré-determinado nulo, no entanto, torna a filtragem efetivamente inexistente. Esta última etapa de filtragem, então, permite que qualquer uma das duas posturas seja adotada, de acordo com a experiência do operador e as particularidades do cultivar.

(35)

2.2.5 A avaliação

Após as etapas de classificação e filtragem, o percentual de área foliar lesionada dentro da moldura é determinado de maneira direta. O resultado, para imagem-exemplo, é apresentado na figura 2.14. Para cada

Classe Percentual

Folhas saudáveis 55%

Restante dos elementos 17%

Sem classificação 28%

Área foliar lesionada 24%

Figura 2.14: Classificação final da imagem exemplo, figura 2.6a, e resultado da avaliação. A área foliar lesionada é relativa às regiões classificáveis da imagem.

classe, são calculadas a cobertura absoluta — a proporção entre a quantidade de pixelscontidos em cada classe e a quantidade total depixelsna imagem — e a cobertura relativa — proporção entre a quantidade depixelscontidos em cada classe e a quantidade depixelsna imagem,

Cobertura Absolutaclasse= Área da Regiãoclasse P

k2ClassesÁrea da Regiãok (2.2)

onde Classes é o conjunto das possíveis classes (“Sem classificação", “Folhas saudáveis"e “Restante dos elementos") e Regiãoké o conjunto de pontos pertencentes à classek. A área de uma região é determinada como a quantidade depixelsque ela contém.

A cobertura relativa segue o mesmo procedimento, excetuando-se o fato de que a proporção é tomada à união de todas as regiões que não possuem a categoria “Sem classificação".

Cobertura Relativaclasse= Área da Regiãoclasse P

k2ClassificáveisÁrea da Regiãok (2.3)

onde Classificáveis é o conjunto Classes sem o elemento “Sem classificação". Em termos práticos, a cobertura relativa elimina completamente os elementos não classificáveis da imagem.

O principal indicador da saúde da planta é a cobertura relativa de "Folhas saudáveis", que, na fi- gura 2.14, recebe o nome deÁrea foliar lesionada. Também é apropriado, apesar de redundante, chamá-la deÁrea foliar lesionada relativa.

(36)

2.2.5.1 Normalização da avaliação

O resultado da avaliação pode ser normalizado em função da quantidade de solo que se espera visualizar dentro da moldura que envolve uma espécime completamente saudável. Devido ao espaçamento de plantio, a distância entre as fileiras de plantas, uma moldura de dimensão maior que a planta obrigatoriamente envolverá trechos de solo, que, nesse caso, não são indicadores de desenvolvimento insuficiente da planta.

Formalmente, podemos definir que a moldura, quando se estende além da largura da planta, começa a envolver uma área de espaçamentoAecontendo apenas solo exposto. Durante o procedimento de classifi- cação,Aeserá classificada como “Restante dos elementos"ou “Sem classificação". Para o último caso não haverá qualquer forma de interferência no resultado, mas, para o primeiro, deve-se remover a contribuição deAeno resultado final, sob a forma do fator

1 + Ae

Af +As Ae (2.4)

onde Ae é a área da moldura que cobre regiões de espaçamento, Af é a cobertura absoluta de folhas saudáveis eAsé a cobertura absoluta dos outros elementos.

2.3 O software

De modo viabilizar a utilização do processo por técnicos da área, desenvolveu-se uma interface grá- fica para o processo, utilizando o softwareMathematicaversão 10.0.0 (WOLFRAM RESEARCH, 2014a).

O programa, executável tanto pelo software citado quanto pelo Wolfram Computable Document Format (CDF) Player (WOLFRAM RESEARCH, 2014b), fornece uma maneira simples de configurar os vários parâmetros do processo e de realizar a análise em um conjunto de imagens utilizando processamento para- lelo.

O desenvolvimento da interface e o do software, apesar de confeccionados com a mesma ferramenta, são completamente ortogonais. Se a interface vier a se tornar um elemento limitador à utilização do pro- grama, oMathematicapossui ferramentas que possibilitam a integração, de forma transparente, do núcleo do processo e do processamento paralelo a linguagens de programação mais familiares à indústria, como o Java.

2.3.1 Princípios de desenvolvimento da interface

Atividades na indústria são frequentemente realizadas por pessoas com diferentes graus de familiari- dade tecnológica. É necessário observar as limitações de cada perfil de usuário e contornar as possíveis dificuldades com abordagens sob medida. Por sua vez, as atividades da indústria agrária são, em sua maioria, realizadas por técnicos agrários, salvo numa primeira etapa de treinamento.

Por visar ao uso em longo prazo, sem supervisão ou suporte facilmente acessíveis, o sistema tem como princípios a simplicidade, a tolerância a erros e a autodescrição. De modo a cumprir adequadamente com tais requisitos, adotaram-se as seguintes diretrizes:

(37)

• A sugestão de um fluxo de trabalho ideal,

• A co-localização de elementos relacionados,

• O estímulo à exploração dos parâmetros,

• A descrição explícita dos elementos, com informações, quando necessário, detalhando seu uso no contexto da análise.

2.3.2 Fluxo de trabalho

Utilizando-se de uma estrutura em abas, o programa sugere um fluxo de trabalho pré-determinado, conforme ilustrado abaixo. Essa sugestão está implícita na disposição das abas e, dentro de cada aba, na disposição dos elementos nos painéis, como se observa nas figuras 2.15 e 2.16.

Esse ordenamento é, no entanto, somente uma sugestão. Escolhido ao menos um arquivo para pro- cessamento, qualquer aba pode ser visitada a qualquer instante. Espera-se que, a cada coleta de imagens, corresponda um conjunto de ajustes de todos os parâmetros. Salvo alterações muito abruptas de luminosi- dade ou das características visuais do solo, o ajuste dos parâmetros não deve ser diferente para imagens do mesmo plantio.

Figura 2.15: Apesar de ser possível a visita a qualquer aba, a qualquer instante, a disposição das abas sugere uma ordem, da esquerda para a direita, para a visitação.

2.3.3 Co-localização de elementos relacionados

A fim de reduzir a carga cognitiva do programa, elementos similares encontram-se em posições pró- ximas, como observado na figura 2.16. As abas são um exemplo, no nível mais alto, dessa forma de agrupamento; dentro de cada aba, o agrupamento se dá na forma de painéis aninhados.

2.3.4 Estímulo à exploração dos parâmetros

Durante as etapas de ajuste de parâmetros, é muito produtivo que o usuário tenha um retorno, tão rápido quanto possível, das alterações que está realizando. Além de facilitar a detecção prematura de erros, ofeedbackimediato estimula, mesmo que por curiosidade, a exploração do campo de parâmetros e traz, sob uma forma indireta de análise deblack-box, melhorias no entendimento da função do parâmetro controlado. Outro fator essencial à exploração é a “impunidade” do usuário, sob a forma de tolerância a erros e da possibilidade de retorno às condições iniciais sem dificuldades.

O software possui, para todos os controles, a funcionalidade doundo, retornando os parâmetros, indivi- dualmente, às suas condições iniciais. A toda alteração nos parâmetros corresponde uma alteração síncrona

(38)

Figura 2.16: O agrupamento dos elementos da interface, além da função estética, traz contexto à utilização dos controles, por exemplo.

(a) Elemento de ajuste de parâmetro em sua posição

inicial (b) Elemento de (a) após ter sua posição alterada

Figura 2.17: Ao manipular qualquer um dosslideresacima, o usuário observa imediatamente a alteração na imagem que, no exemplo, recebe corte vertical e horizontal. A descrição que acompanha a imagem também se altera dinamicamente, indicando o tamanho final da imagem.

em algum outro elemento da interface, geralmente próximo ao elemento de ajuste, conforme observado nas figuras 2.17 e 2.18.

(39)

(a) Elemento de ajuste de parâmetro em sua posição

inicial (b) Elemento de (a) após ter sua posição alterada

Figura 2.18: Exemplo da funcionalidade deundo. A seta de retorno permanece presente mesmo antes de haver alteração, de modo a indicar ao usuário que existe possibilidade de retorno ao estado inicial em caso de mudança.

2.3.5 Descrição explícita e informações auxiliares

Mesmo que a exploração dos parâmetros permita ao usuário certa autonomia no entendimento do pro- cesso, algumas etapas mostraram-se pouco intuitivas. Além das várias descrições presentes em cada painel e controle, o software provê alguns indicadores, conforme ilustrados na figura 2.19, na forma de molduras que enfatizam determinados elementos da interface ou um pequeno parágrafo que contextualiza a utilidade do elemento que está sendo manipulado diante do restante do processo de análise.

Figura 2.19: Exemplo de descrições explícitas. Além de possuírem, cada um, uma curta descrição, os elementos podem receber uma moldura dinamicamente. No exemplo, o elemento central recebe uma moldura, indicando que o controle manipulado naquele instante faz referência ao canala, no espaçoLab, da imagem.

Referências

Documentos relacionados

Outro aspecto a ser observado é que, apesar da maioria das enfermeiras referirem ter aprendido e executado as fases do processo na graduação, as dificuldades na prática

Como objetivos específicos pretendeu-se iden- tificar os taxa existentes nesta gruta, determinar a riqueza de es- pécies de sua comunidade; verificar a influência de fatores

O objetivo do curso foi oportunizar aos participantes, um contato direto com as plantas nativas do Cerrado para identificação de espécies com potencial

Apesar dos esforços para reduzir os níveis de emissão de poluentes ao longo das últimas décadas na região da cidade de Cubatão, as concentrações dos poluentes

Para analisar as Componentes de Gestão foram utilizadas questões referentes à forma como o visitante considera as condições da ilha no momento da realização do

A versão reduzida do Questionário de Conhecimentos da Diabetes (Sousa, McIntyre, Martins &amp; Silva. 2015), foi desenvolvido com o objectivo de avaliar o

Neste estudo foram estipulados os seguintes objec- tivos: (a) identifi car as dimensões do desenvolvimento vocacional (convicção vocacional, cooperação vocacio- nal,

Por último, temos o vídeo que está sendo exibido dentro do celular, que é segurado e comentado por alguém, e compartilhado e comentado no perfil de BolsoWoman no Twitter. No