CLASSIFICAÇÃO DE TOMATES UTILIZANDO REDES NEURAIS ARTIFICIAIS
LOURO, Antônio Henrique Figueira1; MENDONÇA, Michelle Magalhães2; GONZAGA, Adilson3
Endereço: Av. Trabalhador São Carlense, 400 - Centro. Cep: 13566590 - São Carlos, SP - Brasil Tel: (16)33739326 Ramal: 9326 Fax: (16)33739372.
1ahfl63@hotmail.com, 2michelle2000ba@hotmail.com, 3agonzaga@sc.usp.br
RESUMO
Neste estudo, técnicas de processamento de imagens e redes neurais foram aplicadas para classificar tomates em quatro classes diferentes baseadas em seu tamanho e cor. Primeiro, imagens de 102 tomates pertencentes ao grupo saladete foram digitalizadas através de uma web-cam. Segundo, características de cor e forma foram extraídas de cada imagem e terceiro, essas características foram apresentadas a uma combinação de duas redes neurais.
1. INTRODUÇÃO
Nas linhas de controle de qualidade e classificação não automatizadas, as pessoas permanecem olhando o produto deslizar pela esteira, tentando retirar rapidamente os objetos que não estejam dentro dos padrões exigidos. Com o passar das horas, seus olhos cansam, suas mentes se distraem e conseqüentemente uma quantidade de produtos pode ser classificada incorretamente acarretando em prejuízos e desperdícios, com perdas tanto para indústria quanto para a sociedade.
Os sistemas de inspeção automáticos são controlados através de sensores eletrônicos, que muitas vezes simulam os nossos sentidos. Atualmente, existem várias aplicações em que são projetados e construídos sistemas de visão artificial com a finalidade de inspecionar os processos ou supervisionar os produtos finalizados.
A inspeção de frutos para a avaliação de sua qualidade é um campo de aplicação de grande interesse. Tillet
[1] destaca as vantagens que a visão artificial apresenta a esse respeito e, em geral, para a maioria dos produtos alimentícios devido a sua rapidez, confiabilidade e higiene.
Um sistema de visão computacional é composto por hardware e software. A parte que compõe o hardware pode incluir os seguintes componentes: sistema de iluminação, sistema de aquisição de imagens, sistema de processamento e sistema de atuação. A parte de software de um sistema de visão pode ser composta de: melhorias do sinal, segmentação, análise da forma, da cor e da textura e tomadas de decisão. Em todas essas fases, excetuando-se a de iluminação, é possível utilizar técnicas de redes neurais para implementá-las. Em [5] uma rede neural auxilia na classificação de laranjas; em [4] as redes neurais são usadas para classificação de alimentos; em [7] as redes neurais foram usadas para classificar nozes de pistache;
em [6] as redes neurais foram usadas para classificar maçãs.
2. MATERIAIS E MÉTODOS
Além das necessidades industriais pela inspeção automatizada, o mercado de frutas e legumes “in natura” para o consumidor comum também é carente de qualidade. Por exemplo, em [2] e [3] são mostrados resultados de uma pesquisa sobre a insatisfação do consumidor e suas exigências em relação a qualidade dos tomates, onde os seguintes fatos foram observados:
95,6% dos consumidores estavam insatisfeitos quanto à qualidade do tomate, apontando mais de um aspecto, sendo a presença de injúrias (incluindo cortes, furos e amassados) a principal causa do descontentamento, seguido do tomate manchado (aspecto amarelado, coloração não uniforme).
Os consumidores ressaltaram a preferência por tomate com coloração vermelha.
O tomate recebeu o mais alto índice de insatisfação comparado a outros 31 produtos, como por exemplo, alface e batata.
Na opinião dos consumidores um tomate ideal para consumo seria aquele que, de maneira geral, fosse: com coloração vermelha, uniforme, firme e sem presença de injúrias.
Sendo assim, o objetivo deste trabalho é constatar a possibilidade de se classificar tomates utilizando redes neurais artificiais e avaliar seu desempenho comparando as suas respostas com a opinião de um
“especialista”.
Os tomates utilizados neste estudo foram obtidos no supermercado Doto, localizado na região de São Carlo-SP.
Através do sitio de internet
www.agr.unicamp.br/tomates constatou- se que as amostras colhidas pertenciam ao grupo dos saladetes. A figura 1 apresenta amostras desse grupo.
Figura 1 – Amostra de tomates do grupo saladete em diferentes fases de
maturação.
As amostras colhidas possuíam cores e tamanhos diferentes, as mesmas foram lavadas e organizadas em quatro classes diferentes, são elas:
Classe A - tomate maduro e graúdo (acima de 7 cm de diâmetro equatorial) e completamente vermelho sem qualquer mancha verde.
Classe B – tomate apresentando as mesmas características de cor da classe A, porém com tamanho inferior a 7 cm.
Classe C – tomate apresentando qualquer mancha esverdeada e possuindo tamanho acima de 7 cm.
Classe D - tomate apresentando as mesmas características de cor da classe C, porém com tamanho inferior a 7 cm.
Os 102 tomates obtidos foram digitalizados usando-se uma Logitech QuickCam Express-USB. Para a obtenção das imagens foi utilizado um modulo de aquisição de imagens da USP o qual é constituída de uma câmara de iluminação difusa que consegue reduzir ao máximo os reflexos indesejados sobre o objeto. A
figura 2 mostra esse aparato, que facilitou bastante a fase de segmentação das imagens.
Vale a pena ressaltar que inicialmente, como recomendado na maioria dos livros e artigos lidos sobre visão computacional, foi usado um fundo negro, o qual não se mostrou adequado. A substituição por um fundo branco facilitou de forma substancial a fase de segmentação para esse tipo de amostra.
2.1 Extração de características
O fluxograma a seguir apresenta os passos utilizados na extração das características. Ao final desse processamento obteve-se 6 variáveis normalizadas: pixels médios (Rm, Gm, Bm), coordenadas cromáticas r, g ,b. A coordenada cromática do vermelho é calculada com a equação (1).
Figura 2 – Módulo de iluminação/aquisição de imagens.
A mesma equação é usada para o verde e o azul, bastando substituir o numerador. O pixel médio Rm é calculado com a equação (2). A mesma equação é usada para calcular Gm e Bm.
Em ambas as equações o valor N é o total de pixels da imagem.
Figura 3 – Imagem adquirida.
∑ ∑ ∑
∑
= = =
=
+ +
= N
i
N
i
N
i i i
i N
i i
B G
R
R r
1 1 1
1 (1)
255 / ) ( 1
N R Rm
N
i
∑
i= = (2)
3.2 Redes Neurais Artificiais (RNAs) Geralmente a classificação de frutos e a aplicação de RNAs estão relacionadas à maturidade de frutos. Se uma rede neural pode imitar exatamente quão maduro os compradores gostam de comprar seus tomates, pode-se então associar esse aspecto com conjuntos de modelos matemáticos que predizem quanto tempo será necessário até que eles cheguem a esse ponto de maturidade;
dessa forma, as quitandas poderão comprar tomates com a cor ideal de venda, segundo a visão de seus compradores [8].
Uma rede neural típica é constituída de uma camada de entrada de dados, uma camada de modificação desses dados chamada camada oculta ou escondida e uma camada de saída que são os resultados ou dados objetivos, como mostra a Figura 4. Cada camada é constituída de nódulos chamados de neurônios, nas quais ocorre a modificação dos dados segundo uma função de transferência com o campo de variação entre 0 e 1, no caso de se utilizar uma
função de ativação logística. A camada de entrada recebe as variáveis, podendo ser um neurônio para cada variável, e cada variável assume diversos valores diferentes. Todos os neurônios de uma camada estão interligados com todos neurônios da camada subseqüente. Cada uma dessas interligações possui um peso wi,j, que multiplica a saída do neurônio anterior para gerar a entrada do neurônio subseqüente.
Figura 4: Rede neural MLP
4. RESULTADOS
Inicialmente a arquitetura da rede neural foi configurada com 7 neurônios na camada de entrada, um para cada variável citada anteriormente e uma outra variável referente ao diâmetro equatorial do tomate, todos esse valores estão entre 0 e 1 devido a utilização da função de ativação logística na camada escondida da rede (os valores do diâmetro equatorial do tomate foram normalizados). Utilizou-se 15 neurônios na camada escondida e 2 neurônios na camada de saída. Para o aprendizado da rede foi usado o algoritmo resilient backpropagtion, o qual difere do backpropagation original por não considerar as magnitudes das derivadas parciais, utilizando apenas o sinal destas para fazer as atualizações dos pesos.
Para o conjunto de treinamento foram selecionadas 92 amostras e organizadas em uma matriz de 7x92, onde
cada coluna corresponde a uma observação. Foi montada uma matriz 2x92 contendo os valores de saída desejados, isto é, a codificação em binário da classe de cada observação (A=00, B=01, C=10 e D=11). O conjunto de teste foi organizado em uma matriz 7x10.
As respostas da rede apresentaram 80% de acertos para o conjunto de testes.
Decidiu-se, então, realizar um estudo sobre os dados de entrada e as respostas da rede observando-se as faixas de valores (intervalo entre o mínimo e máximo de cada variável) e concluiu-se:
Havia variáveis que não influenciavam na discriminação das classes ou contribuíam da mesma forma que outras (uma espécie de redundância)
O conjunto de treinamento não era suficientemente representativo, isto é, deixava a desejar quanto ao relacionamento tamanho-cor. Por exemplo, amostras que possuíam tamanho grande e cor vermelha e que deveriam ser classificadas como “A” estavam sendo classificadas como “B”, pois a rede não “conhecia” amostras grandes com aquela quantidade de vermelho.
Pretendo-se ter um melhor desempenho, foram eliminadas as variáveis que poderiam trazer problemas ou que não estavam contribuindo de forma desejável.
Os conjuntos de treinamento e de teste foram alterados para utilizar apenas essas duas variáveis coordenadas cromáticas “r e g”. Os tomates foram classificados como verdes ou maduros.
As classes agora são: M=0 e V=1.
A arquitetura da rede foi alterada para se adaptar aos novos conjuntos de dados.
A rede passou a ter 2 neurônios na camada de entrada, 5 neurônios na camada escondida e 1 na camada de saída
(rede_1). Os resultados obtiveram 100%
de acertos.
A idéia seguinte foi tentar classificar os frutos, já separados nas classes verde e maduro, em classes cuja variável
“diâmetro equatorial” fosse levada em conta. Assim, uma segunda rede neural foi construída para ser associada a saída da primeira (rede_2). Esta segunda rede possuía 2 neurônios na camada de entrada, 5 neurônios na camada escondida e 2 neurônios na camada de saída. Todas as características de aprendizado e parâmetros da rede descrita anteriormente foram mantidas para esta nova rede_1.
Uma descrição destas redes pode ser encontrada na figura 5.
r g
etro ial
0 - maduro 1 - verde [Entradas]
[Camada escondida]
[Camada de saída]
Figura 5: Representação gráfica da Rede_1 (a) e Rede_2 (b).
Para montar o conjunto de treinamento da rede_2 usou-se os valores
“0” para maduro e “1” para verde (obtidos no treinamento da rede_1) associados ao diâmetro equatorial correspondente de cada tomate, gerando uma matriz 2x92. Uma matriz 2x92 foi montada para o “target” correspondendo às classes A, B, C e D propostas originalmente.
O conjunto de teste para a rede_2 foi montado da mesma forma que o conjunto de treinamento, usando a saída da rede_1
0 0 - A 0 1 - B 1 0 - C 1 1 - D Diâm
equator a
b
e associando-se ao diâmetro equatorial correspondente. Os resultados da classificação obtiveram 100% de acerto.
6. CONCLUSÕES
Neste trabalho foi observado que há uma necessidade muito grande em se escolher cuidadosamente as variáveis, uma grande quantidade de variáveis não é garantia de um bom desempenho da rede.
O conjunto de treinamento deve possuir dados bem abrangentes que cubram todas as faixas de valores que cada classe possa assumir.
É necessário que se delimite quantitativamente e com certo grau de precisão onde termina e onde se inicia uma determinada classe, por exemplo, qual a faixa de valores permitida para a componente verde de um tomate considerado maduro por um especialista.
Para a classificação de frutos ser feita corretamente é necessário que existam padrões bem definidos e não confiar o treinamento da rede na simples percepção subjetiva das pessoas.
Para um próximo trabalho propõe- se realizar a classificação utilizando os padrões da agroindústria com a inclusão de análise de formas e conversão para um outro espaço de cores com menos distorções, como por exemplo o CIELAB. Propõe-se também a classificação do grau de defeitos do tomate.
BIBLIOGRAFIA
[1] TILLET, R.D.. Image analysis for agricultural processes: A review of potential opportunities. Journal Agriculture Engineering research (1991)50, 247-58.
[2] ANDREUCCETTI, Caroline;
FERREIRA, Marcos; TAVARES, Marcelo. Preferências e costumes dos consumidores de tomate de mesa em supermercados de Campinas-SP Fonte: Anais do 43º Congresso Brasileiro de Olericultura, CBO, Recife-PE, 2003.
[3] ANDREUCCETTI, Caroline;
FERREIRA, Marcos; TAVARES, Marcelo. Reclamações e exigências dos consumidores de tomate de mesa em supermercados de Campinas - SP Fonte: Anais do 43º Congresso Brasileiro de Olericultura, CBO, Recife-PE, 2003
[4] DING, K.; GUNASEKARAN, S..
Shape feature extraction and classification of food material using computer vision. Transactions of the ASAE 1994, vol.37(5):1537-1545.
[5] KONDO, N.. Quality evaluation of orange fruit using neural networks.
Food processing automation IV.
Proceedings of the EPAC IV conference 1995.
[6] NAKANO, K.. Application of neural networks to the color grading of apples. Computers and Electronics in Agriculture 18 (1997) 105-116.
[7] GHAZANFARI,A.; IRUDAYARAJ, J.; Kusalik, A.. Grading pistachio nuts using a neural network approach. Transactions of the ASAE 1996. Vol.39(6):2319-2324.
[8] THAI, C. N.; SHEWFELT, R. L.
Modeling sensory color quality of tomato and peach: neural networks and statistical regression.
Transactions of the ASAE, Saint Joseph v. 34, n. 3, p. 950-954, 1991.