CLASSIFICAÇÃO DE TOMATES UTILIZANDO REDES NEURAIS ARTIFICIAIS

(1)

CLASSIFICAÇÃO DE TOMATES UTILIZANDO REDES NEURAIS ARTIFICIAIS

LOURO, Antônio Henrique Figueira¹; MENDONÇA, Michelle Magalhães²; GONZAGA, Adilson³

Endereço: Av. Trabalhador São Carlense, 400 - Centro. Cep: 13566590 - São Carlos, SP - Brasil Tel: (16)33739326 Ramal: 9326 Fax: (16)33739372.

1ahfl63@hotmail.com, ²michelle2000ba@hotmail.com, ³agonzaga@sc.usp.br

RESUMO

Neste estudo, técnicas de processamento de imagens e redes neurais foram aplicadas para classificar tomates em quatro classes diferentes baseadas em seu tamanho e cor. Primeiro, imagens de 102 tomates pertencentes ao grupo saladete foram digitalizadas através de uma web-cam. Segundo, características de cor e forma foram extraídas de cada imagem e terceiro, essas características foram apresentadas a uma combinação de duas redes neurais.

1. INTRODUÇÃO

Nas linhas de controle de qualidade e classificação não automatizadas, as pessoas permanecem olhando o produto deslizar pela esteira, tentando retirar rapidamente os objetos que não estejam dentro dos padrões exigidos. Com o passar das horas, seus olhos cansam, suas mentes se distraem e conseqüentemente uma quantidade de produtos pode ser classificada incorretamente acarretando em prejuízos e desperdícios, com perdas tanto para indústria quanto para a sociedade.

Os sistemas de inspeção automáticos são controlados através de sensores eletrônicos, que muitas vezes simulam os nossos sentidos. Atualmente, existem várias aplicações em que são projetados e construídos sistemas de visão artificial com a finalidade de inspecionar os processos ou supervisionar os produtos finalizados.

A inspeção de frutos para a avaliação de sua qualidade é um campo de aplicação de grande interesse. Tillet

[1] destaca as vantagens que a visão artificial apresenta a esse respeito e, em geral, para a maioria dos produtos alimentícios devido a sua rapidez, confiabilidade e higiene.

Um sistema de visão computacional é composto por hardware e software. A parte que compõe o hardware pode incluir os seguintes componentes: sistema de iluminação, sistema de aquisição de imagens, sistema de processamento e sistema de atuação. A parte de software de um sistema de visão pode ser composta de: melhorias do sinal, segmentação, análise da forma, da cor e da textura e tomadas de decisão. Em todas essas fases, excetuando-se a de iluminação, é possível utilizar técnicas de redes neurais para implementá-las. Em [5] uma rede neural auxilia na classificação de laranjas; em [4] as redes neurais são usadas para classificação de alimentos; em [7] as redes neurais foram usadas para classificar nozes de pistache;

em [6] as redes neurais foram usadas para classificar maçãs.

(2)

2. MATERIAIS E MÉTODOS

Além das necessidades industriais pela inspeção automatizada, o mercado de frutas e legumes “in natura” para o consumidor comum também é carente de qualidade. Por exemplo, em [2] e [3] são mostrados resultados de uma pesquisa sobre a insatisfação do consumidor e suas exigências em relação a qualidade dos tomates, onde os seguintes fatos foram observados:

95,6% dos consumidores estavam insatisfeitos quanto à qualidade do tomate, apontando mais de um aspecto, sendo a presença de injúrias (incluindo cortes, furos e amassados) a principal causa do descontentamento, seguido do tomate manchado (aspecto amarelado, coloração não uniforme).

Os consumidores ressaltaram a preferência por tomate com coloração vermelha.

O tomate recebeu o mais alto índice de insatisfação comparado a outros 31 produtos, como por exemplo, alface e batata.

Na opinião dos consumidores um tomate ideal para consumo seria aquele que, de maneira geral, fosse: com coloração vermelha, uniforme, firme e sem presença de injúrias.

Sendo assim, o objetivo deste trabalho é constatar a possibilidade de se classificar tomates utilizando redes neurais artificiais e avaliar seu desempenho comparando as suas respostas com a opinião de um

“especialista”.

Os tomates utilizados neste estudo foram obtidos no supermercado Doto, localizado na região de São Carlo-SP.

Através do sitio de internet

www.agr.unicamp.br/tomates constatou- se que as amostras colhidas pertenciam ao grupo dos saladetes. A figura 1 apresenta amostras desse grupo.

Figura 1 – Amostra de tomates do grupo saladete em diferentes fases de

maturação.

As amostras colhidas possuíam cores e tamanhos diferentes, as mesmas foram lavadas e organizadas em quatro classes diferentes, são elas:

Classe A - tomate maduro e graúdo (acima de 7 cm de diâmetro equatorial) e completamente vermelho sem qualquer mancha verde.

Classe B – tomate apresentando as mesmas características de cor da classe A, porém com tamanho inferior a 7 cm.

Classe C – tomate apresentando qualquer mancha esverdeada e possuindo tamanho acima de 7 cm.

Classe D - tomate apresentando as mesmas características de cor da classe C, porém com tamanho inferior a 7 cm.

Os 102 tomates obtidos foram digitalizados usando-se uma Logitech QuickCam Express-USB. Para a obtenção das imagens foi utilizado um modulo de aquisição de imagens da USP o qual é constituída de uma câmara de iluminação difusa que consegue reduzir ao máximo os reflexos indesejados sobre o objeto. A

(3)

figura 2 mostra esse aparato, que facilitou bastante a fase de segmentação das imagens.

Vale a pena ressaltar que inicialmente, como recomendado na maioria dos livros e artigos lidos sobre visão computacional, foi usado um fundo negro, o qual não se mostrou adequado. A substituição por um fundo branco facilitou de forma substancial a fase de segmentação para esse tipo de amostra.

2.1 Extração de características

O fluxograma a seguir apresenta os passos utilizados na extração das características. Ao final desse processamento obteve-se 6 variáveis normalizadas: pixels médios (Rm, Gm, Bm), coordenadas cromáticas r, g ,b. A coordenada cromática do vermelho é calculada com a equação (1).

Figura 2 – Módulo de iluminação/aquisição de imagens.

A mesma equação é usada para o verde e o azul, bastando substituir o numerador. O pixel médio Rm é calculado com a equação (2). A mesma equação é usada para calcular Gm e Bm.

Em ambas as equações o valor N é o total de pixels da imagem.

Figura 3 – Imagem adquirida.

∑ ∑ ∑

∑

= = =

=

+ +

= _N

i

N

i

N

i i i

i N

i i

B G

R

R r

1 1 1

1 (1)

255 / ) ( ¹

N R Rm

N

i

∑

i

= = (2)

(4)

3.2 Redes Neurais Artificiais (RNAs) Geralmente a classificação de frutos e a aplicação de RNAs estão relacionadas à maturidade de frutos. Se uma rede neural pode imitar exatamente quão maduro os compradores gostam de comprar seus tomates, pode-se então associar esse aspecto com conjuntos de modelos matemáticos que predizem quanto tempo será necessário até que eles cheguem a esse ponto de maturidade;

dessa forma, as quitandas poderão comprar tomates com a cor ideal de venda, segundo a visão de seus compradores [8].

Uma rede neural típica é constituída de uma camada de entrada de dados, uma camada de modificação desses dados chamada camada oculta ou escondida e uma camada de saída que são os resultados ou dados objetivos, como mostra a Figura 4. Cada camada é constituída de nódulos chamados de neurônios, nas quais ocorre a modificação dos dados segundo uma função de transferência com o campo de variação entre 0 e 1, no caso de se utilizar uma

função de ativação logística. A camada de entrada recebe as variáveis, podendo ser um neurônio para cada variável, e cada variável assume diversos valores diferentes. Todos os neurônios de uma camada estão interligados com todos neurônios da camada subseqüente. Cada uma dessas interligações possui um peso wi,j, que multiplica a saída do neurônio anterior para gerar a entrada do neurônio subseqüente.

Figura 4: Rede neural MLP

4. RESULTADOS

Inicialmente a arquitetura da rede neural foi configurada com 7 neurônios na camada de entrada, um para cada variável citada anteriormente e uma outra variável referente ao diâmetro equatorial do tomate, todos esse valores estão entre 0 e 1 devido a utilização da função de ativação logística na camada escondida da rede (os valores do diâmetro equatorial do tomate foram normalizados). Utilizou-se 15 neurônios na camada escondida e 2 neurônios na camada de saída. Para o aprendizado da rede foi usado o algoritmo resilient backpropagtion, o qual difere do backpropagation original por não considerar as magnitudes das derivadas parciais, utilizando apenas o sinal destas para fazer as atualizações dos pesos.

Para o conjunto de treinamento foram selecionadas 92 amostras e organizadas em uma matriz de 7x92, onde

(5)

cada coluna corresponde a uma observação. Foi montada uma matriz 2x92 contendo os valores de saída desejados, isto é, a codificação em binário da classe de cada observação (A=00, B=01, C=10 e D=11). O conjunto de teste foi organizado em uma matriz 7x10.

As respostas da rede apresentaram 80% de acertos para o conjunto de testes.

Decidiu-se, então, realizar um estudo sobre os dados de entrada e as respostas da rede observando-se as faixas de valores (intervalo entre o mínimo e máximo de cada variável) e concluiu-se:

Havia variáveis que não influenciavam na discriminação das classes ou contribuíam da mesma forma que outras (uma espécie de redundância)

O conjunto de treinamento não era suficientemente representativo, isto é, deixava a desejar quanto ao relacionamento tamanho-cor. Por exemplo, amostras que possuíam tamanho grande e cor vermelha e que deveriam ser classificadas como “A” estavam sendo classificadas como “B”, pois a rede não “conhecia” amostras grandes com aquela quantidade de vermelho.

Pretendo-se ter um melhor desempenho, foram eliminadas as variáveis que poderiam trazer problemas ou que não estavam contribuindo de forma desejável.

Os conjuntos de treinamento e de teste foram alterados para utilizar apenas essas duas variáveis coordenadas cromáticas “r e g”. Os tomates foram classificados como verdes ou maduros.

As classes agora são: M=0 e V=1.

A arquitetura da rede foi alterada para se adaptar aos novos conjuntos de dados.

A rede passou a ter 2 neurônios na camada de entrada, 5 neurônios na camada escondida e 1 na camada de saída

(rede_1). Os resultados obtiveram 100%

de acertos.

A idéia seguinte foi tentar classificar os frutos, já separados nas classes verde e maduro, em classes cuja variável

“diâmetro equatorial” fosse levada em conta. Assim, uma segunda rede neural foi construída para ser associada a saída da primeira (rede_2). Esta segunda rede possuía 2 neurônios na camada de entrada, 5 neurônios na camada escondida e 2 neurônios na camada de saída. Todas as características de aprendizado e parâmetros da rede descrita anteriormente foram mantidas para esta nova rede_1.

Uma descrição destas redes pode ser encontrada na figura 5.

r g

etro ial

0 - maduro 1 - verde [Entradas]

[Camada escondida]

[Camada de saída]

Figura 5: Representação gráfica da Rede_1 (a) e Rede_2 (b).

Para montar o conjunto de treinamento da rede_2 usou-se os valores

“0” para maduro e “1” para verde (obtidos no treinamento da rede_1) associados ao diâmetro equatorial correspondente de cada tomate, gerando uma matriz 2x92. Uma matriz 2x92 foi montada para o “target” correspondendo às classes A, B, C e D propostas originalmente.

O conjunto de teste para a rede_2 foi montado da mesma forma que o conjunto de treinamento, usando a saída da rede_1

0 0 - A 0 1 - B 1 0 - C 1 1 - D Diâm

equator a

b

(6)

e associando-se ao diâmetro equatorial correspondente. Os resultados da classificação obtiveram 100% de acerto.

6. CONCLUSÕES

Neste trabalho foi observado que há uma necessidade muito grande em se escolher cuidadosamente as variáveis, uma grande quantidade de variáveis não é garantia de um bom desempenho da rede.

O conjunto de treinamento deve possuir dados bem abrangentes que cubram todas as faixas de valores que cada classe possa assumir.

É necessário que se delimite quantitativamente e com certo grau de precisão onde termina e onde se inicia uma determinada classe, por exemplo, qual a faixa de valores permitida para a componente verde de um tomate considerado maduro por um especialista.

Para a classificação de frutos ser feita corretamente é necessário que existam padrões bem definidos e não confiar o treinamento da rede na simples percepção subjetiva das pessoas.

Para um próximo trabalho propõe- se realizar a classificação utilizando os padrões da agroindústria com a inclusão de análise de formas e conversão para um outro espaço de cores com menos distorções, como por exemplo o CIELAB. Propõe-se também a classificação do grau de defeitos do tomate.

BIBLIOGRAFIA

[1] TILLET, R.D.. Image analysis for agricultural processes: A review of potential opportunities. Journal Agriculture Engineering research (1991)50, 247-58.

[2] ANDREUCCETTI, Caroline;

FERREIRA, Marcos; TAVARES, Marcelo. Preferências e costumes dos consumidores de tomate de mesa em supermercados de Campinas-SP Fonte: Anais do 43º Congresso Brasileiro de Olericultura, CBO, Recife-PE, 2003.

[3] ANDREUCCETTI, Caroline;

FERREIRA, Marcos; TAVARES, Marcelo. Reclamações e exigências dos consumidores de tomate de mesa em supermercados de Campinas - SP Fonte: Anais do 43º Congresso Brasileiro de Olericultura, CBO, Recife-PE, 2003

[4] DING, K.; GUNASEKARAN, S..

Shape feature extraction and classification of food material using computer vision. Transactions of the ASAE 1994, vol.37(5):1537-1545.

[5] KONDO, N.. Quality evaluation of orange fruit using neural networks.

Food processing automation IV.

Proceedings of the EPAC IV conference 1995.

[6] NAKANO, K.. Application of neural networks to the color grading of apples. Computers and Electronics in Agriculture 18 (1997) 105-116.

[7] GHAZANFARI,A.; IRUDAYARAJ, J.; Kusalik, A.. Grading pistachio nuts using a neural network approach. Transactions of the ASAE 1996. Vol.39(6):2319-2324.

[8] THAI, C. N.; SHEWFELT, R. L.

Modeling sensory color quality of tomato and peach: neural networks and statistical regression.

Transactions of the ASAE, Saint Joseph v. 34, n. 3, p. 950-954, 1991.