4. METODOLOGIA
4.4 Algoritmos propostos para detecção do cromossomo
Apesar de que a utilização de um só método possa trazer resultados interessantes, principalmente em relação ao método da rosa-dos-ventos com níveis de cinza que alcançou cerca de 89% de acertos (ver capítulo 5), decidiu-se por verificar os resultados obtidos ao tentar utilizar o melhor de cada método. Ou seja, cada método pode apresentar taxa de acertos melhores que os outros dependendo do comprimento dos cromossomos, portanto, o comprimento do cromossomo é utilizado como critério para a elaboração dos novos algoritmos. Estes algoritmos serão apresentados nas seções seguintes.
4.4.1 Primeiro algoritmo proposto para detecção do centrômero
O primeiro algoritmo proposto para detecção do centrômero irá aplicar, de acordo com o comprimento relativo do cromossomo, um dos cinco métodos de detecção descritos anteriormente. Nos testes executados para definição de qual método será aplicado como padrão em determinado comprimento de cromossomo, é verificado com qual dos cinco se obtém maiores acertos para aquele comprimento de cromossomo, e assim, o método que apresentar maiores acertos é tomando este método como fixo para aquele comprimento.
Desta forma, após a determinação dos métodos, o algoritmo funcionará de acordo com o fluxograma da Figura 4.7, que apresenta de forma simplificada o funcionamento deste algoritmo. Primeiramente é lido o comprimento do cromossomo de determinada imagem, e em seguida verifica qual algoritmo deve ser aplicado para aquele comprimento de
66
cromossomo, e por fim, de acordo com a posição encontrada por determinado método, é definida a classificação de acordo como o centrômero. No anexo C a Tabela 7.3 mostra qual método foi utilizado para determinado comprimento, sendo que os índices correspondentes a cada método são apresentados na Tabela 4.9.
Figura 4.7 – Fluxograma simplificado do funcionamento do primeiro algoritmo proposto.
4.4.2 Segundo algoritmo proposto para detecção do cromossomo
Uma variação o primeiro algoritmo foi criada na tentativa de se buscar por melhores resultados. A idéia do segundo algoritmo é a aplicação de vários métodos para determinado comprimento de cromossomos, diferente do primeiro que aplica somente um dos métodos para determinado comprimento.
Para determinar quais métodos serão e quais não serão aplicados em determinado comprimento de cromossomo, novamente foram realizados testes na forma de um treinamento
67
para o sistema, verificando qual a melhor combinação de métodos deve ser utilizada para determinado comprimento. A definição das combinações de métodos aplicadas a cada comprimento é feita a partir dos seguintes passos: primeiramente classificam-se todos os cromossomos de acordo com todos os 5 métodos, e em seguida armazena-se o resultado em memória, para que não seja necessário executar os métodos toda a vez que se testar uma nova combinação. Além disso, define-se um índice para cada um dos 5 métodos, conforme mostra a Tabela 4.9.
Tabela 4.9: Índices dos métodos
Índice Método
1 Linha perpendicular com níveis de cinza 2 Rosa-dos-ventos com níveis de cinza
3 Rosa-dos-ventos com níveis de cinza por comprimento 4 Rosa-dos-ventos com níveis de cinza refletido
5 Rosa-dos-ventos com níveis de cinza médio
Com a definição dos índices, inicia-se a segunda etapa, em que se verificam, para cada comprimento relativo dos cromossomo, todas as combinações possíveis de métodos, se eles serão utilizados ou não para determinado comprimento. Ou seja, para cada comprimento relativo de 0 a 100, testam-se todas as combinações possíveis de métodos. Como são cinco métodos, cada um pode assumir dois valores: ser utilizado naquele determinado comprimento (1) ou não (0). Desta forma, para cada comprimento, existem (2^5)-1 combinações, totalizando 31. Nota-se que o total de combinações não é 32, pois não se considera a combinação em que nenhum método é aplicado.
Para representar as combinações, pode-se utilizar tanto um valor inteiro de 1 a 31 como uma string de 0’s e 1’s. Por exemplo, se após testar todas as combinações para cromossomos de comprimento relativo 60 definiu-se que o melhor é utilizar o método da linha perpendicular com níveis de cinza (índice 1), método da rosa-dos-ventos com níveis de cinza (índice 3) e o método da rosa-dos-ventos com níveis de cinza refletido (índice 5), sua combinação pode ser expressa tanto pela string binária 10101 quanto pelo valor que ela representa, no caso 21. Na string binária, a posição dos valores 0’s e 1’s indica se o método
68
será aplicado ou não, conforme pode ser visto na Figura 4.8. A combinação definida nos testes para determinado comprimento relativo é então utilizada, após a etapa de treinamento, em todos os cromossomos do mesmo comprimento.
Figura 4.8: Exemplo de combinação de métodos utilizados em cromossomos de comprimento 60.
Para determinar como um cromossomo será classificado de acordo com certa combinação, tem-se o seguinte exemplo: supondo-se que para um cromossomo k qualquer de comprimento 60 a classificação do mesmo se dará pelas classificações feitas pelos métodos 1, 3 e 5. Ao executar estes métodos sobre a imagem do cromossomo k ele é classificado da seguinte forma:
Método 1 - Método da linha perpendicular com níveis de cinza – metacêntrico;
Método 3 - Método da rosa-dos-ventos com níveis de cinza – submetacêntrico;
Método 5 - Método da rosa-dos-ventos com níveis de cinza refletido – metacêntrico; Como se pode ver acima nas as classificações dadas por cada método ao cromossomo
k, ele será classificado como metacêntrico, pois este ocorre em maior quantidade. Nos testes
para definição das combinações utilizam-se os mesmos critérios, verificando qual combinação traz a maior taxa de acertos para cada comprimento de cromossomo. O funcionamento do algoritmo é semelhante ao apresentado pelo fluxograma da Figura 4.6, sendo que a diferença é que ao invés de aplicar somente 1 algoritmo, são verificados quais dos 5 algoritmos serão aplicados. As combinações de algoritmos utilizadas em cada comprimento de cromossomo são apresentadas no anexo D na Tabela 7.4.
69
A seção seguinte tem como objetivo uma análise dos resultados relacionados à detecção do centrômero, bem como uma discussão sobre a grande quantidade de testes realizados para se obter esta taxa de acertos.