• Nenhum resultado encontrado

Casos de utilização do sistema de servidor 68

4   Análise de Tripletos de Codões e de Aminoácidos 65

4.2   Análise de requisitos 66

4.2.2   Casos de utilização do sistema de servidor 68

Os dados a utilizar na aplicação dizem respeito apenas a orfeomas, pelo que requer à partida, a aplicação de regras de validação dos genes em estudo. Nesse sentido, deverão ser excluídos da análise de codões que vier a ser efectuada, os genes que verificam uma das seguintes condições e pela ordem indicada:

 Não iniciados por ATG.

 Comprimento do gene não é múltiplo de 3.

 Não termina com TAA ou TAG ou TGA (codões de STOP).  Contém TAA ou TAG ou TGA sem ser no fim do gene.  Contém nucleótidos desconhecidos, indicados pela letra N.

É um requisito fundamental que os algoritmos de análise de tripletos de codões e de respectivos aminoácidos em cada organismo, efectuem essa filtragem à partida, no momento de leitura do ficheiro, e que exiba no final o número de genes analisados, o número de genes considerados válidos e o nº de genes que foram ignorados, devendo mostrar nesse caso, as condições pelas quais foram excluídos. Essas condições fazem parte

69

da definição dos requisitos, sendo portanto incluídas na especificação dos casos de utilização principais (Figura 4.1).

Figura 4.1: Diagrama de casos de utilização da componente executável (backoffice)

De forma a ilustrar a interacção entre o utilizador do sistema e as funcionalidades, a Figura 4.1 mostra o diagrama de casos de utilização em UML (Unified Modelling Language). O actor “Utilizador/administrador” neste diagrama representa um tipo de utilizador único do sistema. Sendo esta componente executada na vertente servidor, o utilizador é

Utilizador/administrador

Contagem de tripletos de codões

Contagem de tripletos de aminoácidos

Modificar relação entre codões e aminoácidos <<extend>>

Procurar cadeia máxima de codões

Procurar Cadeias maximas de aminoácidos Converter codões para aminoácidos <<include>> <<include>> <<extend>> Normalizar frequência

relativa dos codões <<extend>> Gerar relatório de processamento <<include>> <<include>> Normalizar frequência relativa aminoácidos <<extend>> Calcular as ocorrências de codões iguais agrupadas pelo

número obtido

Calcular as ocorrências de aminoácidos iguais agrupadas

70

simultaneamente um administrador do sistema pelo que não há necessidade de definir requisitos ao nível da segurança, para além dos requisitos assegurados pelo sistema operativo.

O utilizador neste sistema começa por importar dados no formato FASTA, exclusivamente orfeomas, uma vez que a conversão para aminoácidos deverá ser efectuada internamente. Futuramente poderão ser considerados outros formatos de dados, devendo detectar automaticamente se o utilizador está a trabalhar com as bases azotadas de DNA (A, C. T, G) ou com as bases de RNA (A, C, U, G).

Após a importação do ficheiro de dados, o processamento deve contemplar uma ou mais opções indicadas pelos casos de utilização principais: “Contagem de tripletos de codões”, “Contagem de tripletos de aminoácidos”, “Procurar cadeia máxima de codões”, “Procurar cadeia máxima de aminoácidos”, “Calcular as ocorrências de codões iguais agrupadas pelo número obtido” e/ou “Calcular as ocorrências de aminoácidos iguais agrupadas pelo número obtido”.

O caso de utilização “Contagem de tripletos de codões” efectua a análise completa do orfeoma contando cada ocorrência do tripleto de codões com deslocamento de três nucleótidos. Poderá invocar o caso de utilização “Normalizar frequência relativa dos codões”, nesse caso o resultado das contagens deverá vir acompanhado dos resultados estatísticos, nomeadamente a frequência relativa, os valores esperados para cada tripleto, entre outros.

A invocação do caso de utilização “Contagem de tripletos de aminoácidos” em tudo é idêntica, no entanto carece da invocação prévia do caso de utilização “Converter codões para aminoácidos” e em determinadas situações, da inclusão do caso de utilização “Modificar relação entre codões e aminoácidos”, de forma a evitar enviesamentos nos resultados. Atendendo ao facto de que para alguns organismos como por exemplo Candida

albicans e Debaryomyces hansenii, o codão CTG/CUG, que normalmente codifica o

aminoácido Leucina, nestes organismos codifica o aminoácido Serina [135-136], a inclusão do caso de utilização “Modificar relação entre codões e aminoácidos” permite manualmente ajustar a associação entre codões e aminoácidos. Pretende-se dessa forma

71

prevenir efeitos de propagação de erro, quer nesses casos, quer noutros casos que se venham a verificar posteriormente.

Diversos organismos possuem no seu orfeoma sequências repetidas do mesmo codão, pelo que em qualquer um dos casos de utilização principais descritos anteriormente, o sistema deve possibilitar ao utilizador a opção de ignorar ou não essas repetições excluindo-as das contagens e dos restantes cálculos.

De forma a obter-se informação adicional sobre o resultado do processamento, nomeadamente os genes que são excluídos, o sistema contempla a inclusão do caso de utilização “Gerar relatório de processamento” que deverá reportar gene a gene, entre outras situações, a ocorrência de erros, a exclusão de sequências de repetição superior a 3 codões/aminoácidos, motivos de rejeição de genes e a localização das sequências repetidas. Os casos de utilização “Procurar cadeia máxima de codões” e “Procurar cadeia máxima de aminoácidos”, são invocados sempre que se pretende encontrar para cada codão e para cada aminoácido respectivamente, a maior sequência repetida no orfeoma.

Por fim, os casos de utilização “Calcular as ocorrências de codões iguais agrupadas pelo número obtido” e “Calcular as ocorrências de aminoácidos iguais agrupadas pelo número obtido”, permitem ao utilizador obter informação adicional sobre as ocorrências de codões

e aminoácidos respectivamente, em que estes surgem isoladamente ou agrupadas de 2..n,

ou seja, o número de vezes que determinado codão/aminoácido aparece em dupletos,

tripletos, quádruplos, até n-uplos, em que n representa o comprimento da maior sequência

repetida.

O processo de gravação de dados está implícito nos casos de utilização principais, uma vez que, dado o volume de informação resultante do processamento, não será possível manter os dados de outra forma. Para esse efeito, o sistema deve incluir essa funcionalidade num processo automático, para que o utilizador apenas necessite carregar o ficheiro do orfeoma, seleccionar de seguida os algoritmos que pretende que sejam executados e proceder à ordem de execução. A informação resultante, deverá estar num formato legível e facilmente importável para outras aplicações, nomeadamente bases de dados e folhas de cálculo.

72