• Nenhum resultado encontrado

MÉTODOS PARA ESTIMAÇÃO DE INTERVALOS DE CONFIANÇA EM REDES NEURAIS ARTIFICIAIS

υ  campo local induzido no neurônio k.

3.4 MÉTODOS PARA ESTIMAÇÃO DE INTERVALOS DE CONFIANÇA EM REDES NEURAIS ARTIFICIAIS

Mesmo que uma RNA tenha convergido de modo correto e esteja apresentando valores com erros mínimos, na prática fica impossível se conhecer o erro final apresentado pelo modelo neural. O reconhecimen- to desse fato levou ao desenvolvimento de métodos para estimação de intervalos de confiança (IC). Até a presente data, muitos métodos foram desenvolvidos para estimar esses intervalos. No entanto, eles não satis-

fazem as necessidades metrológicas e não são aceitos segundo os precei- tos de avaliação da incerteza de medição.

Os métodos foram concebidos com o intuito de prover confiabili- dade aos modelos neurais e geralmente dependem do tipo de arquitetura da RNA (NETO, 2012). Os trabalhos de Chryssolouris (1996), seguido de Hwang (1997) e deVeaux (1998) são até os dias atuais referências seguidamente citadas pelos mais diferentes autores. Estes estabeleceram abordagens para a estimativa do IC, assumindo que os erros apresenta- dos são normalmente distribuídos e independentes. Os autores utilizam técnicas de estimação de IC aplicadas em regressões não lineares e asso- ciaram a informação de que os modelos foram obtidos a partir de dados contaminados por ruídos aleatórios. Através da equação (18) Chryssolouris (1996) estabelece um método de como obter o IC para o resultado de uma rede neural.

IC = ±tF9G|I/s+ (s+ s)fL(FLF)9f0 N (18)

Onde:

tF9G|I fator t-student com n − p graus de liberdade e nível de confiança I; n número de padrões utilizados no

treinamento;

p número de parâmetros da RNA (pe- sos e bias);

s estimador não tendencioso do erro

referente ao modelo causado pelas variáveis não observáveis ou não controláveis;

s estimador dos erros aleatórios de

medição presentes nas entradas da rede;

f vetor de derivadas da função apren-

dida pela rede em relação a cada parâmetro da rede para cada nova entrada;

F matriz jacobiana - x Q da função aprendida pela rede.

Em contraste ao método de determinação de IC apresentado por Chryssolouris (1996), outros propõem estimar a variabilidade dos dados de treinamento a partir do próprio treinamento do modelo neural. Outra diferença marcante é que esses métodos não consideram constante a variabilidade dos dados, o que permite valores diferentes de IC ao longo da função de saída da RNA (ZAPRANIS, 2005). Papadopoulos (2001) compara três desses principais métodos no intuito de mostrar qual o mais adequado a uma aplicação industrial específica. Os métodos testa- dos obtêm um IC através de um estimador de variância associado a cada valor de saída durante uso do modelo neural. Espera-se que este estima- dor possa então representar a variabilidade dos dados utilizados durante a fase de treinamento. Os seguintes métodos são apresentados:

• treinamento via máxima verossimilhança, que estabelece a criação de uma rede aumentada conforme apresentado na figura 10, a qual tem o objetivo de se obter um estima- dor de variância que represente a variabilidade dos dados utilizados durante a aprendizado da RNA. O treinamento das duas redes é realizado conjuntamente através de uma função que engloba todos os parâmetros;

• treinamento bayesiano aproximado, que também faz uso de uma rede aumentada como apresentado na figura 10, porém realiza o treinamento das duas redes separadamen- te;

método bootstrap, que parte da criação de um comitê de RNA, onde um selecionado de k redes, com a mesma con- figuração, é obtido através da reamostragem com reposi- ção dos dados do conjunto de treinamento. Assim, a cada nova aprendizagem, um conjunto de n elementos é esco- lhido aleatoriamente de uma base de dados de treinamento de N elementos. Nesse caso, o resultado do modelo é dado pela média aritmética simples das saídas das redes que formam o comitê, e a variância é o estimador da variabili- dade, o qual é usado para a obtenção do IC.

FIGURA 10: REDE AUMENTADA (PAPADOPOULOS,2001)

Os métodos apresentados mostram o interesse dos autores em es- tabelecer meios que possam fornecer confiabilidade aos modelos neurais treinados a partir de dados contaminados. Porém, todos os métodos se preocupam exclusivamente com os erros aleatórios. No entanto, em muitas situações práticas de medição, os erros sistemáticos podem ter maior influência do que os erros aleatórios.

Na verdade, tanto o erro aleatório quanto o erro sistemático estão presentes em uma medição, e a dúvida em relação ao resultado sempre irá existir. Cabe aqui relatar que a IM é uma medida de dúvida e não corresponde à variabilidade dos dados. Assim, em casos onde a dúvida referente ao erro sistemático for maior que à do erro aleatório, os méto- dos apresentados não irão fornecer um IC adequado.

Outra situação metrológica não abordada pelos métodos apresen- tados para a determinação dos IC, é que os mesmos não se preocupam com as IM dos instrumentos durante o uso das RNA. Eles consideram que os dados obtidos durante o uso permanecerão com a mesma variabi- lidade daqueles coletados durante a fase de treinamento. Tal considera- ção foge aos preceitos da avaliação da IM, pois os instrumentos de me- dição utilizados durante a fase de treinamento podem não ser os mesmos que aqueles utilizados durante o uso das RNA.

O capítulo 3 apresentou: como as RNA são estruturadas e como se dá o aprendizado das mesmas; um meio para a minimização dos erros aleatórios provenientes do treinamento; métodos conceituados para estimar intervalos de confiança.

Em relação às RNA no âmbito deste trabalho pode se concluir que: • os métodos encontrados na literatura para estimar interva-

los de confiança de resultados de redes neurais artificiais não satisfazem os preceitos metrológicos vigentes; • até o presente não foi encontrado na literatura um método

que seja capaz de considerar as incertezas das medições do conjunto de treinamento.

4 PROPOSTA DE ENSAIO PARA ESTIMAR A