• Nenhum resultado encontrado

APLICAÇÃO DO MÉTODO BOOTSTRAP NO TREINAMENTO DE REDES NEURAIS ARTIFICIAIS

R constante universal dos gases; [J.K 1 mol 1 ];

5 PROPOSTA DE MÉTODO METROLOGICAMENTE EMBASADO PARA EXPRESSÃO DA INCERTEZA NA

5.2 APLICAÇÃO DO MÉTODO BOOTSTRAP NO TREINAMENTO DE REDES NEURAIS ARTIFICIAIS

O item 5.1 mostrou que o método para propagar as incertezas pode ser utilizado para fornecer um valor de incerteza na saída do modelo neural. No entanto, como exemplificado na tabela 3, a simples aplicação desse método considera somente uma pequena parte das fontes de erros que podem estar presentes em processos metrológicos envolvendo RNA. Por outro lado, existem métodos tradicionais para estimar interva- los de confiança em redes neurais, como mostrado no item 3.4 (página

72). Entre eles será destacado nesta tese o método bootstrap, por ser uma técnica bastante popular na estimação de intervalos de confiança em redes neurais (BRABANTER, 2011), por utilizar um comitê de RNA, o que minimiza os erros devido ao processo de treinamento au- mentando a robustez do modelo neural (AHMAD, 2002) e por ir ao encontro da solução proposta neste trabalho17

.

O método bootstrap estabelece valores para os IC18 através de um comitê de RNA, onde os exemplos de treinamento são escolhidos alea- toriamente de um mesmo banco de dados. Para esse método, a reamos- tragem possibilita que cada rede, que compõe o comitê, apresente um resultado diferente. Isso ocorre, pois os exemplos utilizados no treina- mento, para cada uma das k RNA, possuem n dados, os quais são obti- dos a partir de um conjunto de N elementos. Como a reamostragem é feita aleatoriamente com reposição, certamente dentro de um conjunto de n elementos existirão alguns dados repetidos e outros que não apare- cerão, formando assim k conjuntos de treinamentos diferentes. Espera-se então que essa escolha aleatória imprima no comitê a variabilidade dos dados contida na base de conhecimento de tamanho N. Vale lembrar que no processo de treinamento das RNA é comum que o conjunto inicial de pesos atribuídos a cada neurônio seja escolhido aleatoriamente e, assim, não há garantia de que o processo de otimização dos pesos atinja a mesma solução em cada treinamento. Esses fatos implicam que redes treinadas com os mesmos dados apresentem resultados distintos. A vari- abilidade desses resultados é então utilizada para estabelecer o IC e é capaz de considerar os erros aleatórios dos dados do conjunto de treina- mento, os erros devido ao processo de otimização e aqueles devido a incompletude dos dados do conjunto de treinamento (ALLENDE, 2004; PAPADOPOULOS, 2001), como exemplificado pela tabela 4.

Como o método bootstrap não faz qualquer tratativa em relação aos dados que serão inseridos no modelo neural após a rede treinada, em termos metrológicos, ele não é capaz de considerar os erros dos dados durante o uso do modelo neural. Logo, em termos gerais, a reamostra- gem obtida pelo método bootstrap possibilita considerar somente os

17

Dentre os métodos apresentados para estimar IC em RNA, será dado destaque ao método

bootstrap, que é utilizado neste trabalho, em conjunto com outra técnica, para elaborar um

novo método capaz de expressar a I-If de modo mais confiável do ponto de vista metrológico. 18

Para os métodos tradicionais, encontrados na literatura, para expressar a dúvida a cerca do resultado de uma RNA, será utilizado o termo intervalo de confiança (IC) e não o termo incer- teza da inferência (I-If), por essa ser a nomenclatura usualmente utilizada nos trabalhos que fazem uso desses métodos.

erros devido ao processo de aprendizagem e a variabilidade dos dados do conjunto de treinamento.

TABELA 4: ERROS CONSIDERADOS PELO MÉTODO BOOTSTRAP

erro aleatório erro sistemático não compensado dados de medições

treinamento da RNA

exemplos de entrada considera não considera

exemplos de saída considera não considera

uso da RNA

dados de entrada não considera não considera aprendizagem

processo de otimização considera não se aplica incompletude dos dados

de treinamento não se aplica considera

Outro fato relevante sobre essa técnica utilizada para estimar IC, é que erros sistemáticos não compensados durante as medições não são considerados. Assim, quando esses erros forem significativos, o método

bootstrap não será capaz de apresentar IC condizentes do ponto de vista

metrológico. No entanto, a dúvida sobre cada uma das medições utiliza- das na aprendizagem ainda existe e, metrologicamente, os erros sistemá- ticos não compensados encontram-se dentro dela. Vale lembrar, que os demais métodos apresentados no item 3.4, que são aqueles frequente- mente citados na literatura especializada (PENZ, 2011), também não consideram esses erros sistemáticos não compensados em uma medição. Tais métodos focam exclusivamente na variabilidade dos dados do con- junto de treinamento para considerar os erros de medições.

No exemplo apresentado no apêndice E, é exposta uma situação onde os dados de medição utilizados no treinamento e no uso do modelo neural possuem erros sistemáticos não compensados e que são significa- tivos. Para esse exemplo, o método bootstrap não apresentou IC capazes de considerar tais erros, fornecendo um resultado final incompatível com o que seria esperado do ponto de vista metrológico.

De modo semelhante, o apêndice E mostra que mesmo utilizando o método bootstrap e considerando as incertezas dos dados de medição presentes nas entradas do modelo neural, também não é possível consi- derar todas as fontes de erros que podem ser significativas na busca da I-If.

Metrologicamente, o meio para considerar os erros não compensa- dos é através da IM. Porém, até o presente momento, não foi encontrada na literatura uma solução que estime I-If, em RNA, e empregue o con- ceito de avaliação da IM para considerar todas as fontes de erro que podem ser significativas. Tal constatação levou o autor a desenvolver meios para expressar o valor da incerteza da inferência e que seja metro- logicamente mais confiável do que aqueles obtidos pelos métodos dis- poníveis na literatura.

5.3 APLICAÇÃO DO MÉTODO DE MONTE CARLO NO