• Nenhum resultado encontrado

6.5 Classi…cação e validação dos resultados dos modelos de previsão

6.5.2 Testes de hipóteses

Resultados preliminares dos nossos modelos de previsão apontam para acerto de tendência acima do que temos com um processo totalmente aleatório. Para justi…car isso, nesta seção, vamos fazer o teste de hipótese e analisar se estes resultados obtidos indicam que o modelo acerta mais a previsão de tendência do que uma moeda justa. O lançamento de uma moeda justa pode ser considerado um experimento binomial, sendo uma sequência de n lançamentos sucessivos com igual probabilidade p = 1=2 de obter cara ou coroa, a cada lançamento. Para um número grande de eventos, a distribuição amostral de p pode ser aproximada por uma distribuição normal de probabilidade. Segundo [21], o tamanho da amostra pode ser considerado grande sempre que n p 5ou n (1 p) 5. Baseados nesta a…rmação, podemos considerar que as amostras obtidas com os modelos de previsão são amostras binomiais e que os resultados de acerto ou erro podem ser aproximados por uma distribuição normal, uma vez que n = 4500 e assumindo que p varia em torno de 50%. Assumindo que podemos aproximar a amostra por uma distribuição de probabilidade normal, então,

^

p N (p; p(1 p)=n), (6.19) em que ^pé um estimador de p e p(1 p)=n) é a variância da amostra.

O teste de hipótese é provado por contradição. Para isso, temos que de…nir uma hipótese nula H0, a qual vamos assumir como sendo verdadeira, também de…nir uma hipótese alternativa Ha, que é a hipótese de pesquisa. A conclusão de que Ha é verdadeira pode ser feita se os dados da amostra indicam que a hipótese nula H0 pode ser rejeitada. Para a amostra obtida com os modelos podemos realizar o teste de hipótese da proporção de acertos bilateral, de forma que vamos assumir como hipótese nula H0 : ^p = 50% e

hipótese alternativa Ha : ^p 6= 50%. Isso signi…ca que assumimos como verdade que o modelo é um processo totalmente aleatório e que a sua taxa de acerto gira em torno de 50%. De…nindo a hipótese de pesquisa Ha : ^p6= 50%, signi…ca que queremos mostrar que os modelos diferem do processo aleatório. Para isso, de…nimos um nível de signi…cância , que é a probalidade de rejeitarmos H0 uma vez que H0 é verdadeira. Nos testes aplicados aos resultados obtidos com os modelos, vamos de…nir um nível de signi…cância = 0; 01 e = 0; 05 para evitar cometer o erro do tipo 16. Como o teste é bilateral, fazemos

=2para determinar os pontos críticos P c1 e P c2, que são as fronteira entre a região de aceitação e a região de rejeição. Com estes pontos críticos encontramos a região crítica Rc, que é de…nida como:

Rc =f^p2 Rj^p < P c1 ou ^p > P c2g. (6.20)

A …gura (6-1) mostra uma região crítica de uma teste de hipótese bilateral.

Figura 6-1: Região crítica para o teste de hipótese bilateal

Resumindo, os testes de hipótese seguem as etapas apresentadas no algoritmo (6.2).

Algorithm 6.2 Etapas do teste de hipótese

Determinar a hipótese nula H0 e a hipótese alternativa Ha; Especi…car o nível de signi…cância ;

Determinar os pontos críticos, consequentemente a região de rejeição; De…nir a amostra e o valor estimado ^p;

Concluir o teste analisando se ^p está na região de aceitação ou de rejeição.

Diante das amostras com os resultados obtidos com os modelos, vamos realizar o teste de hipótese para todas as proporções de acerto, com o objetivo de testar se podemos ou não rejeitar a hipótese de que o modelo tem uma taxa de acerto diferente de um processo totalmente aleatório. Os parâmetros que serão aplicados aos testes são os de…nidos ante- riormente, com H0 : ^p = 0:50, Ha : ^p6= 0:50, = 0; 01 ou = 0; 05 e ^p a taxa estimada de acerto para cada caso de previsão de tendência do modelo que está sendo analisado. Os resultados desses testes serão apresentados em tabelas em que cada uma de suas células contém a proporção de acerto dos modelos (PA), o ponto crítico (PC), que delimita a região de aceitação da região de rejeição, e a conclusão de se rejeita (R) ou não rejeita (RN) a hipótese H0. As proporções de acertos já foram apresentadas nas seções de resul- tados de desempenho dos modelos de previsão e serão repetidas, aqui, para comparação com o ponto crítico. Nesta seção, vamos apresentar os resultados dos testes de hipótese para o nível de signi…cância = 0; 05, os resultados para = 0; 01estão disponíveis para consulta no Apêndice C.

Os resultados dos testes para para a amostra completa quando avaliada a precisão total dos modelos, a acurácia, são apresentados na tabela (6.18). Em um balanço geral, as matrizes ótimas At e A(t) apresentaram melhores resultados. No modelo contínuo, utilizando a matriz ótima A(t) , todas as proporções de acerto do modelo estão na região crítica, de forma que podemos rejeitar a hipótese nula H0 de que o modelo tem uma taxa de acerto aleatória. Os resultados dos testes para avaliar o desempenho dos modelos para a previsão de tendência de alta e baixa, sensibilidade (Recall) e especi…cidade, são apresentados na tabela (6.19). Nesta análise, as matrizes ótimas At e A(t) também apresentaram maior número de rejeição da hipótese nula H0.

Para a amostra de dados que contém os maiores retornos em módulo previstos pelos modelos, os resultados dos testes de hipótese foram melhores quando comparados com os resultados da amostra completa. A tabela (6.20) mostra o resultados dos testes de hipótese

aplicados às taxas de acurácia dos modelos. O melhor desempenho foi do modelo contínuo utilizando a matriz ótima A(t) para a previsão de tendência das 3 ações. As hipóteses nulas H0 foram rejeitadas em todos os 3 casos. Na análise de desempenho do modelo para a classi…cação de tendência de alta, Recall, e na análise de classi…cação de tendência de baixa, especi…cidade, o modelo discreto e o contínuo apresentaram o mesmo número de rejeição de H0 quando utilizada as matrizes ótimas At e A(t) . Os resultados dos testes de hipótese são apresentados na tabela (6.21).

De maneira geral, podemos considerar que os modelos de previsão apresentam taxas de acerto superiores a um processo totalmente aleatório. Os melhores resultados foram obtidos utilizando as matrizes ótimas At e A(t) quando avaliada a taxa de acurácia dos modelos.

Documentos relacionados