AJUSTAMENTO DOS MODELOS MATEMÁTICOS

3. MODELOS MATEMÁTICOS

3.3. AJUSTAMENTO DOS MODELOS MATEMÁTICOS

Os modelos matemáticos, para a modelagem das PRCs, foram descritos na seção 3.2. Estes modelos foram ajustados pelo Método dos Mínimos Quadrados (MMQ). Optou-se por usar o método paramétrico de ajustamento. A escolha deste método recaiu no fato de que se busca determinar os coeficientes das variáveis x, y e z, dos polinômios propostos, os quais são, justamente, os parâmetros do modelo matemático do ajustamento, justificando assim a escolha do método. Esses modelos são dados pelas equações 3.5, 3.6, 3.7 e 3.8. Para a determinação dos parâmetros baseou-se em GEMAEL(1994, p. 117-122) e DALMOLIN(2002, p. 89-100).

O quadro 3.1 mostra as denominações dadas para cada modelo, os modelos matemáticos, a quantidade de parâmetros a determinar em cada um deles e a

quantidade de equações que foram utilizadas nos ajustamentos. O número de equações também corresponde à quantidade de estações de referência que foram utilizadas na determinação dos parâmetros de cada modelo matemático.

Quadro 3.1. Modelos Matemáticos Propostos

DENOMINAÇÃO MODELO MATEMÁTICO

Parâmetros Equações

Grau1 PRC(x,y,z)= a x + b y + c z + d 4 5

Grau2sem PRC(x,y,z) = a.x² + b.y² + c.z² + d.x + e.y + f.z + g 7 9 Grau2com PRC(x,y,z) = a.x² + b.y² + c.z² + d.x.y + e.x.z + f.y.z + g.x + h.y + i.z + j 10 12

Grau3 PRC(x,y,z) = a.x³ + b.y³ + c.z³ + d.x² + e.y² + f.z² + g.x + h.y + i.z + j 10 12

3.4. TESTE DE QUI-QUADRADO ( χ² )

Em várias etapas desta tese, foi aplicado o teste estatístico de χ². Segundo COSTA NETO (1977, p. 130), o teste de qui-quadrado ( χ² ), é um dos “Testes de Aderência”. Neste tipo de teste é admitida a hipótese (H0), de que a distribuição de uma variável de interesse na população é descrita por determinado modelo de distribuição de probabilidade e este modelo é testado.

DOWNING e CLARK (2000, p. 259), citam que o teste de qui-quadrado pode ser aplicado também para verificar se determinada distribuição de probabilidade se ajusta bem aos dados observados e, também citam, que este tipo de teste é denominado por teste de aderência.

De acordo com SPIEGEL (1994, p. 303), o teste de χ² é uma maneira de medir a discrepância existente entre as freqüências observadas e esperadas. O valor estimado de χ², é calculado pela eq. 3.9.

∑

= −

χ ⁿ

i i

2 i 2 i

estimado

E ) E O

( , (3.9) sendo:

- Oi : valor observado;

- Ei : valor esperado;

- n : número de parâmetros da amostra.

Quando χ²=0, as freqüências observadas e esperadas concordam exatamente e quando χ² > 0 , não existe concordância entre as variáveis. Quanto maior o valor de χ² , maior será a diferença entre elas e menor será a aderência entre os valores observados e esperados.

3.4.1. Aplicação do Teste de Qui-Quadrado

O teste estatístico de χ² é aplicado nas seguintes situações:

- seções 5.1, 5.3 : os modelos matemáticos propostos são testados. As correções diferenciais estimadas por estes modelos matemáticos, consideradas como correções “observadas”, são comparadas com as correções diferenciais simuladas (seção 5.1) ou que foram geradas pelas estações de referência (seções 5.3), as quais são consideradas como

“esperadas”. Estas correções são comparadas entre si e é testada a hipótese de que elas se eqüivalem.

- seção 5.2: são comparadas as correções diferenciais geradas por dois receptores GPS, estando ambos conectados a uma única antena, simultaneamente. No caso ideal, as correções diferenciais geradas por um dos receptores (supostas como “observadas”) devem ser iguais as geradas pelo outro receptor (consideradas como “esperadas”). É aplicado o teste de χ² para verificar a aderência entre as correções diferenciais observadas e esperadas, como forma de verificar a hipótese de que os dois receptores geram correções diferenciais, que se eqüivalem (ou que os receptores são equivalentes, entre si);

Para a estatística de χ²énecessário definir o número de graus de liberdade.

O número de graus de liberdade, ν, corresponde ao número de variáveis aleatórias, envolvidas no cálculo da estatística, menos 1, ou seja,

1 n−

ν , (3.10) onde:

- n : número de freqüências (ou número de variáveis aleatórias);

- ν : número de graus de liberdade.

3.4.2 – A Hipótese H0

Na aplicação do teste de χ² é suposta uma hipótese H0, que se contrapõe a uma hipótese alternativa, H1. O teste verifica se a hipótese H0 pode ser aceita, considerando um determinado nível de significância¹ α0.

- Se H0 for aceita, considera-se que a aderência é boa.

- Se a hipótese H0 for rejeitada, a hipótese alternativa H1 é aceita, conseqüentemente, o modelo testado é inadequado para representar a distribuição da população.

Segundo JOBSON (1991, p.17), a hipótese H0 é denominada por hipótese nula. A tomada da decisão sobre a aceitação, ou rejeição, da hipótese H0, é feita pela comparação entre o valor de χ²_estimado, obtido pela eq. 3.9, com o valor teórico, denominado por χ²_crítico . Este valor crítico pode ser obtido por meio de tabelas estatísticas ou de programas computacionais.

O χ²_crítico é função do nível de significância fixado e do número de graus de liberdade (ν).

Se χ²_estimado ≤χ²_crítico , a hipótese H0 é aceita, com probabilidade de se estar acertando, igual ao nível de confiança de 1-α, onde α é o nível de significância fixado .

3.4.3 – Função Densidade de Probabilidade

A compreensão dos motivos pelos quais se considera que a hipótese H0 deve ser aceita quando χ²_estimado ≤χ_crítico² , é explicada pela análise da função densidade de

1 Corresponde ao risco de erro que o experimentador admite ao rejeitar a hipótese testada (H0).

probabilidade e da função distribuição de probabilidade da variável aleatória considerada.

De acordo com STRANG e BORRE (1997, p. 313), a função densidade de probabilidade de uma variável aleatória Qui-Quadrado, x

∼

χ²_ν, é dada pela equação:

2 1 x 2 2

e x ) 2 ( 2 ) 1 x (

f ⁻ ⁻

ν ν

ν Γ

= , com x ≥ 0. (3.11)

Os elementos desta equação são:

- f(x) : função densidade de probabilidade;

- ν : número de graus de liberdade;

- x : variável aleatória;

- Γ : função gama².

Uma das situações onde foi aplicado o teste de χ², é aquela da execução do modelo matemático denominado por Grau1, seção 5.3.1. Neste modelo foram geradas PRCs para 5 estações de referência, as quais foram consideradas como

“PRCs estimadas”. Nestas estações dispõe-se também das PRCs medidas, as quais foram consideradas como “PRCs esperadas”. As PRCs estimadas e esperadas são comparadas e é aplicado o teste de χ². Como o número de estações de referência é 5, o número de graus de liberdade é 4 (ν = 4).

No gráfico 3.3, a função densidade de probabilidade f(x), para 4 graus de liberdade, está representada pela linha vermelha.

O formato desta curva é dependente apenas de ν. Segundo STRANG e BORRE (1997, p. 313), para pequenos valores de ν, esta curva é fortemente não simétrica e, quando ν tende para ∞, a distribuição de χ²tende para a distribuição normal.

2 Operador matemático.

Em todos os modelos matemáticos testados na seção 5.3, foi aplicado o teste de χ² para o conjunto de todas as 15 estações disponíveis, neste caso, o número de graus de liberdade é 14. O gráfico 3.4 mostra a função densidade de probabilidade para ν = 14. Comparando-o com o gráfico 3.3, pode-se verificar que o aumento do número de graus de liberdade fez com que o formato da curva se aproximasse da curva da distribuição normal, conforme é previsto pela teoria.

GRÁFICO 3.3. FUNÇÃO DENSIDADE DE PROBABILIDADE f(x), ν = 4

Probability Density Function y=chi2(x;4)

0,00 0,02 0,04 0,06 0,08 0,10 0,12 0,14 0,16 0,18 0,20

0 5 10 15 20 25 30 35 40

f(x)

χ²

Função Densidade de Probabilidade y = χ²(x;4)

Probability Density Function y=chi2(x;14)

0,00 0,02 0,04 0,06 0,08 0,10 0,12 0,14 0,16 0,18 0,20

0 5 10 15 20 25 30 35 40

GRÁFICO 3.4. FUNÇÃO DENSIDADE DE PROBABILIDADE f(x), ν = 14 f(x)

χ²

Função Densidade de Probabilidade y = χ²(x;14)

Adiante será comentado que as curvas representadas nos gráficos 3.3 e 3.4, delimitam uma mesma área, entre a curva representativa da função densidade de probabilidade e o eixo das abscissas.

Este teste é aplicado também em outras situações, para outros graus de liberdade.

3.4.4. Função Distribuição de Probabilidade

De acordo com JOBSON (1991, p. 12), a distribuição da probabilidade, para uma variável aleatória X, é definida também pela “função de distribuição”. Esta função está relacionada com a função densidade de probabilidade pela equação:

∫

∞

−

≤

=P(X x) ^xf(x)dx )

x (

F (3.12) sendo que:

- F(x) : função de distribuição de probabilidade;

- P(X≤x) : probabilidade da variável aleatória X assumir um valor menor ou igual ao valor específico x;

- f(x) : função densidade de probabilidade;

- x : variável aleatória.

A função distribuição de probabilidade, fornece a probabilidade em função do valor da variável aleatória x. A integração de f(x), de - ∞ até + ∞, corresponde à área gráfica total, compreendida entre a função densidade de probabilidade e o eixo das abscissas. Esta área gráfica é numericamente igual a 1. Este valor corresponde a uma probabilidade de 100%.

A análise dos gráficos 3.3 e 3.4, mostra que x

∼

χ²_ν, somente pode assumir valores positivos ou o valor zero. A equação 3.12, pode ser, então, escrita como:

∫

= ^x

dx ) x ( f ) x (

F (3.13)

Ao se aplicar um teste estatístico, deve-se escolher um nível de significância, o qual corresponde à probabilidade de erro que se admite ao se rejeitar a hipótese H0. São diversas as possibilidades de escolha desses níveis.

A decisão sobre a escolha do nível de significância mais adequado a este trabalho, foi baseado em:

- GEMAEL (1994, pp. 91, 94 e 95) , e também em outras páginas do mesmo livro, aplica testes estatísticos, considerando o nível de confiança, 1-α, de 95%, logo, α=5%;

- KRUEGER (1996, p. 54), apresenta situação onde também foi considerado nível de confiança de 95%, ao se aceitar H0, ou seja, α=5%;

- STRANGE e BORRE (1997, p. 310), comentando o teste de χ², cita: “este nível de confiança de 95% é sempre tomado como um indicador”;

- foi discutido com professores da área de estatística, sobre qual o nível de confiança que deveria ser utilizado neste trabalho e foi sugerido 1-α= 95%.

Considerando todas as informações acima, o autor optou por considerar o nível de confiança de, 95% para todos os testes estatísticos de χ² desta tese, exceto na seção 5.2, onde é considerado nível de confiança igual a 99%. O nível de significância, correspondente à estatística escolhida, é definido como “valor p”, e é expresso por:

p = P(X>xcalculado) . (3.14) Um exemplo de aplicação do teste, para explicar como foram tomadas as decisões, foi feito com o uso do programa computacional Statistica.

São necessários dois elementos para aplicar o teste, a saber:

- número de graus de liberdade, o qual foi escolhido como: ν = 4;

- nível de confiança, que foi de 95% (1-α=0,95), logo, o nível de significância é 5% (α=0,05).

O gráfico 3.5 mostra a função densidade de probabilidade correspondente a esses dados. Uma linha vertical, próxima ao centro do gráfico, indica o valor do

2 crítico

χ , calculado com o programa Statistica. Esse valor é 9,487729.

A linha vertical divide a área gráfica em duas regiões, a da esquerda com 95% da área total e a da direita, com 5% da área total. A área gráfica a esquerda do

2crítico

χ , pode ser calculada por:

A região delimitada pelos valores de χ², entre 0 a 9,487729, correspondente à área de 95%, que é exatamente o nível de confiança ao se aceitar o teste.

Probability Density Function

GRÁFICO 3.5. FUNÇÃO DENSIDADE DE PROBABILIDADE : ν=4, α=0,05 eχ_crítico² = 9,487729

Função Densidade de Probabilidade

Nível de significância α =0,05

GEMAEL (1994, p. 91), ao comentar a estimativa por intervalos, inclusive exemplificando para um nível de confiança de 95%, escreve:

“Na chamada estimativa por intervalo resultam dois números que definem um intervalo de confiança que deverá, com certa probabilidade, incluir o parâmetro populacional estimado³ . Sejam, por exemplo, a e b os extremos do intervalo, e o estimador da fdp⁴ conhecida e ε o parâmetro estimado:

P (a ≤ ε ≤ b) = 1- α ;

se tivermos 1 - α = 0,95 diremos que o nível de confiança é de 95% ou ainda que a probabilidade do intervalo aleatório conter o parâmetro ε é de 95%.”

No texto acima, P corresponde à probabilidade e α ao percentual do nível de significância, neste caso, 5%.

Nesta tese ter-se-á, sempre, a=0, b=χ²_crítico e ε =χ²_estimado, resultando:

P(0 ≤ χ²_estimado ≤ χ_crítico² ) = 95% ; (3.15)

Em todo teste estatístico existe um valor verdadeiro (parâmetro), o qual é desconhecido. Em seu lugar é usado um valor estimado (estatística). Se o valor estimado estiver contido no intervalo entre 0 e o crítico, neste caso, existe 95% de probabilidade de que o valor verdadeiro também esteja neste intervalo. O que corresponde à aceitação da hipótese H0, conforme é citado na seção 3.4.2.

De acordo com DALMOLIN (2002, p. 35-36), é mostrado uma situação eqüivalente a aqui analisada, onde a região delimitada por este intervalo é chamada de região de aceitação da hipótese proposta e a região fora deste intervalo, de região de rejeição desta hipótese:

3 Nota do autor: neste caso é oχ²_estimado.

4 Nota do autor: fdp corresponde à função densidade de probabilidade.

Por analogia, têm-se:

- Região de aceitação da hipótese H0: 0 ≤ χ²_estimado ≤ χ²_crítico ;

- Região de rejeição da hipótese H0: χ²_estimado > χ²_crítico .

3.4.5. Função Distribuição de Probabilidade Acumulada

Outro modo utilizado para a tomada da decisão sobre a aceitação ou não da hipótese H0, e que foi utilizada nesta tese, é com o uso do valor p, no lugar de χ².

GEMAEL (1994, p. 21) e LEICK(1995, p. 103), mostram que a função de distribuição de probabilidade acumulada de uma variável aleatória contínua X, é a função Φ, tal que:

∫

−∞Φ

≤

Φ(x) P(X x) ^x (x)dx . (3.16)

Exemplificando esta função, a qual corresponde à probabilidade de que o valor de χ²₀_,₉₅ seja menor que o χ²_estimado, é dado:

∫

^χ ^Φ

= χ

≤

χ²_estimado ²_crítico) ₀²⁰^,⁹⁵ (x)dx (

P . (3.17)

O programa Statistica disponibiliza uma ferramenta que permite o cálculo das distribuições de probabilidade, cuja utilização é assim descrita:

- campo “df “ : número de graus de liberdade;

- e no campo “p” : nível de confiança;

- opção “inverse”: permite que se calcule o valor de χ², a partir do valor nível de confiança (1-α);

- opção “(1-Cumulative p)” : faz com que o valor calculado de χ² seja correspondente à função densidade de probabilidade acumulada;

- campo “Chi²” : valor determinado pelo programa, neste caso;

710723 ,

2 0

crítico =

χ .

A figura 3.1, mostra a tela do calculador de distribuição de probabilidade.

O formato do gráfico da distribuição de probabilidade, é função do número de graus de liberdade. Com o uso das funções disponíveis no programa EXCEL, foram calculados os valores χ².Foi traçado o gráfico 3.6, para 4 graus de liberdade e o gráfico 3.7, para 11 graus de liberdade. Estes dois graus de liberdade foram freqüentemente usados nos testes estatísticos.

Nestes gráficos foram assinalados os valores “p” relativos ao nível de confiança de 95% e os correspondentes valores críticos de χ².

FIGURA 3.1. CALCULADOR DE DISTRIBUIÇÃO DE PROBABILIDADE

A segunda maneira de aplicar o teste estatístico de χ², é feita com base na distribuição de probabilidade acumulada. A seguir é dada uma explicação sobre este teste. Para tanto, está sendo suposto que se dispõe de um valor estimado para χ², igual a 0,38657. Este valor foi obtido em um dos inúmeros processamentos realizados com o modelo Grau1, o qual não está detalhado na tese.

Função D istribuição de P robabilidade (ν = 4)

0,95

0,0 0,2 0,4 0,6 0,8 1,0

0 2 4 6 8 10 12 14 16 18 20

Q ui-Q uadrado

GRÁFICO 3.6. FUNÇÃO DISTRIBUIÇÃO DE PROBABILIDADE ACUMULADA: graus deliberdade=4, nível de confiança=0,95

Nível de confiança

Função D istribuição de P robabilidade (ν = 11)

0,95

0,0 0,2 0,4 0,6 0,8 1,0

0 2 4 6 8 10 12 14 16 18 20

Q ui-Q uadrado

GRÁFICO 3.7. FUNÇAO DISTRIBUIÇÃO DE

PROBABILIDADE ACUMULADA: graus de liberdade=11,

Nível de confiança

- o modelo Grau1 processa dados de 5 estações, logo, ν = 4;

- o nível de confiança escolhido é 95%, conseqüentemente, o nível de significância é

1-0,95 = 0,05;

- com o uso do EXCEL, foi calculado o valor crítico de χ² (1-p):

710724 ,

2 0

crítico=

χ ;

- o modelo Grau1 determina o valor estimado para χ²: 38657

2 0

estimado=

χ ;

- com o EXCEL, determina-se o valor do nível de confiança estimado, correspondente ao χ²_estimado :

nível de confiança estimado=0,983562;

Pode-se ver que χ²_estimado é menor que χ²_crítico . Isto já é motivo suficiente para a não rejeição da hipótese H0.

A interpretação para a tomada da decisão é:

- a hipótese H0 não é rejeitada, quando o nível de confiança estimado for, no mínimo, igual ao nível de confiança crítico escolhido (0,95);

- foi obtido valor do nível de confiança estimado igual a 0,983562 (98,3562%);

- decisão: a hipótese H0 não é rejeitada.

Com isso, sempre que o nível de confiança estimado for maior que o nível de confiança crítico, a hipótese H0 não é rejeitada. Isto foi aplicado em várias etapas desta tese. Esta mesma análise pode ser feita graficamente. No gráfico 3.8, os valores críticos estão escritos na cor vermelha e foram assinalados no gráfico por

uma linha pontilhada vermelha. Os valores estimados, estão representados na cor azul e foram assinalados por uma linha pontilhada, também azul. Observa-se que o valor χ²_estimado é menor que χ²_crítico e que o nível de confiança estimado (0,983562), é maior que o nível de confiança crítico (0,95).χ²

Função Distribuição de Probabilidade

0,95 0,983562

0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

0 2 4 6 8 10 12 14 16 18 20

Qui-Quadrado

valor p

GRÁFICO 3.8. FUNÇÃO DISTRIBUIÇÃO DE PROBABILIDADE ACUMULADA: COMPARAÇÃO DE VALORES

Nível de confiança

No documento INVESTIGAÇÃO DE UMA MODELAGEM MATEMÁTICACOMO ALTERNATIVA PARA AUMENTO DA ÁREA DECOBERTURA DE ESTAÇÕES DE REFERÊNCIA DGPS (páginas 73-89)