• Nenhum resultado encontrado

LISTA DE SIGLAS CEF Caixa Econômica Federal

2.9 A AVALIAÇÃO POR INFERÊNCIA ESTATÍSTICA

A inferência estatística vem sendo aplicada na avaliação de imóveis e em outras situações de mercado que estudam a sua tendência. Existem recomendações explicitadas nas Normas Brasileiras de Avaliação visando à utilização da inferência estatística na Engenharia de Avaliações, com algumas exceções, têm sido particularmente voltadas, até o momento, para a utilização da Regressão Linear no cálculo do valor do imóvel.

WARWICK RAMALHO DE FARIAS LEITE

133

Atualmente a aplicação dessas técnicas estatísticas é bastante facilitada graças ao avanço tecnológico dos computadores que tornou os cálculos relativamente fáceis e originaram vasta disposição de programas aplicativos, em particular aqueles de Regressão Linear que empregam o Método dos Mínimos Quadrados, mas isso não é condição suficiente, pois sua aplicação não pode prescindir do julgamento crítico e de sólidos conhecimentos do mercado imobiliário por parte de avaliadores.

Sobre os conceitos de modelo introduzido por Orlando Carneiro de Matos, no seu tratado ―Econometria Básica Teoria e Aplicações‖ trata a palavra modelo, de modo geral, podendo ser entendida como representação simplificada da realidade, estruturada de forma tal que permita compreender o funcionamento total ou parcial dessa realidade ou fenômeno. Num sentido mais restrito, modelo, é uma representação formal de idéias ou conhecimentos acerca de um fenômeno. Essas idéias (chamadas teorias) expressam-se por um conjunto de hipóteses sobre os elementos essenciais do fenômeno e das leis que os regem, as quais geralmente se traduzem sob a forma de um sistema de equações matemáticas. As definições introduzidas na Norma Brasileira NBR14653-1, de forma resumida, endossam esses conceitos, ou seja, ―modelo é a representação técnica da realidade‖.

Podemos expressar que ―modelo de regressão‖ como sendo a equação utilizada para representar um determinado fenômeno com base numa amostra, considerando-se as diversas características influenciantes mais representativas.

WARWICK RAMALHO DE FARIAS LEITE

134

Os modelos de uma forma geral podem ser puramente teóricos ou econométricos5, Modelos Teóricos são aqueles que expressam leis de

mercado sem necessariamente conter a especificação efetiva da forma matemática nem a enumeração exaustiva das variáveis que o compõem.

A literatura aponta que modelos econométricos são aqueles que necessariamente contêm as especificações em forma matemática e com definição das variáveis para aplicação empírica, além de incorporar um termo residual com a finalidade de levar em consideração as variáveis ou outros elementos, que, por alguma razão, não puderam ser considerados explicitamente.

A montagem de um modelo é sempre um processo interativo e geralmente requer o uso da evidência empírica dos dados e do conhecimento do mercado/comportamento analisado. Mesmo contendo os elementos que permitam sua operacionalização, os modelos probabilísticos não admitem relações exatas em virtude da não-inclusão de todas as variáveis que determinam o comportamento do fenômeno e de erros de medidas das variáveis. Constituem uma formulação incompleta da realidade em face da impossibilidade de um modelo abranger todos os fatores que determinam ou condicionam o comportamento de um evento, contrastando com os modelos determinísticos que supõem a existência de variáveis que satisfazem exatamente as equações matemáticas.

5 - Econometria é um conjunto de ferramentas estatísticas com o objetivo de entender a relação entre variáveis econômicas através da aplicação de um modelo matemático. WOOLDRIDGE. Introdução á Econometria. Apêndice E. Página 110 - http://pt.wikipedia.org/wiki/Econometria.

WARWICK RAMALHO DE FARIAS LEITE

135

Os modelos devem ser o mais simples possível e represente a compreensão da realidade, mas que ao mesmo tempo possuam a abrangência suficiente para que os principais fatores intervenientes e suas interações estejam claramente identificados, apontando tal referencia como de extrema importância.

Os métodos estatísticos, de um modo geral, envolvem a análise e a interpretação de dados observados em um fenômeno. O conjunto de observações colhidas constitui-se na amostra e o grupo todo de elementos do qual ela foi extraída, é designado por população.

A parte estatística referente a coleta, a sumarização e a descrição dos dados refere-se a estatística descritiva. Compreende a organização e o resumo dos mesmos, bem como análise e interpretações numéricas e gráficas, envolvendo cálculo de medidas, tais como, a média, a mediana, o desvio padrão, etc.

A inferência estatística, por sua vez, envolve a formulação de certos julgamentos (ou conclusões) sobre um todo, após examinar apenas uma parte, ou amostra, dele. Para que a inferência estatística seja válida, a amostra deve ser representativa da população, e a probabilidade do erro, ser especificada. Deste modo, a inferência estatística envolve um raciocínio indutivo: argumentação do específico - amostra - para o geral - população, no qual se impõe que obedeça algum modelo de probabilidade.

WARWICK RAMALHO DE FARIAS LEITE

136

Na prática, o processo de inferência consiste em investigar a forma e o grau das relações entre as observações colhidas em amostras, que se supõem estarem interligadas de alguma maneira e, a partir delas, construir modelos. O modelo escolhido deve satisfazer os pressupostos básicos determinado por um conjunto de testes de hipóteses e, dentro de intervalos de confiança, conferir validade às predições das probabilidades estabelecidas.

A abordagem da análise de regressão passa pelo método dos mínimos quadrados. A aplicação do método dos mínimos quadrados traz a consideração de um gráfico cartesiano com duas variáveis (Yi, Xi), consiste em encontrar, a partir dos dados amostrais as estimativas para o coeficiente angular B1 (que define o aumento ou diminuição da variável Yi por unidade de variação da variável Xi) e para o intercepto B0 (que define o ponto em que a reta corta o eixo das ordenadas), de modo que os erros (ou resíduos) sejam mínimos.e pode ser representado pela equação:

RETA DA REGRESSÃO: Y= b0 +b1.X1 + ( erro)

FIGURA 12 - Representação da reta de regressão

y Yi Y1 Ŷi e i b1 b0

Como conceito da equação de regressão, temos que ela se compõe por 4 elementos básicos:

WARWICK RAMALHO DE FARIAS LEITE

137

1. Variáveis: dependente (Y) e independentes (X1, X2,...Xn) que podem ser qualitativas ou quantitativas;

2. Relações (ou equações): descrevem o comportamento investigado (no caso da ocorrência da Evasão Escolar) através de uma função linear (ou linearizáveis):

3. - Parâmetros: são as magnitudes das relações (Bo, B1, ...,Bn);

4. - Termo aleatório ou erro (resíduos): incluído na análise de regressão para contemplar erros devidos a não consideração na regressão de variáveis de importância menor (já que o propósito do modelo é generalizar e simplificar as relações apenas das causas mais importantes), levar em conta o efeito de possíveis erros de medidas ou informações e para captar a imprevisibilidade do comportamento humano, inerentemente aleatório.

Este procedimento vem sendo aplicado pela engenharia brasileira para avaliações de bens e se faz com a utilização de modelos de regressão linear e constata-se que esta técnica esta sendo muito utilizada quando se deseja estudar o comportamento de uma variável dependente em relação a outras que são responsáveis pela variabilidade observada nos valores, configurando a proposta de análise de regressão, entendo que uma situação social como a evasão escolar pode e deve ser estudada por este modelo matemático

Pensamos na formulação de um modelo linear para representar a equação que indique a provável ocorrência da Evasão Escolar, reconhecendo esta como a variável dependente que no estudo deverá ser expressa por uma combinação linear das variáveis independentes, em escala original ou transformadas, e

WARWICK RAMALHO DE FARIAS LEITE

138

respectivas estimativas dos parâmetros populacionais, acrescida de erro aleatório, oriundo de variações do comportamento humano – habilidades diversas, desejos, necessidades, compulsões, caprichos, ansiedades, diferenças sociais, entre outras observações ou medida de efeitos poderão ser consideradas como variáveis irrelevantes e não serão incluídas no modelo. Com base em uma amostra extraída de um evento reconhecemos os parâmetros populacionais que são estimados por inferência estatística.

A Inferência estatística exige a formulação de um modelo que deve ser expostos por hipóteses relativas aos comportamentos das variáveis dependentes e independentes, com base no conhecimento que o pesquisador tem a respeito do evento e sua re-ocorrência, e poderá ser ate aplicada formulações com a indicação de hipóteses nula e alternativa para cada parâmetro. Como indica ser uma Analise de Regressão Linear que nada mais é que uma previsão com critérios: Homocedasticidade, Normalidade e independência.

Os autores Douglas Downing e Jeffrey Clarkems em seu tratado sobre a Estatística Aplicada ( 2004), recomendam os seguintes passos:

1. Sempre iniciar com um gráfico de dispersão para observar a possível relação entre X e Y.

2. Verificar se as suposições do modelo de regressão (homoscedasticidade, normalidade e independência) estão satisfeitas, antes de prosseguir e utilizar seus resultados.

WARWICK RAMALHO DE FARIAS LEITE

139

3. Se as suposições em (2) forem violadas deve-se utilizar métodos alternativos para remediar as violações, como por exemplo, transformações nas variáveis explicativas ou respostas.- Se as suposições forem satisfeitas, deve-se realizar testes em relação aos coeficientes de regressão e construir intervalos de confiança e previsão

Verifica-se que é pressupostos básicos e que se deve ressalta sendo necessário, nos modelos de regressão, observando-se os modelos apresentados passam na condição de validade, principalmente no que concerne à sua especificação, normalidade, homocedasticidade. não- multicolinearidade, não autocorrelação independência e inexistência de pontos atípicos, com o objetivo de obter avaliações não-tendenciosas, eficientes e consistentes.

A homocedasticidade diz respeito à constancia da variação de resíduos, conforme pode ser visto em um gráfico de dispersão de resíduos quando assumimos que o erro inicial se aproxima de N (entre zero e a variância), estamos implicitamente assumindo que a variância de Yj Xi não depende de um particular valor Xi.

A não multicolinearidade é condição básica e dever ser conseguida. Sendo a multicolinearidade um problema comum em regressões, onde as variáveis independentes possuem relações lineares exatas ou aproximadamente exatas. O índício mais claro da existência da multicolinearidade é quando o coeficiente de determinação chamado de R² é bastante alto, mas nenhum dos coeficientes

WARWICK RAMALHO DE FARIAS LEITE

140

da regressão é estatisticamente significativo segundo a estatística t convencional. O teste t de Student ou somente teste t é um teste de hipótese que usa conceitos estatísticos para rejeitar ou não uma hipótese nula, desde que o objeto do teste siga uma distribuição t de Student.

As conseqüências da multicolinearidade em uma regressão são a existência de erros-padrão elevados no caso de multicolinearidade moderada ou severa e até mesmo a impossibilidade de qualquer estimação se a multicolinearidade for perfeita.

Quanto a premissa da existência de não autocorrelação, tem que verificar esta condição e pode também ser detectada pela analise estatística de Durbin Watson. Essa estatística mede a correlação entre cada resíduo e o resíduo correspondente ao período de tempo imediatamente anterior.

Na técnica de Durbin Watson é definida por D, onde os valores são interpretados da seguinte forma:

D próximo de 0 = resíduos positivamente autocorrelacionados. D próximo de 2 = resíduos não são autocorrelacionados.

D próximo de 4 = resíduos negativamente autocorrelacionados

O desenvolvimento dos sistemas de equações depende do aprofundamento de estudo e a escolha da melhor solução depende para a sua utilização de modelos lineares de regressão múltipla, especialmente aqueles envolvendo

WARWICK RAMALHO DE FARIAS LEITE

141

muitas variáveis explicativas, onde a estimação dos parâmetros pelo método dos mínimos quadrados (b0, b1, b2,...., bk) é obtida através de operações com matrizes, cujas formulações teóricas baseiam-se em cálculos complexos, que não se constituem no principal objetivo deste trabalho, razão pela qual estamos apresentado apenas os conceitos mais importantes, até mesmo porque, os programas aplicativos de computador resolvem todos os sistema de equações.

Em resumo, a técnica estatística nos mostra que devemos seguir a seguinte ordem:

a) Para evitar a micronumerosidade, o número mínimo de dados efetivamente utilizados (n) no modelo deve obedecer aos seguintes critérios, com respeito ao número de variáveis independentes (k): n ≥ 3 (k+1); ni ≥ 5, até duas variáveis dicotômicas ou três códigos alocados para a mesma característica; ni ≥ 3, para 3 ou mais variáveis dicotômicas ou quatro ou mais códigos alocados para a mesma característica onde ni é o número de dados de mesma característica, no caso de utilização de variáveis dicotômicas ou de códigos alocados, ou número de valores observados distintos para cada uma das variáveis quantitativas;

b) Aos erros, temos que considerar como sendo variáveis aleatórias com variância constante, ou seja, homocedásticos;

c) Os erros são variáveis aleatórias com distribuição normal;

d) Os erros são não-autocorrelacionados, isto é, são independentes sob a condição de normalidade;

WARWICK RAMALHO DE FARIAS LEITE

142

e) e) Não devem existir erros de especificação no modelo, isto é, todas as variáveis importantes devem estar incorporadas – inclusive as decorrentes de interação – e nenhuma variável irrelevante deve está presente no modelo;

f) Em caso de correlação linear elevada entre quaisquer subconjuntos de variáveis independentes, isto é, multicolinearidade, deve-se examinar a coerência das características da situação em avaliando com a estrutura de multicolinearidade inferida, vedada a utilização do modelo em caso de incoerência;

g) Não deve existir nenhuma correlação entre o erro aleatório e as variáveis independentes do modelo.

h) Possíveis situações influenciantes, devem ser investigadas a qual poderá ser retirada devendo-se ter justificativa para sua saída.

Em uma mesma amostra, a explicação do modelo pode ser aferida pelo seu coeficiente de determinação. Devido ao fato de que este coeficiente sempre cresce com o aumento do número de variáveis independentes e não leva em conta o número de graus de liberdade perdidos a cada parâmetro estimado, é recomendável considerar também o coeficiente de determinação ajustado

Apresentamos conforme ensina Oliveira (2010:46) em uma sinopse dos procedimentos para construção, análise e definição do modelo estatístico em forma de fluxograma para um melhor entendimento, vejamos:

WARWICK RAMALHO DE FARIAS LEITE

143

FIGURA 13 – Contexto escolar e social

ok P E S Q U I S A ok ok Correlação (r) e coeficiente determinação - R ²

Significância das variáveis Teste de hipóteses ―t‖ e ―F‖

Ampliar a pesquisa Abandonar a equação ou Assumir que o comportamento admitido a priori era equivocado Verificação da coerência

do modelo

não ok Coleta de dados e

identificação das variáveis

Verificação preliminar-dados (Análise quali-quantitativa)

Determinação dos vários subconjuntos de variáveis explicativas e Cálculo dos

parâmetros da equação

Nova especificação (modelo)

Eliminação de variáveis pouco significativas. Realização de nova especificação do modelo

Análise de resíduos e verificação dos pressupostos

Linearidade; Normalidade; Autocorrelação, situação Influenciante; Verifica variável

(se possível, ampliar a pesquisa e nova

especificação do modelo)

não ok não ok

não ok

ok

Fim com a escolha do modelo

Utilização da regressão para aplicação no estudo da Evasão Escolar indicando o Intervalo de confiança e o nível de precisão e sua fundamentação.

WARWICK RAMALHO DE FARIAS LEITE

144

Para melhor compreensão sobre o tema, introduzo o sumario sobre os objetivos dos modelos de regressão e sua construção como demonstrado por F.Mattar (1996); Richardson(1999); Douglas Downing e Jeffrey Clarkems(2004) e Oliveira(2010), assim, temos:

a) Predição – Como esperamos que grande parte da variação da variável de saída seja explicada pelas variáveis de entrada, podemos utilizar o modelo para obter valores de Y correspondentes a valores de X que não estavam entre os dados. Esse procedimento é chamado de predição e, em geral, usamos valores de X que estão dentro do intervalo de variação estudado.. Acredita-se que a predição seja a aplicação comum dos modelos de regressão;

b) Seleção de variáveis - Freqüentemente, não se tem idéia de quais são as variáveis que afetam significativamente a variação de Y. Para responder a esse tipo de questão, os estudos são realizados com um grande número de variáveis. A análise de regressão pode auxiliar no processo de seleção de variáveis eliminando aquelas cuja contribuição não seja importante;

c) Estimação de parâmetros - Dado um modelo e um conjunto de dados referente às variáveis respostas e preditoras, estimar parâmetros ou ajustar um modelo aos dados significa obter valores ou estimativas para os parâmetros, por algum processo, tendo por base o modelo e os dados observados;

d) Inferência - O ajuste de um modelo de regressão em geral tem por objetivos básicos, além de estimar os parâmetros, realizar inferências sobre eles, tais como, testes de hipóteses e intervalos de confiança.

WARWICK RAMALHO DE FARIAS LEITE

145

Para a variação total temos que é a distância entre o valor médio de y e o valor observado de cada yi; o somatório do quadrado dos desvios das observações

yi com relação ao valor da média y das mesmas observações y, isto é, (yi – ymédio )² é sua medida estatística.

Para a variação não-explicada como sendo a distância entre os valores estimados pela reta e os valores observados de y; o somatório do quadrado dos desvios das observações y com relação aos valores estimados pelo modelo de regressão, isto é, ( yi – yc )2 é sua medida estatística.

E para a variação explica como sendo expressa pela distância entre o valor médio de y e os valores estimados pelo modelo para cada y; o somatório do quadrado dos desvios dos valores estimados pelo modelo de regressão yc com

relação ao valor médio de y, isto é, (yc – ymédio)2 é sua medida estatística.

Também Oliveira (2010) conclui, que então a [Variação total = variação explicada + variação não-explicada] e a percentagem de variação explicada, R², é a razão da variação explicada sobre a variação total.

Ao finalizar este importante tema do marco teórico, observamos que este trabalho tenta referenciar a inferência estatística como forma e instrumento de avaliação. Que de forma lógica e em ordem , aplica-se os objetivos e descreve a metodologia de trabalho, para que seja de fácil entendimento aos leitores e em especial para os gestores que por ventura venham a trabalhar ou realizar estudos utilizando a inferência estatística para propor soluções que minore o fenômeno da evasão escolar. Como vimos, esta ferramenta tem a

WARWICK RAMALHO DE FARIAS LEITE

146

finalidade de avaliação, como mecanismo de planejamento do ambiente escolar na orientação dos procedimentos didáticos e reconhecimento da problemática mais significante.

Ao final, temos o induzimento para a aplicação dos remédios adequados em procedimentos ao contexto a que pertence, podendo e devendo ser executada a pesquisa com os prováveis elementos a coletar, que deverá ser restrita aos dados de interesse da pesquisa.

2.10 O SOFTWARE COMO FERRAMENTA DE TRABALHO DE