• Nenhum resultado encontrado

Análise Discriminante e as variáveis independentes

CAPÍTULO 2 – OS SETORES URBANOS PARA ALÉM DA TITULARIDADE DA

2.4 Análise Discriminante e as variáveis independentes

Com as evidências anteriores de que existiam em 2010, nas RMs selecionadas, áreas consideradas comuns com características de precariedade de infraestrutura de serviços urbanos semelhantes, ou até piores, que as áreas de aglomerados subnormais, utilizaremos a técnica de Análise Discriminante para identificar e quantificar os setores censitários comuns com características similares às dos setores subnormais, relativas às condições habitacionais, de infraestrutura, socioeconômicas e demográficas, exceto pela condição de titularidade da terra. Esses setores censitários serão nomeados, daqui em diante, apenas como setores similares.

Devido à diversidade de situações urbanas encontradas no país, optamos por aplicar a Análise Discriminante separadamente em cada uma das nove RMs selecionadas. Por outro lado, em razão da interdependência econômica, demográfica e territorial dos municípios que compõem um espaço urbano

36 “O Programa Luz para Todos foi criado em novembro de 2003, e até dezembro de 2011 levou energia elétrica a 2,9 milhões de famílias, beneficiando cerca de 14,5 milhões de pessoas. O maior número de ligações, cerca de 49%, foram feitas no Nordeste” (BRASIL, 2011b).

37

A Pesquisa Nacional por Amostra de Domicílios (PNAD), substituída em 2016 pela Pesquisa Nacional por Amostra de Domicílios Contínua (PNAD Contínua), realizada pelo IBGE, apresenta informações anuais sobre a adequação dos serviços de água, esgoto e coleta de lixo para as nove RMs analisadas nesse estudo. No entanto, como os dados levantados por essa pesquisa não são desagregados na escala intraurbana, optamos por não considerar seus resultados nas análises desse trabalho. Para maiores informações, acessar www.ibge.gov.br.

metropolitano (IBGE, 2011b), consideramos, para os objetivos desse estudo, cada RM como um único espaço urbano. Essas prerrogativas implicam que as características dos setores similares possam variar de RM para RM, de acordo com a variação das características dos respectivos setores subnormais, e que os setores pertencentes a realidades político-administrativas distintas dentro de uma mesma RM possam ser diretamente comparados.

A técnica de Análise Discriminante consiste na formulação de uma função ou modelo de classificação de grupos (variável dependente) com base em um conjunto de variáveis selecionadas previamente (variáveis independentes), de tal forma que a probabilidade de se classificar uma unidade de investigação no grupo errado seja minimizada. Na nossa abordagem, consideramos dois grupos na variável dependente – setores subnormais (1) e setores comuns (0) – e um conjunto prévio de 21 variáveis independentes, apresentado no quadro 1 mais adiante. Assim, os setores similares serão aqueles originalmente classificados como comuns (0), mas que foram classificados como subnormais (1) pelas respectivas funções discriminantes.

A utilização dessa técnica requer que algumas premissas sejam atendidas, como a normalidade multivariada da combinação das variáveis independentes em cada grupo e a homogeneidade de suas matrizes de covariância (MALHOTRA, 2012). O primeiro pressuposto é o mais difícil de ser testado, visto que “os testes estatísticos disponíveis em grande parte dos softwares não tratam da normalidade multivariada” (MÁRIO, 2009, p. 243) e o teste de normalidade das variáveis separadamente não garante a normalidade conjunta. Já o segundo pressuposto pode ser avaliado com o uso do teste de Box, disponível no SPSS38,

que testa a hipótese nula de igualdade das matrizes de covariância de duas populações. Para as nove RMs analisadas não foi possível garantir a homogeneidade das matrizes de covariância. No entanto, como dispomos de um volume de observações relativamente grande nos grupos analisados em cada RM (o menor deles é o conjunto de setores subnormais da RM de Curitiba, com 253 observações), a violação desses pressupostos se torna menos crítica (MÁRIO, 2009)39.

38

As análises discriminantes foram realizadas no software estatístico IBM SPSS Statistics 20. 39

Consideramos o uso da Regressão logística para a classificação dos setores similares, uma vez que essa técnica requer um número menor de suposições iniciais (MÁRIO, 2009). Entretanto, os

O conjunto de variáveis testadas nas análises incluiu, além daquelas relativas à adequação dos serviços de água, esgoto, coleta de lixo e energia elétrica, variáveis de caráter socioeconômico, demográfico e de condições habitacionais levantadas no questionário do universo do Censo Demográfico 2010.

Com as mudanças no questionário do universo do Censo 2010 em relação ao de 2000, não foi possível considerar algumas variáveis utilizadas por Marques et al. (2007). São elas: porcentagem de responsáveis com menos de 8 anos de estudo, porcentagem de domicílios do tipo cômodo no setor censitário, porcentagem de domicílios com outra forma de posse da moradia e porcentagem de domicílios com outra forma de posse do terreno. Em contrapartida, novas variáveis foram acrescentadas na análise, como mostra o Quadro 1:

percentuais de classificação correta para os setores subnormais, utilizados para validar o modelo de classificação, apresentaram resultados bastante inferiores quando comparados aos obtidos com a Análise Discriminante.

QUADRO 1 – Relação das variáveis selecionadas para o estudo

Dimensão Variáveis

Características do domicílio

1 – Porcentagem de domicílios em outra condição de ocupação (não são próprios, alugados, nem cedidos) (OUT.OCUP.)

2 – Porcentagem de domicílios sem ligação à rede de abastecimento de água (INAD.ÁGUA)

3 – Porcentagem de domicílios sem ligação à rede de esgoto ou fossa séptica (INAD.ESG.)

4 – Porcentagem de domicílios sem banheiro de uso exclusivo dos moradores e nem sanitário (SEM-BANH.)

5 – Número médio de banheiros por morador (BANH.MOR.) 6 – Porcentagem de domicílios sem coleta de lixo (INAD.LIXO)

7 – Porcentagem de domicílios com coleta de lixo em caçamba de serviço de limpeza (LIXO-CAÇAM.)

8 – Porcentagem de domicílios sem energia elétrica, com energia elétrica de outra fonte, com energia elétrica de companhia distribuidora sem medidor ou com medidor de uso coletivo (INAD.ENERG.)

9 – Porcentagem de domicílios próprios e quitados (PRÓP.QUIT.)

Características do responsável pelo domicílio

10 – Porcentagem de responsáveis não alfabetizados (RESP.N.ALF.) 11 – Porcentagem de responsáveis com menos de 30 anos (RESP.<30)

12 – Porcentagem de responsáveis não alfabetizados com menos de 30 anos (RESP.N.ALF.<30)

13 – Renda média dos responsáveis pelos domicílios (RENDA-MÉD)

14 – Porcentagem de responsáveis com renda de até 2 salários mínimos (RENDA-2SM)

15 – Porcentagem de responsáveis do sexo feminino (RESP.FEM.)

Aspectos gerais

16 – Total de domicílios particulares permanentes no setor censitário (DOM.P.P.) 17 – Total de pessoas residentes no setor censitário (PES.D.P.P.)

18 – Número médio de moradores por domicílio (MOR.DOM.) 19 – Total de domicílios particulares improvisados (DOM.IMP.)

20 – Porcentagem de pessoas residentes no setor censitário de cor/raça preta ou parda (PRET.PARD.)

21 – Porcentagem de pessoas residentes de até 10 anos que não tinham, ou não sabiam se tinham, registro de nascimento (SEM-R.N.)

Fonte: Elaboração própria.

Nota: As variáveis foram construídas a partir da informação dos domicílios particulares permanentes.

Embora o IBGE tenha levantado, durante a operação censitária de 2010, informações espaciais dos setores subnormais, como a localização, a topografia, a existência e a predominância de padrões urbanísticos, como o tipo de via de

circulação interna e externa ao setor e a densidade de ocupação da área, com informações sobre a verticalização dos domicílios e do espaçamento existente entre eles (IBGE, 2013b), as mesmas informações não foram coletadas para os setores comuns, o que nos impediu de incluí-las na análise proposta.

Da mesma forma, as informações sobre o entorno dos domicílios, como a existência de identificação do logradouro, de iluminação pública, pavimentação, calçada, arborização, entre outras, não foram incorporadas às análises do presente estudo, pois elas não estavam disponíveis para todos os setores subnormais (IBGE, 2011c).

As análises discriminantes foram realizadas com o método de seleção de variáveis denominado stepwise (em que as variáveis independentes são introduzidas sequencialmente, com base na sua capacidade de discriminar os grupos) e com probabilidades a priori iguais para os dois grupos (setores subnormais e comuns). Para proporcionar maior robustez à formulação das funções discriminantes, optamos por excluir os setores censitários com menos de 50 domicílios particulares permanentes dessa etapa do processo. Posteriormente, esses setores foram classificados a partir dessas funções.

Na próxima seção serão apresentadas as medidas de ajuste dos modelos construídos e o número de setores similares identificados, bem como de domicílios e pessoas correspondentes. Neste capítulo, priorizamos a análise comparativa entre as RMs, buscando identificar semelhanças e dissemelhanças entre elas, em detrimento da análise de suas especificidades internas.