• Nenhum resultado encontrado

3.2 Metodologia

3.2.1 Análise dos dados

A análise das uniões intra e inter-raciais será feita por intermédio de suas relações com a escolaridade e a religião dos parceiros. Por isso, todas as dimensões a serem estudadas serão contempladas com o cruzamento dessas variáveis e suas categorias. Para esse tipo de análise, o método mais utilizado é a construção de tabelas de contingência a partir dos dados em questão.

Tabelas de contingência são utilizadas para descrever a associação de uma população entre duas ou mais variáveis categóricas30 e são importantes por agruparem observações individuais em tabelas resumidas. Supondo que X e Y são duas variáveis categóricas, X tenha I níveis (ou categorias) de resposta e Y tenha J níveis (ou categorias) de resposta, quando se faz o cruzamento dessas duas variáveis, existem IJ possibilidades de classificação. Colocando essas respostas na forma de uma tabela, têm-se I linhas para as categorias de X e J colunas para as categorias de Y. As células da tabela irão representar as IJ possibilidades de resultados (π ) e essa será uma tabela de contingência ij

(Agresti, 1990).

A probabilidade de distribuição (π ) é a distribuição conjunta de X e Y e as ij

probabilidades marginais são os totais obtidos pela soma das probabilidades conjuntas em cada linha (πi+) ou coluna (π+j). Assim, tem-se

+ i π = j ij π e π+j= i ij π (1)

que satisfazem a igualdade +

i i π = + j j π = i j ij π = 1.

Em muitas tabelas de contingência, há uma associação explícita entre X e Y. Quando se conhece essa relação e consegue-se identificar qual variável é a resposta e qual variável é explicativa, o modelo mais coerente para fazer essa análise é o modelo logístico, para se identificar o efeito de uma variável sobre a outra. No entanto, quando não se consegue determinar qual variável exerce efeito sobre a outra, como no caso das uniões intra e inter-raciais e demais características como escolaridade, religião, status marital, o modelo mais utilizado é o log-linear, exatamente para identificar quais associações existem entre essas variáveis (Agresti, 1990 e Oliveira, 2006). Somando-se a isso, quando se tem tabelas de dimensões maiores que dois e se deseja explorar relações mais complexas, as tabelas de contingência e os modelos log-lineares se prestam a isso (Powers e Xie, 2000). Além disso, a maioria dos trabalhos que fazem a

30 Variáveis categóricas são aquelas cuja resposta pode ser classificada em categorias, podem ser ordenadas em níveis (ordinais) ou não (nominais) (Agresti, 1990). Tanto raça/cor, quanto escolaridade, idade e religião podem ter suas respostas agrupadas por categorias.

análise de endo ou exogamia utiliza o modelo log-linear (Silva, 1987; Qian, 1997; Fu, 2001; Kalmijn e Flap, 2001; Gullickson, 2006; Oliveira, 2006; Ribeiro e Silva, 2009) e a utilização desse modelo também se justifica pela maior comparabilidade que pode ser obtida entre esses estudos.

Como a construção das tabelas de contingência permite calcular os percentuais de uniões intra e inter-raciais para as características selecionadas (escolaridade, religião, status marital), antes de se verificar as possíveis associações dessas variáveis, é necessário se levar em conta uma questão muito importante: o tamanho das categorias de raça/cor. Essa consideração é muito importante para o cálculo das taxas de endogamia e exogamia.

Como há uma diferença muito grande entre a proporção de brancos, pardos e principalmente pretos na população em geral e, conseqüentemente entre os casais, é preciso eliminar o efeito do tamanho dessas categorias envolvidas na análise, via padronização. Petrucelli (2001) utiliza esse recurso para analisar as taxas de endogamia da população brasileira em 1991, conforme discutido a seguir.

3.2.1.1 Padronização

Antes de se calcular as taxas de endo e exogamia é preciso padronizar os dados, para evitar interpretações equivocadas em função dos tamanhos diferenciados dos grupos de brancos, pardos e pretos. Quando se iguala o tamanho das categorias de raça/cor de homens e mulheres, é possível identificar um “padrão endogâmico intrínseco” da população. Esse procedimento também torna possível eliminar os efeitos de desequilíbrios na razão de sexo por categoria (Petrucelli, 2001 e Oliveira, 2006).

O procedimento de padronização vem de um método interativo, cujo objetivo é ajustar as tabelas de contingência por meio das distribuições marginais, de modo a manter a mesma associação observada ou estrutura de interação. Esse ajuste deverá terminar quando forem obtidos, para cada linha e coluna, os totais marginais iguais a 100 (Agresti, 1990). Para tornar os padrões de associação

mais nítidos, utiliza-se o método IPF (Iterative Proportional Fitting), ou método interativo de ajuste proporcional, que consiste na seguinte rotina:

(1) transformar os valores de cada célula na tabela (nij) em valores iniciais (

) 0 ( ˆij m ) no tempo t = 0, ou seja, ˆ(0) ij m = nij;

(2) em cada t = 1, 3, 5, ..., deverá ser feita a seguinte multiplicação: ) ( ˆ t ij m = ˆ(t−1) ij m + ) 1 ( ˆ 100 t i m (2) e ) 1 ( ˆ t+ ij m = ˆ(t) ij m + ) ( ˆ 100 t j m (3)

(3) essa multiplicação deverá ser repetida quantas vezes forem necessárias até se obter os totais marginais em cada linha e coluna iguais a 100.

Quando isso acontecer, a tabela está padronizada e as taxas de endogamia e exogamia poderão ser calculadas, de acordo com as medidas apresentadas a seguir.

3.2.1.2 Medidas de endogamia e exogamia

Após a padronização dos dados, ou seja, após eliminar o efeito do tamanho diferenciado dos grupos de raça/cor na população brasileira, será possível calcular algumas medidas clássicas de endogamia e exogamia.

Taxa Geral de Endogamia (TGE)

A Taxa Geral de Endogamia pode ser calculada de acordo com a característica de interesse. No caso das uniões intrarraciais, ela é definida pelo percentual de

uniões de cônjuges de mesma raça/cor em relação ao total de uniões. Sua formalização matemática é a seguinte:

TGE = = I i ii f f 1 .. (4)

onde fii se refere às células da tabela de contingência nas quais a linha é igual à

coluna, ou seja, a diagonal principal (cônjuges de mesma raça/cor) e ƒ.. é o total geral da tabela (total de todas as uniões).

Taxa de Exogamia Feminina Positiva e Negativa (TEFP e TEFN)

As Taxas de Exogamia Positiva e Negativa também podem ser calculadas de acordo com a variável de interesse. No caso específico deste trabalho, as taxas de exogamia permitem calcular os percentuais de uniões inter-raciais do ponto de vista feminino, separando-as em negativas, quando a mulher é de uma raça/cor de maior status social do que a do homem (mais claras); e positivas, quando o homem é que é de uma raça/cor de maior posição social (mulheres mais escuras).

Para calculá-las, utilizam-se as expressões abaixo:

TEFP = .. f f j i ij > (5) TEFN = .. f f j i ij < (6)

onde fij se refere às células da tabela de contingência fora da diagonal principal

(cônjuges de raça/cor diferentes) e ƒ.. é o total geral da tabela (total de todas as uniões).

Como se pode perceber, a TGE e as TEFP e TEFN são complementares, sendo a soma delas igual a 100%. Em outras palavras, é possível decompor as uniões a

partir dessas medidas, mensurando os percentuais de uniões intra e inter-raciais para cada tipo de união (formal, consensual e total).

Essas taxas serão calculadas também considerando cada uma das dimensões de análise - escolaridade e religião, para cada ano censitário. No caso da escolaridade, essas taxas serão calculadas para os casos de hipogamia (quando a mulher tem uma escolaridade inferior à do homem), endogamia (cônjuges com mesma escolaridade) e hipergamia (quando a mulher tem uma escolaridade superior à do homem). Para a religião, os casais serão agrupados em religiões iguais (endogamia por religião) e religiões diferentes (exogamia por religião). Após o cálculo dessas taxas, será elaborada uma análise mais aprofundada, buscando identificar as relações compensatórias entre as uniões e as demais características sócio-demográficas. Como já mencionado, o melhor método para a análise conjunta da raça/cor e escolaridade e raça/cor e religião dos cônjuges são os modelos log-lineares. Esses modelos são bastante úteis nesse tipo de análise de dados categóricos, quando se têm tabelas de contingência mais complexas, com mais variáveis e mais categorias (Souza e Benício, 1985). O cruzamento da raça/cor dos cônjuges com a escolaridade e a religião, considerando o tipo de união e o ano de análise, tem como resultado tabelas com muitas categorias, que podem dificultar a interpretação dessas características simultaneamente. Nesse caso, os modelos log-lineares são bastante utilizados para esse tipo de análise e serão explicados de forma mais detalhada na próxima seção.