• Nenhum resultado encontrado

Modelos de Goodman: Perfis das uniões pela cor dos casais

N/A
N/A
Protected

Academic year: 2021

Share "Modelos de Goodman: Perfis das uniões pela cor dos casais"

Copied!
22
0
0

Texto

(1)

Modelos de Goodman: Perfis das uniões pela cor dos casais

Raquel de Vasconcellos Carvalhaes de OliveiraMaysa Sacramento de MagalhãesAida Cecília Graciela Verdugo Lazo♦ Palavras-chave: endogamia; modelos log-lineares; cor.

Resumo

Neste artigo estuda-se endogamia por cor, procurando padrões nas escolhas dos arranjos matrimoniais baseados nos modelos log-lineares ou log-multiplicativos de Goodman. No Brasil, a variável cor é analisada como atributo autodeclarado pelo respondente, classificada em cinco categorias: branca, preta, amarela, parda, indígena.

Os modelos log-lineares propostos capturam a endogamia homogênea, ou seja, uniões dentro do mesmo grupo, como também são capazes de capturar o grau de afastamento desse comportamento endogâmico, através de padrões específicos como, por exemplo simetria, isto é, as uniões entre diferentes categorias de cor são similares independente do sexo. A causalidade nas escolhas dos cônjuges foi verificada através do modelo “ao acaso”, rejeitando-se esta hipótese em todos os casos.

Na modelagem da endogamia segundo cor, utilizaram-se modelos log-lineares bidimensionais considerando o total de uniões e o tipo de união, formal ou consensual através dos microdados da amostra do Censo 2000. A análise das estatísticas de qualidade de ajuste, tais como a razão de log-verossimilhança (G2) e o critério de informação bayesiano (BIC), possibilitou a escolha do melhor modelo ajustado para cada um dos três casos. Assim sendo, analisam-se os padrões entre eles, citando-se diferenças entre os modelos e parâmetros encontrados.

Trabalho apresentado no XV Encontro Nacional de Estudos Populacionais, ABEP, realizado em Caxambú- MG –

Brasil, de 18- 22 de Setembro de 2005.

Escola Nacional de Ciências Estatísticas - ENCE/IBGE. Escola Nacional de Ciências Estatísticas - ENCE/IBGE. Escola Nacional de Ciências Estatísticas - ENCE/IBGE.

(2)

Modelos de Goodman: Perfis das uniões pela cor dos casais

Raquel de Vasconcellos Carvalhaes de OliveiraMaysa Sacramento de Magalhães ♦ Aida Cecília Graciela Verdugo Lazo

1. Introdução

Endogamia consiste do estudo de uniões entre indivíduos pertencentes a um mesmo atributo, seja ele raça, religião, classe social, escolaridade, linhagens, dentre outros.Alguns autores, tais como, Strauss (1982), Silva (1987), Lazo (1991) abordam este tema com bastante propriedade. Portanto para um entendimento mais profundo de endogamia bem como, para verificar a importância da endogamia, foi feita uma revisão bibliográfica referente ao tema a fim de entender, mais especificamente, a melhor maneira de como abordar os dados, apresentá-los e também comparar resultados de diferentes anos ou culturas. A maioria dos artigos sobre endogamia envolve trabalhos internacionais, onde o atributo cor tende a ser tratado como raça devido à abrangência de conceitos culturais diferenciados. Portanto, para o tratamento do atributo de cor no Brasil, artigos nacionais de autores consagrados na área foram utilizados como referência. Já na área de modelagem da endogamia, a bibliografia se reduz muito, uma vez que a maioria dos autores trabalha com taxas e análise descritiva ao tratar deste assunto.

Alguns autores como Strauss (1982), Silva (1987), Qian (1997) e Kalmjin (1993; 2001) foram considerados essenciais para o delineamento dos modelos aqui propostos, embora muitas vezes a endogamia por cor não seja o objeto de estudo em muitos deles. No levantamento do estado da arte aqui apresentado mostra-se a importância do estudo das associações entre os casais, demonstrando como a escolha do parceiro ocorre nos mais diversos contextos.

Em 1971, Romney trabalhou com exemplos hipotéticos de endogamia a fim de apresentar um método iterativo do ajuste dos totais marginais, linha e coluna, através de multiplicadores linha e coluna, devido à proporção desigual dos grupos. Romney demonstra como essa diferença dos tamanhos dos grupos, principalmente devido à razão de sexos, implica em interpretações equivocadas das taxas, proporções e razões de proporções endogâmicas. Após a ilustração do uso

Trabalho apresentado no XV Encontro Nacional de Estudos Populacionais, ABEP, realizado em Caxambú- MG –

Brasil, de 18- 22 de Setembro de 2005.

Escola Nacional de Ciências Estatísticas - ENCE/IBGE. Escola Nacional de Ciências Estatísticas - ENCE/IBGE.

(3)

do seu método, o autor demonstra a consistência do método por meio de dados reais da vila de Aguacatenango (México) e dedados de linhagem e de origem da esposa de uma sociedade árabe, encontrando padrões de escolha maritais entre categorias adjacentes.

Strauss (1982) utiliza modelos log-lineares multiplicativos de Goodman para modelar a endogamia segundo a classe social e a endogamia de classe mensurada através da mobilidade social entre ocupação do marido e pai da esposa. Ele faz uma análise bidimensional da endogamia, além de propor uma análise de modelos tridimensionais por meio de exemplos didáticos. O método iterativo de padronização das marginais utilizado em Romney (1971) é criticado por Strauss, uma vez que ele propõe a inclusão da homogeneização da diagonal no método proposto por Romney. A modelagem log-linear bidimensional utiliza dados de classe social da vila de Aguacatenango (México) fornecidos por Romney. No caso da endogamia de classe social comparada entre as vilas de Aguacatenango e Socoltenango (ambas no México), dois tipos de configurações tri-dimensionais são testados: na primeira tentativa verifica-se que o padrão endogâmico é independente da cidade; na segunda inserem-se no modelo anterior interações que permitem a variação dos tamanhos de classes de mulheres e homens através das cidades, encontrando-se assim um melhor ajustamento aos dados. Na finalização do estudo, o autor padroniza uma tabela de dados de mobilidade social entre ocupação do esposo e pai da mulher usando modelos que levam em conta a natureza ordinal entre as categorias de profissão. Devido à diversidade de modelos e abordagens testados em tabelas de natureza endogâmica, esse autor foi de grande importância no delineamento do nosso estudo.

Silva (1987) discorre sobre as motivações para sua pesquisa, mostrando que do ponto de vista sociológico a endogamia por cor pode ser vista como “um indicador de grau de assimilação das minorias” e do ponto de vista demográfico seria a compreensão das mudanças na composição populacional, não só pela seletividade marital, mas também pela fecundidade marital. O conceito de “distância social” é empregado com cuidado no sentido de que a definição de cor estaria muito próxima a conceitos sócio-econômicos ou culturais, como classe social e preconceito, no nosso país. Modelos log-lineares bidimensionais são testados e constata-se que aquele que investiga a dificuldade ao cruzar as barreiras entre os grupos raciais nas escolhas maritais é o que se ajusta aos casais, derrubando a hipótese da distância social, isto é, que pardos tem comportamento próximo aos pretos, aproximando ao comportamento dos brancos.

A partir da década de 90, observa-se a crescente preocupação com investigação da endogamia, onde Lazo (1991) utiliza dados da PNAD de 1984 da cidade de São Paulo com a finalidade de estudar endogamia por anos de estudo de mulheres em primeira união onde o homem é o responsável pelo domicílio através de estudo de diferentes coortes. Kalmijn (1993) utiliza dados de 33 estados americanos de 1968 a 1986 na avaliação da endogamia de raça, avaliando que a exogamia ocorre geralmente entre mulheres de raças consideradas de alto prestígio e homens de raças de menor prestígio social e, por conseguinte, demonstrando ainda a ligação intrínseca entre raça e status sócio-econômico, utilizando para tal, modelos log-lineares de pelo menos três dimensões. Qian (1997) modela endogamia por raça utilizando dados do Censo de 1980 e 1990 dos EUA. Em alguns casos, modela endogamia segundo anos de estudo do casal. A endogamia homogênea e o modelo que chama de afinidade são ajustados com e sem escolaridade através de diversos anos, onde a estatística de razão de log-verossimilhança e o BIC confirmam os melhores ajustes em cada um dos casos. A distância social entre as raças se reflete

(4)

nas escolhas maritais em todos os grupos estudados, demonstrando a dificuldade em atravessar as “barreiras” entre as raças.

A preocupação com a modelagem da endogamia mostra-se mais detalhista na figura de Kalmijn (2001), que tem por objetivo estudar endogamia quanto a diversos atributos, por exemplo, idade, educação, classe de origem, religião do casal, utilizando dados de entrevistas de 1519 casais holandeses. O autor propõe diversos modelos log-lineares multidimensionais com restrições nas interações dos parâmetros dedados do homem e da mulher de forma a descrever padrões pré-definidos. No Brasil, Petruccelli (2001) estuda os mecanismos de endogamia/exogamia de cor de todas as uniões das PNAD´s de diversos anos (1987, 1995 e 1996), analisando freqüências e taxas com e sem ajuste dos grupos. O autor faz uma análise da distribuição de cor (PNAD de 1995) e da distribuição segundo sexo e estado conjugal no Censo de 1991 e analisa a distribuição de cor de uniões entre homens e mulheres segundo as faixas etárias mais extremas (jovens- 15 a 24 anos; mais velhos- acima de 65 anos).

A endogamia por cor é o objeto de estudo nesse artigo, procurando padrões nas escolhas dos arranjos matrimoniais baseados nos modelos log-lineares ou log-multiplicativos de Goodman utilizados na abordagem proposta em Strauss (1982), em complemento às taxas comumente citadas. Na modelagem da endogamia segundo cor utilizou-se modelos log-lineares bidimensionais considerando o total de uniões e o tipo de união, formal ou consensual. Os quase quatro milhões de microdados da amostra do Censo 2000 (IBGE, 2000) sobre casais foram utilizados na modelagem das tabelas de contingência das contagens das uniões. No Brasil, a variável cor é analisada como atributo autodeclarado pelo respondente, em cinco categorias: branca, preta, amarela, parda, indígena. Entretanto, segundo estudos brasileiros anteriores sobre endogamia (Silva,1987; Petrucelli, 2001) optou-se por trabalhar com quatro dessas categorias (não foram incluídos os indígenas devido ao pequeno tamanho amostral). Assim, os modelos log-lineares propostos capturam desde a endogamia homogênea, ou seja, uniões dentro do mesmo grupo até modelos capazes de detectar o grau de afastamento desse comportamento endogâmico, através de padrões específicos como simetria ou pesos ponderados atribuídos pela distância entre categorias, ou seja, levando em conta a ordenação entre categorias e, por conseguinte, atribuindo maiores ponderações as categorias adjacentes. A causalidade nas escolhas dos cônjuges foi verificada através do modelo “ao acaso”, rejeitando-se esta hipótese em todos os casos.

2. Modelos log-lineares

2.1. População, variáveis de estudo e taxas

A população alvo desse estudo é formada por casais participantes da amostra do Censo 2000 (IBGE, 2000), totalizando 3989713 uniões formais ou informais em território nacional. O atributo analisado é a cor ou raça de homens e mulheres, estratificados, posteriormente, segundo tipo de união. Na análise dos microdados do Censo 2000, amostra, utilizou-se o software SAS v 8.0, principalmente a Procedure Genmod para a obtenção dos resultados dos modelos. Trabalhou-se com tabelas de contingência, constituídas pelas categorias de dados de homens e mulheres, a fim de verificar a sua estrutura de concordância (Tabelas 1, 2 e 3 –Anexo)

A variável cor foi construída segundo pergunta fechada do questionário da amostra do Censo 2000, com cinco itens de resposta: "branca", "preta", "amarela", "parda" e "indígena". Nessa pergunta, os entrevistados se autodeclaram através de sua percepção pessoal. A minoria

(5)

dos respondentes se engloba na categoria "indígena", sendo assim, este foi suprimido das análises devido ao pequeno tamanho amostral (Silva,1987; Petrucelli, 2001).

A categoria "preta" é sabidamente subestimada devido ao fato que os possíveis respondentes desta cor se autodeclaram de cor “parda” (Silva, 1987, p.72). Em estudos anteriores sobre endogamia (Silva, 1987;Petruccelli, 2001) notou-se a tendência da cor preta se comportar tal e qual a cor parda e, embora fosse possível a agregá-las, procurou-se trabalhar com as duas categorias separadamente, pois espera-se comportamentos diferenciados segundo diversos atributos como, por exemplo, pelo tipo de união.

No presente artigo, procura-se testar diversos padrões nas escolhas maritais e um desses padrões considera as distâncias sociais entre os grupos raciais separados muitas vezes por diferenças sócio-econômicas, demográficas ou culturais que conduzem a “potenciais barreiras” a exogamia. Deste modo a ordenação necessária às categorias de cor não pretende trazer nenhuma importância a um grupo específico e sim, demonstrar distâncias sociais observadas entre as cores dos brasileiros. segundo análise dos atributos, principalmente, sócio-econômicos como classe social ou escolaridade. A ordenação das categorias foi feita considerando o trabalho de Silva (1987), em que a distância social dos grupos pode interferir nas escolhasdos indivíduos, ou seja, quanto mais distantes os indivíduos, maiores os obstáculos à uniãoentre grupos distintos.

O tipo de união do casal foi questionado através de pergunta fechada com opções variando do casamento civil e religioso, só casamento civil, só casamento religioso, união consensual até o nunca viveu (sob qualquer tipo de união). Na investigação das escolhas maritais, conforme mencionado acima, trabalhou-se com o total de uniões bem como com o tipo de união, formal ou consensual. O objetivo em trabalhar com tipo de união, separadamente, é que se cogita a hipótese que casamentos consensuais devem possuir maiores níveis de exogamia se comparados aos casamentos formais.

As tabelas de contingência podem ser avaliadas por medidas-resumo do comportamento endogâmico, onde probabilidades próximas à unidade indicam uma forte ocorrência entre uniões de "iguais". Essas medidas envolvem avaliações descritivas das contagens das células, e resumem a concordância a valores únicos. Na maioria dos casos, fazem-se abordagens diferenciadas do atributo e comparam-se freqüências e taxas de forma a descrever um padrão nos dados. A padronização descrita por Romney (1971) e Strauss (1977) é muitas vezes necessária para igualar os totais marginais (geralmente iguala-se a 100) antes do cálculo das taxas, a fim de evitar uma interpretação e conclusão errônea. Lazo (1988) descreve como o desequilíbrio da razão de sexos pode impactar negativamente nos resultados.

A taxa geral de endogamia (TGE) antes da padronização era de 71,02% passando para 74,13% afirmando a importância da padronização entre grupos de tamanhos desiguais. Ulteriormente à padronização, a taxa de endogamia ampliada (TEA) possui quase a totalidade de casais com 83,59%, demonstrando a procura de parceiros “iguais” ou de maior proximidade de características. As taxas marginais médias (TMME) segundo a cor variam bastante com elevados índices como já era esperado nos amarelos (94,44%) seguidos dos pretos (74,07%) e dos brancos (65,06%), onde o grupo pardo é o grupo de maior mobilidade entre as diversas categorias com 62,96%, consolidando-se como o mais propício às uniões exogâmicas. A interpretação dos valores da razão de sexos (Tabela 4) é importante já que demonstra que existem mais homens nas

(6)

categorias parda e preta, conduzindo a “pressões“ na procura por companheiras nas demais categorias, refletindo principalmente nas taxas de endogamia dos grupos branco e pardo.

Tabela 4

Razão de sexos calculada segundo a cor do respondente

Cor Branca Amarela Parda Preta Média

Razão de sexos 0,9229 0,9553 1,0826 1,0185 0,9948 Fonte: Censo 2000/IBGE.

As taxas de exogamia feminina demonstram que a união de mulheres mais claras e homens mais escuros é o mais freqüente (13,19% do total de uniões) nas associações maritais, como já citado por Silva em 1987.

2.2. Ferramental teórico

A vantagem principal da análise exploratória é a sua fácil utilização e interpretação conduzida pela simples observação, entretanto, torna-se complicada o seu emprego em grandes dimensões. O objetivo não é resumir toda a relação endogâmica das caselas da tabela em uma única medida e sim descrever como é o padrão de comportamento dos casais segundo cor, demonstrando se há influência do tipo de união nesse tipo de endogamia. Portanto, na análise de dados categóricos são propostos os modelos log-lineares já descritos por Bishop (1975), Agresti (1990), Christensen (1997) e Powers & Xie (2000). Assim, os modelos testados impõem restrições nas suas interações de maneira a descrever alguns possíveis padrões.

Utilizados na análise de dados envolvendo variáveis ordinais ou nominais, onde todas as variáveis envolvidas no modelo devem ser categóricas com mais de duas categorias (Dobson, 1990). Modelos log-lineares são diferentes das regressões lineares no sentido que a variável resposta corresponde às próprias freqüências observadas ao invés de uma variável de interesse (Powers & Xie, 2000). Num modelo deste tipo existem vários parâmetros e deve-se focar em parâmetros significantes que geralmente são as interações.

Modelo saturado: ijRC C j R i ij F =μ+μ +μ +μ log

onde Fij é a freqüência esperada das células fij , i é a i-ésima linha, j é a j-ésima coluna e μ é o log

de um dado parâmetro τ. A distribuição de probabilidades utilizada no caso da endogamia é a distribuição de Poisson com ligação canônica log, pois possui a vantagem de ser tratada mais facilmente computacionalmente e possui convergência com as demais distribuições no cálculo da Estimativa de Máxima Verossimilhança, segundo Birch (1963). As estimativas de máxima verossimilhança dos coeficientes são calculadas através do método iterativo de Newton-Raphson. Estatísticas de qualidade de ajuste

(7)

A estatística Qui-quadrado de Pearson é utilizada para verificação, à priori, da hipótese nula de independência entre categorias de duas variáveis. Esta estatística envolve valores observados e esperados, e a princípio desde que os valores esperados sejam calculados através dos resultados dos modelos, esta seria uma boa medida de adequação de ajuste.

∑∑

= = − = I i J j ij ij ij F F f 1 1 2 2 ( ) χ

Alternativamente é proposta a estatística de Razão de Log-Verossimilhança G2 que leva em consideração as verossimilhanças dos modelos, sendo muito mais eficiente, portanto na avaliação da qualidade do ajustamento. Diversos autores já citaram que quando se trabalha com grandes tamanhos amostrais, torna-se mais fácil encontrar rejeição da hipótese nula, já que é mais fácil encontrar significância em qualquer teste efetuado (Bishop, 1975; Hauser, 1980; Strauss, 1982 ; Agresti, 1990). Alternativas propostas por Christensen (1997) e por Powers & Xie (2000) como o Critério de Informação Bayesiano (BIC), R2 e Akaike são descritos posteriormente.

A função denominada de Deviance, ou estatística da razão de log –verossimilhança (G2), faz a comparação entre o log das verossimilhanças do modelo saturado e do modelo testado (ou incompleto). Escrevendo a função Deviance da forma da família exponencial e particularizando a estatística para a Distribuição de Poisson, tem-se:

2 2 1 1 2 ~ )} ( ) / (ln { 2 )} ( ) ln (ln { 2 p n i i i i n i i i i i i n i i G F f F f f f F F f f G − = = ⇒ − − = = − + − =

χ

Critério de Informação Bayesiano (BIC)

O uso da estatística G2 tem sido criticado, pois em grandes amostras é mais fácil aceitar modelos mais complexos, uma vez que é construída para detectar qualquer desvio do modelo em relação aos dados observados. Ao adicionar qualquer variável em um modelo, sabe-se que o ajuste é aprimorado sendo que no caso de grandes amostras não se sabe distinguir se essa melhoria no ajuste é real ou não (Power & Xie, 2000). O critério de informação bayesiano penaliza a estatística de razão de log-verossimilhança em relação ao tamanho amostral e, portanto, valores negativos indicariam um bom ajuste.

) log( 2 n DF G BIC= − R2 e R2 ajustado

O R2 mede a porcentagem de variabilidade total nos dados, já que se testa o modelo que melhor se ajusta aos dados em relação ao modelo de pior ajuste. Desta forma, as estatísticas G2

(8)

funcionariam como estimativas da soma quadrada dos erros de uma regressão comum, permitindo a avaliação de qualidade de ajuste dos log-lineares também por esta abordagem.

) ( ) ( ) ( 0 2 2 0 2 2 X G X G X G R = −

onde G2(X0) e G2(X) são as estatísticas da Razão de Log-Verossimilhança para os modelos comparados ao saturado, em que o X0 é o menor modelo.

O R2 geralmente possui o problema que não penaliza o cálculo pelo número de variáveis inseridas, e sabe-se que num modelo de Regressão Múltipla qualquer nova variável melhoraria o modelo, pois se baseia na soma de variabilidades. Assim, procurou-se penalizar as estatísticas G2 pela diferença dos graus de liberdade do modelo testado com o saturado.

) /( ) ( ) /( ) ( 1 0 0 2 2 2 r q X G r q X G ajustado R − − − =

onde q é o número de células na tabela, devido o número de parâmetros do saturado, e r e r0 são

os graus de liberdade dos modelos X e X0. Akaike e Akaike Corrigido

O critério de informação Akaike (Akaike, 1974; Christensen, 1997) é baseado no princípio da máxima verossimilhança, procurando um modelo que maximize a informação e seja parcimonioso. Para tal, o Akaike minimizado indicará o melhor ajuste aos dados.

] 2 [ ) ( 2 r q X G AIC= − −

Uma alternativa ao Akaike comumente calculada é uma correção ao subtrair os graus de liberdade, onde o AICc é avaliado da mesma forma que o AIC.

] [ 2 ) ( 2 r q X G AICc= − − 2.3. Modelando endogamia

Os modelos log-lineares podem ser descritos da forma multiplicativa ou aditiva, sendo a última mais aplicada pela facilidade de formalização. Os modelos multiplicativos de Goodman são descritos na literatura desde Bishop (1975) para a análise de tabelas de contingência, onde o primeiro a utilizar esse tipo de modelagem para endogamia foi Romney (1971) com uma abordagem iterativa. Strauss inicia a proposta de diversos modelos log-lineares apropriados a medir endogamia dispostos de forma hierárquica, onde se pode testar o modelo mais parcimonioso através de testes de significância entre as estatísticas de Razão de Log-Verossimilhança (G2). A análise dos modelos log-lineares aqui descrita pretende chegar ao melhor modelo testado para o total de uniões, uniões formais e uniões consensuais e comparar os achados.

(9)

Modelo multiplicativo: ijRC C j R i ij F =ττ τ τ Modelo aditivo: ijRC C j R i ij F =μ+μ +μ +μ log

A notação matricial das interações também é definida para cada uma das possíveis configurações topológicas, em que cada nível é um parâmetro de interação diferente entre a i-ésima linha e j-i-ésima coluna. As matrizes são construídas com base nas razões de chance parciais de maneira a descrever padrões desejados ao agrupar comportamentos semelhantes.

Modelo de exogamia total

O modelo de exogamia total verifica se a associação se dá ao acaso, ou seja, não há nenhuma relação de dependência entre os efeitos principais testados, não sendo imposta nenhuma interação. Modelo A: Cj R i ij F =μ+μ +μ log

com (I-1)(J-1) graus de liberdade (gl).

Supondo uma tabela de dimensão 4 X 4, as interações do modelo de independência podem ser descritas em notação matricial por:

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

Modelo de Endogamia Homogênea

O modelo de endogamia homogênea (Strauss, 1982) verifica se existe concordância exata entre os casais quanto a um determinado atributo. Esta configuração é o modelo de independência acrescido de um parâmetro que mede a concordância na diagonal principal da matriz e outro que incide fora da diagonal medindo sua discordância, foi desenvolvido por Goodman em 1972. A endogamia homogênea significa dizer que houve concordância exatamente nos mesmos escores nos dois momentos, que seria a “concordância perfeita”, porém, quase impossível obtê-la na prática. Este modelo é o mais discutido em bibliografia referente, pode ser encontrado também em Bishop (1975), Agresti (1990), Powers & Xie (2000), Strauss (1982), Qian (1997), Hauser (1980), Kalmjin (2001). Modelo B: ⎩ ⎨ ⎧ = = + + + = contrário caso j i se onde F ijRC RC ij C j R i ij , 0 , , log μ μ μ μ μ δ

com (I-1)(J-1) -1 graus de liberdade. Supondo uma tabela de dimensão 4 X 4, as interações do modelo de endogamia homogênea podem ser descritas em notação matricial por:

(10)

2 1 1 1 1 2 1 1 1 1 2 1 1 1 1 2 Modelo de Quasi-Independência

O modelo de quasi-independência é aquele em que exluindo a diagonal principal, os demais elementos “assumem” o modelo de independência, através de parâmetros incidentes sobre a diagonal principal, ou ainda, é uma generalização da endogamia homogênea em que a restrição na interação varia de acordo com cada casela da diagonal principal. Von Eye (2000) chama esse modelo de concordância diagonal com diferentes pesos.

Modelo C: ⎩ ⎨ ⎧ = = + + + = contrário caso j i se onde F ijRC i RC ij C j R i ij , 0 , , log μ μ μ μ μ δ

com (I-1)(J-1)-I graus de liberdade. Podem-se igualar os parâmetros da diagonal principal a um único δ (independente de i e j), assumindo o particular modelo de endogamia homogênea. Supondo uma tabela de dimensão 4 X 4, as interações de quasi-independência podem ser descritas em notação matricial por:

5 1 1 1 1 4 1 1 1 1 3 1 1 1 1 2

Modelo de associação linear por linear (uniforme)

O modelo de associação linear por linear procura verificar padrões ordinais nas respostas a um determinado atributo, ideal para o caso de variáveis categóricas como Anos de estudo.

Modelo D: F C ij j R i ij =μ+μ +μ +β log

com (I-1)(J-1) -1 graus de liberdade, onde i e j representam os valores (postos) que devem ser fixados ou conhecidos para as categorias das variáveis explicativas. O parâmetro β mede a associação linear entre esses valores de i (variável linha) e j (variável coluna), e como esses valores de i e j têm uma ordenação ao serem atribuídos para cada linha e coluna, diz-se que esta é uma associação comumente esperada quando os dados são do tipo ordinal. O tipo de associação muito utilizado na literatura desde Goodman (1979), tem sido o de associação do tipo uniforme, onde o escore atribuído à categoria i=j aumenta progressivamente em uma unidade.

(11)

Supondo uma tabela de dimensão 4 X 4, as interações de associação uniforme podem ser expressas em notação matricial por:

16 12 8 4 12 9 6 3 8 6 4 2 4 3 2 1

Modelo de associação linear por linear (uniforme) com restrição na diagonal

Essa nova configuração une a associação ordinal medida pelo parâmetro de associação uniforme com o parâmetro que verifica a concordância diagonal com pesos idênticos.

Modelo E: ⎩ ⎨ ⎧ = = + + + + = contrário caso j i se onde ij F RC ij RC ij C j R i ij , 0 , , log μ μ μ β μ μ δ

com (I-1)(J-1)–2 graus de liberdade. Supondo uma tabela de dimensão 4 X 4, as interações de associação uniforme mais concordância homogênea, podem ser expressas em notação matricial por: 2 12 8 4 12 2 6 3 8 6 2 2 4 3 2 2

Modelo de Semi-Associação (Goodman, 1979)

Seria uma composição dos parâmetros de interação do modelo de Associação Uniforme e Quasi-Independência, ou seja, somente introduz pesos diferentes à diagonal principal em relação ao modelo anterior. Modelo F: ⎩ ⎨ ⎧ = = + + + + = contrário caso j i se onde ij F ijRC i RC ij C j R i ij , 0 , , log μ μ μ β μ μ δ

com (I-1)(J-1) –I-1 graus de liberdade

Supondo uma tabela de dimensão 4 X 4, as interações de um semi-associação podem ser descritas em notação matricial por:

5 12 8 4 12 4 6 3 8 6 3 2 4 3 2 2

(12)

Modelo de Quasi – simetria

O melhor no contexto da endogamia, já que os fij e fji podem diferir por causa da

eligibilidade das contagens, fi. e f.j, e o contrário.Geralmente é o melhor modelo ajustado no

estudo das interrelações, pois é utilizada com totais desiguais. O modelo de Quasi-Simetria, permite heterogeneidade nas marginais, mas restringe as interações ao fenômeno da simetria através da diagonal principal.

Modelo G: CRji RC ij RC ij C j R i ij onde F =μ+μ +μ +μ , μ =μ log

com (I-1)(I-2) graus de liberdade.

Supondo uma tabela de dimensão 4 X 4, as interações de simetria podem ser formuladas matricialmente como: 5 8 7 1 8 4 6 1 7 6 3 1 1 1 1 2

Modelo Crossing (Goodman, 1972)

A hipótese implícita em um modelo crossing é que diferentes categorias de uma variável nominal apresentam vários graus de dificuldade para atravessar de um nível para outro. Portanto, esse tipo de modelo supõe ordenação nos dados, tentando identificar as dificuldades ao cruzar as barreiras inter-raciais. Modelo H: Fij =ττiRτCjτijRC sendo ⎪ ⎪ ⎪ ⎪ ⎩ ⎪⎪ ⎪ ⎪ ⎨ ⎧ < > =

− = − = contrario caso j i para j i para j i u u i j u u RC ij , 1 ; , ; , 1 1 ν ν τ

com (I-1)(J-1)-(I-1) graus de liberdade.

Supondo uma tabela de dimensão 4 X 4, as interações de crossing podem ser descritas em notação matricial por:

(13)

4 3 3 2 3 2 1 3 3 2 2 1 3 2 2 2 1 3 2 1 2 1 1 1 ξ ν ν ν ν ν ν ν ξ ν ν ν ν ν ν ξ ν ν ν ν ν ν ν ξ

onde as matrizes dos parâmetros νi podem ser escritas como:

4 3 4 2 1 1 0 0 0 1 0 0 0 1 0 0 0 1 1 1 1 0 ν 4 3 4 2 1 2 0 0 1 1 0 0 1 1 1 1 0 0 1 1 0 0 ν 4 3 4 2 1 3 1 1 1 1 1 0 0 0 1 0 0 0 1 0 0 0 ν

Modelo Crossing com restrição na diagonal

Nessa versão do modelo crossing, inserem-se parâmetros diferentes na diagonal principal atribuindo assim comportamento diferenciado nas células endogâmicas como no modelo de quasi-independência. Modelo I: RC ij C j R i ij F =ττ τ τ sendo ⎪ ⎪ ⎪ ⎪ ⎩ ⎪⎪ ⎪ ⎪ ⎨ ⎧ = < > =

− = − = j i se j i para j i para i j i u u i j u u RC ij , ; , ; , 1 1 ξ ν ν τ

com (I-1)(J-1)-(I-1)-I graus de liberdade. Os parâmetros diagonais se dão tal qual o modelo de quasi-independência e os parâmetros crossing como o do modelo H, e suas matrizes são idênticas aos dos modelos já citados.

3. Análise dos resultados

Para as abordagens de todos os tipos de união, uniões formais e consensuais chegamos a mesma conclusão através da análise do menor valor BIC, maior R2 Ajustado e menor AICc: o melhor modelo aos dados de contagens é o modelo crossing com restrição na diagonal (Modelo I). Como já esperado, a estatística de Razão de Log-Verossimilhança indica péssimo ajuste aos dados devido, principalmente, ao grande tamanho amostral. Assim o modelo mais parcimonioso aos dados é aquele que considera barreiras diferenciadas segundo as categorias raciais e endogamia intrínseca.

(14)

A Tabela 5 demonstra que o BIC de 57,72, um R2 ajustado que explica 100% da variabilidade total e AICc de apenas 59,89 confirmam que o modelo I é o encontrado ao se estudar o conjunto de totais de uniões na avaliação das escolhas dos cônjuges por cor.

Tabela 5:

Estatísticas de qualidade de ajuste de todas as uniões Modelos G2 BIC gl G2/gl

p-valor R

2 R2

Ajustado AIC AICc

Modelo A 1339658,56 1339521,91 9 148850,95 0,0000 - - 1339660,56 1339644,56 Modelo B 131532,93 131411,46 8 16441,62 0,0000 0,9018 0,9141 131532,93 131516,93 Modelo C 6111,93 6036,01 5 1222,39 0,0000 0,9954 0,9971 6105,93 6089,93 Modelo D 364752,90 364631,43 8 45594,11 0,0000 0,7277 0,7618 364752,90 364736,90 Modelo E 120480,45 120374,17 7 17211,49 0,0000 0,9101 0,9301 120478,45 120462,45 Modelo F 1775,92 1715,19 4 443,98 0,0000 0,9987 0,9992 1767,92 1751,92 Modelo G 1764,11 1718,56 3 588,04 0,0000 0,9987 0,9993 1754,11 1738,11 Modelo H 124083,32 123992,22 6 20680,55 0,0000 0,9074 0,9352 124079,32 124063,32 Modelo I 87,89 57,52 2 43,94 0,0000 0,9999 1,0000 75,89 59,89

As uniões formais apresentam o mesmo modelo consolidado para o estudo de cor (BIC=12,35, R2 ajustado=1,0000 e AICc=14,05) apresentando uma melhora na adequação das estatísticas de qualidade de ajuste.

(15)

Tabela 6:

Estatísticas de qualidade de ajuste de uniões formais Modelos G2 BIC gl G2/gl

p-valor R

2 R2

Ajustado AIC AICc

Modelo A 1038577,62 1038443,97 9 115397,51 0,0000 - - 1038579,62 1038563,62 Modelo B 115505,85 115387,06 8 14438,23 0,0000 0,8888 0,9027 115505,85 115489,85 Modelo C 5398,79 5324,54 5 1079,76 0,0000 0,9948 0,9967 5392,79 5376,79 Modelo D 274186,50 274067,70 8 34273,31 0,0000 0,7360 0,7690 274186,50 274170,50 Modelo E 106576,89 106472,94 7 15225,27 0,0000 0,8974 0,9202 106574,89 106558,89 Modelo F 1196,47 1137,07 4 299,12 0,0000 0,9988 0,9993 1188,47 1172,47 Modelo G 1193,86 1149,31 3 397,95 0,0000 0,9989 0,9994 1183,86 1167,86 Modelo H 103901,39 103812,29 6 17316,90 0,0000 0,9000 0,9300 103897,39 103881,39 Modelo I 42,05 12,35 2 21,03 0,0000 1,0000 1,0000 30,05 14,05

Os casais sob uniões consensuais embora apresentem valores similares nas estatísticas de teste e encontrem o modelo I apresentam uma discreta queda na qualidade do ajuste se comparado às uniões formais.

Tabela 7:

Estatísticas de qualidade de ajuste de uniões consensuais Modelos G2 BIC gl G2/gl

p-valor R

2 R2

Ajustado AIC AICc

Modelo A 263680,73 263555,42 9 29297,86 0,0000 - - 263682,73 263666,73 Modelo B 16673,65 16562,26 8 2084,21 0,0000 0,9368 0,9447 16673,65 16657,65 Modelo C 769,09 699,47 5 153,82 0,0000 0,9971 0,9981 763,09 747,09 Modelo D 88131,21 88019,82 8 11016,40 0,0000 0,6658 0,7075 88131,21 88115,21 Modelo E 15890,16 15792,70 7 2270,02 0,0000 0,9397 0,9531 15888,16 15872,16 Modelo F 501,24 445,54 4 125,31 0,0000 0,9981 0,9989 493,24 477,24 Modelo G 482,06 440,29 3 160,69 0,0000 0,9982 0,9990 472,06 456,06 Modelo H 16964,72 16881,18 6 2827,45 0,0000 0,9357 0,9550 16960,72 16944,72 Modelo I 44,05 16,20 2 22,02 0,0000 0,9998 0,9999 32,05 16,05

Após a definição do modelo, parte-se à análise das estimativas dos coeficientes (tabelas 8,9 e 10). Ao se analisar as estimativas correspondentes às barreiras inter-raciais confirmam-se as dificuldades de atravessar as variações da cor branca à preta, sendo a travessia parda-preta a de maior obstáculo. Quando se concentra nas uniões ditas formais percebe-se que os valores dos parâmetros crossing são maiores enquanto que nas uniões consensuais a diferença entre as

(16)

categorias é bem pequena. A endogamia homogênea também é medida através de parâmetro na diagonal, onde se observam que existem maiores valores nos casamentos entre amarelos, seguidos dos pretos, brancos e por último os pardos. O tipo de união demonstra que os consensuais apresentam uma menor concordância entre indivíduos de mesma cor do que as uniões oficiais.

Tabela 8:

Estimativas dos coeficientes do modelo crossing (Todas as uniões) Parâmetros Graus de

liberdade Coeficientes Desvio-padrão IC 95% quadrado Qui- valor

p-Intercepto 1 11,6164 0,0030 11,6105 11,6223 1,50E+07 <,0001 Cor do Homem Branca 1 1,9931 0,0117 1,9702 2,0160 29067,1 <,0001 Cor do Homem Amarela 1 -3,5267 0,0282 -3,5819 -3,4715 15680,7 <,0001 Cor do Homem Parda 1 1,1578 0,0276 1,1038 1,2118 1765,93 <,0001 Cor do Homem Preta 0 0,0000 0,0000 0,0000 0,0000 . . Cor da Mulher Branca 1 2,3201 0,0134 2,2939 ‘ 30012,9 <,0001 Cor da Mulher Amarela 1 -3,5609 0,0227 -3,6055 -3,5163 24509,8 <,0001 Cor da Mulher Parda 1 1,2909 0,0285 1,2350 1,3467 2052,4 <,0001 Cor da Mulher Preta 0 0,0000 0,0000 0,0000 0,0000 . . Crossing 1 1 -0,2856 0,0276 -0,3397 -0,2316 107,3 <,0001 Crossing 2 1 -0,4926 0,0111 -0,5143 -0,4708 1968,68 <,0001 Crossing 3 1 -0,6239 0,0278 -0,6785 -0,5693 501,89 <,0001 Diagonal 2 1 -1,5648 0,0247 -1,6132 -1,5163 4005,52 <,0001 Diagonal 1 1 -1,2667 0,0553 -1,3751 -1,1584 524,97 <,0001 Diagonal 3 1 4,8958 0,0487 4,8004 4,9911 10125,1 <,0001 Diagonal 4 1 -0,3192 0,0558 -0,4286 -0,2098 32,69 <,0001 Diagonal 5 0 0,0000 0,0000 0,0000 0,0000 . .

(17)

Tabela 9:

Estimativas dos coeficientes do modelo crossing (União Formal) Parâmetros Graus de

liberdade Coeficientes Desvio-padrão IC 95% quadrado Qui- valor

p-Intercepto 1 11,1654 0,0038 11,1580 11,1727 8806531 <,0001 Cor do Homem Branca 1 2,2171 0,0145 2,1887 2,2455 23432,4 <,0001 Cor do Homem Amarela 1 -3,3934 0,0339 -3,4598 -3,3269 10010,2 <,0001 Cor do Homem Parda 1 1,1790 0,0338 1,1128 1,2453 1216,87 <,0001 Cor do Homem Preta 0 0,0000 0,0000 0,0000 0,0000 . . Cor da Mulher Branca 1 2,6003 0,0169 2,5672 2,6334 23675,4 <,0001 Cor da Mulher Amarela 1 -3,4248 0,0285 -3,4806 -3,3689 14449,9 <,0001 Cor da Mulher Parda 1 1,3269 0,0351 1,2580 1,3958 1426,61 <,0001 Cor da Mulher Preta 0 0,0000 0,0000 0,0000 0,0000 . . Crossing 1 1 -0,3790 0,0338 -0,4452 -0,3128 125,9 <,0001 Crossing 2 1 -0,5723 0,0137 -0,5991 -0,5455 1755,47 <,0001 Crossing 3 1 -0,7484 0,0342 -0,8155 -0,6814 479,04 <,0001 Diagonal 2 1 -1,8346 0,0309 -1,8951 -1,7741 3532,8 <,0001 Diagonal 1 1 -1,3205 0,0678 -1,4534 -1,1876 379,32 <,0001 Diagonal 3 1 5,0286 0,0597 4,9115 5,1457 7084,14 <,0001 Diagonal 4 1 -0,3739 0,0686 -0,5084 -0,2394 29,69 <,0001 Diagonal 5 0 0,0000 0,0000 0,0000 0,0000 . .

(18)

Tabela 10:

Estimativas dos coeficientes do modelo crossing (União Consensual)

Parâmetros Graus de

liberdade Coeficientes Desvio-padrão IC 95% quadrado Qui- valor

p-Intercepto 1 10,6032 0,0050 10,5934 10,6129 4526604 <,0001 Cor do Homem Branca 1 1,4899 0,0208 1,4491 1,5306 5133,3 <,0001 Cor do Homem Amarela 1 -3,8300 0,0526 -3,9331 -3,7268 5295,88 <,0001 Cor do Homem Parda 1 1,1891 0,0486 1,0938 1,2844 598,2 <,0001 Cor do Homem Preta 0 0,0000 0,0000 0,0000 0,0000 , . Cor da Mulher Branca 1 1,7407 0,0230 1,6957 1,7858 5730,61 <,0001 Cor da Mulher Amarela 1 -3,7388 0,0379 -3,8130 -3,6646 9755,19 <,0001 Cor da Mulher Parda 1 1,3314 0,0498 1,2337 1,4291 713,31 <,0001 Cor da Mulher Preta 0 0,0000 0,0000 0,0000 0,0000 , . Crossing 1 1 -0,0624 0,0488 -0,1581 0,0333 1,63 0,2015 Crossing 2 1 -0,2189 0,0200 -0,2582 -0,1797 119,32 <,0001 Crossing 3 1 -0,3327 0,0490 -0,4288 -0,2366 46,01 <,0001 Diagonal 2 1 -1,1044 0,0433 -1,1893 -1,0194 649,2 <,0001 Diagonal 1 1 -1,3613 0,0976 -1,5526 -1,1701 194,59 <,0001 Diagonal 3 1 3,3444 0,0928 3,1625 3,5263 1298,48 <,0001 Diagonal 4 1 -0,3954 0,0982 -0,5878 -0,2029 16,22 <,0001 Diagonal 5 0 0,0000 0,0000 0,0000 0,0000 . .

(19)

4. Considerações Finais

Os modelos log-lineares de Goodman são excelentes ferramentas na análise de endogamia, uma vez que possibilitam verificar um padrão nas escolhas maritais com a possibilidade de controle de grupos de tamanhos desiguais através da inserção dos efeitos principais. Ou seja, tais modelos são mais que um complemento às medidas resumo,

tradicionalmente, utilizadas.

Na abordagem quanto ao tipo de união (formal ou consensual) verificou-se que, além da tradicional procura de cônjuges com características iguais, como já encontrado por Silva (1987), a distância social influencia o mercado matrimonial, uma vez que quanto maior a distância social dos indivíduos menor a chance da união se concretizar. Ou seja, indivíduos de características sociais “menos” favorecidas são menos propensos a uniões com indivíduos pertencentes aos demais grupos, sendo os primeiros, mais predispostos às uniões endogâmicas. As uniões consensuais apresentaram menores pressões quanto a casamentos endogâmicos, permitindo maior exogamia pela maior mobilidade inter-racial em contraposição aos casamentos formais. Os amarelos constituem-se o grupo mais endogâmico, enquanto que ospardos o de maior exogamia e com maior proximidade do grupo preto.

O tipo de união tem grande importância na escolha do parceiro quanto à cor, deste modo, sugere-se como trabalhos futuros à verificação da influência da escolaridade ou renda nestas escolhas, uma vez que se supõe que as uniões consensuais possuem similaridades quanto aos anos de estudo do casal e estes seriam os responsáveis pela maior propensão a exogamia e menores distâncias sociais. Do mesmo modo, os casais em primeira união podem apresentar padrões diferenciados, logo o estudo de modelos log-lineares de mais de duas dimensões deve propiciar um maior entendimento desse padrões.

5.

Referências

o AGRESTI, A., 1990. Categorical data analysis. New York: John Wiley.

o AKAIKE, H., 1974. A New Look at the Statistical Model Identification. IEEE

Transactions on Automatic Control, v. ac-19 n.6.

o BIRCH, M.W., 1963. Maximum likelihood in three-way contingency tables. Journal of

The Royal Statistical Society -Series B, v. 25, p. 220-233.

o BISHOP, Y.M.M.; FIENBERG, S.E.; HOLLAND, P.W., 1975. Discrete Multivariate Analysis: Theory and Practice. The MIT Press. Cambridge, Massachusetts, e Londres,

Inglaterra.

o CHRISTENSEN, R., 1997. Log-Linear Models and Logistic Regression. Second Edition.

New-York: Springer-Verlag.

o DOBSON, A. J., 1990. An Introduction to Generalized Linear Models. Ed. Chapman &

Hall.

o IBGE, Instituto Brasileiro de Geografia e Estatística , 2000. Censo Demográfico - 2000 :

(20)

http://www.ibge.gov.br/home/estatistica/populacao/censo2000/populacao/cor_raca_Censo 2000.pdf

o KALMIJN, M., 1993. Trends in black/white intermarriage. Social Forces; v.72 n.1 p.119-136.

o KALMJIN, M.; FLAP, H.; 2001. Assortative Meeting and Mating: Unintended Consequences of Organized Settings for Partner Choices. Social Forces; v.79, p.1289-1312.

o LAZO, A.C.G.V., 1988. Medidas Estatísticas de Endogamia: Uma Introdução Didática.

Material didático do Departamento de Estatística / IMECC-Unicamp.

o LAZO, A.C.G.V., 1991. Nupcialidade em São Paulo: Um Estudo por Corte e Coorte. Tese de Doutorado. Departamento de Ciências Sociais do Instituto de Filosofia e

Ciências Humanas (IFCH) /Universidade Estadual de Campinas (Unicamp).

o PETRUCCELLI, J. L., 2001. Seletividade por cor e escolhas conjugais no Brasil dos 90.

Estudos Afro-Asiáticos; ano 23, v.1, p. 29-52.

o POWERS, D.A.; XIE, Y., 2000. Statistical methods for categorical data analysis.

Academic Press San Diego.

o QIAN, Z., 1997. Breaking the racial barriers: variations in interracial marriage between 1980 and 1990. Demography; v. 34, n. 2, p. 263-276.

o ROMNEY, K., 1971. Measuring endogamy. In: Kay, Paul (ed). Exploration in

mathematical anthropology; p.191-213.

o SILVA, N. V. 1987. Distância social e casamento inter-racial no Brasil. Estudos

Afro-Asiáticos; v.14, p. 54-84.

o STRAUSS, D. J.; ROMNEY, K., 1982. Log-Linear Multiplicative Models for the Analysis of Endogamy. Ethnology; v. 21, p. 79-99.

(21)

6. Anexo

Tabela 1:

Distribuição dos casais brasileiros segundo cor Cor

Homem/Mulher Branca Amarela Parda Preta Total Branca 1732129 4777,2 383236 56218 2176360 Amarela 7146,4 12390 1828,3 394,16 21758 Parda 464721 2123,9 932787 53417 1453048 Preta 78257 527,15 85270 110904 274958 Total 2282253 19817,8 1403122 220933 3926125 Tabela 2:

Distribuição das uniões formais segundo cor

Cor

Homem/Mulher Branca Amarela Parda Preta Total Branca 1394600 3814,9 252241 31529 1682185 Amarela 5885,5 11800 1236,7 236,06 19159

Parda 318927 1366,6 595637 29055 944985

Preta 46414 281,11 48621 70641 165958

(22)

Tabela 3:

Distribuição das uniões consensuais segundo cor Cor

Homem/Mulher Branca Amarela Parda Preta Total Branca 337530 962,24 130995 24688 494175

Amarela 1260,9 589,19 591,65 158,1 2599,9

Parda 145794 757,3 337150 24361 508063

Preta 31843 246,03 36650 40262 109001

Referências

Documentos relacionados

Dessa maneira, nos pautamos nas noções de experiência, de estesia e de reversibilidade dos sentidos, a partir da fenomenologia de Merleau-Ponty 1999; 2014; de tradição, em Almeida

AtravŽs dessas iniciativas, Paula e Cristiano buscam atingir o quanto antes a vis‹o da Onodera EstŽtica - Unidade Bela Vista ÒSer referncia no ramo de estŽtica

A pecuária de corte no Brasil passa por rápidas e intensas transformações que acionam, diretamente, diversos segmentos de sua estrutura de produção, passando pelos geradores

Acredita-se que as pes- soas especiais devem estar presentes não só como ouvintes, mas como agentes que possam estar envolvidos nas discussões e decisões sobre uma

3.2 Objetivos específicos a utilizar técnicas de sensoriamento remoto para determinar índices de vegetação e avaliar a dinâmica da cobertura vegetal no Alto Ipanema ao longo dos anos

Professor André: A questão da robótica na licenciatura eu tive uma introdução mas foi bem rápida, não foi bem detalhada não, mas a questão de trabalhar na escola foi quando chegou

Os desfechos pesquisados foram o impacto do diabetes mellitus tipo 1 sobre a qualidade de vida de crianças e adolescentes com esse problema e os principais

tratando do ambiente escolar, quando a criança se desvincula do seio familiar para inserir na escola ela já trás consigo um referencial de aprendizagem referente aos