• Nenhum resultado encontrado

VIÉS DE SELEÇÃO, RETORNOS À EDUCAÇÃO E MIGRAÇÃO NO BRASIL #

N/A
N/A
Protected

Academic year: 2021

Share "VIÉS DE SELEÇÃO, RETORNOS À EDUCAÇÃO E MIGRAÇÃO NO BRASIL #"

Copied!
19
0
0

Texto

(1)

VIÉS DE SELEÇÃO, RETORNOS À EDUCAÇÃO E MIGRAÇÃO

NO BRASIL

#

Eduardo P Ribeiro* Viviane M Bastos**

Resumo

O Brasil é reconhecido como um país com grandes fluxos de migração entre regiões. Do ponto de vista teórico, um das forças indutoras da migração é a busca por maiores rendimentos nas regiões de destino. Desta forma, uma população residente não é uma amostra aleatória da população de uma região. O presente trabalho propõe a estimativa dos retornos à educação para os estados brasileiros corrigindo o problema de viés por seleção gerado pela migração, dentro de um modelo de Roy de salários. A correção da seleção emprega, pela primeira vez no Brasil, uma técnica recentemente desenvolvida por Dahl (Econometrica, 2002). A conclusão do nosso trabalho é que parece existir viés de seleção dos indivíduos nas estimativas das equações de salários, viés este que não é corrigido através de uma dummy de migração, como especificado em trabalhos anteriores da literatura no país. Verificamos também que os retornos à educação crescem à medida que o nível educacional aumenta e que as diferenças regionais dos retornos aumentam com a correção das estimativas.

Palavra-Chave: Retornos à Educação, Viés de Seleção, Migração.

Abstract

Brazil have experienced large waves of internal migration in the past fifty years. One of the attracting forces are the regional income differentials and rewards to personal characteristics. This implies that residents are not a random sample in an earnings equation model. Previous studies in the Brazilian iteratura have tackled this sample selection bias using either migrant dummies, or restricting attention to mover-stayer models, where only two regions are considered. Given that the first solution is innapropriate and the second solution implies common within-region state-wide returns, we proprose new return to schooling estimates using a recent, previously unused, semi-parametric polichotomous sample selection correction method by Dahl (Econometrica, 2002). Our results suggest the presence of sample selection biases in states’returns to schooling. Our results also suggest that state returns by schooling level are wider than previously estimated, although in many cases the differences are not significative.

Key words: returns to schooling, sample selection bias, migration. JEL Codes: C25, J3, J61.

# Este trabalho é baseado na dissertação de mestrado da segunda autora. Agradecemos a André Nunes

(PIBIC/UFRGS/CNPq) pelo apoio na pesquisa. Os erros são de nossa responsabilidade. Endereço para Correspondência: PPGE/UFRGS, Av. João Pessoa 52, sl.33b, Porto Alegre, RS, 90040-000.

* PPGE/UFRGS, Pesquisador do CNPq. eribeiro@ufrgs.br ** Georgia State University, EUA e PPGE/UFRGS

(2)

VIÉS DE SELEÇÃO, RETORNOS À EDUCAÇÃO E

MIGRAÇÃO NO BRASIL

1- INTRODUÇÃO:

O Brasil é um país marcado por desigualdades econômicas. Estas desigualdades também se estendem ao grau de escolaridade, havendo grandes disparidades entre níveis educacionais médios de cada região. Por outro lado, o Brasil apresenta grandes fluxos migratórios entre regiões as brasileiras. Dados do IBGE indicam que 40% da população brasileira são de migrantes ou de pessoas que já migraram em algum momento da vida, sendo que este fluxo geralmente ocorre de regiões com renda per capita baixa para regiões de maiores rendas. Um outro fator importante neste fluxo de migração é que as pessoas que migram do Nordeste para o Sudeste têm um nível educacional superior à média da região e, o inverso, quando estamos falando do migrante oriundo da região Sudeste em direção ao Nordeste. Os migrantes também parecem ser pessoas mais qualificadas (obtêm maiores rendimentos) do que os não–migrantes (Fiess e Verner, 2003 e Santos et al., 2003). Por esses motivos, a migração pode estar aumentado a desigualdade de renda entre Regiões no Brasil de modo não trivial. Por outro lado, os retornos à educação no Nordeste foram estimados como maiores que no Sudeste (Barros, 2001). Os maiores retornos à educação no Nordeste sugerem que, ao contrário, a migração levaria a uma equalização na desigualdade de renda nacional.

Dada a importância da migração e dos possíveis diferenciais de remuneração da escolaridade no Brasil, o objetivo deste trabalho é obter as estimativas de retornos à educação para os estados brasileiros, corrigindo o problema de viés de seleção, pela primeira vez no Brasil. A metodologia seguirá os recentes resultados de Dahl (2002), que supera os problemas de controle do viés de seleção em ambientes de escolha múltipla (mais de duas opções) empregando um modelo semi-paramétrico, mais robusto que os métodos baseados em Heckman (1976). Os resultados obtidos podem vir a contribuir para a literatura de duas formas. Primeiro, trazendo subsídios para a hipótese de migração como sendo determinada por diferenciais de rendimentos. Segundo, adicionando ao atual debate sobres desigualdades regionais advindas de desigualdades de renda ou de dotações, pois será possível identificar se há diferenças regionais sistemáticas na remuneração do mercado às características pessoais.

Recentemente, Santos et al. (2003) e Fiess e Verner (2003) estimaram equações de rendimentos para o Brasil enfocando a questão da migração. Santos et al. em uma equação minceriana, com escolaridade medida de forma contínua, empregam dummies para identificar os migrantes e inferiram a partir de um coeficiente positivo, a seleção positiva dos migrantes. Todavia, Maddala (1984) demonstra que este controle não é suficiente para corrigir o possível viés de seleção existente na amostra. Ao mesmo tempo, Gonzaga e Soares (1999) identificaram que os retornos à educação no Brasil são não-lineares. Já Fiess e Verner (2003), empregando um modelo com retornos à escolaridade não lineares e analisando exclusivamente o Sudeste e o Nordeste, corrigem o viés de seleção por migração apenas através de um modelo bivariado mover-stayer. Este modelo impõe uma semelhança entre os atributos não mensurados dos migrantes dentro de cada região, o que pode ser restritivo em demasia.

O presente trabalho propõe uma contribuição à literatura, ao estimar os retornos (possivelmente não-lineares) à educação no Brasil, focando os estados brasileiros e controlando pelo viés de seleção da migração entre diferentes estados. Para isso, aplicamos, pela primeira vez na literatura nacional, o método de Dahl (2002) para corrigir viés de seleção

(3)

em ambientes de escolha com múltiplas opções. O método é um desenvolvimento semiparamétrico multi-escolha do método de Heckman (1976) de correção do viés de seleção. Este trabalho se divide em quatro seções além desta introdução e de comentários finais. A primeira é composta de uma breve resenha sobre determinantes econômicos de migração. A segunda, apresenta um sumário do perfil de migrantes oriundos de cada Estado ou Região brasileira, na amostra em estudo. A terceira seção desenvolve a metodologia empregada para obtenção de retornos à educação a última seção traz os resultados obtidos. 2 - DETERMINANTES ECONÔMICOS DA MIGRAÇÃO: UMA RESENHA

A migração leva a diversas implicações tanto para o migrante como para a região de destino. A decisão de migrar é um evento de extrema importância na vida de um indivíduo pois ele ou ela não estará apenas se deslocando de um lugar para outro. Na verdade, ao decidir migrar, o indivíduo incorre em custos de deslocamento, custos emocionais, como também corre o risco de não encontrar emprego ou então de não encontrar um emprego que compense os custo iniciais e seus custos de sobrevivência.

Na literatura econômica há várias teorias que explicam a decisão de migrar, sendo o foco principal a busca por melhores rendimentos. O trabalho recente seminal na área foi Sjaastad (1962), que desenvolveu o primeiro modelo analítico para a tomada de decisão com relação à migração aplicando as premissas da teoria de investimento em capital humano. De acordo com o autor, esta decisão pode ser vista como um problema de investimento em capital humano e, como todo investimento, incorre em custos e se obtém benefícios.

Os custos de migrar podem ser divididos em duas categorias: custos monetários e não monetários. Os custos monetários de se mudar poderiam ser obtidos diretamente com os indivíduos ou então por meio de estimativas, de acordo com a distância entre os locais, números de dependentes e características dos seus dependentes. A diferença entre os custos de vida entre os locais de origem e destino também é considerado como um custo monetário. Já os custos de oportunidade1e os custos psíquicos2 são considerados como não monetários

Por outro lado, a migração pode implicar em benefícios, tais como: aumento no salário e na capacidade de consumo, oportunidade de conhecer novos lugares, obter novas experiências de trabalho, etc. Os dois primeiros são considerados benefícios monetários e os seguintes não monetários

Sjaastad estruturou o problema de decisão do migrante a partir da maximização do valor presente dos benefícios líquidos atuais e futuros entre migrar e permanecer, separando os benefícios em diferenças de salários e também na diferença de custos e benefícios que não são correlacionados com o salário. Sem levar em consideração a incerteza dos agentes, o ganho líquido presente da migração (GL) é dado por:

GL = C ) r ( w w T t t t t

= − + − 0 0 1 1 (1)

onde w1t e w0t representam os rendimentos médios do local de destino e de origem, respectivamente, no período t e C representa os custos de migrar. De acordo com esse modelo, o indivíduo migrará quando o diferencial de salários for positivo, ou seja, quando o ganho líquido for positivo.

Os custos de migrar, particularmente a distância, podem ser um impecílio ao deslocamento dos trabalhadores. Primeiro, porque a distância leva a uma redução da informação, ou melhor, a informação torna-se mais imperfeita sobre o possível lugar de

1 Os custos de não estar trabalhando durante o período de deslocamento e o de procura por outro trabalho. 2 Devido ao fato das pessoas serem relutantes em deixar sua família e seu circulo de amizades.

(4)

destino. E também, porque o custo psíquico aumenta à medida que a distância entre o local de origem e de destino cresce; Terceiro, o custo da mudança em si.

Saajastad (1962) encontrou que a atratividade de um estado americano não se altera, se para cada 16% de aumento na distância o migrante obtiver uma compensação de 10% na sua renda. Já no caso do Brasil, a relação entre a distância e a migração é menos acentuada, se compararmos com o caso americano, apesar da relação permanecer negativa, como pode ser visto em Sabota (1968).

Aba (1997) também explorou a influência da distância nas trajetórias de migração. Para os EUA foi encontrado que a elasticidade da distância é negativa e que ela diminui em valor absoluto à medida que ao nível educacional aumenta. Por fim, Widerstedt (1998) sugere que a elasticidade distância só é relevante para migração entre estados e não entre municípios.

Há outros fatores que influenciam a migração, como as relações familiares o sociais (Mincer, 1978 e outros autores citados em Borjas, 2001). A maioria destes é de difícil mensuração, devendo ser considerado um efeito não observado na decisão de migrar.

Por outro lado, a migração pode afetar a distribuição de rendimentos em si, tanto da região de origem como da região de destino dos migrantes, como chama a atenção Borjas (1987, 2001). O fato dos migrantes terem mudado de região por sua decisão, comparando rendimentos potenciais, afeta de sobremaneira estimativas de retornos à educação nas diferentes regiões. A auto-seleção de ser um migrante gera um viés de seleção nas estimativas de retornos à educação, obtidos com uma amostra de pessoas que habitam uma região. Este viés se mantém se excluímos da amostra migrantes, ou , ao contrário, quando excluímos aqueles que não migraram.

Para entender este viés e que tipo de resultados ele implica, considere a seguinte análise da decisão de migrar e sobre a distribuição de rendimentos, desenvolvida no trabalho já clássico de Borjas (1987). Como acima, considere duas regiões apenas, 0 (origem) e 1 (destino). Os (log) rendimentos (wk) das pessoas na região de origem e destino possuem as seguintes distribuições:

w0 = µ0 + u0, u0 ~N(0,σ02)

w1 = µ1 + u1, u1 ~N(0,σ12),

sendo u0 e u1 diferencias não observados determinantes dos rendimentos individuais3 e Cor(u0, u1) = ρ. As médias das distribuições podem ser condicionais à algumas características pessoais que são remuneradas pelo mercado, como, por exemplo, escolaridade. Supõe-se que os atributos pessoais sejam remunerados de modo similar na região 1, irrespectivo se a pessoa é migrante ou não.

Como visto na equação 1 acima, a decisão individual de migrar é dado critério de benefício líquido e pode ser representada por

I(w1 – w0 – C>0) = I [(µ1 – µ0 – C ) +( u1 – u0) >0], (2) onde I( ) uma função indicador que toma valor 1 se o argumento for verdadeiro e 0 se for falso. Supõe-se que C seja (condicional à características pessoais) igual para todos os habitantes da região 0, para facilitar a exposição. Desta forma, a probabilidade de migração é dada por

P(I>0) = P[( u0 – u1) < (µ1 – µ0 – C )] = P[v/σv < (µ1 – µ0 – C )/σv ] =Φ(z), (3) onde Φ(z) é a distribuição normal padronizada, z=(µ1 – µ0 – C )/σv, e u0 – u1 = v ~N(0, σv2), onde σv2= σ02 + σ12 – 2 σ01 = σ02 + σ12 – 2 ρ σ1 σ0, e σ01=Cov(u0, u1). O resultado aqui é similar ao de Sjaastad, apresentado acima, em que a migração depende do diferencial de salários esperados, líquido dos custos.

Mas, como Borjas chama a atenção, as conseqüências deste modelo são importantes para a distribuição de rendimentos observados na região de origem e de destino e

(5)

na distribuição de rendimentos dos migrantes e não migrantes. Este insight vem do reconhecimento de que o modelo de migração é uma releitura do modelo clássico de Roy (1951), de auto-seleção de setor de ocupação (aqui região) pelos trabalhadores, que são heterogêneos. Esta auto-seleção gera mudanças na distribuição de rendimentos, como já chamava a atenção Maddala (1983, cap.9). Considere a média dos rendimentos dos migrantes na região de destino,

E[ w1 | I=1 ]= E[µ1 + u1 | ( u1 – u0) >– (µ1 – µ0 – C )]

= µ1 + E[ u1 | ( u1 – u0) >– (µ1 – µ0 – C )] ≠ µ1, (4) pois a média condicional de u1 é diferente de zero. Em adição, o valor desta média condicional depende de µ0, µ1 e C. Para entender a diferença entre o rendimento médio dos migrantes na região 1 (de destino) e dos nativos da região 1, pode-se demonstrar que (Maddala, 1983, eq 9.1)

E[ w1 | I=1 ]= µ1 – Cov(u1 , v) λ(z), (5)

onde λ(z)=φ(z)/Φ(z) é conhecido como o inverse Mill’s Ratio e φ(z) é a densidade da Normal Padrão. Borjas afirma que λ(z) é inversamente relacionado à probabilidade de migração e que λ(z)=0 se todos os habitantes de 0 migrassem para a região 1. Deixando de lado este extremo, ou seja, considerando que apenas parte da população da região 0 emigra, pode-se analisar se os migrantes estão em melhor ou pior situação do que em sua região de origem. Supondo que não há migração reversa, ou seja dos habitantes da região 1 para a região 0, a diferença dos rendimentos entre os nativos e os migrantes da região 0 para a região 1 é dado pelo segundo termo à direita da igualdade acima, Cov(u1 , v) λ(z). Este termo será negativo, gerando um diferencial positivo entre os migrantes e os nativos, quando, por exemplo, a correlação entre os rendimentos das duas regiões for positivo (o que é razoável) e a dispersão dos rendimentos na região de destino for igual ou maior que na de origem. (Cov(u1 , v)<0 => σ01-σ12 <0 => ρ <σ1 /σ0). Ou seja, os migrantes têm desempenho médio melhor que os nativos.

Se, por outro lado, ρ >σ0 /σ1, os autores citados demonstram que E[ w0 | I=1] > E[w0], isto é, os migrantes são pessoas que teriam os rendimentos acima da média na região de origem também. Isto representaria o chamado brain drain, isto é, a seleção dos melhores trabalhadores (com u0 alto) da região de origem para a migração.

O ponto relevante a ter da leitura de Borjas (1987), para os objetivos deste trabalho, é de que a estimação dos rendimentos médios na região de destino é viesado, pela auto seleção dos migrantes. O viés se mantém se tomarmos uma amostra apenas de não migrantes apenas ou se controlarmos pelo fato das pessoas serem migrantes ou não pois o condicionante depende dos determinantes dos rendimentos. Isto é, variáveis explicativas que determinam µ1 também estão presentes em λ(z). A omissão de λ(z) leva a um viés clássico de estimação por auto-seleção da amostra.

Santos Jr. et al. (2003) estimaram uma equação minceriana de rendimentos para o Brasil, usando a PNAD de 1999, controlando os migrantes através de uma dummy. A interpretação de um coeficiente da variável migrante pelos autores é de uma seleção positiva. Pelo que vimos acima, o coeficiente da variável migrante no contexto seria viesdada, pois não controla o possível viés de seleção. Em adição um coeficiente positivo não implica uma seleção positiva, pois faz-se necessária estimar os redimentos dos migrantes se tivessem ficado na sua região de origem.

A quarto seção irá apresentar um método ainda não empregado na literatura nacional para controlar o viés de auto-seleção e obter estimativas não viesadas dos retornos à educação. Antes de iniciarmos nossas estimativas apresentaremos no próximo seção um breve perfil dos migrantes brasileiros.

(6)

3- PERFIL DOS MIGRANTES

Neste seção analisamos algumas características dos trabalhadores que migraram em relação ao estado de nascimento, estado onde moram e, sobretudo, dos que decidiram não migrar. Para esta análise do perfil dos migrantes, para a estimação das equações de salários e demais cálculos, utilizamos a Pesquisa Nacional de Amostra de Domicílio de 1999, por ser a última disponível no início deste trabalho. Excluiremos da Amostra indivíduos: estrangeiros, com renda nula ou ignorada, com idade inferior a 25 anos ou superior a 60 anos e pessoas que não responderam algum quesito com respeito as variáveis utilizadas. A seleção da amostra busca comparabilidade com outros trabalhos na literatura nacional e internacional.

Neste trabalho será classificado como migrante neste trabalho aquele indivíduo que nasceu em um determinado estado e não reside mais neste estado no momento da pesquisa. Outro ponto importante é sobre as agregações regionais que tivemos que fazer para evitar problemas com pequenas amostras. A Primeira região a ser agregada foi a Norte. Na segunda região agregamos os estados do Maranhão, Piauí e Ceará e na terceira região Paraíba, Rio Grande do Norte, Pernambuco, Alagoas e Sergipe. Essas duas agregações foram feitas a partir das características econômicas e do mercado de trabalho serem similares.

Ao analisarmos as características dos indivíduos que nasceram na Região Norte e que decidiram migrar podemos destacar que a proporção das mulheres que migram é superior a qualquer outra região ou estado. Das mulheres que migraram podemos destacar que quase 47% delas tinham pelo menos o 2º grau completo e quase 15% tinham o superior completo. Vale mencionar também que 40% destas não são casadas. Já, com relação a cor dos indivíduos que migraram, temos um pouco mais de 60% da cor parda, dos quais 28% cursaram apenas até 4 anos de estudo e 30% com pelo menos o curso superior.

Analisando as pessoas que migram para a Região Norte, 64% delas são do sexo masculino e 60% são da cor parda. A maior parte dos migrantes desta região concluiu no máximo o 4o ano do ensino fundamental. Esta região recebe mais pessoas nascidas no Maranhão, Piauí e Ceará.

As pessoas que decidiram permanecer nesta região são, na média, menos educadas do que aquelas que decidiram migrar, porém mais educadas do que as que migraram para esta região.

A taxa de migração na Região 2 (MA, PI e CE) é de 25%. As trajetórias de migração destes indivíduos são em parte para São Paulo (34%), Rio de Janeiro (16%), Bahia (12%) e Distrito Federal (10%).

Em média, os indivíduos que nasceram nesta região e migraram são mais educados que aqueles que preferiram não migrar contudo menos educados do que eles que migraram para esta região.

As pessoas que decidiram migrar para os estados da Região 3 ( RN,PB, PE, AL e SE) são, na média, mais educadas do que as pessoas que nasceram neste estado, não importando se elas migraram ou não. Vale a pena ressaltar que as pessoas que nasceram neste estado e migraram têm um nível de escolaridade média mais alto do que as que permaneceram. De todos os que nasceram nestes estados, 22% preferiram buscar novas oportunidades em outros estados ou regiões. O estado mais procurado por estes indivíduos foi São Paulo.

É de se notar que o salário médio não segue esta mesma dinâmica. Os indivíduos que decidiram migrar para outras estados ou regiões recebem R$ 605,46 enquanto os que preferiram não migrar recebem apenas R$ 423,08. Já os que migraram para esta região recebem R$ 821, 33, em média.

(7)

A taxa de migração das pessoas que migraram da Bahia para os outros estados não difere muito das anteriores. Os baianos migraram com uma taxa de quase 42% para o estado de São Paulo e em segundo lugar Distrito Federal com 11,34%. Na média, não há grandes diferenças entre os anos de estudo entre os baianos que migraram e os que decidiram permanecer, porém os que imigraram são mais educados tendo uma média de dois anos a mais de estudo.

Mesmo não havendo grandes diferenças entre os níveis educacionais, os migrantes recebem salário, na média, 93% superior ao do nativo. E os baianos que decidiram procurar novas oportunidades em outros lugares, recebem um salário, na média, 30% maior do que os que preferiram não migrar.

Mudando para o Sudeste, apesar das pessoas que migraram para Minas Gerais serem, na media, mais educadas do que as que nasceram lá, o salário médio dos migrantes que moram em MG é mais elevado do que o dos nativos, todavia menor em relação aos mineiros que migraram para outros estados. Os migrantes nascidos em MG foram, principalmente, para SP (29,27%), RJ (14,08%), GO (13,57%) e DF (13,66%).

O estado de Minas Gerais recebe mais migrantes oriundos de SP (22,86%), BA (19,02%), RJ (16,03%) e ES (10,15%). Porém, a população de migrantes não é tão representativa em MG, correspondendo a apenas 8,12% da sua população. Em compensação, os mineiros migram a uma taxa de 23,08%.

Continuando no Sudeste, apenas 11% das pessoas nascidas no estado do Rio de Janeiro moram atualmente em outros estados, a segunda menor taxa de migração de todo o país. Das que migraram, 18% foram para MG, 14% para SP e 11% para Região 3 (RN, PB, PE, AL e SE).

O nível educacional médio das pessoas que nasceram no RJ é o segundo maior do Brasil. E os migrantes fluminenses são os que têm um nível educacional médio mais elevado do país. Onde 67% dos migrantes nascidos no estado tinham pelo menos concluído o ensino médio4, enquanto 72% dos que migraram para o Rio de Janeiro não tinham nem o curso fundamental completo.

Já das pessoas que nasceram em São Paulo, menos de 82% continuam morando em SP, já os outros agora estão no PR (22%), MS (16%), MT (12%) e MG (11%). Para São Paulo migraram, principalmente, pessoas nascidas na região 3 (24,5%), na Bahia (19%) e Minas Gerais (22,9%).

Apesar dos não migrantes terem, na média, mais anos de estudo com relação aos que migraram para outros estados, a diferença entre os anos de estudo dos migrantes e não-migrantes nascidos neste estado é mínima, 9,24 e 9,64, respectivamente. Todavia, ao analisarmos os indivíduos que migraram para SP, vemos que eles têm uma escolaridade inferior aos nascidos em SP.

Apesar do nível educacional dos indivíduos que nasceram em São Paulo e não migraram, ser um pouco superior aos que decidiram migrar, os não migrantes recebem salário inferior àqueles que preferiram migrar para outra localidade. Contudo, o salário, na média, dos indivíduos que vieram morar em SP é quase 30% inferior ao indivíduo que nasceu e reside neste estado.

Começando a análise da Região Sul, o Paraná tem uma taxa de migração superior a 26%, elevada se compararmos com a média brasileira. Dos indivíduos que migraram, 39,3% moram em São Paulo e 15,1% em Mato Grosso. Em contrapartida, das pessoas que migraram para o Paraná, 8% vieram de São Paulo, 24,7% de Santa Catarina e 20% do Rio Grande do Sul.

4 Quando falamos que um indivíduo completou pelo menos o ensino médio, estamos queremos dizer que ele

(8)

Não existe praticamente nenhuma diferença entre o salário médio do migrante não-migrante nascido neste estado; eles recebem, em média, R$ 674,60 e R$ 679,49 respectivamente. Com respeito ao salário médio daqueles que migraram para o Paraná, vemos que os indivíduos recebem, na média, 14% a mais do que os que residem e nasceram neste Estado.

Aproximadamente 28% dos nascidos em Santa Catarina não residem mais lá. Esta é a taxa de migração mais alta do país. Destes 28%, 47,8% foram morar no Paraná e 32,4% no Rio Grande do Sul. Enquanto para Santa Catarina, a maior parte dos seus migrantes vieram também do Paraná (37,1%) e Rio Grande do Sul (51,90%).

As pessoas que nasceram em Santa Catarina e não migraram têm, na média, 7,9 anos de estudo, em compensação os que migraram têm 8,6 anos. E os indivíduos que nasceram neste estado e agora residem nele têm de 8,1 anos de estudo.

Enquanto o salário dos não migrantes que nasceram neste estado é em média de R$ 649, 88, o salário médio daqueles que decidiram morar em outra região ou estado é de R$ 913,26 na média. E o daqueles que migraram para Santa Catarina corresponde a R$ 733,26.

No Rio Grande do Sul encontramos a menor taxa de migração da região Sul, 10,7%. Das pessoas que migraram, 31,8% foram para o Paraná e 25,8% para Santa Catarina. Como era de se esperar, as pessoas que migraram para este estado vieram na sua maioria do Paraná (55,5%) e de Santa Catarina (17,7%). Ao contrário dos outras regiões e estados podemos ver que na Região Sul os indivíduos tendem a migrar entre os estados da região.

Indivíduos que nasceram neste estado e resolveram migrar tinham em média 8,9 anos de estudo enquanto os que não migraram tinham 8,7 anos. Já os que vieram para este estado tinham 9,1 anos de estudo.

O individuo que migrou para Rio Grande do Sul recebe 17% mais do que o nativo. Enquanto que, o gaúcho que migrou recebe R$ 1007,22, o equivalente a 46% a mais em relação ao que não migrou.

Por fim, estudando os resultados para o Centro-Oeste e começando pelo Estado do Mato Grosso do Sul, dos 17,8% que nasceram neste estado e migraram para outros lugares, 43,1% foram para Mato Grosso, 20,1% para São Paulo e 11,3% para a Região Norte. Em compensação, das pessoas que migraram para o Mato Grosso do Sul 35% vieram de São Paulo.

Os indivíduos que migraram para outras localidades são aqueles com mais anos de educação, 8,8 anos. Já os que migraram para Mato Grosso do Sul tem um nível educacional inferior (7,5 anos) aos nativos que lá residem( 7,9).

Apesar dos que migraram para o Mato Grosso do Sul terem um nível educacional inferior aos que nasceram e ainda moram lá, eles recebem em média R$ 675,40 enquanto o não migrante recebe R$ 505,98 em média. O salário médio do indivíduo que nasceu neste estado mas migrou é de R$ 810,35.

Por sua vez, cerca de 20% da população nascida em Mato Grosso migrou para outros estados, 32,5% deste foram para região Norte e 22,1% para Mato Grosso do Sul. Com respeito às pessoas que migraram para Mato Grosso, vemos que 18,9% nasceram no Paraná,

Os indivíduos mais educados do Mato Grosso, na média, são aqueles que nasceram neste estado, mas não migraram com 8,1 anos de estudo. E os menos educados, são aqueles que migraram para lá com 6,6 anos de estudo.

Já com respeito ao salário, encontramos o padrão inverso: os indivíduos melhores remunerados foram os que migraram para lá recebendo R$ 604,30% em média. Ao passo que, o pior remunerado foi o que nasceu neste estado e continua residindo neste estado.

O estado de Goiás apresenta a maior taxa de migração da região Centro-Oeste, 24,5%. Esses indivíduos migraram mais para o Distrito Federal (35%), Região Norte (26,4%), Mato Grosso (20,5%).

(9)

O indivíduo mais educado é aquele que nasceu em Goiás e migrou para outros estados com 7,8 anos de estudo em média, em relação à aquele que migrou para Goiás.

Por fim, das pessoas que nasceram no Distrito Federal 18,7% migraram para outros lugares, destes 44,9% migraram para Goiás. A maior parte dos migrantes que o DF recebeu veio da Região 2 (25,6%), Minas Gerais(19,6%), Goiás (14,5%) e Região 3 (13,9%)

O indivíduo melhor remunerado no país é aquele que migrou para o Distrito Federal, recebendo R$ 1170,00 em média. Porém, seu nível educacional, é menor se compararmos com indivíduos que nasceram no Distrito Federal ( migrantes e não-migrantes). Já com relação aos indivíduos que nasceram no Distrito Federal, mas migraram para outros lugares, na média, estes recebem menos do que os que não migraram.

Em suma, podemos afirmar depois desta seção que o migrante no Brasil não têm um perfil exato. Em algumas Regiões e Estados temos altas probabilidades de migrar para um determinado destino, enquanto em outros temos baixa probabilidade de migrar para o mesmo destino. Ou seja, as diversas trajetórias apresentam probabilidades de migrar significantemente diferente entre si. O mesmo acontece com os salários: constatamos que os diferencias de salários ora são altos ora baixos nas regiões e estados do Brasil. Os diferenciais de rendimentos não são, a princípio, negativa ou positivamente proporcionais aos fluxos de migração.

4 - RETORNOS À EDUCAÇÃO

Para identificar o efeito das características pessoais sobre os rendimentos, o modelo a ser estimado é uma equação Minceriana de salários usual. Todavia, dado a migração, a amostra de trabalhadores não é uma amostra aleatória da população. Para entender isto, considere a seguinte versão da equação de log-rendimentos (wik) a ser estimada5:

wik = αik + xi’δk+ si βk + uik i=1,...,I e k=1,...,N, (6) onde x engloba as características pessoais, s é a medida de escolaridade, i indexa os indivíduos na amostra total e k as regiões de uma país onde a pessoa se encontra. Supomos que os retornos à educação e aos atributos pessoais, isto é, os coeficientes da regressão, dependem da região onde a pessoa trabalha, mas não dependem se a pessoa é migrante ou não.

O problema para estimação é de que observamos o log-salário wi apenas na região

onde a pessoa se encontra. Não sabemos seu salário nas outras regiões. Isto é um problema, pois, como vimos na segunda seção, a decisão de migrar da região j para a região k, ou seja, a decisão que faz com que w seja observado, depende dos salários em wk e wj, , isto é E[uik | wik observado ] ≠ 0, criando um viés de seleção nas estimativas dos coeficientes.

Para entender melhor o problema de seleção, considere que a utilidade em relação à decisão da migrar da região j para a região k, para o indivíduo i, Vijk, seja dada por

Vijk= wik + cijk, (7)

onde wik é definido como anteriormente e cijk representa os custos (monetários e subjetivos) líquidos de migrar de j para k para o indivíduo i. Os custos podem depender de explicativas, através de cijk= γjk zijk + erro.

O critério de seleção (migração) é tal que

wik é observado se (e somente se) Vijk ≥ Vijm ∀m.

Em outras palavras, se observamos o indivíduo na região k isto reflete o fato de que a utilidade obtida de migrar de j para k é estritamente maior que a utilidade de migrar para

(10)

outras regiões m=1,..., k-1, k+1,...,K (e igual à utilidade de migrar para a região m=k). Podemos reescrever o critério de outras formas:

wik é observado se e somente se Vijk = max(Vij1,..., VijN), ou

wik é observado se e somente se k : maxm (Vij1 – Vijk, ..., VijN – Vijk). Esta última representação deixa claro que são necessárias N comparações multilaterais para a escolha, sendo que estas comparações dependem dos salários não observados wim (m ≠ k) e dos custos.

Seguindo a literatura de seleção, vamos decompor a utilidade da migração em uma média condicional e um “erro”,

Vijk= Vjk + εijk, (8)

onde Vjk =E[wik |x,s] + E[cijk | z] e εijk = {wik – E[wik |x,s]} + {cijk – E[cijk | z]}. Aqui, seguindo Dahl, supomos que z é um vetor de características pessoais que afetam os custos líquidos de migrar6 .Note também que o primeiro termo entre chaves de εijk é igual ao termo aleatório da regressão de salários, uik. Esta decomposição é importante para isolar os termos aleatórios de Vijk dos componentes observáveis (que dependem de x,s e z).

A correção do vies de seleção segue a literatura (e.g. Maddala, 1984, Heckman, 1976), em que supõe-se uma distribuição conjunta para uik e os termos εijk e modela-se a distribuição condicional do erro da equação de salários. Isto é,

E[uik | wik observado ] = E[uik | Vijk ≥ Vijm , ∀m] = E[uik | Vijk – Vijm ≥ 0, ∀m]

= E[uik | Vjk + εijk – Vjm + εijm ≥ 0 , ∀m]

= E[uik | εijm – εijk

Vjk – Vjm , ∀m] ≠ 0. (9) Com a expressão acima, a equação de salários (6) pode ser escrita da seguinte forma, para uma amostra de salários observados:

yik = αik + xi’δk+ si βk +

Σ

Nj 1= [Mijk ψjk(Vj1 – Vjk, ..., VjN – Vjk)] + vik

i=1,...,I e k=1,...,N, (10) onde o indicador Mijk = 1 se a pessoa i migra da região j para a região k e ψjk(Vj1 – Vjk, ..., VjN – Vjk)= E[uik | εijm – εijk

Vjk – Vjm , ∀m], como na equação (9), a média condicional de uik dada a distribuição cumulativa multivariada dos erros εijm – εijk, avaliada no vetor (Vj1 – Vjk, ..., VjN – Vjk) 7. Note que este vetor depende, por suposição, apenas de componentes

observados x, s e z. Por fim, vik é um termo aleatório iid, na amostra da região k.

Para facilitar a compreensão, vamos explorar o caso especial de duas regiões. Reescrevendo µik= αik + xi’δk+ si βk, para a região 1, o modelo pode ser escrito como

wi1 = µi1 + Mi11 ψ11(V11 – V11, V12 – V11) + Mi21 ψ21(V21 – V21, V22 – V21)+ vi1 e

wi2 = µi2 + Mi12 ψ12(V11 – V12, V12 – V12) + Mi22 ψ22(V21 – V22, V22 – V22)+ vi2, para a região 2, i=1,...,I. Focando a região 1, note que as funções ψj1( ) passam a ter um argumento apenas

wi1 = µi1 + Mi11 ψ11( V12 – V11) + Mi21 ψ21(V22 – V21)+ vi1, (11) sendo que Mi11 representa o não migrante e Mi21 indica o migrante. Simplificando a notação para Mi1=1 se a pessoa é migrante, temos

wi1 = µi1 + (1 – Mi1) ψ11( V12 – V11) + Mi1 ψ21(V22 – V21)+ vi1. (12) No método tradicional de correção de viés de seleção, a regressão acima é estimada para uma subamostra dos residentes 1, apenas de migrantes (ou não migrantes),

6 O vetor z pode incluir x e s.

7 Note que, escrevendo de outra forma, u

(11)

como, por exemplo, Greene (2000) ou Falaris (1987). A equação (12) fica simplificada para wi1 = µi1 + ψ21(V22 – V21)+ vi1. Dentro do método de Heckman (1976), ψ21( ) é substituído pelo Inverse Mill’s Ratio,

yi1 = αi1 + xi’δ1+ si β1 + γ λ(zi)+ vi1, i=1 (13) onde zi representa as variáveis que influenciam a decisão de migrar (que determinam V22 – V21).

Para o Brasil, Fiess e Verner (2003) estimam equações mincerianas de rendimentos para o Nordeste e Sudeste, considerando a probabilidade de ser migrante ou não (mover-stayer).

O método de Heckman impõe suposições sobre a distribuição dos erros que o método de Dahl não o faz, como veremos abaixo. Por outro lado, no método de Dahl, a estimação é feita para toda a amostra da região k, ao invés de apenas os migrantes (ou apenas os não migrantes). Isto ajuda a identificar o coeficiente β e explicita uma hipótese implícita nos modelos de que usam a correção de Heckman (Borjas, 1987 é um dos poucos à explicitá-la), que é a de que o retorno à educação é o mesmo para migrantes ou não migrantes, condicional à região estudada, como dito acima.

Estimar o modelo para a amostra completa de uma região k usando apenas uma dummy para identificar os migrantes, sem empregar o termo de correção de seleção não corrige as estimativas de modo satisfatório. A correção se daria se as características não observadas dos migrantes e a decisão de migrar não fossem correlacionadas com a escolaridade. Dito de outra forma, ψ21(V22 – V21) têm de ser ortogonal à escolaridade, ou não variar com as características observadas x e s. Isto é contraditório com o modelo, pois, como visto acima, V2k =E[w2k |x,s] + E[ci2k | z]. A suficiência da dummy para corrigir o viés de seleção implica em que Vjk =E[wjk |x,s] + E[cijk | z] = E[wjk] + E[cijk] = jk, uma constante por região e origem do migrante. Em adição, a hipótese de suficiência da dummy parece muito restrita e irrealista, pois, por exemplo, vimos na seção anterior que as probabilidades de migração variam com a escolaridade.

Voltando para o caso de N regiões, há vários problemas para estimar a equação (10): (i) A função ψjk(•) é desconhecida e sua dimensão é N.

(ii) Os argumentos (Vj1 – Vjk, ..., VjN – Vjk) podem depender uma gama muito grande de variáveis, relacionados aos custos líquidos, objetivos e subjetivos de migrar, além dos determinantes dos rendimentos.

(iii) Há N funções a serem estimadas em cada uma das regiões, uma para cada estado de origem dos moradores (inclusive aqueles que não mudaram).

(iv) Usando algum tipo de parametrização de ψjk(•) o primeiro estágio da estimação envolve estimar um modelo de escolha multinomial com N casos (para cada região), o que não é prático ou até computacionalmente inviável. Os modelos multinomiais são reconhecidos por terem problemas de convergência, ou imprecisão das estimativas, com muitos casos (a “maldição da dimensão” – curse of dimensionality).

No caso do Heckit usual, com duas regiões apenas, a função ψjk(•) depende de apenas um valor (single index) e o primeiro estágio é um problema simples de escolha binária, sendo estimada apenas uma função, como mencionado acima.

Dahl (2002) propõe soluções originais para vários destes problemas. Primeiro, seguindo outros autores, chama a atenção que a distribuição multivariada de εijm – εijk, m=1,...,N no problema pode ser sintetizada na distribuição do máximo percentil (maximum order statistic)8, pois na solução do problema de maximização condicionante, escolhe-se o

8 Para entender o que a maximum order statistic, considere uma amostra X

1, ..., Xn, ordenada do menor para o

maior valor: X(1), ..., X(n),. A estimativa do percentil máximo é X(n), da mesma forma que X(n/2) é a estimativa da

(12)

maior valor das comparações Vijm – Vijk, vide equação (9). Este valor é máximo para m=k, ou seja, onde a pessoa é observada, pois a lógica econômica é tal que a pessoa mora do lugar onde é maior a utilidade de ter migrado de j. Note que no o valor das comparações é zero no máximo e estritamente negativo para aquelas regiões em que a pessoa não é observada. Esta síntese no máximo percentil reduz a dimensão da distribuição multivariada condicionante em ψjk(•) para uma só dimensão. Falaris (1987) apresenta uma estimação para a migração e retornos à educação na Venezuela que também emprega este resultado de máximum order.

Segundo, esta única dimensão, sob certas hipóteses discutidas pelo autor, pode ser sintetizada por pijk, a probabilidade do indivíduo i ter migrado de j para k (condicional à (Vj1 – Vjk, ..., VjN – Vjk)). Desta forma, reescreve-se (10) como

wik = αik + xi’δk+ si βk +

Σ

Nj 1= [Mijk λjk(pijk)] + ωik (14) e E[ωik | si, xi, pijk, Mijk =1]=0. A função λjk(pijk) é desconhecida, mas por ser univariada, pode ser facilmente aproximada por um polinômio de ordem satisfatória. Desta forma, a estimação é semiparamétrica, com hipótese de índice único, single index (veja, por exemplo, Powell, 1997).

A estimação semi-paramétrica oferece alguns benefícios. Vários autores têm chamado a atenção que métodos de correção de seleção baseados no Heckit são pouco robustos à violações das hipóteses da distribuição conjunta dos erros. No método de Dahl, este problema é evitado.

Terceiro, Dahl faz outra hipótese simplificadora, para reduzir o número de funções λjk( )a estimar:

λjk = λ*k, ∀ j≠k,

isto é, a função de correção é a mesma para os migrantes, irrespectivo de onde venham. Note que isto não quer dizer que a função de correção independe do local de origem do migrante, pois a função λ*

k depende de pijk, que é função do local de origem. Apenas supõe-se que a forma da função λjk é comum para os migrantes em cada região (as funções podem ser diferenciadas por região analisada). Assim, reescrevemos (14) como

yik = αik + xi’δk+ si βk + λ*kk(pikk) + λ*k(pijk, pijj) + ωik. (15) Há duas funções de correção em cada região. Uma para os migrantes, λ*k(pijk, pijj) e outra para as pessoas que nasceram na própria região, λ*kk(pikk). A probabilidade pikk é chamada de probabilidade de retenção para os moradores da região k. Por outro lado, a probabilidade pijj representa a probabilidade de um morador da região j ter ficado em j (ou seja, a probabilidade do migrante da região j não ter migrado).

Por fim, resta o problema de estimarmos pijk, condicional à x, s e z. Se x,s e z forem variáveis discretas, podemos calcular as probabilidades de modo não paramétrico, dentro de células, isto é, o calculo da probabilidade de migração dentro de uma sub-amostra gerada por cruzamentos entre as características pessoais (por exemplo, idade entre 30 e 35 anos, homens, brancos com algum ano do ensino médio completo). Este processo evita estimar um modelo multinomial para as probabilidades de migração das regiões j, para cada estado k. Um outro exemplo de trabalho com células pode ser visto em Barros et al (1995). 5. RESULTADOS EMPÍRICOS

O modelo a ser estimado é a equação (15), com a seguinte especificação de variáveis para x e s:

wik = αik + δ1k ID + δ2k ID2 + δ3k Feminino + δ4k nbranco + δ5k urbano

(13)

onde: w- log do salário do individuo i; ID – idade do indivíduo; ID2 – idade ao quadrado do individuo i; nbranco – variável dummy que recebe o valor 0 se o individuo i for da cor branca ou amarela e 1 se for negro, pardo ou indígena; urbano – variável dummy igual a 0 se o indivíduo i mora na área rural e 1 se mora na área urbana; s4anos - variável dummy igual a 1 se o indivíduo i completou de 4 a 7 anos de escolaridade e 0 caso contrário; s8anos - variável dummy igual a 1 se o indivíduo i completou no mínimo 8 anos e no máximo 10 anos de escolaridade e 0 caso contrário; smedio_sup - variável dummy igual a 1 se o indivíduo i completou pelo menos Ensino Médio e 0 caso contrário (11 anos ou mais de estudo). Os coeficientes β1, β2 e β3 podem ser interpretados como sendo o retorno de educação para um indivíduo que possui 4 a 7, 8 a 10 anos ou 11 a 16 anos em relação àqueles com 3 anos ou menos de escolaridade, ou seja, sem a primeira parte do fundamental completa9. Os termos λ( ) corrigem o viés de seleção.

Para implementa o método de Dahl descrito na seção anterior, nosso primeiro passo foi estimar as probabilidades de migrar, semiparametricamente por grupos de indivíduos com o mesmo nível de educacional10. Não pudemos separar os grupos por mais características por nossa amostra ser relativamente pequena. Se o fizemos incorríamos num outro problema, já que teríamos diversas células vazias na nossa matriz de transição ou muita imprecisão nas estimativas. As probabilidades de migrar foram calculadas a partir de um cross-tabs entre UF que nasceu e UF onde mora separando para cada um dos três níveis de educação, já definidos anteriormente.11

Essas probabilidades de migrar foram substituídas na função de correção de cada estado. Como já foi explicado anteriormente, esta função de correção é composta por duas partes: uma para os migrantes e outra para não migrantes. Ambas as funções de correção foram estimadas a partir de uma expansão polinomial de 2º ordem (a probabilidade de migração, de retenção, seus quadrados e a interação). Nas tabelas 1 a 3 destacamos os resultados referentes aos retornos à educação dos diferentes níveis de escolaridade. As regressões completas estão apresentadas no apêndice.

Na tabela 1, vemos que os retornos corrigidos mudam em vários estados, com diferenças de 53,9 a –36,4%, embora a diferença não seja estatisticamente significativa em quase todos os casos. Uma exceção é São Paulo, onde a queda de mais de 35% no retorno parece significativa a 10%. As estimativas corrigidas apresentam intervalos de confiança mais largos, como é comum na literatura. Para SC e RS as estimativas corrigidas não são significativas.

Quanto à diferença de retornos com e sem a correção, notamos que no Nordeste as estimativas aumentam, enquanto que para o Sudeste e Sul as estimativas corrigidas são menores, em alguns casos significativamente menores.

Regionalmente, os retornos do Nordeste são maiores do que no Sudeste, como é comum na literatura. Por exemplo, um indivíduo que mora na Região 2 (MA, PI, CE) e tem entre 4 e 7 anos de estudos, possui um retorno de 0,64 enquanto um indivíduo com as mesmas características em São Paulo tem um retorno de 0,1619.

9 De modo mais rigoroso, a interpretação do coeficiente como retorno à educação supõe, grosso modo, que os

únicos custos da educação sejam apenas o rendimento perdido por não trabalhar enquanto obtém a escolaridade adicional. Detalhes podem ser vistos em Berndt (1991). Mantemos a interpretação como “retornos à educação”, seguindo o abuso de linguagem da literatura.

10 No seu trabalho Dahl, por ter uma amostra grande, calculou as matrizes de transição separando os indivíduos

por grupos com mesmo nível de escolaridade, idade e cor.

11 As matrizes de transição (as probabilidades de um indivíduo que nasceu no estado ou região j migrar para um

(14)

Tabela 1: Retornos à Educação Corrigidos e Não-Corrigidos estimados para pessoas com 4 a 7 anos de escolaridade, por Estado ou região.

4 a 7 anos de escolaridade

Retorno Intervalo de Confiança Retorno Intervalo de Confiança Viés

Não Corrigido 95% Corrigido 95% %

MA,PI,CE 0.4180 0.3726 0.4634 0.6433 0.3432 0.9434 53.9 RN, PB, PE,AL,SE 0.3034 0.2647 0.3421 0.4469 0.2536 0.6401 47.3 BA 0.3016 0.2592 0.3440 0.3395 0.1332 0.5458 12.6 MG 0.3133 0.2755 0.3510 0.2969 0.1513 0.4425 -5.2 ES 0.2586 0.1547 0.3626 0.3421 0.1437 0.5406 32.3 RJ 0.2022 0.1615 0.2429 0.1688 0.1206 0.2169 -16.5 SP 0.2544 0.2126 0.2961 0.1619 0.1038 0.2199 -36.4 PR 0.4296 0.3660 0.4933 0.4392 0.3151 0.5632 2.2 SC 0.3403 0.2423 0.4382 0.1602 -0.1124 0.4333 -52.9 RS 0.3750 0.3136 0.4365 0.2296 -0.0487 0.5079 -38.8 MS 0.3066 0.2125 0.4008 0.2661 0.1186 0.4135 -13.2 MT 0.2683 0.1855 0.3510 0.3045 0.1968 0.4122 13.5 GO 0.3358 0.2764 0.3953 0.3400 0.2388 0.4413 1.3 DF 0.3102 0.2116 0.4087 0.3153 0.2098 0.4208 1.7

Nota: * significa que viés é significativo ao nível de 5%, ou seja, coeficientes com e sem correção não se cruzam. O viés é calculado como (retorno corrigido – retorno não corrigido)/ retorno não corrigido*100.

Ao longo das tabelas 1 a 3, vemos que os retornos a educação são crescentes com o nível de escolaridade, como já visto na literatura (e.g. Gonzaga e Soares, 1999). Em adição, as diferença entre os retornos corrigidos e não corrigidos são mais significativos quanto maior for o grau de escolaridade.

Sobre a função de correção polinomial, testes Wald da significância dos termos de correção (disponíveis com os autores) indicam que são significativos em todas as regressões. Isto sugere que a correção de seleção é requerida, sob pena de omissão de variáveis explicativas relevantes. Olhando as funções de correção de migrantes e não migrantes separadamente, o resultado não é tão claro. A função de correção dos migrantes não entra significativamente ao nível de 5% nas equações da Região 1, Minas Gerais, Espírito Santo, Rio Grande do Sul, Mato Grosso do Sul, Mato Grosso e Goiás. E a dos não-migrantes nas equações de Goiás, Rio Grande do Sul, Paraná e Bahia.

Tabela 2: Retornos à Educação Corrigidos e Não-Corrigidos estimados para pessoas com 8 a 10 anos de escolaridade por Estado ou região.

8 a 10 anos de escolaridade

Retorno Intevalo de Confiança Retorno Intevalo de Confiança Viés

Não Corrigido 95% Corrigido 95% %

MA,PI,CE 0.7904 0.7316 0.8491 1.0011 0.6343 1.3680 26.7 RN, PB, PE,AL,SE 0.5801 0.5303 0.6299 0.7716 0.5834 0.9599 33.0 * BA 0.5995 0.5411 0.6578 0.6431 0.4439 0.8423 7.3 MG 0.6333 0.5858 0.6808 0.5491 0.4069 0.6913 -13.3 ES 0.5523 0.4310 0.6735 0.5922 0.3804 0.8040 7.2 RJ 0.3911 0.3432 0.4390 0.3389 0.2834 0.3943 -13.4 SP 0.5434 0.4969 0.5898 0.3864 0.3191 0.4537 -28.9 * PR 0.7180 0.6453 0.7906 0.7938 0.6679 0.9196 10.6 SC 0.6135 0.5063 0.7207 0.4272 0.1432 0.7113 -30.4 RS 0.6453 0.5770 0.7137 0.5069 0.2072 0.8066 -21.5

(15)

MS 0.5720 0.4507 0.6933 0.5698 0.4033 0.7364 -0.4

MT 0.5293 0.4209 0.6377 0.5548 0.4090 0.7006 4.8

GO 0.6348 0.5617 0.7079 0.6572 0.5506 0.7638 3.5

DF 0.6634 0.5579 0.7688 0.6813 0.5617 0.8010 2.7

Nota: * significa que viés é significativo ao nível de 5%, ou seja, coeficientes com e sem correção não se cruzam.

Tabela 3: Retornos à Educação Corrigidos e Não-Corrigidos estimados para o pessoas com, ensino Médio completo e algum Superior por Estado ou Região.

Ensino Médio completo e algum Superior

Retorno Intevalo de Confiança Retorno Intevalo de Confiança Viés

Não Corrigido 95% Corrigido 95% %

Região 2 1.5243 1.4694 1.5792 1.7310 1.4195 2.0426 13.6 Região 3 1.3616 1.3173 1.4058 1.8682 1.6388 2.0977 37.2 * BA 1.3186 1.2651 1.3720 1.5371 1.3656 1.7085 16.6 * MG 1.3326 1.2854 1.3797 1.2448 1.1024 1.3871 -6.6 ES 1.2066 1.0849 1.3283 1.3149 1.0868 1.5431 9.0 RJ 1.1327 1.0861 1.1793 1.0046 0.9187 1.0905 -11.3 * SP 1.2042 1.1589 1.2496 1.1266 1.0667 1.1865 -6.4 * PR 1.4010 1.3297 1.4722 1.5514 1.4066 1.6962 10.7 * SC 1.2545 1.1431 1.3659 1.2681 0.9415 1.5946 1.1 RS 1.4301 1.3630 1.4971 1.2777 0.9751 1.5804 -10.7 MS 1.3531 1.2408 1.4653 1.3353 1.1651 1.5055 -1.3 MT 1.1246 1.0220 1.2271 1.1631 1.0319 1.2943 3.4 GO 1.2514 1.1788 1.3240 1.2727 1.1586 1.3867 1.7 DF 1.5845 1.4857 1.6832 1.6136 1.4910 1.7361 1.8

Nota: * significa que viés é significativo ao nível de 5%, ou seja, coeficientes com e sem correção não se cruzam.

Para facilitar a visualização das diferenças regionais, apresentamos os retornos a educação corrigidos das tabelas 1 a 3 no gráficos 1 a 3, respectivamente. Em geral, o padrão de retornos é similar entre níveis de escolaridade, com os estados da região Nordeste agrupados nas regiões 2 e 3 com retornos maiores e com Rio de Janeiro e São Paulo com retornos menores. Podemos ver que na maior parte dos casos os intervalos de confiança dos coeficientes dos retornos à educação se cruzam. Os retornos à edução SP e RJ para o nível de escolaridade são significativamente diferentes da Região 2, Região 3, Paraná e Goiás. Para o gráficos 2, o Distrito Federal também parece ser significativamente diferente.

Grafico 1: Retornos de Educação Corrigidos - Fundamental 1

0.0000 0.2500 0.5000 0.7500 1.0000 Regi ão 2 Regi ão 3 BA MG ES RJ SP PR SC RS MS MT GO DF Estado Retornos de Educa ç

(16)

Grafico 2: Retornos da Educação Corrigidos - Fundamental 2 0.0000 0.2000 0.4000 0.6000 0.8000 1.0000 1.2000 1.4000 1.6000 Regi ão 2 Regi ão 3 BA MG ES RJ SP PR SC RS MS MT GO DF Estado Re tornos de E d u c

CI low CI upper Coeficiente Corrigido Grafico 3: Retornos de Educação Corrigidos - Ensino Médio

0.0000 0.2500 0.5000 0.7500 1.0000 1.2500 1.5000 1.7500 2.0000 2.2500 Regi ão 2 Regi ão 3 BA MG ES RJ SP PR SC RS MS MT GO DF Estado Re tornos de E d u c

CI low CI upper Coeficiente Corrigido

Vemos acima que os termos de correção são significativos e que geram mudanças significativas nos coeficientes de retorno a escolaridade nos estados, sendo maiores as mudanças para os níveis de escolaridade mais altos. Um modo de se ter uma idéia se os retornos afetaram do modo diferenciados os retornos por estado é através da comparação do ordenamento dos retornos por nível de escolaridade, que é apresentado na tabela 4. Podemos ver que, em geral, os Rankings dos retornos mudaram após a correção. Por exemplo, o Nordeste Leste (RN, PB, PE, AL, SE) que antes era a nona passa ser a segunda com maior retorno para 4 a 7 anos de escolaridade. Por outro lado, alguns estados não apresentam grandes mudanças. São Paulo manteve a mesma posição para o 4 a 7 anos e nunca foi um dos três menores retornos. Do ponto de vista estatístico, o coeficiente de correlação de Spearman vai aumentando por nível de escolariadade sugerindo uma maior semelhança no ordenamento. A hipótese nula de que não há ordenamento pode ser muito forte, pois impõe que não há semelhança no efeito da correção ( que não implica que não há correção). Vemos que o efeito da correção foi mais heterogêneo para o nível de escolaridade mais baixo, talvez reflexo da pouca precisão das estimativas para aquele nível. Já para os níveis de escolaridade mais altos a correlação é positiva e forte.

(17)

Tabela 4: Rank dos Retornos à Educação Corrigidos e Não Corrigidos

4 a 7 anos de escolaridade

8 a 10 anos de escolaridade

Ensino Médio completo e algum Superior Ordem Retono Retorno Retorno Retorno Retorno Retorno

Não

Corrigido Corrigido CorrigidoNão Corrigido Não Corrigido Corrigido

1 PR Região 2 Região 2 Região 2 DF Região 3

2 Região 2 Região 3 PR PR Região 2 Região 2

3 RS PR DF Região 3 RS DF 4 SC ES RS DF PR PR 5 GO GO GO GO Região 3 BA 6 MG BA MG BA MS MS 7 DF DF SC ES MG ES 8 MS MT BA MS BA RS 9 Região 3 MG Região 3 MT SC GO 10 BA MS MS MG GO SC 11 MT RS ES RS ES MG 12 ES RJ SP SC SP MT 13 SP SP MT SP RJ SP 14 RJ SC RJ RJ MT RJ Spearman (P-value) (0.318)0.2879 (0.016)0.6308 0.7934(0.001)

Nota: Spearman é o coeficiente de correlação de posto de Spearman, com o valor p para a hipótese nula de correlação zero.

EM suma, os resultados obtidos em termos regionais e entre níveis de escolridade confirmam os fatos estilizados de maiores retornos no NE em relação ao SE e não linearidades nos retornos à educação. Em adição, as funções de correção são relevantes no modelo e geram grandes mudanças nos coeficientes dos retornos, embora estas mudanças sejam pouco precisos, quanto menor o grau de escolaridade. Isto é muito comum em modelos de correção de viés de seleção.

5 – COMENTÁRIOS FINAIS:

O que nos propusemos neste trabalho foi estimar as taxas de retorno à educação para os Estados brasileiros. O tema dos retornos a escolaridade já é bastante explorado na literatura nacional, como podemos ver na resenha de Corseuil e XXXX(2002). Por outro lado, há poucos estudos explorando o efeito da migração sobre estes retornos. A literatura internacional sugere que em países, como o Brasil, que apresenta um grande fluxo migratório, a migração pode ser um forte causador de viés de seleção nas estimativas de retornos à educação em uma equação de salários. Pode ser o caso que os grandes diferenciais de retornos entre o Nordeste e Sudeste, que aprofundam as desigualdades de renda nacionais e estaduais, sejam fruto da auto seleção dos migrantes entre regiões.

A literatura prevê diversos e diferenciados métodos de correção. Um método que não corrige o possível viés de seleção é o uso de dummies, como em Santos et al. (2003), pois este supõe um viés de seleção independente das características pessoais, o que vai contra a literatura. A solução mais conhecida e mais utilizada para corrigir este problema é o metódo de Heckman. Neste trabalho seria impossível utilizar este método, já que Heckman é viável apenas se tivermos duas opções, por exemplo, migrar ou não migrar, usando um Probit simples para calcular um único Mill's Ratio. Em nosso caso, ao contrário de, por exemplo,

(18)

Fiess e Verner (2003) consideramos a possibilidade de diferentes probabilidades de migrar por estados, enriquecendo a descrição regional no modelo, sem juntar, por exmeplo, estados como o Piauí e Sergipe, ou Espírito Santo e São Paulo. Mas neste caso temos a seleção entre mais de quinze opções, ou seja, a de migrar para cada um dos estados ou regiões consideradas mais a possibilidade do indivíduo não migrar. Poderíamos estimar através de Multinomial Probit, porém para este número de opções não é possível, já que o software terá que resolver integrais múltiplas e muito possivelmente não haveria convergência.

Dahl (2002) sugere uma solução para esse problema, apresentando um método, em que, sob certas hipóteses de identificação (retornos iguais entre migrantes e não migrantes, condicional à probabilidade de migrar), a correção da seleção depende apenas da probabilidade de migrar para o estado escolhido. Em adição um método semiparamétrico pode ser empregado para calcular os vários termos de correção.

Os resultados sugerem, primeiramente, que há presença de viés de seleção nas estimativas, pela significância dos termos de correção por viés de seleção nas equações de salários. Por exemplo, para São Paulo, as estimativas de retornos a escolaridade caem significativamente até 35% com a correção para viés de seleção. Em geral, as estimativas corrigidas para seleção por migração aumentam no Nordente e caem no Sudeste, com maiores diferenças para os menores níveis de escolaridade. Por exemplo, para a região que engloba Piauí, Maranhão e Ceará os retornos corrigidos são 54, 26 e 13% maiores, a medida que aumentamos o grau de escolaridade. Infelizmente as estimativas dos retornos a escolaridade são menos precisas, fazendo com que muitas diferenças entre retornos estimados com e sem a correção sejam não significativas. Isto deve ser fruto do tamanho relativamente pequeno da amostra para este tipo de estudo, baseado na PNAD e não no Censo, ou das hipóteses de identificação dos termos de correção que baseiam-se na escolaridade dos migrantes.

Em adição , alguns fatos estilizados da literatura se mantém nas estimativas de retornos com a correção e sem. Os retornos crescem à medida que o nível de escolaridade cresce em todos os Estados e regiões. Os retornos a escolaridade nas regiões menos ricas são maiores do que nas regiões mais ricas. Vale a pena destacar o caso do Rio Grande do Sul e Santa Catarina que, sem correção possuiam retornos superiores aos dos estados do Nordeste, mas com a correção de viés de seleção, passam a ter retornos menores que no Nordeste, dentro do padrão esperado de renda média- retornos à escolaridade.

Este trabalho sugere perguntas para trabalhos futuros. Primeiro, sugere-se repetir as estimativas com dados do Censo, para aumentar a precisão das estimativas semi-paramétricas. Segundo, aprofundar os estudos sobre os determinantes da migração, diante de resultados como o se São Paulo, que recebe grande número de migrantes, mas possui baixos retornos à educação com respeito a todos os níveis educacionais. Faz-se necessário investigar quais seriam os fatores que os indivíduos levam mais em consideração quando decidem migrar.

6- Referências Bibliograficas:

Aba, S., Interpreting the Effect of Distance in Migration. Journal of Political Economy, 81(3) 1153-1169, 1997.

Barros, A.R. Is there a regional problem in Brazil. mimeo, Datametrica, 2001.

Barros, R.P. et al. Técnicas empíricas de decomposição: uma abordagem baseada em simulações contrafactuais. Revista de Econometria, v.15, p.33-64, 1995.

Berndt, E. The practice of Econometrics: classic and contemporary. Upper Sadle River: Addison Wesley, 1991.

(19)

Borjas, G. “Self selection and the earnings of immigrants”. American Economic Review, v.77, n.4, 1987.

______________, “Labor Economics” McGraw-Hill,1996.

______________, “The Economic Analysis of Immigration”. Handbook of Labor Economics vol. 3, 2001.

Dahl, G.B. “Mobility and the Return to Education: Testing a Roy Model with Multiple Markets” Econometrica, vol.70 nº6, 2002.

Ehrenberg, R. And Smith, R. “Modern Labor Economics – Theory and Public policy”. Adison- Wesley, Sixty edition, 1996.

Fiess, N. e Verner, D. Migration and human capital in Brazil during the 1990´s. WorldBank Policy Research Working Paper, no.3093, 2003.

Falaris, E. “A Nested Logit Migration Model with Selectivity”. International Economic Review v.28, n.2, 429-443, 1987.

Gonzaga, G. e Soares, R. Determinação de Salários no Brasil: Dualidade ou Não-Linearidade no Retorno à Educação?, Revista de Econometria, 19: 271-304, 1999.

Greene, W. Econometric Analysis. 4th.Ed. Upper Saddle River:Addison Wesley, 2000. Heckman, J. Sample Selection XXX. Econometrica XX, 1976.

Maddala, G.S. Limited Dependented Variables. Cambridge:University Press, 1984.

Mincer, J. Family Migration Decision, Journal of Political Economy, 86(5):749-773, 1978. Powell, J. Semiparametric Methods. in Heckman and McFadden, Handbook of Econometrics,

v.4, Amterdam:North-Holland, 1997.

Sahota, G.,. An Economic Analysis of Internal Migration in Brazil. Journal of Political Economy, 76(2): 218-245, 1968

Santos, E. et al. Migração, seleção e diferenças regionais de renda no Brasil. Anais da ANPEC 2003, Porto Seguro, BA (cd-rom), 2003.

Sjaastad, Larry A. “The costs and Returns of Human Migration”, Journal of Political Economy 70, 80-93,1962.

Referências

Documentos relacionados

A anotação que se faz sobre tais normas é que, da forma como estão sendo elaboradas, privilegiam muito mais a manutenção de um sistema de visitação turística que é elitista e

Como foi visto, a primeira etapa do processo decisório de consumo é o reconhecimento da necessidade, com isso, observou-se que, nessa primeira etapa, os consumidores buscam no

È importante que o gerenciamento do custo total veja a empresa como uma interface entre os fornecedores e os clientes, sendo que esta deve identificar, coletar, organizar e analisar

Discutir os benefícios alcançados até o momento (físico, econômico, social, etc); discutir as estratégias que os usuários vêm utilizando para lidar com a

Este trabalho tem como objetivo geral avaliar a quantidade de água pluvial que pode ser aproveitada após infiltrar em um pavimento permeável de concreto

Considerando que o experimento não alterou a área do citoplasma dos neurônios deste estudo, sugere-se que essa redução da área nuclear seja a principal responsável pela

Mas existe grande incerteza sobre quem detém esses direitos em certas áreas do Brasil rural.. Esta é a posição do Brasil em relação à segurança de direitos de propriedade de

This infographic is part of a project that analyzes property rights in rural areas of Brazil and maps out public policy pathways in order to guarantee them for the benefit of