• Nenhum resultado encontrado

Modelos de redes sociais para dados de Migração

N/A
N/A
Protected

Academic year: 2021

Share "Modelos de redes sociais para dados de Migração"

Copied!
42
0
0

Texto

(1)

Modelos de redes sociais para dados

de Migração

(2)

Redes Sociais

Uma rede social se estrutura por um conjunto de atores ou nós (pessoas, objetos, locais ou eventos) ligados por uma relação;

Na teoria dos grafos, estes elementos são conhecidos como vértices e arestas ;

Os objetivos da análise de redes sociais abrangem a

identificação de nós com papel importante, a

sumarização, a identificação do padrão geral e da

existência de grupos subjacentes na rede;

(3)

Redes Sociais

A popularização das redes sociais evidencia a necessidade de avanços na modelagem das relações e interações entre indivíduos que convivem em sociedade;

Vários pesquisadores têm se dedicado a estudar e modelar redes sociais;

Dentre os trabalhos desenvolvidos na literatura

estatística, destacam-se àqueles que pressupõem a

(4)

Pergunta

É possível utilizar modelos de espaços latentes para redes sociais a fim de modelar dados de migração e de movimentos de pessoas?

Resposta: SIM!

(5)

Redes Sociais e o Movimento de Pessoas

A identificação e a análise dos fluxos migratórios têm sido fruto de inúmeros estudos;

O mesmo acontece na análise de movimentos pendulares (moradia-trabalho) nas grandes metrópoles;

Causas costumam ser explicadas por teorias sociais e

econômicas, aproveitando-se a grande quantidade de

dados disponíveis;

(6)

Visualização de fluxos

A visualização de fluxos migratórios usualmente é realizada por meio de tabelas com estatísticas de saldos migratórios e com mapas plotando as diferentes direções dos fluxos existentes;

Alguns autores têm se dedicado a criar formas

alternativas para uma melhor visualização e análise dos

dados (Aigner et al., 2007, Guo, 2009, Sander et al., 2014,

entre outros).

(7)

Visualização de fluxos

Os resultados da utilização de recentes modelos de espaços latentes para redes sociais permitem o mapeamento da estrutura latente dos fluxos migratórios, além da identificação de agrupamentos regionais;

Adicionalmente, permitem ainda uma forma alternativa de

visualização de fluxos migratórios.

(8)

Modelos para redes sociais

Os modelos básicos para redes sociais podem envolver efeitos fixos, efeitos aleatórios ou ainda considerar a existência de espaços latentes;

Técnicas de análise multivariada (escalonamento

multidimensional) e de análise de grafos (medidas de

centralidade) podem também ser utilizadas para

sumarização das informações contidas em uma rede.

(9)

Modelos para redes sociais

Os dados costumam ser organizados em uma matriz simétrica, de dimensão × , onde cada elemento indica a existência (ou não) da relação social entre dois indivíduos da rede;

Alternativamente, esta matriz pode conter o grau da

relação social, mensurado pelo número de conexões,

existente entre dois indivíduos da rede;

(10)

Modelos para redes sociais

Em geral é modelado por uma distribuição Bernoulli ou Poisson, onde o valor esperado é tratado como função de efeitos aleatórios;

Esta média é usualmente modelada em função de efeitos aleatórios associados a cada um dos indivíduos da rede;

O processo de inferência geralmente é baseado nos

métodos de MV e MCMC.

(11)

1. Modelo de intensidade de conexões

~ , <

log 1 − = +

onde é a variável indicadora da presença ou ausência de

relação entre os elementos e da rede social.

(12)

Formulação alternativa

ou

~ , <

log = +

onde é a variável que contabiliza o número de conexões

entre os elementos e da rede social.

(13)

Observações

Fácil implementação e bom ajuste;

O efeito é interpretado como um índice de propensão para conexões ou como um índice de intensidade de conexões na rede social;

Sob a abordagem bayesiana, estes efeitos são modelos

com prioris Normais pouco informativas;

(14)

Aplicação I: Fluxos migratórios entre UF’s no Brasil

Dados: fluxo migratório (número de pessoas) entre Unidades Federativas (UF) no Brasil ocorridos entre os anos de 2005 e 2010;

Fonte: Microdados da Amostra do Censo 2010 – IBGE;

Dados brutos podem ser representados na forma de um

grafo não-orientado.

(15)
(16)

Fluxos migratórios entre UF’s no Brasil

Cada aresta no grafo representa 10 mil pessoas migrando (em qualquer direção);

Muito difícil extrair informações deste grafo;

Este grafo representa apenas uma dentre infinitas formas de representação destes dados.

Um modelo de intensidade de conexões (fluxos) foi

(17)

Estimativas de , … ,

!"

via MV

(18)

Fluxos migratórios entre UF’s no Brasil

Os efeitos de intensidade de fluxo evidenciam o maior deslocamento de pessoas envolvendo os Estados de SP, GO e BA;

Por outro lado, os Estados da Região Norte apresentam menores efeitos de intensidade de fluxo;

Note que este modelo não considera o efeito das

populações envolvidas e também não considera a

direção dos fluxos!

(19)

2. Escalonamento Multidimensional

O Escalonamento Multidimensional (EMS) é uma técnica que utiliza a proximidade entre objetos para criar uma representação espacial dos mesmos a partir de uma matriz de dissimilaridades.

Dada uma matriz de dissimilaridades # entre os

elementos da rede, o objetivo é encontrar uma

configuração de pontos em um espaço latente (de baixa

dimensão) de tal forma que as suas coordenadas

produzam uma matriz de distâncias Euclidianas tão

(20)

Aplicação II: Pendularidade na Região Metropolinada do Rio de Janeiro

Dados: O movimento captado através das perguntas de deslocamento para o trabalho (Município em que trabalha e se retorna do trabalho para a casa diariamente).

Fonte: Microdados do Censo 2010 – IBGE;

Atualmente a Região Metropolitana do Rio de Janeiro

(RMRJ) é composta por 21 municípios, sendo a segunda

maior área metropolitana do Brasil.

(21)

Pendularidade na Região Metropolinada do Rio de Janeiro

Neste caso temos interesse em analisar os fluxos pendulares considerando a direção dos mesmos;

Assim, a matriz com os fluxos pendulares não será simétrica!

O objetivo é encontrar padrões de chegada e de saída

de trabalhadores em cada município.

(22)

Ilustração do método

(Mattos, 2016)

Município de trabalho São

Gonçalo Niterói Rio de Janeiro Maricá Itaboraí

Município de Residência

São Gonçalo 0 20 60 3 16

Niterói 10 0 20 8 50

Rio de Janeiro 2 3 0 60 80

Maricá 20 20 50 0 100

Itaboraí 2 50 150 70 0

Municípios População São Gonçalo 2000

Niterói 1000 Rio de Janeiro 3000

Deslocamento diário de trabalhadores entre 5 municípios

Tamanho populacional dos 5 municípios

(23)

Representação espacial da movimentação de saída

(24)

Representação espacial da movimentação de chegada

(25)

Representação espacial da movimentação de saída de trabalhadores dos municípios da RMRJ, 2010

(Mattos, 2016).

(26)

Representação espacial da movimentação de chegada de trabalhadores dos municípios da RMRJ, 2010

(Mattos, 2016).

(27)

3. Modelo de intensidade de conexões de abertura e de receptividade

~ , ≠

= %

log % = &

'

+ ( +

onde é um offset representando o número esperado de

conexões entre os elementos e da rede caso todos os

(28)

Interpretação das componentes

( representa o grau de abertura para novas conexões do -ésimo elemento da rede;

representa o grau de receptividade para novas conexões do -ésimo elemento da rede;

Quanto maior o valor destes efeitos, maior será o

número esperado de conexões entre os elementos e .

(29)

Pendularidade na Região Metropolinada do Rio de Janeiro

No caso da utilização deste modelo para dados de fluxos pendulares na RMRJ, temos:

( representa o índice de repulsividade do -ésimo município;

representa o índice de atratividade do -ésimo

município;

(30)

Distribuição dos municípios da RMRJ segundo índices de atratividade e repulsividade para

movimento pendular, 2010 (Mattos, 2016).

(31)

4. Modelo de Distâncias Latentes

(Hoff et al, 2002 e Handcock et al, 2007)

Considera que cada um dos elementos da rede assume uma posição em um espaço latente definido em ℜ

*

, onde geralmente + = 2;

Neste modelo, o número de ligações entre dois elementos da rede segue uma distribuição Poisson;

Por sua vez, a média desta Poisson depende da distância

em que estes elementos se encontram neste espaço

(32)

Modelo

~ , <

log = . − | − |

onde | − | representa a distância euclidiana entre as

posições e .

(33)

Observações

Caso + = 2, temos que =

0

,

1

representa um ponto no espaço latente bidimensional.

Elementos que ocupam posições próximas no espaço latente apresentam maior valor esperado de conexões entre si do que com elementos cujas posições no espaço latente estão distantes;

Note que esta versão do modelo considera que é

(34)

Problemas de Inferência

Este modelo possui problemas de identificabilidade, uma vez que é possível representar uma mesma configuração de posições no espaço latente de infinitas formas;

Quando estimado por MV, recomenda-se utilizar as posições obtidas por escalonamento multidimensional como valores iniciais em um algoritmo de maximização;

Também é necessário fixar algumas posições para

eliminar efeitos de translação, rotação e reflexão da

configuração;

(35)

Problemas de Inferência

Quando a inferência é realizada sob o enfoque Bayesiano, pode-se atribuir prioris (Normais) pouco informativas para . e para , … ,

2

;

Ao realizar a inferência via MCMC, é necessário fixar uma configuração de referência a cada iteração do algoritmo;

Isto pode ser feito utilizando a função Procustean para

em torno de uma configuração obtida via MV.

(36)

Ilustração do uso da função procrustean:

configuração original (esq), configuração alvo (centro),

configuração final (dir)

(37)

Modelo de Distâncias Latentes para Fluxos migratórios entre UF’s no Brasil

~ , <

= %

log % = . − | − |

onde é o fluxo migratório esperado entre as UF’s e

caso todos os Estados tivessem o mesmo padrão de fluxo.

(38)

Posições das UF’s no espaço latente de migrações no

período 2005-2010 estimada via MV.

(39)

Média a posteriori das posições das UF’s no espaço latente de migrações no período 2005-2010 estimada

via MCMC.

(40)

Considerações Finais

A aplicação de modelos para redes sociais é eficaz para organizar e identificar padrões e agrupamentos de fluxos migratórios e pendulares;

É possível interpretar as distâncias das posições de cada elementos da rede e ainda estimar a probabilidade de aumentos ou diminuições nos fluxos entre dois elementos da rede;

As precisões das estimativas podem ser obtidas com

algum trabalho computacional;

(41)

Considerações Finais

Os resultados obtidos com a aplicação destes modelos permite a obtenção de índices de atratividade e repulsividade de localidades, levando-se em conta todo o padrão da rede;

Adicionalmente, os resultados permitem uma melhor

visualização da dinâmica dos fluxos migratórios.

(42)

OBRIGADO!

gustavo.ferreira@ibge.gov.br

Referências

Documentos relacionados

Os casos não previstos neste regulamento serão resolvidos em primeira instância pela coorde- nação do Prêmio Morena de Criação Publicitária e, em segunda instância, pelo

Assim, a presente pesquisa objetiva apresentar uma proposta voltada à re- ferida zona de esperança, que pressuponha o uso correto dos direitos do homem, a partir de uma

Foi ainda emitida confirmação de que não são utilizadas quaisquer substâncias químicas tóxicas, cancerígenas, tóxicas para a reprodução e mutagénicas da

&#34;tendo em vista a estrutura da incorporação pretendida, a Companhia entende que não se faz necessário o atendimento integral ao Artigo 264 da Lei 6.404/76 e à ICVM

Acredita-se que as pes- soas especiais devem estar presentes não só como ouvintes, mas como agentes que possam estar envolvidos nas discussões e decisões sobre uma

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

forficata recém-colhidas foram tratadas com escarificação mecânica, imersão em ácido sulfúrico concentrado durante 5 e 10 minutos, sementes armazenadas na geladeira (3 ± 1

Dentro do contexto da produção siderúrgica nacional (Quadro 6), a produção brasileira de aço bruto, acumulada no 1º semestre de 2013, totalizou 11,7 milhões de toneladas de