JUSLEY TALITA GRIMES DE SOUZA
LEIS DE POT ˆENCIA E ELEIC¸ ˜OES
DISSERTAC¸ ˜AO
CAMPO MOUR ˜AO 2019
LEIS DE POT ˆENCIA E ELEIC¸ ˜OES
Dissertac¸ ˜ao apresentada ao Programa de P ´os Graduac¸ ˜ao em Inovac¸ ˜oes Tec-nol ´ogicas, da Universidade TecTec-nol ´ogica Federal do Paran ´a, como requisito parcial para a obtenc¸ ˜ao do grau de Mestre. Orientador: Profª. Drª. Magda Cardoso Mantovani.
Coorientador: .
CAMPO MOUR ˜AO 2019
Dados Internacionais de Catalogação na Publicação
S726l Souza, Jusley Talita Grimes de
Leis de potência e eleições / Jusley Talita Grimes de Souza – 2019.
100f. : il. ; 30 cm.
Texto em português com resumo em inglês Orientadora: Magda Cardoso Mantovani
Dissertação (Mestrado) – Universidade Tecnológica Federal do Paraná. Programa de Pós-Graduação em Inovações Tecnológicas Campo Mourão, 2019.
Inclui bibliografias.
1. Eleições. 2. Estatística. 3. Inovações Tecnológicas – Dissertações. I. Mantovani, Magda cardoso, orient. II. Universidade Tecnológica Federal do Paraná. Programa de Pós-Graduação em Inovações Tecnológicas. III. Título.
CDD: 607
Biblioteca Câmpus Medianeira Fernanda Bem 9/1735
JUSLEY TALITA GRIMES DE SOUZA
LEIS DE POT ˆENCIA E ELEIC¸ ˜OES
Dissertac¸ ˜ao apresentada ao Programa de P ´os Graduac¸ ˜ao em Inovac¸ ˜oes Tec-nol ´ogicas, da Universidade TecTec-nol ´ogica Federal do Paran ´a, como requisito parcial para a obtenc¸ ˜ao do grau de Mestre.
Data de aprovac¸ ˜ao: 04 de marc¸o de 2019.
Profª. Drª. Magda Cardoso Mantovani Universidade Tecnol ´ogica Federal do Paran ´a
Prof. Dr. Haroldo Valentin Ribeiro Universidade Estadual de Maring ´a
Prof. Dr. Wyrllen Everson de Souza Universidade Tecnol ´ogica Federal do Paran ´a
Prof. Dr. Leandro de Santana Costa Universidade Tecnol ´ogica Federal do Paran ´a
A Deus por permitir a conclus ˜ao desse trabalho me dando sa ´ude, forc¸a e me capacitando.
A minha orientadora Magda Cardoso Mantovani, pelo acolhimento, apoio e orientac¸ ˜ao com muita paci ˆencia e dedicac¸ ˜ao.
A minha fam´ılia, pelo amor, incentivo e apoio incondicional.
Aos meus amigos, que sempre me incentivaram, ouviram e aconselheram em muitos momentos durante essa trajet ´oria. Em especial, Adriele, Camila, Danielly, Miriam, Suellen e Fernando.
A Jaiza e Cibele, amigas que fiz no decorrer do mestrado e que me ajudaram muito.
E a todos que diretamente ou indiretamente fizeram parte dessa conquista, o meu muito obrigada.
Utilizando conceitos e ferramentas de Estat´ıstica este trabalho apresenta alguns exem-plos de sistemas sociais, nos quais as suas din ˆamicas s ˜ao modeladas por leis de pot ˆencia ou leis de escala. Inicialmente, foi dado um breve panorama da emerg ˆencia de leis de escala em fen ˆomenos urbanos de modo geral: caracter´ısticas universais nas din ˆamicas de crescimento, atividades religiosas, escala urbana e distribuic¸ ˜ao lei de pot ˆencia e alometrias para indicadores urbanos. Especificamente, fen ˆomenos eleitorais modelados por relac¸ ˜oes de escala foram o foco deste trabalho. Neste sentido, foram apresentados resultados em que tais relac¸ ˜oes emergem de fen ˆomenos eleitorais. Em seguida, s ˜ao apresentadas as investigac¸ ˜oes desta dissertac¸ ˜ao. Essa pesquisa, teve como objetivo investigar resultados de eleic¸ ˜oes brasileiras para governos dos estados federativos num cen ´ario de apenas dois partidos pol´ıticos, tomando, assim, dados de segundo turnos no per´ıodo de 1994-2018. Obteve-se um modelo anal´ıtico dependendo de um ´unico par ˆametro, o que possibilitou constatar que na maioria das eleic¸ ˜oes o n ´umero de votos do primeiro colocado tende a crescer com o tamanho da cidade numa proporc¸ ˜ao menor que o segundo colocado.
By using concepts and tools from statistics, this paper presents some exemples of social systems, in which their dynamics are modeled by power laws or scaling laws. Initially, it was given a brief overwiew about the scaling laws emerging from urban phenomena in general: universal characteristics in growth dynamics, religion activities, urban scales, power law distribution, and allometric urban indicators. Specifically, electoral phenomena modeled by scaling relations, which was the focus of this work. In this direction, it was presented results in which such relations emerge from electoral phenomena. Next, the investigations of this dissertation are presented. This research aimed to investigate Brazilian election results for federal state governments in a scenario with only two political parties, disputing thus taking data from the second round of elections in the period 1994-2918. This dataset allowed to verify that in the majority of the elections the number of votes for the first placed candidate tends to grow with the city size in a smaller proportion than those of the second placed candidate.
1 INTRODUC¸ ˜AO 9
2 LEIS DE POT ˆENCIA E FEN ˆOMENOS SOCIAIS 11
2.1 Leis de Pot ˆencia modelam crescimento de atividades religiosas 11
2.2 Escalas urbanas conectadas com a Lei de Zipf 17
2.3 Uma relac¸ ˜ao entre a escala urbana e func¸ ˜ao de produc¸ ˜ao 25 2.4 Fatores que d ˜ao origem as relac¸ ˜oes de escala dos fatores urbanos
relacionados ao tamanho da populac¸ ˜ao 31
2.5 Conex ˜ao entre distribuic¸ ˜ao Lei de Pot ˆencia e Alometrias para
indi-cadores urbanos 35
3 LEIS DE POT ˆENCIA EM ELEIC¸ ˜OES 44
3.1 Distribuic¸ ˜ao de Votos 44
3.2 Simulac¸ ˜ao de Distribuic¸ ˜ao de Votos em Rede 48
3.3 Relev ˆancia dos Partidos 54
3.4 Processo de Candidatura 56
3.5 Lei de Pot ˆencia Universal nas Eleic¸ ˜oes Presidenciais dos Estados
Unidos 61
3.6 A falta de economia em eleic¸ ˜oes proporcionais 64
4 LEI DE ESCALA EM SEGUNDO TURNO DE ELEIC¸ ˜OES BRASILEIRAS 72
4.1 Apresentac¸ ˜ao dos Dados 73
4.2 An ´alise dos Dados 76
4.3 Resultados e Conclus ˜oes 86
REFER ˆENCIAS 89
AP ˆ
ENDICES
93
AP ˆENDICE A LEI DE POT ˆENCIA OU ESCALA 94
AP ˆENDICE D MODELO DE SZNAJD 98
AP ˆENDICE E REDE DE BARAB ´ASI-ALBERT 99
1 INTRODUC¸ ˜AO
O n ´umero de indiv´ıduos, assim como o n ´umeros de cidades, est ˜ao em geral crescendo ininterruptamente e com isso os desafios sociais tamb ´em aumentam. Al ´em disso, as interac¸ ˜oes sociais s ˜ao reforc¸adas devido `a alta mobilidade das pessoas e grande facilidade de comunicac¸ ˜ao. Diante desses fatores, ´e tamb ´em uma necessidade crescente compreender os variados aspectos da sociedade. Nos ´ultimos anos, muitas pesquisas t ˆem sido realizadas utilizando conceitos e ferramentas de Estat´ıstica na tentativa de entender fen ˆomenos coletivos emergentes das interac¸ ˜oes entre pessoas como unidades elementares em estruturas sociais, isto ´e, com o objetivo de aumentar a compreens ˜ao de sistemas sociais. Nesse contexto, do ponto de vista dos sistemas complexos, muitos sistemas sociais t ˆem suas din ˆamicas modeladas por leis de pot ˆencia, ou leis de escala. Segundo Macau (2002), um sistema ´e considerado “sistema complexo” quando apresenta um comportamento entrelac¸ado, no qual ´e dif´ıcil de ser modelado analisando somente suas partes. Como os sistemas complexos aparecem em diversas
´areas, alguns exemplos ser ˜ao apresentados nesse trabalho.
Nesse sentido, no primeiro cap´ıtulo apresentou-se alguns estudos sobre pes-quisas de fen ˆomenos urbanos modelados por distribuic¸ ˜oes do tipo lei de pot ˆencia e alometrias. Comec¸ando pelo sistema social da religi ˜ao, Picoli e Mendes (2008) desco-briram que a distribuic¸ ˜ao das taxas logar´ıtmicas de crescimento anuais exibe a mesma forma funcional para escalas de tamanhos distintas e o desvio padr ˜ao das taxas de crescimento escala como uma lei de pot ˆencia. Gomez-Lievano et al. (2012) constru´ıram uma ferramenta estat´ıstica auto-consistente que caracteriza as distribuic¸ ˜oes de proba-bilidades conjuntas de indicadores urbanos e tamanho de populac¸ ˜ao da cidade atrav ´es de um sistema urbano. Lobo et al. (2013) mostraram empiricamente que existe uma depend ˆencia sistem ´atica da produtividade urbana no tamanho da populac¸ ˜ao da cidade, resultante do descompasso entre a depend ˆencia do tamanho do sal ´ario e trabalho, de modo que a produtividade das cidades americanas aumenta cerca de 11% cada vez que dobra a populac¸ ˜ao. Bettencourt (2013) verificou que medidas de efici ˆencia urbana que capturam o equil´ıbrio entre os resultados socioecon ˆomicos e os custos de infra-estrutura, mostraram-se independentes do tamanho da cidade. Alves et al. (2014) mostraram que um conjunto de 12 indicadores urbanos das cidades brasileiras, s ˜ao assintoticamente distribu´ıdos como leis de pot ˆencia.
No segundo cap´ıtulo apresentou-se um hist ´orico de resultados de leis de pot ˆencia em um tipo de fen ˆomeno urbano de grande interesse para a populac¸ ˜ao: as eleic¸ ˜oes. Inicia-se com Costa Filho et al. (1999;2002), argumentando que o n ´umero de candidatos que recebem uma dada frac¸ ˜ao de votos, em eleic¸ ˜oes proporcionais
brasileiras, tem distribuic¸ ˜ao seguindo uma lei de pot ˆencia com expoente −1, e que esse comportamento pode ser modelado como um processo multiplicativo; em seguida, os mesmos dados foram melhor ajustados por Lira et al. (2003) usando uma generalizac¸ ˜ao da lei de Zipf. Com o objetivo de simular o comportamento de lei de pot ˆencia encontrado por Costa Filho et al., Bernardes et al. (2002) constru´ıram um modelo que utiliza a generalizac¸ ˜ao da din ˆamica de opini ˜ao de Snajd na rede de Barab ´asi-Albert. Travieso e Costa (2006) constru´ıram uma din ˆamica de opini ˜ao e a aplicaram a cinco modelos de redes. Analisando as eleic¸ ˜oes proporcionais e, agora considerando a “forc¸a” dos partidos, Fortunato e Castellano (2007) apontam que a distribuic¸ ˜ao do n ´umero de votos recebidos por candidatos para tr ˆes pa´ıses ´e ajustada por uma lognormal; em contraste, Arirape e Costa Filho (2009) indicam que os resultados para eleic¸ ˜oes brasileiras s ˜ao diferentes. Mantovani et al. (2013), analisando dados de eleic¸ ˜oes para prefeitos e vereadores, encontraram um comportamento m ´edio lei de pot ˆencia e um aparente crescimento do expoente com o n ´umero de posic¸ ˜oes. Bok ´anyi et al. (2018) analisaram dados das eleic¸ ˜oes dos Estados Unidos e do Referendo da Uni ˜ao Europeia e conclu´ıram que as curvas de escala s ˜ao todas universais e dependem de um ´unico par ˆametro. Melo et al. (2018) investigaram o crescente custo das campanhas eleitorais, mostrando que os principais candidatos gastam mais dinheiro por voto do que os candidatos menos bem sucedidos, uma superlinearidade que revela uma n ˜ao economia de escala.
Diante desses resultados para fen ˆomenos urbanos modelados por leis de es-cala, o cap´ıtulo 3 apresenta a pesquisa desenvolvida neste trabalho, que foi direcionada pelos resultados anteriores, em particular, o trabalho que investigou os resultados de eleic¸ ˜oes para presidentes dos Estados Unidos entre 1948-2016 e do referendo sobre a perman ˆencia do Reino Unido na Uni ˜ao Europeia em 2016, identificando um comportamento de escala universal com um ´unico par ˆametro (BOK ´ANYI, 2017). Nesse contexto, essa pesquisa realizou uma investigac¸ ˜ao similar para os dados do Brasil, optando por investigar eleic¸ ˜oes para governos dos estados federativos. Al ´em disso, usou-se dados de segundo turnos com o objetivo de obter um modelo para um cen ´ario com apenas dois partidos, obtendo uma lei de escala universal.
2 LEIS DE POT ˆENCIA E FEN ˆOMENOS SOCIAIS
Com o r ´apido crescimento das cidades h ´a uma crescente preocupac¸ ˜ao em compreender os fen ˆomenos urbanos. No entanto, persiste a dificuldade em abord ´a-los devido a interdepend ˆencia entre eles. Por ´em, a exist ˆencia de uma relac¸ ˜ao com o tama-nho da populac¸ ˜ao ´e evidente. Sendo Y = Y0Nβ, onde N ´e o tamanho da populac¸ ˜ao, Y o fen ˆomeno urbano, e neste contexto e, do ponto de vista dos sistemas complexos, foram investigados fen ˆomenos sociais como em religi ˜ao, economia, propagac¸ ˜ao de not´ıcias, popularidade, din ˆamicas de opini ˜ao e pol´ıtica. Neste cap´ıtulo ser ˜ao apre-sentados alguns exemplos de investigac¸ ˜oes de fen ˆomenos urbanos, nos quais tais investigac¸ ˜oes focaram em caracter´ısticas universais nas din ˆamicas de crescimento, atividades religiosas, escala urbana e distribuic¸ ˜oes lei de pot ˆencia e alometrias para indicadores urbanos.
2.1 Leis de Pot ˆencia modelam crescimento de atividades religiosas
Grupos religiosos s ˜ao sistemas sociais muito importantes. Nesse sentido, Picoli e Mendes (2008), investigaram a din ˆamica de crescimento de um grupo religioso crist ˜ao, as Testemunhas de Jeov ´a, em 140 pa´ıses por um per´ıodo de 47 anos, desde de 1959 a 2005. Esse grupo compreende mais de 6,9 milh ˜oes de membros praticantes em todo o mundo, organizados em cerca de 100.000 congregac¸ ˜oes em 236 pa´ıses. Todos os membros editores s ˜ao envolvidos em um trabalho de pregac¸ ˜ao p ´ublica. As medidas de suas atividades religiosas s ˜ao registradas pelo pa´ıs e publicadas nos relat ´orios anuais do servic¸o. Os dados analisados foram obtidos a partir desses relat ´orios anuais de servic¸os. As investigac¸ ˜oes focaram em quatro medidas distintas de atividade religiosa: n ´umero total de editores; m ´edia mensal de tempo integral de editores pioneiros; tempo total investido em horas no trabalho de pregac¸ ˜ao p ´ublica e m ´edia mensal de cursos realizados em casas.
Considerou-se a taxa anual de crescimento logar´ıtmica definida como R(t) = log10
S(t + 1) S(t)
, (2.1)
onde S(t) e S(t + 1) s ˜ao os n ´umeros totais de editores em anos sucessivos t e t + 1, em um dado pa´ıs. ´E mostrada na Figura 2.1.1 a evoluc¸ ˜ao temporal de R(t) para alguns pa´ıses no per´ıodo de 1959-2005. Nesse per´ıodo as m ´edias dos n ´umeros de editores,
¯
S, para esses pa´ıses s ˜ao: Gr ˜a-Bretanha ( ¯S = 92, 006) e Ilhas Cayman ( ¯S = 67), Brasil ( ¯S = 226, 682) e Niu ˆe ( ¯S = 20), Estados Unidos ( ¯S = 655, 607) e Monserrate ( ¯S = 24), It ´alia ( ¯S = 112, 660) e Ilhas Falkland ( ¯S = 6), Z ˆambia ( ¯S = 66, 554) e G ˆambia ( ¯S = 42),
Jap ˜ao ( ¯S = 96, 937) e N ´evis ( ¯S = 40). Note que as flutuac¸ ˜oes em R s ˜ao maiores nos pa´ıses com pequeno S.
(anos) (anos) Grã-Bretanha Ilhas Cayman Brasil Niuê Estados Unidos Monserrate Itália Ilhas Falkland Zâmbia Gâmbia Japão Névis
Figura 2.1.1 – Taxas de crescimento. Evoluc¸ ˜ao temporal das taxas de crescimento, dada
pela Equac¸ ˜ao 2.1, para alguns pa´ıses no per´ıodo de 1959-2005. Adaptada de Picoli e Mendes (2008).
S ˜ao mostradas na Figura 2.1.2 (a) a densidade de probabilidade de log10S, para 207 pa´ıses em 2005, em comparac¸ ˜ao com uma distribuic¸ ˜ao Gaussiana. S tem distribuic¸ ˜ao aproximadamente lognormal, que ´e reforc¸ada pela distribuic¸ ˜ao cumulativa de log10S na Figura 2.1.2 (b). Resultados semelhantes s ˜ao v ´alidos para outros anos no per´ıodo de 1959-2005.
Figura 2.1.2 – Distribuic¸ ˜ao de editores. (a) Densidade de probabilidade do logaritmo do
n ´umero de editores para 207 pa´ıses em 2005. A linha s ´olida ´e um ajuste Gaussiano dos dados. (b) Distribuic¸ ˜ao cumulativa do logaritmo do n ´umero de editores para os mesmos dados definidos em (a). A linha s ´olida representa a distribuic¸ ˜ao cumulativa de uma vari ´avel Gaussiana com m ´edia e desvio padr ˜ao id ˆenticos aos dados emp´ıricos. Adaptada de Picoli e Mendes (2008).
Em seguida, foram analisadas distribuic¸ ˜ao das taxas de crescimento de edi-tores usando dados de 140 pa´ıses de 1949 a 2005. Por ser uma atividade religiosa relativamente recente o n ´umero de editores representa uma frac¸ ˜ao bem pequena da populac¸ ˜ao dos pa´ıses.
Com o intuito de investigar como a distribuic¸ ˜ao das taxas de crescimento depende do n ´umero de editores, considerou-se grupos de pa´ıses escolhidos de acordo com a m ´edia dos editores. A Figura 2.1.3 (a) mostra a densidade de probabilidade condicional p(R|S) das taxas de crescimento bem descrita por uma distribuic¸ ˜ao de Laplace p(R|S) = √ 1 2σ(S)exp − √ 2|R − µ| σ(S) ! , (2.2)
onde µ e σ s ˜ao, respectivamente, a m ´edia e o desvio padr ˜ao de R calculados sobre um determinado grupo de pa´ıses. Na Figura 2.1.3 (b) ´e mostrado a distribuic¸ ˜ao cumulativa do valor absoluto de R em comparac¸ ˜ao com func¸ ˜oes exponenciais.
Foi ainda calculada, Figura 2.1.3 (c), a densidade de probabilidade condicional p(R|S)da taxa de crescimento normalizada
r(t) = R(t) − µ
σ . (2.3)
Colapsando em uma ´unica curva,
p(r|S) = √1
2exp(− √
Nas Figuras 2.1.3 (a) e 2.1.3 (c) pode ser observado um tipo de invari ˆancia de escala, j ´a que a distribuic¸ ˜ao das taxas de crescimento exibe a mesma forma funcional da distribuic¸ ˜ao de Laplace para escalas de tamanhos distintos.
Analisou-se ainda como a largura da distribuic¸ ˜ao das taxas de crescimento aumenta com o tamanho da escala. Calculou-se σ em func¸ ˜ao de S, encontrando-se uma relac¸ ˜ao aproximadamente lei de pot ˆencia
σ(s) ∝ S−β, (2.5)
com β ' 0, 16 como mostra a Figura 2.1.3 (d), indicando que as flutuac¸ ˜oes nas taxas de crescimento decaem como uma lei de pot ˆencia. As flutuac¸ ˜oes de R s ˜ao maiores para pa´ıses com pequenos S, o que ´e consistente com a Figura 2.1.1.
Considerou-se ainda o grupo 76, 638 < ¯S < 655, 607 mas, para maior clareza, mostrou-se dados apenas para os tr ˆes primeiros grupos.
Figura 2.1.3 – Din ˆamica de crescimento dos editores. Em (a), (b) e (c) os grupos
de pa´ıses selecionados pelo n ´umero m ´edio de editores: 6 < ¯S < 105 (tri ˆangulos), 105 < ¯S < 425(c´ırculos), e 980 < ¯S < 2, 160(quadrados). (a) Densidade de probabilidade condicional p(R|S) das taxas de crescimento R. As linhas s ´olidas s ˜ao dadas pela Equac¸ ˜ao 2.2 usando µ e σ obtido dire-tamente dos dados. (b) Distribuic¸ ˜ao cumulativa pc(|R|)do valor absoluto de
R. As linhas s ´olidas s ˜ao ajustes lineares dos dados (na escala mono-log), representando o decaimento exponencial. (c) Densidade de probabilidade condicional p(r|S) normalizada das taxas de crescimento r. (d) Desvio padr ˜ao σ das taxas de crescimento R como uma func¸ ˜ao de S. A linha s ´olida ´e um ajuste linear para os dados (em escala log-log), dando um expoente de escala β ' 0, 16. Adaptada de Picoli e Mendes (2008).
Outras medidas importantes tamb ´em foram analisadas como: m ´edia mensal de editores em tempo integral (N ), o total de tempo gasto em horas no trabalho educativo p ´ublico (H) e a m ´edia mensal de cursos realizados nas casas (C). Descobriu-se que a densidade da probabilidade de log10N, log10H e log10C s ˜ao consistente com uma distribuic¸ ˜ao Gaussiana, implicando que N , H e C s ˜ao distribuic¸ ˜oes lognormal, o desvio padr ˜ao das taxas de crescimento como uma lei de pot ˆencia, com expoentes β ' 0, 16 para horas, β ' 0, 13 para cursos e β ' 0, 10 para os pioneiros [Figura 2.1.4 (a)], e a densidade de probabilidade condicional das taxas de crescimento normalizada, p(r|N ), p(r|H), e p(r|C) s ˜ao consistentes com a curva universal definida pela Equac¸ ˜ao 2.4
[Figura 2.1.4 (b)]. Essas distribuic¸ ˜oes foram obtidas, respectivamente, dos seguintes grupos de pa´ıses: 979 < ¯S < 2157 e 123 < ¯S < 424; 230, 508 < ¯H < 596, 327 e 26, 431 < ¯S < 79, 627; 1, 014 < ¯C < 2, 664 e 122 < ¯C < 390; 113 < ¯N < 328 e 15 < ¯N < 44.
Encerrando as investigac¸ ˜oes, analisou-se a distribuic¸ ˜ao das taxas de cresci-mento para as seguintes vari ´aveis: cursos por editores (C/S), pioneiros por editora (N/S), e horas por editores (H/S). A Figura 2.1.4 (c) mostra a distribuic¸ ˜ao das taxas de crescimento normalizadas de 140 pa´ıses no per´ıodo de 1959-2005, em comparac¸ ˜ao com a Equac¸ ˜ao 2.4.
Figura 2.1.4 – Din ˆamica de crescimento de outras atividades religiosas. (a) Desvio
padr ˜ao σ das taxas de crescimento em func¸ ˜ao das seguintes medidas de tamanho (X): horas H (quadrados), cursos C (c´ırculos), e pioneiros N (tri ˆangulos). As linhas s ´olidas s ˜ao ajustes lineares aos dados (na escala log − log). (b) Func¸ ˜ao densidade de probabilidade condicional p(r|S), p(r|H), p(r|C), e p(r|N ). A linha s ´olida ´e dada pela Equac¸ ˜ao 2.4. (c) Densidade de probabilidade p(r) das taxas de crescimento normalizadas r, calculadas para 140 pa´ıses, nas seguintes vari ´aveis: C/S (quadrados), N/S (tri ˆangulos), e H/S(c´ırculos). A linha s ´olida ´e dada pela Equac¸ ˜ao 2.4. Adaptada de Picoli e Mendes (2008).
Os resultados mostrados na Figura 2.1.4 sugerem que as mesmas leis gerais se aplicam a diferentes medidas de atividade religiosa.
2.2 Escalas urbanas conectadas com a Lei de Zipf
Com o objetivo de verificar e identificar relac¸ ˜oes de escala em indicadores urbanos Gomez-Lievano et al. (2012), constru´ıram uma ferramenta estat´ıstica que caracteriza a distribuic¸ ˜ao de probabilidade conjunta de indicadores urbanos dado o tamanho da populac¸ ˜ao atrav ´es de sistemas urbanos. Para isso, utilizaram dados sobre homic´ıdios em tr ˆes pa´ıses latino-americanos, Brasil (2003-2007), Col ˆombia (2004-2009) e M ´exico (2004-(2004-2009), nos quais as taxas nacionais variaram substancialmente. Obtiveram, usando a regra de Bayes juntamente com a probabilidade condicional do n ´umero de homic´ıdios por ano, dado o tamanho da populac¸ ˜ao de uma cidade. Em seguida, mostrou-se que as leis de escala emergem como valores de expectativa dessas estat´ısticas condicionais.
A Figura 2.2.1 mostra o total de homic´ıdios versus o tamanho da populac¸ ˜ao do ano 2007. As vari ´aveis Y e N , s ˜ao respectivamente, n ´umero de homic´ıdios e tamanho da populac¸ ˜ao. A linha s ´olida se encaixa na escala de homic´ıdios apenas para ´areas metropolitanas. Colômbia Homicídios População População México População Brasil
Figura 2.2.1 – N ´umero anual de homic´ıdios nas cidades da Col ˆombia, do M ´exico e do Brasil versus o tamanho da populac¸ ˜ao (2007). Grandes cidades s ˜ao
defi-nidas em termos de ´area metropolitanas que s ˜ao agregac¸ ˜oes de munic´ıpios (c´ırculos vermelhos), enquanto munic´ıpios n ˜ao metropolitanos s ˜ao apresen-tados separadamente (quadrados verdes). A linha azul ajusta apenas os dados de homic´ıdio para ´areas metropolitanas. Adaptada de Gomez-Lievano et al. (2012).
Grandes variac¸ ˜oes, especialmente entre as unidades populacionais menores, e o fato de que muitos munic´ıpios tem Y = 0 (n ˜ao mostrado) impedem uma an ´alise de escala direta. No entanto, ´e poss´ıvel analisar os dados consistentemente atrav ´es da estimativa de probabilidades condicionais, supondo que as vari ´aveis Y e N s ˜ao vari ´aveis estoc ´asticas e que seus valores em cada cidade espec´ıfica e tempo s ˜ao realizac¸ ˜oes estat´ısticas.
Bayes em que a func¸ ˜ao de distribuic¸ ˜ao da probabilidade condicional de Y , dada uma cidade de populac¸ ˜ao N , P (Y |N ),
P (Y |N ) = P (N |Y )P (Y )
P (N ) , (2.6)
para calcul ´a-lo, dado o conhecimento da distribuic¸ ˜ao de probabilidade P (Y ) de ho-mic´ıdios nas cidades, independentemente de sua populac¸ ˜ao e da distribuic¸ ˜ao de probabilidade condicional P (N |Y ) para o tamanho populacional de cidades com um dado n ´umero de homic´ıdios. O denominador ´e uma constante em Y e pode ser ex-presso como o trac¸o do numerador sobre todos os valores de Y . P (N ) ´e a func¸ ˜ao densidade de probabilidade de Zipf para tamanhos populacionais.
Para estimar a distribuic¸ ˜ao dos homic´ıdios totais nas cidades P (Y ) deve levar em conta o fato de que as propriedades urbanas mudam (super) extensivamente com a populac¸ ˜ao e que h ´a cidades com tamanhos muito diferentes. Devido a esses fatos gerais, as densidades de probabilidade da lei de pot ˆencia (distribuic¸ ˜oes Zipf ou Pareto), s ˜ao comuns entre as m ´etricas urbanas. Mais especificamente, essas distribuic¸ ˜oes explicam o fato de que um pequeno n ´umero de cidades ´e respons ´avel pela maioria dos homic´ıdios e que um grande n ´umero de cidades exibe apenas alguns. No M ´exico, por exemplo, aproximadamente 60% dos homic´ıdios v ˆem de 2% das cidades. N ´umeros semelhantes caracterizam a Col ˆombia e o Brasil nos anos estudados.
Para evitar o ru´ıdo da cauda para as grandes cidades adotou-se, na pr ´atica, um procedimento de analisar a func¸ ˜ao distribuic¸ ˜ao acumulada complementar ao inv ´es da func¸ ˜ao densidade de probabilidade.
A Figura 2.2.2 mostra as distribuic¸ ˜oes cumulativas emp´ıricas de homic´ıdios para o ano de 2007 na Col ˆombia, M ´exico e Brasil, as quais apresentam cauda pesada por v ´arias d ´ecadas e um corte efetivo menor para valores pequenos de Y . Com isso sup ˜oe-se o modelo
P (Y ) = (Y + κ) −τ
ς(τ, κ) , Y ∈ ℵ, (2.7)
onde τ > 0 ´e o expoente da lei de pot ˆencia e κ ´e um n ´umero real positivo, que permite P (Y )permanecer anal´ıtico com Y → 0, em que
ς(τ, κ) = Σ∞Y =0(Y + κ)−τ (2.8)
´e a func¸ ˜ao zeta generalizada ou zeta de Hurwitz, que garante a normalizac¸ ˜ao de P (Y ) como uma vari ´avel discreta.
As distribuic¸ ˜oes cumulativas normalizadas de homic´ıdios na Col ˆombia, M ´exico e Brasil s ˜ao bem descritas por distribuic¸ ˜oes lei de pot ˆencia, como pode ser observado na Figura 2.2.2. Para atenuar as flutuac¸ ˜oes da cauda e facilitar a interpretac¸ ˜ao visual n ˜ao analisou-se a func¸ ˜ao densidade, mas a distribuic¸ ˜ao cumulativa complementar. Os
melhores ajustes da forma P (Y ≥ y) = Cy−τ +1foram estimados usando o procedimento para a func¸ ˜ao densidade. Enquanto a distribuic¸ ˜ao de homic´ıdios totais ´e invariante por escala, este ´e o resultado de trac¸ar distribuic¸ ˜oes condicionais mais previs´ıveis para cada cidade sobre uma ampla distribuic¸ ˜ao de tamanhos de cidades.
Homicídios Colômbia Homicídios México Homicídios Brasil
Figura 2.2.2 – Distribuic¸ ˜oes normalizadas cumulativas de homic´ıdios na Col ˆombia, M ´exico e Brasil. A linha vermelha tracejada mostra os ajustes. Os erros
padr ˜ao s ˜ao mostrados entre par ˆenteses. A linha azul s ´olida mostra o valor m´ınimo de Y para o qual um ajuste de lei de pot ˆencia ´e v ´alido. Adaptada de Gomez-Lievano et al. (2012).
Para calcular P (N |Y ), fixou-se o valor de Y e estimou-se a distribuic¸ ˜ao de probabilidade sobre a populac¸ ˜ao. A Figura 2.2.3 mostra os histogramas das frequ ˆencias de homic´ıdios para Col ˆombia, M ´exico e Brasil, para uma faixa de Y . Esses n ´umeros d ˜ao uma impress ˜ao do tipo da distribuic¸ ˜ao de probabilidade que descreve os dados. Observa-se que todas as distribuic¸ ˜oes, em cada valor de Y , mostram um pico distinto com m ´edia e vari ˆancia definidas. A hip ´otese nula da distribuic¸ ˜ao de Poisson foi rejeitada com alta confianc¸a por um m ´etodo de m ´axima verossimilhanc¸a. Em vez disso, os dados se encaixam bem em termos de uma distribuic¸ ˜ao lognormal:
P (N |Y ) = 1 Np2πσ2 Y e −(lnN − µY) 2 2σ2 Y , (2.9)
Colômbia México Brasil
Figura 2.2.3 – Histogramas de frequ ˆencia normalizada do logaritmo da populac¸ ˜ao da cidade para um n ´umero vari ´avel de homic´ıdios observados Y . Uma
distribuic¸ ˜ao lognormal (note que o eixo x ´e expresso em termos de ln N ) ´e mostrada como uma linha vermelha s ´olida, com par ˆametros obtidos via estimativa m ´axima verossimilhanc¸a. Adaptada de Gomez-Lievano et al. (2012).
Segue-se que a m ´edia e a vari ˆancia s ˜ao dadas por: hN iY = eµY+σ 2 Y/2 (2.10) (∆NY)2 = (eσ 2 Y−1)e2µY+σ2Y. (2.11)
Os estimadores de m ´axima verossimilhanc¸a dos par ˆametros lognormal s ˜ao:
c µY = 1 nY Σi∈SY ln Ni (2.12) c σ2 Y = 1 nY Σi∈SY(ln Ni−µcY) 2 (2.13)
onde SY ´e o conjunto de cidades com Y homic´ıdios e nY o n ´umero de cidades em SY. Se a distribuic¸ ˜ao normal mant ´em em termos as vari ´aveis logar´ıtmicas da populac¸ ˜ao, dado diferentes valores de Y , pode-se colapsar os diferentes histogramas da Figura 2.2.3 padronizando as log-vari ´aveis. Isso ´e poss´ıvel calculando os estimadores de m ´axima verossimilhanc¸a da m ´edia e da vari ˆancia para cada valor de Y e, em
seguida, construindo no mesmo histograma a distribuic¸ ˜ao para v ´arios valores de Y . A Figura 2.2.4 mostra essas distribuic¸ ˜oes padronizadas. Esse procedimento tem suas limitac¸ ˜oes devido ao fato de que `a medida que aumentamos Y , o n ´umero de cidades decresce, at ´e que haja apenas uma cidade com dado Y e N e a estimativa estat´ıstica se torne imposs´ıvel. Por outro lado, tem a vantagem de que a forma da distribuic¸ ˜ao P (N |Y )para v ´arios valores de Y pode ser exibida em uma ´unica figura.
Colômbia México Brasil
Fr
equênc
ia
Figura 2.2.4 – Colapsos dos histogramas de P (N |Y ) atrav ´es de valores de Y em 2007. As func¸ ˜oes densidade de probabilidade lognormal para as tr ˆes nac¸ ˜oes
s ˜ao mostradas como linhas vermelhas s ´olidas. Adaptada de Gomez-Lievano et al. (2012).
Note que, as distribuic¸ ˜oes da lei de pot ˆencia que descreve o n ´umero total de homic´ıdios nos sistemas urbanos t ˆem, de fato, estat´ısticas mais previs´ıveis quando condicionadas ao tamanho populacional da cidade.
Agora, pode-se estimar os par ˆametros da Equac¸ ˜ao 2.9 usando as Equac¸ ˜oes 2.12 e 2.13, e plotando cσ2
Y eµcY inferindo sua depend ˆencia funcional de Y . O comportamento de σ2
Y mostrado na Figura 2.2.5 ´e est ´avel e sup ˆos-se cons-tante a partir daqui. As curvas mostradas na Figura 2.2.6 sugerem um crescimento logar´ıtmico de µcY em func¸ ˜ao de Y . A func¸ ˜ao logar´ıtmica mais geral que pode ser ajustada aµcY ´e:
c
µY = f (Y ) = b ln(Y + r) + lnA (2.14)
onde r ´e uma constante positiva que permite o logaritmo permanecer finito (e positivo) quando Y → 0 e A ´e um n ´umero positivo. Adiante, a constante b ser ´a identificada com o expoente de escala 1/β. Note que, cada pa´ıs tem uma variac¸ ˜ao caracter´ıstica de seus indicadores condicionados a outras quantidades urbanas. A esse respeito, ´e interessante notar as semelhanc¸as entre a Col ˆombia e o Brasil.
Colômbia México Brasil
Figura 2.2.5 – Estimativas de σ2
Y (via m ´axima verossimilhanc¸a) para diferentes
valo-res de Y ∈ {0, ..., 29}, para a Col ˆombia, M ´exico e Brasil. Uma curva
diferente foi constru´ıda para cada ano da an ´alise. Os pontos mostrados s ˜ao as m ´edias ao longo de v ´arios anos. As barras de erro representam intervalos de um desvio padr ˜ao em torno da m ´edia (n´ıvel de confianc¸a de 67%). As figuras n ˜ao mostram uma depend ˆencia sistem ´atica clara de Y em σY2. Adaptada de Gomez-Lievano et al. (2012).
Colômbia: México: Brasil:
Figura 2.2.6 – Estimativas de µY (via m ´axima verossimilhanc¸a) para diferentes
va-lores de Y ∈ {0, ..., 29}, para a Col ˆombia, M ´exico e Brasil. Uma curva
diferente foi constru´ıda para cada ano da an ´alise, e os pontos trac¸ados s ˜ao as m ´edias ao longo de v ´arios anos. As barras de erro representam um intervalo de um desvio padr ˜ao sobre a m ´edia. Adaptada de Gomez-Lievano et al. (2012).
Os gr ´aficos mostram uma depend ˆencia logar´ıtmica de Y , da qual uma relac¸ ˜ao de escala surge em termos de valores esperados. Os melhores ajustes foram obtidos usando um algoritmo de Levenberg-Marquardt, ponderando cada ponto por seu erro.
Usando a Equac¸ ˜ao 2.6, deriva-se a func¸ ˜ao de probabilidade condicional P (Y |N ). Se a Equac¸ ˜ao 2.9 ´e v ´alida para todos Y ≥ 0, usando a Equac¸ ˜ao 2.7, obt ´em-se:
P (Y |N ) ∝ (1/ eY )exp − 1 2σ2 Y (lnN − µY)2+ (1 − τ )ln eY , (2.15) onde eY ≡ Y + κ.
Usando a Equac¸ ˜ao 2.14 para substituir µY porµcY, obt ´em-se P (Y |N ) ∝ (1/ eY )exp − 1 2σ2 Y ((lnN − lnA(Y∗)b)2+ 2σY2(τ − 1)ln eY ) . (2.16)
Expandindo os termos ao quadrado, os logaritmos e agrupando alguns dos termos, essa equac¸ ˜ao se transforma em:
P (Y |N ) ∝ (1/ eY )exp[− 1 2σ2 0 (ln2Y∗− 2ln( (Y ∗)P e Y σ2 0(τ − 1) ) + P2)], (2.17) onde Y∗ = Y + r, P = 1 bln(N/A)e σ0 = (σY/b).
Lembrando que r em Y∗ = Y + r e κ em eY = Y + κ foram introduzidos para explicar o limite quando Y → 0. Essas constantes geram limites esperados e nos impedem de dividir por zero na distribuic¸ ˜ao da lei de pot ˆencia e de tomar o lo-garitmo de zero em µcY. N ˜ao h ´a restric¸ ˜oes que impec¸am de consider ´a-los iguais e pequenos, pois ambos introduzem uma escala caracter´ıstica que se manifesta como uma mudanc¸a de regime no comportamento de escala quando as cidades s ˜ao muito pequenas e as realizac¸ ˜oes de homic´ıdios nulos (ou outras medidas discretas) comec¸am a ocorrer. Portanto, n ˜ao ´e razo ´avel supor que eles s ˜ao os mesmos, assim Y∗ ≈ eY. Sob esta suposic¸ ˜ao, pode-se completar o quadrado e calcular a distribuic¸ ˜ao poste-rior. Percebendo que P (Y |N ) = P (Y∗|N ) porque ∆Y∗/∆Y = 1, e mantendo apenas termos dependentes de Y (os outros ser ˜ao finalmente absorvidos pela constante de normalizac¸ ˜ao), chega-se a
P (Y∗|N ) ∝ (1/Y∗)exp[− 1 2σ2 0 (lnY∗− (P − σ2 0(τ − 1))) 2], (2.18)
que ´e uma distribuic¸ ˜ao lognormal para Y∗ dado N , com par ˆametros µN = P − σ20(τ − 1) e σN = σ0. Expressando os par ˆametros de distribuic¸ ˜ao nas vari ´aveis originais e introduzindo a constante de normalizac¸ ˜ao adequada, obt ´em-se
P (Y∗|N ) = 1 Y∗p2πσ2 N e −(lnY ∗− µN )2 2σ2 N , (2.19) µN = 1 bln( N A) − σ 2 N(τ − 1) (2.20) σ2N = σY2/b2. (2.21)
As express ˜oes acima relacionam as estat´ısticas lognormal da distribuic¸ ˜ao condicional P (Y |N ) com a escala e a lei de Zipf para a distribuic¸ ˜ao do tamanho das cidades. Como mostra abaixo, isso leva a um relacionamento entre o escalonamento e os expoentes de Zipf.
Com essas distribuic¸ ˜oes condicionais ´e poss´ıvel calcular seus momentos, como a m ´edia e a vari ˆancia. Tomando a Equac¸ ˜ao 2.14 e a Equac¸ ˜ao 2.20 para derivar hN iY e hY iN explicitamente em termos de Y e N , isto ´e:
hY + riN = e(3/2−τ )σN2 Aβ ! Nβ (2.22) hN iY = Aeσ 2 Y/2(Y + r)1/β. (2.23)
Da mesma maneira, os desvios padr ˜ao ∆YN∗ = ΣNNβ e ∆NY podem ser expressos como
∆YN∗ = ΣNNβ (2.24)
∆NY = ΣY(Y + r)1/β, (2.25)
onde ΣN e ΣY s ˜ao coeficientes de proporcionalidade.
Pode-se mostrar como uma distribuic¸ ˜ao da lei de pot ˆencia emerge ao derivar a distribuic¸ ˜ao da probabilidade de N . Na Equac¸ ˜ao 2.6, P (N ) ´e chamado de “evid ˆencia”, e age na pr ´atica como uma constante de normalizac¸ ˜ao. Podendo ser calculado a partir do conhecimento do numerador
P (N ) = Σ∞Y∗=rP (N |Y∗)P (Y∗) (2.26)
∝ N−α, (2.27)
que ´e uma distribuic¸ ˜ao da lei de pot ˆencia. Segue-se ent ˜ao que os v ´arios expoentes s ˜ao obrigados a obedecer `a relac¸ ˜ao
β = α − 1
τ − 1. (2.28)
Se a escala superlinear (β > 1) se aplica a algum indicador urbano Y , pode-se prever que os tamanhos populacionais sejam distribu´ıdos pela lei de pot ˆencia com expoente α > τ , e vice-versa, se a escala for sublinear. Se α ≈ 2, significa que a escala superlinear τ < 2 e, portanto, a quantidade Y pode n ˜ao ter m ´edia e vari ˆancia definidas. Nestes casos, as refer ˆencias as “cidades m ´edias” n ˜ao t ˆem significado matem ´atico. Note, no entanto, que tamb ´em ´e poss´ıvel que α > τ > 2 desde que o expoente de Zipf
´e suficientemente maior que 2. Em geral, essas propriedades podem ser usadas para restringir o valor do expoente de Zipf a partir da observac¸ ˜ao das estat´ısticas de muitos indicadores urbanos diferentes e do conhecimento de suas propriedades m ´edias de escala.
2.3 Uma relac¸ ˜ao entre a escala urbana e func¸ ˜ao de produc¸ ˜ao
Essa sec¸ ˜ao apresenta uma investigac¸ ˜ao de Lobo et al. (2013) na qual a partir de relac¸ ˜oes de escala urbana de quantidades econ ˆomicas versus populac¸ ˜ao derivou-se um modelo de sa´ıda econ ˆomica na forma de uma func¸ ˜ao de produc¸ ˜ao do tipo Cobb-Douglas. A principal contribuic¸ ˜ao deste estudo foi abordar a quest ˜ao de como formas espec´ıficas de func¸ ˜oes de produc¸ ˜ao, comuns a todas as cidades, surgem como modelos eficazes de produc¸ ˜ao econ ˆomica como resultado da observac¸ ˜ao das relac¸ ˜oes de escala urbana e seus fundamentos te ´oricos.
Um resultado observado para as cidades ´e que a maioria de suas propriedades n ˜ao s ˜ao proporcionais ao tamanho da populac¸ ˜ao. Por exemplo, as cidades maiores ten-dem a exibir maiores produc¸ ˜oes per capita, desde crime a sal ´arios, e precisam de uma infraestrutura com menos material por pessoa, embora a utilizem mais intensamente. Essas propriedades, e sua detalhada express ˜ao quantitativa observada em termos de relac¸ ˜oes de escala, podem ser derivadas de uma teoria microsc ´opica que descreve as cidades como co-localizadas misturando redes sociais, sujeitas a certas restric¸ ˜oes gerais de efici ˆencia.
As relac¸ ˜oes de escala caracterizam-se como uma determinada quantidade de interesse, Y , dependendo de uma medida do tamanho de um sistema, N , de acordo com a relac¸ ˜ao
Y (N ) = Y0Nβ, (2.29)
onde Y0 ´e uma constante de normalizac¸ ˜ao e β o expoente de escala. A relev ˆancia desta relac¸ ˜ao lei de pot ˆencia torna-se clara quando considera-se uma mudanc¸a de escala arbitr ´aria por um fator λ de N para λN . Isso induz uma mudanc¸a em Y de Y (N ) para Y (λN )que pode ser expressa como
Y (λN ) = Z(λ, N )Y (N ). (2.30)
Se o fator de escala Z depende apenas de λ, isto ´e, Z(λN ) = Z(λ), a Equac¸ ˜ao 2.30 pode ser resolvida de forma ´unica fornecendo o resultado invariante de escala da Equac¸ ˜ao 2.29, com Z(λ) = λβ. Invari ˆancia de escala implica que a relac¸ ˜ao Y (λN )/Y (N ) ´e parametrizada por um ´unico n ´umero adimensional, β. A relac¸ ˜ao Y (λN )/Y (N ) ´e independente do tamanho do sistema particular N , mas depende da relac¸ ˜ao entre os tamanhos, λ; tais sistemas s ˜ao frequentemente referidos como autossimilares.
A Equac¸ ˜ao 2.29 assemelha-se com uma func¸ ˜ao de produc¸ ˜ao, sendo Y a produc¸ ˜ao econ ˆomica total e N o tamanho da populac¸ ˜ao urbana ou grupos de trabalho. Em uma base per capita, essa mesma equac¸ ˜ao implica y ≡ Y /N = Y0Nβ−1, que pode ser interpretada, por exemplo, como uma equac¸ ˜ao para a sa´ıda por pessoa, em func¸ ˜ao do n ´umero m ´aximo de pessoas compartilhando ideias entre si.
As relac¸ ˜oes de escala e func¸ ˜oes de produc¸ ˜ao podem expressar expectativas m ´edias para sa´ıdas (econ ˆomicas) em termos de conjuntos de entradas. Por ´em, a interpretac¸ ˜ao estat´ıstica correta das leis de escala s ˜ao valores de expectativa para a quantidade Y , condicionada ao tamanho da populac¸ ˜ao de uma cidade; essa ´e a m ´edia associada `a densidade de probabilidade P (Y |N ).
As flutuac¸ ˜oes estat´ısticas em torno da lei de escala m ´edia, com os valores dos par ˆametros de escala, podem ser determinadas aplicando ln na Equac¸ ˜ao 2.29.
ln Yi = ln Y0+ β ln Ni+ ξi, (2.31) com ´areas urbanas indexadas por i. Aqui, as flutuac¸ ˜oes est ˜ao representando desvios locais (espec´ıficos de uma cidade) da escala em forma de vari ´avel. Tendo como exemplo uma m ´etrica urbana que exibe um comportamento de escala, considere o total de sal ´arios, definido como a soma total de sal ´arios e vencimentos auferidos pelos residentes em uma ´area urbana. A estimativa de m´ınimos quadrados ordin ´arios da Equac¸ ˜ao 2.31 - corrigindo para heterocedasticidade, usando dados sobre sal ´arios totais (T W ) e populac¸ ˜ao para as 943 ´areas urbanas dos Estados Unidos durante o per´ıodo de 2009-2011 fornece o seguinte resultado:
ln(T Wi) = 1, 404 + 1, 146 ln(P opi), R2 = 0, 97, (2.32) com p-valores virtualmente zero. A Figura 2.3.1 mostra o gr ´afico de dispers ˜ao dos dados e a linha de regress ˜ao ajustada; o gr ´afico da Figura 2.3.2 mostra que eles s ˜ao independentes de escala. Assim, um aumento de 1% na populac¸ ˜ao est ´a associado, em m ´edia, a um aumento de 1,15% na produc¸ ˜ao, independentemente do tamanho da cidade, em geral de acordo com as expectativas te ´oricas para β ∼ 7/6. Esses retornos de escala semelhantes e crescentes estabelecem quantitativamente as vantagens econ ˆomicas das grandes cidades.
A Equac¸ ˜ao 2.32 indica a produtividade m ´edia de uma cidade com tamanho N. Os desvios m ´edio desse comportamento det ˆem as caracter´ısticas de cada ´area urbana individual n ˜ao esclarecidas pelos efeitos gerais de aglomerac¸ ˜ao do tamanho da populac¸ ˜ao. Estes desvios podem ser quantificados escrevendo a equac¸ ˜ao residual em 2.31 como ξi = ln Yi Y (Ni) = ln Yi Y0Niβ (2.33) onde Yi ´e o valor observado de sa´ıda para cada ´area metropolitana e ξ ´e um indicador metropolitano ajustado `a escala (SAMI). Como os SAMIs podem ser constru´ıdos para quaisquer caracter´ısticas vari ´aveis de captura da vida urbana que est ˜ao sujeitas a efeitos de aglomerac¸ ˜ao em escala, pode-se escrever qualquer indicador urbano estoc ´astico, como
Yi = Y0Niβe ξY
Agora pode-se derivar a func¸ ˜ao de produc¸ ˜ao econ ˆomica das cidades a partir de suas propriedades probabil´ısticas de escala.
Figura 2.3.1 – Gr ´afico de dispers ˜ao dos dados e linha de regress ˜ao ajustada. Escala
do total de sal ´arios usando dados para todas as 943 ´areas urbanas dos Estados Unidos (suavizadas no per´ıodo de 2009-2011) mostrando escala superlinear. Adaptada de Lobo et al. (2013).
Figura 2.3.2 – Res´ıduos da regress ˜ao de ln (total de sal ´arios) em ln (populac¸ ˜ao). Na
regress ˜ao foi usados dados para todas as 943 ´areas urbanas dos Estados Unidos (suavizadas no per´ıodo de 2009-2011). Adaptada de Lobo et al. (2013).
Prosseguindo-se com uma relac¸ ˜ao cont ´abil onde em algum momento, t,
Yi(t) = Wi(t) + Ri(t) (2.35)
sendo Y , o valor pecuni ´ario da sa´ıda total gerada na i- ´esima ´area metropolitana, W a renda total do trabalho e R a renda total de capital. As ac¸ ˜oes do fator de produc¸ ˜ao s ˜ao definidas como: 1 − α = Wi(t) Yi(t) , α = Ri(t) Yi(t) . (2.36)
Em geral, α = αi(t, Ni) ´e espec´ıfica da cidade e de uma func¸ ˜ao de tempo e tamanho da populac¸ ˜ao N . Diferenciando a Equac¸ ˜ao 2.35 em relac¸ ˜ao ao tempo (ou em relac¸ ˜ao a N) e dividindo por sa´ıda, Y , obt ´em-se
1 Yi(t) dYi(t) dt = 1 Yi(t) dWi(t) dt + 1 Yi(t) dRi(t) dt = [1 − α(t)] Wi(t) dWi(t) dt + α(t) Ri(t) dRi(t) dt . (2.37) Integrando 2.37, tem-se lnYi(t) = Z (1 − α)dlnWi(t) + Z αdlnRi(t). (2.38)
Integrando por partes, obt ´em-se o seguinte resultado: lnYi(t) = (1 − α)lnWi(t) + αlnRi(t) + Z ln Wi(t) Ri(t) dα. (2.39)
A ´ultima integral pode ser escrita como Z
ln 1 − α α
dα = ln[c(1 − α)α−1α−α], (2.40)
onde c ´e uma constante de integrac¸ ˜ao, de modo que,
Yi(t) = c(1 − α)α−1α−αWi(t)1−αRi(t)α. (2.41) Note que a Equac¸ ˜ao 2.41 ´e uma instanciac¸ ˜ao de uma relac¸ ˜ao mais geral, que pode ser derivado algebricamente e que para o fator livre ser independente dos fatores de produc¸ ˜ao α deve ser uma constante. Essa derivac¸ ˜ao destaca que Y, W e R s ˜ao func¸ ˜oes do tempo.
Restringindo a soluc¸ ˜ao na Equac¸ ˜ao 2.39 para ser consistente com a Equac¸ ˜ao original 2.35 determina c = 1. Essa soluc¸ ˜ao ´e geral na medida em que n ˜ao exige, por exemplo, que o fator compartilhado, α, seja constante no tempo ou no tamanho da populac¸ ˜ao. Assim, a derivac¸ ˜ao de uma func¸ ˜ao de produc¸ ˜ao do tipo Cobb-Douglas segue diretamente das definic¸ ˜oes 2.35 e 2.36 e n ˜ao possui significado econ ˆomico mais espec´ıfico al ´em do contido nessas relac¸ ˜oes. De fato, a func¸ ˜ao de produc¸ ˜ao Cobb-Douglas ´e basicamente uma identidade trivial que decorre de um simples argumento
dimensional, j ´a que Y, W e R devem ter as mesmas dimens ˜oes, e supondo que Y ´e unicamente por W e R, deve ser express ´avel como a Equac¸ ˜ao 2.41, com expoentes somando a unidade. No entanto, esse formalismo assume uma utilidade potencialmente maior quando α ´e uma constante independente do tempo e do tamanho da populac¸ ˜ao; isto ´e, quando
∂α
∂N |t= 0, ∂α
∂N |N= 0. (2.42)
A Equac¸ ˜ao 2.39, sob a suposic¸ ˜ao de α constante, pode ser relacionada `a func¸ ˜ao de produc¸ ˜ao Cobb-Douglas, que ´e um modelo amplamente utilizado para economias nacionais e urbanas. Isto requer a introduc¸ ˜ao dos fatores de convers ˜ao relativos a sal ´arios, Wi(t), `a m ˜ao-de-obra, Li(t), e renda do capital, Ri(t), `a entrada do capital, Ki(t): wi(t) = Wi(t) Li(t) , ri(t) = Ri(t) Ki(t) , (2.43)
w ´e o sal ´ario m ´edio e r ´e o prec¸o m ´edio de locac¸ ˜ao do capital. Assim, pode-se escrever, Y como
Yi(t, N ) = C(α)Wi(t, N )1−αRi(t, N )α = Ai(t, N )Li(t, N )1−αKi(t, N )α, (2.44) com C(α) ≡ (1 − α)−(1−α)α−α. O pr ´e-fator A(t, N ) ´e frequentemente referido como a produtividade total de fatores (PTF) da ´area urbana e ´e medida preferida da pro-dutividade econ ˆomica. Uma maior ou menor PTF multiplica os mesmos fatores de entrada de m ˜ao-de-obra e capital para produzir maior ou menor produc¸ ˜ao econ ˆomica, respectivamente. A partir da Equac¸ ˜ao 2.44, obt ´em-se a seguinte express ˜ao para a PTF urbana em func¸ ˜ao da produtividade do trabalho e capital:
Ai(t, Ni) = C(α) Wi(t, Ni) Li(t, Ni) 1−α R i(t, Ni) Ki(t, Ni) α = C(α)wi(t, Ni)1−αri(t, Ni)α. (2.45) Em seguida, mostra-se como a exist ˆencia de relac¸ ˜oes de escala determina a forma de A, resultando em sua parametrizac¸ ˜ao sistem ´atica como uma func¸ ˜ao expl´ıcita do tamanho da populac¸ ˜ao, Ni, e desvios locais, ξi.
At ´e aqui, explorou-se as consequ ˆencias de uma relac¸ ˜ao cont ´abil, Equac¸ ˜ao 2.35, e a definic¸ ˜ao de ac¸ ˜oes fatoriais, Equac¸ ˜ao 2.36, juntamente com as leis de conservac¸ ˜ao expressas na Equac¸ ˜ao 2.42, para obter uma func¸ ˜ao do tipo Cobb-Douglas comum para todas as cidades. Mostra-se agora, que a const ˆancia de α ´e uma consequ ˆencia das relac¸ ˜oes de escala urbana e a din ˆamica microsc ´opica subjacente, e usa-se essas relac¸ ˜oes para obter uma nova express ˜ao para Ai(t, Ni). Note que, com
Wi(t, Ni) = W0eξ w i (t)Nβw i (t), Ri(t, Ni) = R0eξ R i(t)NBR i (t), (2.46) segue que α = R0(t) Y0(t) eξRi(t)−ξiY(t)NβR−βY i (t) = 1 − W0(t) Y0(t) eξiW(t)−ξiY(t)NβW−βY i (t). (2.47)
Assim, para α independente de N ´e equivalente a exigir que ambos os sal ´arios e rendas tenham o mesmo expoente escalar, de modo que βW = βR. Consequentemente, a observac¸ ˜ao da escala urbana superlinear socioecon ˆomica universal e seus fundamen-tos te ´oricos implicam a conservac¸ ˜ao de α versus N e Cobb-Douglas para a produc¸ ˜ao econ ˆomica das cidades versus o tamanho da populac¸ ˜ao.
A const ˆancia de α no tempo requer que os pr ´e-fatores W0 e R0 compartilhem a mesma depend ˆencia de tempo, e que as diferenc¸as entre os SAMIs para os sal ´arios totais espec´ıficos e renda total de capital, e o SAMI para a produc¸ ˜ao total tamb ´em seja independente do tempo. O primeiro refere-se ao crescimento econ ˆomico (nacional) do sistema urbano e, como tal, espera-se que variem lentamente no tempo. O ´ultimo muda lentamente no tempo, mas a an ´alise de suas estat´ısticas revela que sua vari ˆancia (lembrando que os SAMIs t ˆem m ´edia zero) ´e aproximadamente independente do tempo, como tal, pode-se esperar que a m ´edia de α sobre os SAMIs tamb ´em ´e aproximadamente independente do tempo.
Assumindo a const ˆancia de α a partir dos argumentos anteriores, agora deriva-se uma express ˜ao expl´ıcita para a PTF das cidades. Em primeiro lugar, nota-deriva-se que tanto o numerador quanto o denominador nas express ˜oes sal ´ario por trabalhador e renda m ´edia de capital exibem comportamento de escala para que a produtividade marginal dos dois fatores de produc¸ ˜ao possa ser reformulada usando seus SAMIs associados como: wi(t) = Wi(t, Ni) Li(t, Ni) = W0e ξW i (t)Ni(t)βW L0eξ L i(t)Ni(t)βL = W0 L0 eξiW(t)−ξiL(t)N i(t)βW−βL, (2.48) ri(t) = Ri(t, Ni) Ki(t, Ni) = R0e ξR i (t)N i(t)βR K0eξ K i (t)Ni(t)βK = R0 K0 eξiR(t)−ξ K i (t)N i(t)βR−βK. (2.49) O termo para PTF assume, ent ˜ao, a forma geral:
Ai(t) = A0(t)eξ A i NβA i (t), (2.50) com A0(t) = C(α) W0(t) L0(t) 1−α R 0(t) K0(t) α , (2.51) ξiA= (1 − α)(ξiW − ξiL) + α(ξiR− ξiK), (2.52) βA= (1 − α)(βW − βL) + α(βR− βK). (2.53) As Equac¸ ˜oes 2.50 e 2.53 explicitam como a PTF urbana depende do tamanho da populac¸ ˜ao, atrav ´es dos expoentes de escala, quanto de flutuac¸ ˜oes locais indepen-dentes da escala por meio das SAMIs. A Equac¸ ˜ao 2.50 difere de uma formulac¸ ˜ao
padr ˜ao da PTF na qual os efeitos de aumento de produtividade da populac¸ ˜ao s ˜ao explicitamente controlados e os efeitos neutros da populac¸ ˜ao explicitamente represen-tados pela Equac¸ ˜ao 2.52. Como consequ ˆencia, qualquer propriedade urbana adicional proposta para explicar uma maior ou menor produtividade de cidades espec´ıficas n ˜ao vinculadas ao seu tamanho deve ser expressa em termos de sua contribuic¸ ˜ao para os SAMIs para W, L, R e K.
Avaliar A requer conhecimento de como K, o estoque de capital metropolitano, escala com tamanho urbano. Dados os valores observados para os coeficientes de escala para sal ´arios totais e trabalho, βW ≈ 1.15 e βL≈ 1, e com (1 − α)≈0.7 o primeiro termo `a direita do sinal de igualdade na Equac¸ ˜ao 2.52 tem um valor de 0.11 sobre o valor do termo α(βR− βK). Sob a suposic¸ ˜ao de que o aluguel de capital, r, ´e constante, ou quase, em todas as ´areas metropolitanas, e dado que R = r × K, ou equivalente, R0NβK = rK0NβK. Para r ser constante, deve-se ter βR = βK. Portanto, βA ≈ 0.11 implica que a produtividade urbana, medida pela PTF, aumenta cerca de 11% em cada duplicac¸ ˜ao da populac¸ ˜ao.
2.4 Fatores que d ˜ao origem as relac¸ ˜oes de escala dos fatores urbanos relacio-nados ao tamanho da populac¸ ˜ao
Na presente sec¸ ˜ao ser ´a contemplado resultados obtidos por Bettencourt (2013) em um estudo que busca os fatores que originam as relac¸ ˜oes de escala dos fen ˆomenos urbanos sobre o tamanho da populac¸ ˜ao. Segundo Bettencourt (2013) as grandes dificuldades de uma abordagem cient´ıfica para as cidades s ˜ao resultados de suas v ´arias caracter´ısticas interdependentes, como social, econ ˆomico, infraestrutural, e sistemas complexos espaciais que existem em formas semelhantes, no entanto mudando sobre um conjunto de escalas. Nesse sentido essa investigac¸ ˜ao teve como objetivo mostrar como todas as cidades podem evoluir de acordo com um pequeno conjunto de princ´ıpios b ´asicos que operam localmente.
Ao longo de 40 anos, v ´arias pesquisas emp´ıricas alegam que n ˜ao h ´a nenhum tamanho especial para as cidades, de modo que a maioria das propriedades urbanas, Y , variam continuamente com o tamanho da populac¸ ˜ao e s ˜ao descritas matematicamente em termos de relac¸ ˜oes de escala Y = Y0Nβ, onde Y0 e β s ˜ao constantes em N (populac¸ ˜ao). As cidades de tamanhos diferentes n ˜ao possuem as mesmas propriedades. Especificamente, observa-se geralmente que as taxas de quantidades sociais (tais como sal ´arios ou novas invenc¸ ˜oes) aumentam per capita com o tamanho da cidade (escala superlinear, β = 1 + δ > 1, com δ ' 0.15), enquanto o volume ocupado pela infraestrutura urbana per capita (estradas, cabos, etc.) diminui (escala sublinear, β = 1 − δ < 1). Assim, esses dados resumem as expectativas familiares de que cidades
maiores al ´em de ter um custo mais elevado e congestionamentos, s ˜ao tamb ´em mais criativas quando comparadas a cidades pequenas.
Os resultados emp´ıricos sugeriram, tamb ´em, que, apesar da aparente com-plexidade, as cidades podem ser simples: as propriedades globais m ´edias podem ser determinadas por apenas alguns par ˆametros-chave. No entanto, a origem dessas relac¸ ˜oes de escala observadas e uma explicac¸ ˜ao para as interdepend ˆencias entre as facetas espaciais, infra-estruturais e sociais da cidade permaneceram desconhecidas.
Para uma compreens ˜ao te ´orica de como as cidades operam e como essas interdepend ˆencias surgem, o autor desenvolve uma estrutura unificada e quantitativa. Considerando primeiro o modelo mais simples de uma cidade delimitada pela ´area A e populac¸ ˜ao N , escreve-se as interac¸ ˜oes entre pessoas i, j em termos de uma rede social Fkij, e assume-se que as interac¸ ˜oes sociais (amizade, emprego, conhecimento, etc.) s ˜ao locais, ocorrendo em uma ´area de interac¸ ˜ao a0, e tem forc¸a gk, onde k descreve tipos de links sociais. O par ˆametro, gk, pode ser positivo (atraente, expressando um benef´ıcio social, por exemplo, relac¸ ˜oes econ ˆomicas mutuamente ben ´eficas) ou negativo (repulsivo, expressando um custo social, por exemplo, crime). Todos estes processos compartilham a mesma din ˆamica subjacente m ´edia dos encontros sociais no espac¸o e tempo, no contexto da cidade e suas redes de infra-estrutura.
O n ´umero m ´edio de interac¸ ˜oes locais por pessoa ´e dado pelo produto do alcanc¸ado por seu movimento, a0l, multiplicado pela densidade populacional n = N/A, onde l ´e o comprimento t´ıpico percorrido por pessoas, bens e informac¸ ˜oes. A produc¸ ˜ao social m ´edia total de uma cidade pode ser obtida multiplicando-se o n ´umero total de interac¸ ˜oes pelo resultado m ´edio por interac¸ ˜ao, ¯g, levando a Y = GN
2
A , com par ˆametro G ≡ ¯ga0lmedindo o produto da m ´edia da ´area de tempos de sa´ıda social, ambos per capita (Figura 2.4.1). Cada sa´ıda sociecon ˆomica, Y , tem unidades f´ısicas definidas por gk, por ´em ´e ´util pensar em todas as quantidades expressas em termos de energia por unidade de tempo (pot ˆencia).
Al ´em disso, outra propriedade fundamental das cidades ´e que elas est ˜ao mistu-rando populac¸ ˜oes, ou seja, mesmo que as pessoas na cidade exploram locais diferentes em momentos diferenciados, qualquer pessoa pode, em princ´ıpio, ser alcanc¸ada por outra pessoa. Este conceito, ´e a base das definic¸ ˜oes de cidades funcionais como ´areas metropolitanas. Na pr ´atica, isso significa que o custo por pessoa de uma populac¸ ˜ao mista ´e proporcional `a dimens ˜ao transversal (di ˆametro), L, da cidade L ∼ A1/2. Assim, a pot ˆencia de gastos em processos de transporte para manter a cidade misturada
´e dada por, T = εLN = εA1/2N, onde ε ´e uma forc¸a por unidade de tempo. Este custo deve ser coberto pelo orc¸amento de cada indiv´ıduo, y = Y /N , requerendo y ' T /N, o que implica A(N ) = aNα com α = 2/3 e α = (G/ε)α. A ´area da linha de
base, a, aumenta com interac¸ ˜oes mais produtivas, por exemplo, devido ao crescimento econ ˆomico, os custos no transporte ´e diminu´ıdo, como pode-se observar nos padr ˜oes mundiais de expans ˜ao urbana ao longo do tempo. Assim, obt ´em-se Y = Y0Nβ, em que β = 2 − α = 1 + 1/3 > 1 e Y0 = G1−αεα. Este modelo simples leva a ´area, A, variando sublinearmente com N (α = 2/3 < 1), e os resultados socioecon ˆomicos, Y , variando superlinearmente (β = 4/3 > 1). No entanto, isso superestima β porque, `a medida que as cidades crescem, o espac¸o ´e ocupado e o transporte de pessoas, bens e informac¸ ˜oes ´e canalizado para as redes. O espac¸o criado por essas redes fornece a medida correta das interac¸ ˜oes sociais que podem ocorrer nas cidades.
No entanto, o autor prop ˆos um modelo mais realista generalizando essas ideias em quatro premissas:
1) Juntar populac¸ ˜ao. A cidade se desenvolve para que os cidad ˜aos possam explor ´a-la com recursos `a sua disposic¸ ˜ao. Formaliza-se este princ´ıpio como uma condic¸ ˜ao de entrada, exigindo que os recursos m´ınimos acess´ıveis a cada indiv´ıduo, Ymin/N ∼ GN/A, correspondam ao custo de chegar a qualquer ponto da cidade. Como as trajet ´orias de viagem n ˜ao precisam ser lineares, generaliza-se a geometria atrav ´es de uma dimens ˜ao fractal, H, de modo que a dist ˆancia percorrida ∝ AH/D. Combinando densidade de interac¸ ˜ao aos custos, obt ´em-se uma relac¸ ˜ao de escala de
´area generalizada, A(N ) = aNα, com a como antes e α = 2
2 + H [α = D
D + H em dimens ˜oes D]. H = 1 permite que os indiv´ıduos explorem totalmente a cidade dentro da menor dist ˆancia percorrida, o que implica a escala N como um volume f´ısico.
2) Crescimento incremental de rede. Esta suposic¸ ˜ao exige que as redes de infra-estrutura se desenvolvam gradualmente para conectar as pessoas `a medida que elas se unem, levando a redes descentralizadas. Especificamente, a escala da Figura 13 2.4.1 (A) ´e obtida quando a dist ˆancia m ´edia entre os indiv´ıduos d = n−1/2= (A/N )1/2 ´e igual ao comprimento m ´edio da rede de infra-estrutura per capita, de modo que a ´area total da rede, An(N ) ∼ N d = A1/2N1/2. Juntamente com primeira premissa, isso implica que An∼ a1/2N1−δ com δ = 1/6 [An ∼ A1/2N(D−1)/D = a1/DN1−δ, com δ =
H D(D + H) em D dimens ˜oes].
3) O esforc¸o humano ´e limitado, o que requer que G seja, em m ´edia, indepen-dente de N , isto ´e, dG/dN = 0 (Figura 2.4.1 (B), inserc¸ ˜ao). As cidades em crescimento exigem de seus habitantes um esforc¸o maior tanto mental como f´ısico e, isso tem sido uma preocupac¸ ˜ao generalizada para os cientistas sociais. Assim, essa premissa ´e necess ´aria para levantar uma importante objec¸ ˜ao a qualquer conceituac¸ ˜ao de cidades como sistemas invariantes de escala.
4) Os resultados socioecon ˆomicos s ˜ao proporcionais `as interac¸ ˜oes sociais locais, de modo que Y = GN2/A
apenas concentrac¸ ˜oes de pessoas mas de interac¸ ˜oes sociais. Este ponto foi enfatizado por Jacobs (1969) mas, tem sido dif´ıcil quantificar. A previs ˜ao de que a escala de interac¸ ˜oes sociais com β = 1 + δ ' 7/6, foi observada recentemente em redes de telecomunicac¸ ˜oes urbanas por Schl ¨apfer (2013). Juntos, esses pressupostos preveem expoentes de escala para uma ampla variedade de indicadores urbanos, desde de padr ˜oes de comportamento humano e propriedades da infraestrutura at ´e o valor da terra.
A Figura 2.4.1 (A) mostra milhas de pista total (volume) de estradas nas ´areas metropolitanas dos Estados Unidos em 2006. Os dados para as 415 ´areas urbanas foram obtidos do Escrit ´orio de Informac¸ ˜oes sobre Pol´ıticas Rodovi ´arias da Administrac¸ ˜ao Federal de Rodovias. O melhor ajuste para uma relac¸ ˜ao de escala Y (N ) = Y0Nβ, obteve β = 0, 849 ± 0, 038 (intervalo de confianc¸a de 95%, R2 = 0, 65); a previs ˜ao te ´orica, β = 5/6 e a escala linear β = 1. Na Figura 2.4.1 (B) ´e mostrado o produto metropolitano das ´areas metropolitanas dos Estados Unidos em 2006. Os dados para as 363 ´areas metropolitanas foram obtidos pelo Departamento de An ´alise Econ ˆomica. O melhor ajuste aos dados obteve, β = 1, 126±0, 023 (intervalo de confianc¸a de 95%, R2 = 0, 96); a previs ˜ao te ´orica, β = 7/6 e escala proporcional, β = 1.
Log população Log população
Log população Log P roduto Int er no Bru to [Esa tdos Unidos -Dolár es]
Log milhas tota
is de estr adas das ár eas metr opolitanas dos E stados Unidos
Figura 2.4.1 – Escala da infra-estrutura urbana e produc¸ ˜ao socioecon ˆomica - (A) Os
pontos azuis representam milhas de pista total (volume) de estradas nas ´areas metropolitanas dos Estados Unidos. As linhas mostram o melhor ajuste para uma relac¸ ˜ao de escala (vermelho); a previs ˜ao te ´orica (amarelo); e a escala linear (preto). (B) Os pontos verdes representam o produto metro-politano das ´areas metropolitanas dos Estados Unidos. As linhas descrevem o melhor ajuste (vermelho) aos dados; a previs ˜ao te ´orica (amarelo); e escala proporcional, (preto). Adaptada de Bettencourt (2013).
Os dois par ˆametros de melhor ajuste em cada relac¸ ˜ao de escala foram estima-dos por meio da minimizac¸ ˜ao de m´ınimos quadraestima-dos ordin ´arios para a relac¸ ˜ao linear entre as vari ´aveis transformadas logaritmicamente. A inserc¸ ˜ao mostra a estimativa de G para as 313 ´areas metropolitanas dos Estados Unidos e a lei de conservac¸ ˜ao
d ln G
d ln N = 0 (R
2 = 0, 003). G ´e medido como o produto do produto interno bruto e do volume da estrada, ambos per capita. Como previsto, os valores observados de G para diferentes cidades se agrupam em torno de seu valor mais prov ´avel, que fornece uma
´otima estimativa para G∗ e s ˜ao limitados pelo Gmax' 8G∗.
2.5 Conex ˜ao entre distribuic¸ ˜ao Lei de Pot ˆencia e Alometrias para indicadores urbanos
Essa sec¸ ˜ao apresenta a exist ˆencia de conex ˜oes entre distribuic¸ ˜oes leis de pot ˆencia e alometrias encontradas nas investigac¸ ˜oes de Alves et al. (2014). Sistemas urbanos possuem v ´arias propriedades, entre as quais duas s ˜ao not ´aveis e onipre-sentes: o surgimento de distribuic¸ ˜oes assint ´oticas da lei de pot ˆencia e de alometrias para uma ampla gama de vari ´aveis que de alguma forma caracterizam os sistemas urbanos (indicadores urbanos ou m ´etricas). Por um lado a populac¸ ˜ao [MARSILI et al. (1998); BATTY (2008)], tamanhos de edif´ıcios [BATTY (2008)], fortunas pessoais [NEWMAN (2005)], tamanhos de empresa [AXTELL (2001)], e outros indicadores fo-ram encontrados para seguir sinteticamente as distribuic¸ ˜oes da lei de pot ˆencia. Por outro lado, as alometrias com o tamanho da populac¸ ˜ao foram relatadas para o crime [BETTENCOURT et al. (2010); ALVES et al. (2013)], suic´ıdio [MELO et al. (2014)], v ´arias m ´etricas urbanas, incluindo patentes, postos de gasolina, produto interno bruto [BETTENCOURT et al. (2007); ARBESMAN (2009); BETTENCOURT (2010)], entre ou-tros. Estas alometrias foram modeladas por Bettencourt (2013) atrav ´es de um pequeno conjunto de princ´ıpios simples e baseados localmente, como visto na sec¸ ˜ao 2.4. No entanto, a conex ˜ao entre essas duas caracter´ısticas foi elucidada por Gomez-Lievano et al. (2012). Neste trabalho descrito na sec¸ ˜ao 2.2, os autores mostraram, para a relac¸ ˜ao entre homic´ıdios e populac¸ ˜ao, que quando ambos os indicadores urbanos s ˜ao assin-toticamente distribu´ıdos como leis de pot ˆencias, tamb ´em podem exibir uma relac¸ ˜ao alom ´etrica espec´ıfica. Particularmente, o expoente da alometria pode ser totalmente determinado a partir dos expoentes das distribuic¸ ˜oes da lei de pot ˆencia. Diante disto, Alves et al. (2014) estenderam empiricamente os resultados atrav ´es de uma ampla caracterizac¸ ˜ao de todas as poss´ıveis relac¸ ˜oes entre pares a partir de 12 indicadores urbanos de cidades brasileiras.
Para essa an ´alise foram usados dados de cidades brasileiras, dispon´ıveis no s´ıtio do Sistema ´Unico de Sa ´ude - DATASUS no ano de 2000, selecionando 2862 cidades (cerca de 51% das cidades) para as quais todos os valores dos indicadores urbanos estavam dispon´ıveis. A base de dados ´e composta por doze indicadores urbanos Yi ao n´ıvel da cidade. S ˜ao eles: populac¸ ˜ao total (i = 0), n ´umero de casos de trabalho infantil (i = 1), populac¸ ˜ao com mais de 60 anos (i = 2), populac¸ ˜ao feminina
(i = 3), produto interno bruto - PIB (i = 4), PIB per capita (i = 5), n ´umero de homic´ıdios (i = 6), n ´umero de analfabetos com mais de 15 anos (i = 7), renda familiar m ´edia (i = 8), populac¸ ˜ao masculina (i = 9), n ´umero de instalac¸ ˜oes sanit ´arias (i = 10) e n ´umero de desempregados com mais de 16 anos (i = 11). Considerando que cidades s ˜ao as menores unidades administrativas com um governo local.
Iniciou-se as investigac¸ ˜oes por construir os gr ´aficos das distribuic¸ ˜oes acumu-ladas para os 12 indicadores urbanos, como por ser visto na Figura 2.5.1. Pode-se observar um comportamento aproximadamente linear da dispers ˜ao dos dados em log-log o que permite supor que as formas das distribuic¸ ˜oes podem ser aproximadas por leis de pot ˆencias assint ´otica [Pi(Yi) ∝ Yi−αi], das distribuic¸ ˜oes para grandes valores de indicadores urbanos. Com o objetivo de tornar esse resultado mais robusto, empregou-se o procedimento estat´ıstico proposto por Clauempregou-set et al. (2009), que ´e uma maneira sistem ´atica de testar estatisticamente as distribuic¸ ˜oes emp´ıricas lei de pot ˆencia. Devido `a natureza discreta da maioria desses indicadores urbanos, considerou-se a vers ˜ao discreta do procedimento, aplicando-se o ajuste de m ´axima verossimilhanc¸a
Pi(Yi) =
Y−αi
i ζ(αi, Yi,min)
, (2.54)
onde ζ(αi, Yi,min) = Σ∞n=0(Yi,min+ n)−αi ´e a func¸ ˜ao zeta de Hurwitz, para normalizando Pi(Yi)quando Yi ´e discreto. Yi,min ´e um par ˆametro que representa o in´ıcio do regime de lei de pot ˆencia, e αi ´e o expoente da lei de pot ˆencia. Depois de encontrar os par ˆametros de melhor ajuste, avaliou-se a adequac¸ ˜ao do ajuste por meio do teste de Cr ´amer-von Mises.
Os valores de αi e Yi,min, bem como o p-valor do teste de Cr ´amer-von Mises, tamb ´em s ˜ao mostrados na Figura 2.5.1. N ˜ao se pode rejeitar a hip ´otese da lei de pot ˆencia em um n´ıvel de confianc¸a de 99% para quase todos indicadores, exceto o n ´umero de homic´ıdios, para os quais p-valor ´e 0,002.
População p-valor=0.45 Trabalho Infantil p-valor=0.69 População Idosa p-valor=0.17 População Feminina p-valor=0.48 PIB p-valor=0.24
PIB Per Capita
p-valor=0.06 Homicídios p-valor=0.002 Analfabetismo p-valor=0.45 Renda p-valor=0.03 População Masculina p-valor=0.46 Saneamento p-valor=0.39 Desemprego p-valor=0.10 Distribuição Cum ulativa Métrica Urbana
Figura 2.5.1 – Distribuic¸ ˜oes cumulativas de 12 indicadores urbanos das cidades bra-sileiras no ano 2000. Adaptada de Alves et al. (2014).
As distribuic¸ ˜oes exibem decaimentos da lei de pot ˆencia assint ´otica que s ˜ao bem descritas pela func¸ ˜ao lei de pot ˆencia Pi(Yi) ∼ Y
−αi
i para Yi ≥ Yi,min.
Os autores tamb ´em verificaram se as distribuic¸ ˜oes da lei de pot ˆencia para indicadores urbanos implicam em relac¸ ˜oes alom ´etricas entre pares de indicadores. Os seguintes desenvolvimentos anal´ıticos s ˜ao apenas uma revis ˜ao dos resultados presentes no artigo de Gomez-Lievano et al. (2012). Eles propuseram que, se a forma da alometria estiver bem estabelecida, pode-se escrever
Pi(Yi) = Σ∞Yj=Yj∗Pi,j(Yi|Yj)Pj(Yj), (2.55)
onde Pi(Yi) ´e a distribuic¸ ˜ao de probabilidade do indicador urbano Yi e Pi,j(Yi|Yj) ´e a probabilidade condicional representando as flutuac¸ ˜oes em torno da alometria en-tre os indicadores Yi e Yj. J ´a se sabe que Pi(Yi) tem a forma da lei de pot ˆencia da Equac¸ ˜ao 2.54 e ap ´os os resultados emp´ıricos, assume-se que a probabilidade
condicional ´e uma distribuic¸ ˜ao lognormal Pi,j(Yi|Yj) = 1 Yi q 2πσ2 i,j(Yj) exp −[ln Yi− µi,j(Yj)] 2 2σ2 i,j(Yj) , (2.56)
em que µi,j(Yj)e σi,j2 (Yj)representam poss´ıveis depend ˆencias dos par ˆametros lognor-mal no indicador Yj. Em particular, porque tamb ´em est ´a se assumindo que existe uma alometria entre Yi e Yj (isto ´e, Yi ∝ Y
βi,j
j ), a forma funcional de µi,j(Yj) ´e µi,j(Yj) = ln[Ai,jY
βi,j
j ], (2.57)
se considerar o desvio padr ˜ao n ˜ao dependente de Yj (isto ´e, σ2i,j(Yj) = σi,j2 ).
Com essas considerac¸ ˜oes e substituindo o somat ´orio na Equac¸ ˜ao 2.55 por uma integral e considerando Yj∗ suficientemente pequeno. Ap ´os alguns c ´alculos obt ´em-se
Pi(Yi) ∝ Y
−(αj− 1) βi,j
−1
i . (2.58)
Lembrando que Pi(Yi) ∼ Yi−αi, obt ´em a relac¸ ˜ao entre o expoente alom ´etrico (Bi,j)e os expoentes da lei de pot ˆencia (αi e αj) como
βi,j =
αj− 1 αi − 1
. (2.59)
Nas investigac¸ ˜oes de Gomez-Lievano et al. (2012) indicadores urbanos apre-sentam distribuic¸ ˜oes lei de pot ˆencia e podem exibir relac¸ ˜oes alom ´etricas com expoentes espec´ıficos. Para testar empiricamente este resultado, investigou-se todas as poss´ıveis alometrias entre pares de indicadores urbanos da base de dados, considerando o logaritmo dos indicadores urbanos e ajustando (via m ´etodo dos m´ınimos quadrados ordin ´arios) a func¸ ˜ao linear
log10Yi = Ai,j + β (f )
i,j log10Yj (2.60)
para todos os indicadores. Aqui, Ai,j = log10Ai,j ´e uma constante emp´ırica e β (f ) i,j ´e o valor emp´ırico do expoente alom ´etrico (obtido ap ´os o ajuste da alometria). O procedi-mento ´e mostrado na Figura 2.5.2 para homic´ıdio versus populac¸ ˜ao, trabalho infantil versus populac¸ ˜ao e homic´ıdio versus trabalho infantil. Para encontrar os valores de βi,j(f ), aplicou-se um ponto de corte no eixo das abscissas considerando apenas os valores de Yj que s ˜ao maiores que Yj,min (o in´ıcio da lei de pot ˆencia na distribuic¸ ˜ao de Yj). Os pontos azuis na Figura 2.5.2 s ˜ao os pontos que obedecem a essa condic¸ ˜ao e as linhas tracejadas representam as func¸ ˜oes lineares ajustadas aos dados. Repete-se este procedimento para todas as poss´ıveis alometrias e a Figura 2.5.3 mostra um gr ´afico da matriz com todos os valores de βi,j(f ). Caracterizou-se, ainda, a qualidade dessas
alometrias calculando o coeficiente de correlac¸ ˜ao de Pearson ρi,j, para as relac¸ ˜oes alom ´etricas linearizadas (isto ´e, log10Yi versus log10Yj), que ´e mostrado na Figura 2.5.3 atrav ´es do c ´odigo de cores. Observe que a maioria das relac¸ ˜oes apresentam valores ρi,j maiores que 0.5 (≈ 70%). No entanto, tamb ´em observa-se duas excec¸ ˜oes sis-tem ´aticas: alometrias com indicadores urbanos PIB per capita e renda. O motivo desse comportamento desviante est ´a relacionado ao fato de que esses dois indicadores s ˜ao definidos per capita e por fam´ılia. Este resultado tamb ´em sugere que a principal fonte de correlac¸ ˜ao entre os dois indicadores Yi e Yj (i 6= j 6= 0) vem de suas relac¸ ˜oes com o tamanho da populac¸ ˜ao Y0.
População Homicídios População Trabalho in fantil Trabalho infantil Homicídios
Figura 2.5.2 – Exemplos de alometrias entre indicadores urbanos: (a) homic´ıdios
ver-sus populac¸ ˜ao, (b) trabalho infantil verver-sus populac¸ ˜ao e (c) homic´ıdios verver-sus trabalho infantil. Os marcadores s ˜ao logaritmos de base 10 dos valores dos indicadores urbanos Yi versus Yj para cada cidade. Os pontos azuis
representam aquelas cidades que possuem Yj ≥ Yj,mine quadrados cinza
s ˜ao aquelas para as quais Yj < Yj,min. As linhas tracejadas s ˜ao ajustes
lineares ordin ´arios para os pontos que obedecem `a condic¸ ˜ao Yj ≥ Yj,mine
a inclinac¸ ˜ao de cada reta ´e igual ao expoente alom ´etrico β(f )i,j . Adaptada de Alves et al. (2014).