• Nenhum resultado encontrado

4 ANÁLISE EMPÍRICA DOS IMPACTOS DOS PARQUES TECNOLÓGICOS NO SISTEMA LOCAL DE INOVAÇÃO

4.4 ANÁLISE FATORIAL

4.4.1 Uma aproximação para sistemas locais de inovação

A estratégia empírica utilizada aqui tem como referência dois exercícios anteriores: Fagerberg e Srholec (2008) e Cirillo e outros (2019). Ambos estudos analisam sistemas nacionais de inovação e exploraram elementos que os potencializam, visando sugestões de políticas. Fagerberg e Srholec (2008) aplicaram uma análise de fatores (factor analysis), enquanto Cirillo e outros (2019) aplicaram uma análise fatorial (factorial analysis). A diferença é sutil. Ambas estratégias utilizam da mesma fundamentação estatística, o que as difere é que a primeira é baseada em um modelo pré-concebido, enquanto a segunda é uma análise exploratória (PAGÈS, 2014, p. 1). Exemplificando, Fagerberg e Srholec (2008) identificam a que grupos pertencem cada uma das variáveis: sistema de inovação, governança, sistema político e abertura. Já Cirillo e outros (2019), identificam esses grupos – no caso sua atenção é dada ao sistema de inovação – nos componentes obtidos pela análise multivariada.

Nessa etapa, o objetivo de tal aplicação é a criação de uma variável sintética que corresponda ao sistema local de inovação dos municípios analisados. Para tanto, o caminho escolhido é semelhante ao de Cirillo e outros (2019), aplicando uma análise de componente principal (principal component). Essa estratégia é usualmente utilizada para diminuir a quantidade de variáveis a serem analisadas em uma predição, evitando problemas de autocorrelação e de perda de graus de liberdade 151. Wehrens (2011, p. 44) destaca que isso é feito às custas de trocar algumas variáveis que carreguem a maior parte da informação por um componente que carrega a informação adicionada pela maior parte das variáveis. Esse custo é, na verdade, o objetivo dessa seção. Assim, a análise de componente principal evidenciará a variável latente, presente na matriz de correlações das variáveis discutidas. Como a construção das variáveis analisadas foi pensada na forma de elementos que compõem um sistema de inovação, espera-se que, entre os componentes principais, esteja o componente que representa o sistema de inovação.

Bartholomew (2008, p. 122) lembra que o componente principal (ys) é a combinação

linear das variáveis (xs) de uma matriz de interesse (X). Nesse sentido, são feitas rotações

ortogonais dos elementos, identificando diferentes pesos, ou coeficientes na transformação (ass), tal que:

151 Pelo agrupamento das variáveis mais correlacionadas em um componente e pela preservação do número de observações, respectivamente.

𝒚𝟏= 𝒂𝟏𝟏𝒙𝟏+ 𝒂𝟏𝟐𝒙𝟐+ ⋯ + 𝒂𝟏𝒔𝒙𝒔

𝒚𝟐= 𝒂𝟐𝟏𝒙𝟏+ 𝒂𝟐𝟐𝒙𝟐+ ⋯ + 𝒂𝟐𝒔𝒙𝒔

⋮ (𝟑) 𝒚𝒔 = 𝒂𝒔𝟏𝒙𝟏+ 𝒂𝒔𝟐𝒙𝟐+ ⋯ + 𝒂𝒔𝒔𝒙𝒔

Ou, de forma matricial:

𝒚 = 𝑨𝒙 (4)

Em que y e x são vetores com dimensões s x 1, e A é uma matriz de dimensões s x s. Assim, para que a rotação seja ortogonal, os coeficientes da matriz de rotação A devem respeitar algumas condições (BARTHOLOMEW, 2008, p. 123):

∑𝒔𝒊 = 𝟏𝒂𝒊𝒋𝟐 = 𝟏 (𝒋 = 𝟏, 𝟐, … , 𝒔), (5)

e

∑𝒔𝒊 = 𝟏𝒂𝒊𝒋𝒂𝒊𝒌= 𝟎 (𝒋 ≠ 𝒌, 𝒋 = 𝟏, … , 𝒔; 𝒌 = 𝟏, … , 𝒔). (6)

Uma importante consequência dessas restrições é que a variância total de y será igual a variância total de x (BARTHOLOMEW, 2008, p. 123), tal que:

∑𝒔𝒊=𝟏𝒗𝒂𝒓(𝒚𝒊)= ∑𝒔𝒊 = 𝟏 𝒗𝒂𝒓(𝒙𝒊). (7)

A análise do componente principal passa pela busca do componente yi que maximize a

variância de X, sujeito as duas restrições impostas pela condição de ortogonalidade. Uma outra forma de compreender a abordagem é imaginar uma matriz como um espaço de n dimensões e o processo de rotação dessa matriz possibilita alterar o ponto de vista que se olha para esse espaço, possibilitando identificar elementos que não estavam visíveis anteriormente. Outra analogia pode ser feita imaginando o mapa mundial tradicional, centrado na Europa, e compará-lo com outras versões, centradas em outras regiões e países. O mapa permanece com o mesmo número de dimensões e ainda representa o globo terrestre, mas os padrões visuais são outros.

Como lembra Bartholomew (2008), o problema de maximização corresponde ao problema já conhecido de determinação de autovalores e autovetores em álgebra matricial. Os autovalores (normalmente representados pela grega λs) são acompanhados de autovetores à

esquerda, e à direita. Em complemento, Pagès (2014) explica que linhas e colunas de uma matriz são dois aspectos da mesma realidade que, neste caso, podem ser visualizadas de diferentes pontos de vista, representados pelos autovalores em que a sua obtenção é facilitada por diversos algoritmos já padronizados, simplificando sua obtenção (BARTHOLOMEW, 2008). Aqui, foi utilizada a aplicação de Lê e outros (2008) preparada para o software estatístico R. Como explicam os autores, a interpretação dos resultados discutida por eles é fundamentada pela “transition formulae”, ou fórmula de transição que separa um vetor de coordenadas para as linhas, fs(i), e um vetor de coordenadas para as colunas, gs(k). Esses dois

vetores são relacionados da seguinte forma:

𝒇𝒔(𝒊) = 𝟏

√𝝀𝒔∑ 𝒙𝒌 𝒊𝒌𝒎𝒌𝒈𝒔(𝒌) (8) 𝒈𝒔(𝒌) =

𝟏

√𝝀𝒔∑ 𝒙𝒌 𝒊𝒌𝒑𝒊𝒇𝒔(𝒊) (9)

Em que, além dos autovalores, λs, também constam os elementos xik da matriz X, os

pesos das k variáveis, mk, e os pesos dos i indivíduos, pi152. Essa fórmula de transição permite

a identificação de duas nuvens, de indivíduos e de variáveis. Uma vez que a inércia total (variância) é igual nas duas nuvens, o interesse se dá na análise de como ela é distribuída dentro de cada uma das nuvens. Nesse sentido, a interpretação do componente principal, como uma proxy para o sistema de inovação local, será baseada na interpretação da nuvem de variáveis, enquanto a nuvem de indivíduos corresponderá à variável sintética de cada município, a proxy dos sistemas de inovações.

Para tanto, o procedimento adotado consiste em utilizar cada uma das três bases identificadas na seção anterior para calcular os componentes principais de cada ano, entre 2003 e 2016. Assim, serão tabelados os autovetores correspondentes aos primeiros componentes identificados, pois a capacidade explicativa da variância total de cada componente cai rapidamente. A rigor – dada a composição das variáveis, o interesse da

152 Note que na notação anterior, tanto indivíduos, quanto variáveis tinham a mesma quantidade s de elementos. Wehrens (2011), apontam que, como a metodologia visa diminuir a quantidade de variáveis, a dimensão da matriz A, será o mínimo entre o número de indivíduos e de variáveis.

pesquisa e a dificuldade de se trabalhar com tantas variáveis – será dada atenção exclusiva ao componente principal, a proxy para o sistema local de inovação.

Uma observação adicional, diz respeito ao número de variáveis. Sobre o tamanho das amostras, uma vez que as informações não serão calculadas em painel, elas estão restritas a quantidade de municípios de cada base – não passa de 85, na Base 1 (a maior entre elas) e de 32, na Base 3 (a menor entre elas). Já as variáveis consideradas, somam pouco mais de duzentas (212). Husson e outros (2010) fazem uma observação a respeito e recomendam diagonalizar o produto escalar da matriz, ao invés de utilizar a matriz de correlação, tradicionalmente utilizada, caso a matriz contenha um número muito maior de variáveis. Contudo, essa sugestão é feita para casos em que a relação seja de dezenas de indivíduos para milhares de variáveis. Assim, não foi feito ajuste adicional. A respeito do número de componentes calculados, Wehrens (2011) lembra que ele será o mínimo entre o número de indivíduos e de variáveis. Dessa forma, nessa análise, o número de componentes será sempre correspondente ao número de municípios na base utilizada. Apesar disso, o foco da análise será restrito ao primeiro componente.