• Nenhum resultado encontrado

O impacto de valores ignorados nas estimativas empregando Respondent

Driven Sampling (RDS): um exemplo de aplicação do RDSat®.

1 Meta: este estudo tem por meta alertar os usuários do RDS Analysis Tool (RDSAT)

versão 5.68, que a presença de respostas ou resultados ignorados em variáveis observadas em uma amostra coletada via rede de recrutamento influencia nas estimativas dos parâmetros populacionais.

2 Proposta: usando dados simulados em uma rede social real, este estudo propõe mostrar

como um pequeno número de resultados ignorados (missing) em uma variável observada em amostras RDS pode influenciar na contagem do número de recrutamentos utilizados pelo RDSAT e nas estimativas pontuais. Também, mediante duas propostas de imputação única e não condicionada dos valores ignorados avalia as mudanças das estimativas pontuais.

8 O estimador de Salganik e Heckathorn, 2004 encontra-se implementado no software RDsat® v.6.0 na opção “estimativa de multiplicidade”

3 Procedimentos: este estudo descritivo-analítico foi desenvolvido simulando uma variável

dicotômica com e sem respostas ignoradas nas redes de recrutamento da cidade do Rio de Janeiro-RJ, do estudo multicêntrico para vigilância epidemiológica e comportamental em populações de HSH com 18 anos ou mais, realizado no Brasil no ano de 2009.

4 Medições:

A variável dicotômica representou o resultado da infecção por HIV em um teste rápido oferecido durante a pesquisa. Os possíveis resultados são - não infectado por HIV (A), infectado por HIV (B) e estado de infecção ignorado (missing) quando o participante não realiza o teste.

O desfecho de interesse é o grupo de infectados de infectados por HIV (B).

A matriz de recrutamento e as estimativas da proporção de infectados resultante das redes de recrutamento com e sem presença de respostas ignoradas foram realizadas através da simulação das redes:

Rede 01 - todos os participantes aceitam realizar o teste, 37 foram diagnosticados HIV positivo (B) e 320 HIV negativo (A). A distribuição de infectados/não infectados foi realizada aleatoriamente.

A opção de ter 37 (≈11%) HIV positivos foi porque se encontra próximo de uma média da estimativa de HIV positivo do Brasil entre os HSH e usado no cálculo do tamanho da amostra do estudo.

Rede 02 - a partir da Rede 1 e excluindo as sementes, foi aleatoriamente omitida a informação (missing) de 12 infectados e seis não infectados.

A opção de ter o dobro de infectados com dados não avaliados foi com a intenção de imitar o que na prática é mais provável ocorrer em testes de diagnósticos para o HIV (SALANI MOTA et al., 2011).

A opção de eliminar as sementes da simulação foi porque a metodologia de análise RDS sugere a sua eliminação.

Para a posterior imputação única não condicionada dos missing, foram consideradas duas situações de infecção pelo HIV das observações ignoradas:

Rede 03 - a partir da Rede 02, os participantes com status de infecção não avaliado foram todos considerados negativos.

Rede 04 - a partir da Rede 02, os participantes com status de infecção não avaliado foram todos considerados positivos.

5 Análise:

Foi examinada a reciprocidade dos laços da rede social do Rio de Janeiro e descreveram-se os graus autorrelatados.

Na amostra com estado de infecção ignorada, o porquê e como a rede de recrutamento perde laços de recrutamento entre e dentro dos grupos dos estados de infecção foi mostrado no gráfico das redes de recrutamentos.

Cada uma das amostras geradas pelas simulações e imputações foi avaliada em relação ao nível de homofilia e a composição da amostra na distribuição de equilíbrio. A distribuição de equilíbrio é entendida como a estabilidade da proporção das características populacionais mesmo que o recrutamento continue por mais ondas (HECKATHORN, 1997, 2002) e tornam-se independentes das características das sementes com que começou o recrutamento e, assim, supera qualquer viés que a escolha não aleatória de sementes pode introduzir (detalhes no Anexo G). A homofilia é entendida como a probabilidade dos entrevistados terem preferência em recrutar dentro do seu próprio grupo ao em vez de aleatoriamente (HECKATHORN, 1997, 2002; WEJNERT, 2009) (detalhes no Anexo G).

A avaliação das estimativas ponderadas obtidas pelas amostras com estado de infecção ignorado (Rede 02) e para os quais foram imputados valores de infecção negativos (Rede 03) e positivos (Rede 04) foi realizada, comparando-se com a estimativa ponderada obtida na amostra com os estado de infecção sem avaliação ignorada (Rede 01). A avaliação foi realizada de forma descrita e mediante os desvios entre as estimativas.

As estimativas ponderadas da proporção de infectados (não infectados) foram calculadas usando o estimador proposto por Salganik e Heckathorn (2004) (detalhes no Anexo G), baseado em uma amostragem com reposição e no modelo de reciprocidade, pressupondo que a probabilidades de recrutamento é proporcional ao grau. Com tais suposições, Salganik e Heckathorn (2004) mostram que a estimativa da proporção de uma característica populacional do grupo X (

P

X ) igual a

P

X

=

=

é uma estimativa assintoticamente

não tendenciosa de PX.

onde

SXY = probabilidade estimada de membros do grupo X recrutar aleatoriamente

um membro do grupo Y

= é a estimativa do grau médio autorrelatado dos respondentes do

grupo X

nX = total de participantes do grupo X ,

= grau autorrelatado pelo participante i

Os gráficos das redes de recrutamento foram elaborados pelo software

NetDraw 2.3.1. (um software de acesso livre distribuído no site:

http://www.analytictech.com/downloadnd.htm). A matriz de recrutamento e outras medidas necessárias para a avaliação das estimativas populacionais foram calculadas pelo software

Respondent Driven Sampling Analysis Tool (RDSat®) versão 5.6, com a opção de 15.000

reamostragens e intervalo de confianças com um coeficiente de confiança igual a 95% (alfa =0,025).

O tamanho da população de HSH, por município, foi calculada considerando que a população de HSH no Brasil corresponde a 3,2% (Barbosa Júnior, Szwarcwald et al., 2009) da população de homens com 18 a 64 anos em 20099.

9 Estimativas populacionais para 2009 ajustadas por 2007. http://www2.datasus.gov.br/DATASUS/index.php?area=0206.

TEMA 02 - A confiabilidade e o desempenho do autorrelato de Status de HIV entre