DENILSON MORAIS VAGNER AYRES LARA ESTUDO SOBRE ALEITAMENTO MATERNO ATÉ OS 60 PRIMEIROS DIAS DE VIDA: UMA APLICAÇÃO DA REGRESSÃO LOGÍSTICA

(1)

DENILSON MORAIS

VAGNER AYRES LARA

ESTUDO SOBRE ALEITAMENTO MATERNO ATÉ OS 60

PRIMEIROS DIAS DE VIDA: UMA APLICAÇÃO DA

REGRESSÃO LOGÍSTICA

Trabalho de Conclusão de Curso apresentado à disciplina de Laboratório II do Curso de Estatística, Setor de Ciências Exatas, Universidade Federal do Paraná.

Orientadora: Profa. Dra. Nívea da Silva Matuda

CURITIBA

2009

(2)

SUMÁRIO

RESUMO

1. INTRODUÇÃO

2. OBJETIVO

3. METODOLOGIA

3.1 Descrição do conjunto de dados 3.1.1 Amostra

3.1.2 Corte Transversal aos 60 dias de vida da criança 3.1.3 Descrição das variáveis

3.2 Análise Estatística

3.3 Modelo de Regressão Logística Dicotômica 3.3.1 Definição

3.3.2 Estimação dos parâmetros 3.3.3 Método de seleção das variáveis 3.3.4 Qualidade do modelo ajustado

4. RESULTADOS E DISCUSSÃO

4.1 Análise Descritiva e Exploratória 4.2 Regressão Logística

4.2.1 Seleção das Variáveis 4.2.2 Ajuste do Modelo Final

4.2.3 Adequação do Modelo Ajustado 4.2.4 Interpretação dos Parâmetros 4.2.5 Métodos auxiliares

(3)

6. REFERÊNCIAS

7. Anexos

(4)

RESUMO

Morais, Denílson; Lara, Vagner A. Estudo sobre aleitamento materno até os

60 primeiros dias de vida : uma aplicação da Regressão logística. Curitiba, 2009

Trabalho de Conclusão do Curso de Bacharel em Estatística, Setor de Ciências exatas, Universidade Federal do Paraná.

Os efeitos nocivos do desmame precoce representa, além de um capítulo a parte

dentro da prática médica, uma importante fonte de preocupação nas unidades básicas de

saúde públicas do Brasil. A Organização Mundial de Saúde (OMS) recomenda o

aleitamento materno exclusivo até os 6 meses de vida (IBFAN 2001; WHO 2001), pois de acordo com estudos o organismo do bebê ainda não se encontra preparado para outro

tipo de alimentação antes deste período. O objetivo deste trabalho é dentro dos fatores

analisados verificar quais podem levar ao término do aleitamento materno até o

sexagésimo dia de vida da criança. Para tanto, foi utilizado um banco de dados do

Departamento de Epidemiologia da Faculdade de Saúde Pública da Universidade de São

Paulo resultante de um estudo de coorte prospectiva entre os anos de 1998 e 1999 no

Hospital Universitário abrangendo 450 crianças. Para a análise das informações

utilizou-se o software R e foi aplicado o modelo de regressão logística para ajustar os

dados das crianças considerando como resposta o período de tempoem dias da criança

quando a mãe introduziu outro tipo de leite.

(5)

1. INTRODUÇÃO

Vários estudos apontam o leite materno como o melhor tipo de alimentação a ser

dada pelo menos durante os seis primeiros meses aos recém-nascidos devido as suas

propriedades nutricionais, imunológicas e também psicológicas, já que fortalece os

laços afetivos entre a mãe e o seu filho, fazendo com que o bebê se sinta mais seguro e

amado (Newman, 1995). Com relação aos aspectos imunológicos, sabe-se que o leite

humano é uma substância de grande complexidade biológica, protegendo o bebê contra

infecções e alergias bem como estimula o desenvolvimento adequado do sistema

imunológico da criança, além de possuir inúmeros componentes antiinflamatórios

(AKRÉ,1994).

A organização mundial de saúde (OMS) recomenda o aleitamento materno

exclusivo nos seis primeiros meses de vida da criança, a partir de quando já é possível a

introdução de outros tipos de alimentos para o bebê. (WHO, 2001).

O leite materno é livre de impurezas, fresco, disponível na temperatura ideal e é facilmente digerido pela criança. Ele começa a ser produzido nas primeiras 72 horas após o parto e é chamado de colostro, rico em nutrientes necessários para a criança nesta fase e considerado a primeira vacina da criança, pois contem anticorpos maternos que irão ajudá-las a não contrair algumas doenças. Além disso, ele é rico em substâncias que auxiliarão no crescimento do bebê, estimularão o desenvolvimento do seu intestino, preparando-o para digerir e absorver o leite maduro. Por leite maduro subentende-se o leite produzido pelas mamas após o colostro. Dentre as categorias de aleitamento materno definidas pela OMS (1991), citam-se:

Aleitamento Materno Exclusivo (AME): quando a criança recebe apenas leite materno de sua mãe ou ama-de-leite, ou leite materno ordenhado, sem receber nenhum outro tipo de alimento líquido ou sólido com exceção para vitaminas e medicamentos.

(6)

Aleitamento Materno (AM): quando a criança recebe leite materno diretamente do seio ou ordenhado. Entende-se que na definição de aleitamento materno a criança pode ou não estar recebendo qualquer tipo de alimento ou líquido , incluindo leite não materno. Aleitamento Materno Não- Exclusivo (AMNE): quando além do leite materno a criança recebe também qualquer outro tipo de alimento líquido, semi-sólido ou sólido.

Sem Aleitamento Materno (SAM): Quando a criança recebe qualquer tipo de leite, exceto leite materno, independente de estar recebendo alimentos sólidos ou semi-sólidos.

Entende-se por início de desmame, a introdução de qualquer tipo de alimento na dieta de uma criança que, até então, encontrava-se em regime de Aleitamento Materno Exclusivo (AME). Se este fato ocorrer antes dos 6 primeiros meses de vida, é chamado de “desmame precoce”. Assim podemos definir como “período de desmame” aquele compreendido entre a introdução deste novo aleitamento até a completa supressão do aleitamento materno (PALMA, 1998).

Neste estudo, o evento de interesse é o desmame completo até a idade de 60 dias com a supressão completa do leite materno.

Os dados analisados neste trabalho são secundários, obtidos de uma pesquisa da USP (BUENO, 2003) que acompanhou 450 mães e seus filhos desde o parto até o fim do primeiro ano de vida. Para esta análise foi aplicado o Modelo de Regressão Logística para verificar a relação da ocorrência do desmame (sim ou não) com diversos fatores considerados na pesquisa da USP, por um estudo transversal aos 60 dias de vida.

(7)

2. OBJETIVO

Identificar possíveis fatores de risco ou de proteção para “desmame” até os 60

dias de vida, utilizando o modelo de Regressão Logística em um estudo transversal de

(8)

3. METODOLOGIA

3.1 – DESCRIÇAO DO CONJUNTO DE DADOS

A base de dados refere-se a uma pesquisa realizada pela Faculdade de Saúde

Pública da USP e corresponde a uma coorte de mães e de seus filhos recém-nascidos

constituída, entre 1998 e 1999, no Hospital Universitário da Universidade de São

Paulo com o objetivo de descrever a prática do aleitamento materno e identificar fatores associados com a duração do aleitamento materno e aleitamento materno exclusivo.

3.1.1 – AMOSTRA:

Foram incluídas crianças nascidas sem problemas na gestação e no parto, de

mães residentes na área de abrangência do hospital ou funcionárias / alunas da

universidade, que concordaram participar da pesquisa. Não foram incluídas crianças

nascidas com má formação congênita, gêmeas, crianças ou mães que necessitassem

de internação hospitalar por um período superior a cinco dias ou com morte

materna.

Das 609 mães que iniciaram a pesquisa, apenas 506 foram aceitas, tendo como motivo da retirada do estudo, mães que não moravam na área de abrangência da pesquisa e mães que não foram encontradas pelos entrevistadores quando da primeira visita domiciliar.

No período de um ano, foram realizadas oito entrevistas com a mãe, sendo a primeira no hospital e as demais no domicílio da mãe programada para os seguintes períodos: de 15, 30, 60, 90, 180, 270 e 360 dias de vida da criança. (BUENO, 2003). Dados maternos, da condição da gestação e parto, de características da criança ao nascer e de características familiares foram obtidas mediante consulta ao prontuário médico da mãe no dia do parto e diretamente com a mãe ainda no

(9)

hospital. Outras informações, como condição socioeconômica, posse de bens, foram colhidas pelas entrevistadoras na primeira visita domiciliar.

Por tratar-se de um processo dinâmico, ocorreram 123 desistências e perdas, sendo o principal motivo a mudança de endereço. O resultado apresentado foi feito com 450 crianças, compreendendo as 383 que finalizaram o estudo depois de decorrido um ano e as 67 que foram perdidas durante o seguimento, mas que devolveram ao menos o primeiro questionário de freqüência alimentar, com o registro dos primeiros 60 dias de vida. (BUENO 2003)

3.1.2 – CORTE TRANSVERSAL AOS 60 DIAS DE VIDA DA CRIANÇA:

Com o intuito de identificar possíveis fatores de risco ou de proteção para “desmame” até os 60 dias de vida, foram realizados alguns ajustes no conjunto dos dados originais, entre eles:

- A variável resposta amamentação (V1) foi dicotomizada

- Considerou-se apenas a informação do primeiro sintoma/doença ocorrida por criança e categorizada apenas para as duas doenças de maior ocorrência, sendo as demais incluídas em uma única categoria além da informação das crianças que não adoeceram no período deste estudo.

- Criou-se uma nova variável (V3) mostrando o número de sintomas ocorridos com cada criança dentro do período deste estudo.

- A variável duração em dias da primeira doença (V4) teve os seus dados zerados para as crianças que tiveram os sintomas após os 60 dias de vida.

- As variáveis: introdução de outro tipo de leite (V9), escolaridade (V16) e bens foram dicotomizadas.

(10)

3.1.3 – DESCRIÇÃO DAS VARIÁVEIS

Variável dependente (resposta):

Variável Categoria

VY Amamentação – idade (em dias) da criança no desmame completo

0 = Acima de 60 dias 1 = Até 60 dias

Variáveis Independentes (covariáveis)

Variável Categorias

V1 Tipo doprimeiro sintoma/doença ocorrido entre os 60 primeiros dias de vida

0 = Sem ocorrência de doença 1 = Dor de barriga / Cólica 2 = Nariz escorrendo / Resfriado 3 = Outras Doenças

*

V2 Número de sintomas/doença

ocorridos entre os primeiros 60 dias de vida

Discreta

V3 Duração(em dias) da primeira doença ocorridas entre os primeiros 60 dias de vida

Contínua

V4 Hábito de beber da mãe antes da gestação

0 = Não bebia 1 = Bebia V5 Comprimento (em cm) da criança

ao nascer

Contínua V6 Hábito de fumar da mãe antes da

gestação

0 = Não 1 = Sim

V7 Idade da mãe 0 = Menos de 25 anos

1 = 25 anos ou mais V8 Idade da criança quando a mãe

introduziu o leite não materno

0 = Maior de 60 dias

1 = Menor ou igual a 60 dias

V9 _{Condição marital da mãe}

_**

0 = Casada

1 = Não casada

V10 Presença do pai 0 = Sim

1 = Não

V11 Tipo de parto 0 = Normal

1 = Fórceps 2 = Cesárea

V12 Peso ao nascer (em gramas) Contínua

V13 Cor da criança 0 = Branca

1 = Não-Branca

V14 Sexo da criança 0 = Masculino

(11)

V15 Escolaridade da mãe 0 = Médio ou superior 1 = Fundamental

V16 Posse de bens

*******

0 = Nenhum dos bens

1 = Pelo menos um dos bens

V17 Vínculo dos pais com a USP 0 = Sim

1 = não

*

Outras doenças incluem:

Chiado no V1 / Diarréia / Dor de Ouvido / Dor de Garganta / Febre / Prisão de Ventre / Vômito / Tosse / Catapora / Bronquiolite / Conjuntivite / Gengivite / Refluxo gastro-esofágico / Furúnculo / Sapinho / Ressecado / Ferida na língua / Pneumonia / Sarna / Meningite / Alergia / Gases presos

**Foram considerados casamento civil, religioso ou informalmente

*** Foram considerados os itens: telefone TV paga, computador e automóvel.

3.2– ANÁLISE ESTATÍSTICA

Para análise estatística dos dados, inicialmente realizou-se uma análise descritiva

a fim de obter algumas informações básicas e para verificar possíveis problemas de

consistência nos dados. Para isso obteve-se a média e o desvio padrão das variáveis

contínuas, enquanto que para as variáveis categóricas foram construídas tabelas de

freqüências. Após a análise descritiva foi aplicada a análise de regressão logística.

Para tanto, foram selecionadas as variáveis no modelo, utilizando o método

passo-a-passo para o ajuste do modelo e verificada a qualidade do ajuste do modelo. E por

(12)

3.3– MODELO DE REGRESSÃO LOGÍSTICA DICOTÔMICA

Embora a regressão logística seja conhecida desde os anos 50, foi através de Cox

(1970) e COX e SNELL (1989) que a mesma tornou-se popular entre os usuários de

estatística..(PAULA - 2004)

A regressão logística é freqüentemente apropriada para a análise de

experimentos que apresentam variáveis respostas categóricas em que o interesse seja o

de descrever a relação entre a variável resposta e um conjunto de variáveis

explanatórias, sendo denominada dicotômica quando possui apenas duas categorias e

politômica, quando a variável resposta possui mais do que duas categorias (GIOLO -

2006).

3.3.1 Modelo de Distribuição Logística

A explicação da popularidade da regressão logística deve-se a função logística, que descreve a forma matemática em que o modelo logístico é baseado. Esta função, denominada de f(z) varia de - ∞ a + ∞, conforme a figura 1.

( )

_z e z f ₋ + = 1 1

(13)

Sendo assim, quando z tender para -∞ a função logística será igual a 0 e quando z tender para +∞ a função logística será igual a 1. Esta é uma das principais diferenças entre o modelo de regressão linear e o modelo de regressão logístico, pois no primeiro a média condicional, expressa por E(Y|x), onde Y é a variável resposta e x os valores das variáveis independentes, está entre os valores de - ∞ ≤ E(Y|x) ≤ + ∞, e em regressão logística como citado acima é expressa como 0 ≤ E(Y|x) ≤ 1. Com isto tem-se um modelo designado para descrever uma probabilidade que sempre estará entre 0 e 1. Outra razão para a popularidade do modelo logístico deve-se a forma de curva em “S” da função logística que lembra a distribuição acumulada de uma variável aleatória onde de acordo com a figura 1 temos que começando com valores de z = - ∞ e movendo para a direita, o valor de Z aumenta quase chegando a zero e depois ele aumenta drasticamente para próximo de 1 e continua assim até z = + ∞. Portanto o formato em “S” pode ser interpretado da seguinte forma: para baixo risco do fator de estudo teremos um valor baixo da função logística, mas esse valor cresce rapidamente à medida que o risco aumenta chegando próximo ao valor 1, o que nos facilita a explicação da variável resposta. (KLEINBAUM, 1994)

A função Distribuição logística é descrita por:

( )

_{{ }}

{ }

_{{ }}

x x x x F exp 1 exp exp 1 1 + = − + =

Esta função toma valores entre zero e um, possuindo uma curva em forma de “S” como mencionada anteriormente e é utilizada por ser de simples entendimento.

Para descrever a variação entre os

θ

( )

x =E

(

Y|x

)

, foi proposto o modelo de regressão logística:

(14)

( )

(

)

      + +       + = = =

∑

= = p k k k p k k k x x x Y P x 1 0 1 0 exp 1 exp | 1

β

θ

(1.1)

Onde Y=1 significa a presença da resposta, x representa as covariáveis (fatores de risco ou de proteção), o parâmetro

β

₀ é o intercepto e

β

_k (k= 1,....p) são os p parâmetros da regressão, mostrando uma estimativa da probabilidade do indivíduo apresentar a resposta dado que o mesmo possui, ou não, determinados fatores de risco. (GIOLO, 2006)

Sendo assim podemos obter a estimativa da probabilidade do indivíduo não apresentar a resposta dado que o mesmo possui, ou não, determinados fatores de risco, como descrito abaixo:

( )

      + + = −

∑

= p k k kx Exp x 1 0 1 1 1

β

θ

(1.2)

Aplicando o logaritmo natural (ln) na razão entre a estimativa do indivíduo apresentar ou não a resposta, obtemos a linearização do modelo de regressão logística:

( )

∑

= + =       − p k k kx x x 1 0 1 log

β

θ

(1.3)

Isto é conseguido através da função de ligação canônica para o modelo binomial

( )

_    − = x x

θ

η

1

log , também chamada de logito (PAULA, 2004). O que podemos

verificar desta linearização é o fato da fórmula ser na verdade um logaritmo de uma odds, o que permitirá o cálculo de odds ratios (OR = razões de chances) a partir do modelo.

(15)

Odds Ratio é a única medida de associação estimada diretamente do modelo logístico, que calcula a probabilidade de um evento ocorrer, sobre a probabilidade deste mesmo evento não ocorrer. (KLEINBAUM, 1994)

3.3.2 - Estimação dos parâmetros

Um dos métodos mais utilizados em regressão logística para estimar parâmetros é o método de máxima verossimilhança. Ele é baseado na função de verossimilhança, que expressa a probabilidade dos dados observados como uma função dos parâmetros desconhecidos.(HOSMER, 1989)

Assumindo que as observações são independentes temos a função de verossimilhança:

( )

[

( )

]

i

[

( )

]

yi i y i n i x x L − = − ∏ = 1 1 1

θ

β

A qual pode ser simplificada aplicando o logaritmo na função acima:

( )

_∑

[

( )

]

(

)

[

( )

]

= − − + = = n i i i i i x y x y l 1 1 log 1 log log β θ θ β (1.4)

Para obter os valores de β que maximizam l

( )

β

basta diferenciar a respectiva função e igualá-las a zero. Estas equações são chamadas de equações de máxima verossimilhança..

( )

[

]

0 1 = −

∑

= n i i i x y θ (1,5)

( )

[

]

0 1 = −

∑

= n i i i ij y x x θ (1.6)

Os valores de β das equações (1.5) e (1.6) são os estimadores de máxima verossimilhança e denominado como

^ β.

(16)

Após obtermos as estimativas dos coeficientes de β, é preciso avaliar a adequação do modelo e para isto é preciso comparar os valores observados da variável resposta com os valores preditos pelo modelo com e sem a covariável sobre estudo.

Em regressão logística, o teste mais utilizado é o chamado teste de Razão de Verossimilhança, onde a função de verossimilhança do modelo sem as covariáveis (LSC)

é comparada com a função de verossimilhança do modelo com as covariáveis (LCC).

( )

_SC CC CC SC _L _L L L

TRV 2log _=2log( )−2log      − = (1.7)

O motivo de multiplicarmos por -2log a razão de verossimilhança é para que se obtenha uma quantidade que seja próxima aos valores da distribuição qui-quadrado, onde os graus de liberdade serão iguais a diferença entre os números de parâmetros dos dois modelos. (KLEINBAUM, 1994)

Em regressão logística a estatística da fórmula 1.7, também é chamada de

deviance que compara a verossimilhança do modelo sob estudo (Mest) com o modelo

saturado (Msat): _      − = sat est M M D 2log (1.8)

Para um melhor entendimento, é conceitualmente útil pensar em deviance, como um valor observado da variável resposta como sendo também um valor predito resultante do modelo saturado. Por modelo saturado, entende-se ser aquele que contém tantos parâmetros quantos dados existirem e desta forma o teste de razão de verossimilhança pode ser visto com a diferença de duas deviances:

TRV = (Deviance do modelo sem covariáveis) – (Deviance do modelo com covariáveis).

(17)

O Teste de hipóteses realizado para o teste de verossimilhança considera H0 como sendo:

H0 : os p coeficientes associados às covariáveis no modelo são iguais a zero. Com a rejeição da hipótese nula pode-se concluir que pelo menos um ou talvez todos os p coeficientes, sejam diferentes de zero (GIOLO, 2006).

3.3.3 – Método de seleção das variáveis

De acordo com PAULA (2004), uma vez definido o conjunto de covariáveis a ser incluído no modelo logístico, resta saber qual a melhor maneira de encontrar um modelo reduzido que inclua apenas as covariáveis e interações mais importantes para explicar a probabilidade de sucesso (objetivo do estudo).

Um dos métodos mais aplicados em regressão logística é o método stepwise. Este método baseia-se em um algoritmo misto de inclusão e eliminação de covariáveis segundo a importância delas e de acordo com algum critério estatístico, que pode ser o teste de razão de verossimilhança, descrito anteriormente. Quanto menor for esse nível de significância mais importante será considerada a covariável para o modelo. Como a covariável mais importante por esse critério não é necessariamente significativa do ponto de vista estatístico, deve-se impor um faixa de valores aceitável para a aceitação de covariáveis (os valores usuais estão no intervalo PE = [0,15 ; 0,25] além de ter um valor estipulado para o limite superior (PS)

Uma das variantes deste algoritmo foi proposta por HOSMER e LEMESHOW (1989). O processo inicia-se com o ajuste do modelo apenas com o intercepto e é completada pelos seguintes passos:

1. Construímos testes de razão de verossimilhança entre o modelo inicial e os modelos logísticos simples formados com cada uma das variáveis do

(18)

estudo. O menor dos níveis descritos associados a cada teste será comparado com o PE. Se PE for maior, incluímos a covariável referente àquele nível e passamos ao passo seguinte; caso contrário paramos a seleção e adotamos o último modelo.

2. Partindo do modelo incluindo a covariável selecionada no passo anterior, introduzimos individualmente as demais covariáveis significativas. Cada um desses novos modelos é testado contra o modelo inicial desse passo. Novamente, o menor valor dos níveis descritos é comparado com PE. Se for menor que PE, implica na inclusão no modelo da covariável correspondente e a passagem ao passo seguinte. Caso contrário, paramos a seleção.

3. Com o modelo selecionado com as principais covariáveis, inicia-se o processo de verificação de interação de primeira ordem entre as variáveis selecionadas, sempre comparando a significância com o valor de PE, até chegar ao modelo com as covariáveis selecionadas e suas interações de primeira, segunda e terceira ordem, caso existam.

3.3.4 – Qualidade do modelo ajustado

Uma vez selecionado o modelo, é preciso verificar o quão bem ele se ajusta aos dados, ou seja, quão próximos os valores preditos pelo modelo encontram-se de seus correspondentes valores observados. As duas estatísticas tradicionais de qualidade do ajuste são: a qui-quadrado de Pearson (QP) e a qui-quadrado da razão de

verossimilhança (QL), também conhecida por deviance por basear-se nos resíduos

(19)

(

)

∑

− = ij ij ij ij P m m n Q 2         =

∑

ij ij ij ij L m n n Q 2 log Onde m_ij n_i

( )

x ^

θ

+ = para j = 1

( )

      − + =n x m_ij _i ^ 1 θ para j = 2

As estatísticas QP e QL fornecem um único número o qual resume a

concordância entre os valores observados e os ajustados e isto pode ser um problema, pois apenas um número é usado para resumir uma quantidade razoável de informação. (GIOLO, 2006).

PREGIBON (1981) estendeu os métodos de diagnósticos de regressão linear para a regressão logística e argumentou que, como as estatísticas qui-quadrado de Pearson (QP) e deviance (QL) são duas medidas usadas para verificar a qualidade do

modelo ajustado, faz sentido analisar os componentes individuais destas estatísticas, uma vez que estes componentes são funções dos valores observados e preditos pelo método.

Para isso usam-se os assim chamados resíduos de Pearson, uma vez que a somas destes resíduos ao quadrado resulta em QP. O comum é que se tiverem resíduos

excedendo o valor |2,0|, o modelo não está bem ajustado. Segue abaixo a fórmula dos resíduos de Pearson:

( )

            − = + + ^ 1 ^ 1 1 ^ 1 i i i i i i i n n n c θ θ θ

i = 1,..., s

(20)

Similarmente, temos a deviance residual, que é componente da estatística

deviance. A soma das deviances residuais ao quadrado, resulta na Estatística QL. Abaixo

é apresentada a fórmula para a deviance residual.

(

)

2 1 1 ^ 1 1 1 ^ 1 1 1 ^ 1 2 log 2 log sin                   − − − +               ₋ = + + + i i i i i i i i i i i i y n n n n n y n n y n al d Onde

( )

1 ^ 1 ^ i i i n y = ₊ θ

A partir do exame dos resíduos de deviance, podemos observar a presença de outliers, resíduos grandes, ou ainda, padrões sistemáticos de variação, o que pode indicar um modelo não muito adequado.Com isso é possível avaliar a importância que alguma observação tem para o estudo e juntamente com o pesquisador optar pela permanência ou não da referida observação.

(21)

4- RESULTADOS E DISCUSSÕES

4.1

–

ANÁLISE DESCRITIVA E EXPLORATÓRIA

Como informado anteriormente, a análise descritiva é o ponto inicial da análise dos dados, pois permite verificar a ocorrência de erros no banco de dados, bem como ter um primeiro contato com os dados e já inferir algumas conclusões para que sejam confrontados quando da execução do método estatístico de regressão logística.

Nesta primeira análise obtivemos que com relação à variável resposta VY, das 450 crianças em estudo, cerca de 19% das crianças tiveram desmame completo até os 60 dias de vida.

A análise das covariáveis mostrou que 75% das crianças tiveram pelo menos um tipo de doença no período estudado (V3), que e a doença que mais atingiu as crianças foi dor de barriga e cólica (V1), conforme mostra a Tabela 1 e ainda que o sintoma/doença de maior duração ocorreu em uma criança que ficou 97 dias doente com uma única doença (V3).

Tabela 1 – Tipo da primeira doença ocorrida dentro dos 60 primeiros dias de vida

Doença – V2 Frequência %

Não ficou doente 110 24,4 Dor de Barriga / Cólica 167 37,1 Nariz entupido / Resfriado 100 22,2 Outras doenças 73 16,2 Total 450 100

Já as covariáveis que descrevem características das mães e que poderiam ser fatores de risco ou proteção para o estudo são mostradas na tabela 2, onde os dados mostram que o nível de desmame precoce foi de 18% para as mães que não beberam e de 22% para as mães que beberam durante a gestação (pouca diferença entre as duas

(22)

categorias) o que pode significar que a variável V4 não é significativa para o estudo. Com relação a variável V6, O nível de desmame precoce foi de 18% para as mães que não fumaram e 23% para as mães que fumaram durante a gestação (diferença é de 5%), o que pode ser significativo para o estudo em questão. A próxima covariável analisada é a V7, idade da mãe, onde o resultado mostra que o nível de desmame precoce foi de 15% para as mães com menos de 25 anos e de 22% para as mães com mais de 25 anos de idade. Neste caso a diferença entre as duas categorias chega a 7% o que pode levar esta covariável a entrar no modelo de regressão. E por último a covariável escolaridade (V15) que apresenta quase nenhuma diferença entre as duas categorias, pois o desmame precoce foi de 18% para as mães com nível de escolaridade médio e superior e de 19% para as mães com nível fundamental e provavelmente esta covariável não entre no modelo de regressão.

Tabela 2 - .Desmame precoce relacionado as características da mãe

Variáveis Categorias (%) Desmame Total V4 - Bebida 0 69 (18%) 381 1 15 (22%) 69 V6 - Fumo 0 63 (18%) 359 1 21 (23%) 91 V7 - Idade 0 30 (15%) 199 1 54 (22%) 251 V15 - Escola 0 37 (18%) 205 1 47 (19%) 245

Com relação as covariáveis relacionadas a família das crianças, tabela 3, os dados apresentam que o nível de desmame precoce foi de 18% para as mães casadas e

(23)

de 20% para as mães não casadas e de18% para as crianças que moram com o pai e de 23% para as crianças que não moram com os pais.Com relação as bens da família, 21% das mães que não possuíam nenhum dos bens do questionário contra 17% das mães que possuíam pelo menos um dos bens do questionário. Para as três covariáveis descritas acima é pouco provável que as mesmas façam parte do modelo devido a pequena diferença entre as categorias.

A única deste grupo que parece ser significativa para o estudo é a covariável sobre o vínculo dos pais com o hospital. Para esta covariável a diferença entre as categorias chega a 8% onde o desmame precoce foi de 12% para pais com vínculo com a USP contra 20% para os pais que não possuíam vínculo.e isso pode significar que ela deva estar presente ao modelo final.

Tabela 3 - .Desmame precoce relacionado as características da família

Variáveis Categorias (%) Desmame Total V9 - Estado 0 64 (18%) 349 Civil 1 20 (20%) 101 V10 - Presença 0 65 (18%) 83 do Pai 1 19 (23%) 367 V16 - Posse 0 38 (21%) 180 de Bens 1 46 (17%) 270 V17 - Vínculo 0 7 (12%) 56 com a USP 1 77 (20%) 394

Continuando a análise exploratória verificaremos as covariáveis que fazem referências diretas às crianças. Os dados mostraram que o comprimento médio das crianças foi de 48,82 cm com peso médio de 3252 gramas, com baixa diferença entre as

(24)

categorias. O mesmo ocorreu para a covariável sexo das crianças que não parece ser significativa para o estudo.

Já para as covariáveis tipo de parto e cor das crianças, os dados mostraram diferenças entre os tipos de parto e raça e ambas são candidatas a estar no modelo final, principalmente a covariável cor da criança que apresentou uma diferença de 7% entre as categorias. O resultado para estas covariáveis é apresentado na tabela 4.

Tabela 4 - .Desmame precoce relacionado as características das crianças

Variáveis Categorias (%) Desmame Total 0 45 (18%) 248 V11 - Parto 1 20 (24%) 82 2 19 (16%) 120 V13 - Cor da 0 41 (16%) 264 Criança 1 43 (23%) 186 V14 - Sexo 0 44 (19%) 234 1 40 (19%) 216

E por último a covariável V8, introdução de leite não materno que apresentou uma enorme diferença entre as categorias e que é quase certa estar presente ao modelo final, pois o desmame precoce foi de 8% para as mães que introduziram outro tipo de leite acima de 60 dias e de 33% para as mães que introduziram outro tipo de leite até os 60 primeiros dias de vida, uma diferença de 25% e que é mostrado na tabela 5..

Tabela 5 - .Desmame precoce relacionado a introdução de leite não materno

Variáveis Categorias (%) Desmame Total V8 - Introdução 0 22 (8%) 260 de Leite 1 62 (33%) 190

(25)

4.2 – REGRESSÃO LOGÍSTICA

4.2.1 – SELEÇÃO DE VARIÁVEIS

O primeiro passo para a aplicação do método stepwise para a seleção de variáveis, é fazer o ajuste entre a variável resposta e todas demais variáveis independentes, coletar as informações do resíduo de deviance, calcular o teste de razão de verossimilhança e verificar pela tabela de qui-quadrado quais são as variáveis, neste primeiro passo, que são significativas para o estudo em questão. Consideramos para o estudo em PE = 0,19. A tabela 6 mostra o resultado deste primeiro passo.

Tabela 6 – Ajuste do modelo com a variável resposta VY e as demais covariáveis Modelo Índice das

Deviances

Deviance Graus de Liberdade

Teste Razão

Verossimilhança (Dev0 -Dev dos demais modelos) p-valor VY~1 Dev0 433,218 449 xxx xxx VY~V1d Dev1d 433,203 448 0,015 0,90276 VY~V2d Dev2d 432,305 448 0,913 0,33929 VY~V3d Dev3d 433,203 448 0,149 0,90276 VY~V2 Dev2 433,141 448 0,077 0,78123 VY~V3 Dev3 433,129 448 0,089 0,76560 VY~V4 Dev4 432,727 448 0,491 0,48364 VY~V5 Dev5 431,037 443 2,181 0,90225 VY~V6 Dev6 431,815 448 1,403 0,23619 VY~V7 Dev7 430,143 448 3,076 0,07948 VY~V8 Dev8 390,733 448 42,486 0,00000000007 VY~V9 Dev9 433,109 448 0,109 0,74085 VY~V10 Dev10 432,069 448 1,149 0,28379 VY~V1p Dev1p 431,1672 448 2,051 0,15212 VY~V2p Dev2p 432,329 448 0,889 0,3457 VY~V12 Dev12 433,083 448 0,135 0,71329 VY~V13 Dev13 429,131 448 4,087 0,04320 VY~V14 Dev14 433,212 448 0,006 0,93823

(26)

VY~V15 Dev15 433,123 448 0,095 0,75813 VY~V16 Dev16 432,049 448 1,170 0,27949 VY~V17 Dev17 431,473 448 1,745 0,18651

De acordo com a tabela podemos observar que as variáveis V7 (idade da mãe na ocasião do parto), V8 (idade da criança quando a mãe introduziu leite não materno), V13 (cor da criança), V1p (Parto por fórceps) e V17 (Vínculo dos pais com a USP) são significativas para o estudo.

Sobre a covariável parto, devido a mesma ser politômica, utilizou-se variável dummy para o ajuste do modelo.

4.2.2 – AJUSTE DO MODELO FINAL

No passo anterior foram verificadas quais as variáveis são significativas individualmente com a variável resposta. O próximo passo é pegar a covariável com menor deviance (no caso a variável V8 – Idade em dias da criança quando a mãe introduziu leite não materno) e já com ela no modelo, verificar neste primeiro momento, quais das demais variáveis significativas contribuem significativamente com o modelo. Mais tarde, em outro passo será verificado como as demais variáveis significativas se ajustam ao modelo sem a presença da covariável V8.

Tabela 7– Ajuste do modelo com a variável resposta e a variável V8 juntamente com as outras covariáveis mais significativas V7, V1p , V13 e V17

Modelo Índice das Deviances Deviance Graus de Liberdade TRV (Dev8-Devxb) p-valor VY~V8 Dev8 390,733 448 xxx 0,00000000007 VY~V8+V1p Dev1b 388,547 447 2,185 0,13935 VY~V8+V13 Dev2b 388,907 447 1,825 0,17670 VY~V8+V7 Dev3b 389,645 447 1,088 0,29696 VY~V8+V17 Dev4b 390,500 447 0,233 0,62947

(27)

A tabela 7 nos mostra que na presença da covariável V8 apenas as covariáveis V1p (parto por fórceps) e V13 (cor da criança) devem permanecer no modelo, por apresentar p-valor abaixo de 0,19.

O próximo passo será verificar se o modelo fica melhor ajustado se a covariável V8 sair do modelo, para isso testaremos as seguintes hipóteses:

1 ) H0: V8 não é significativo na presença de V1p e V2p

Vale lembrar que em todas as verificações em que deva entrar no modelo a covariável dummy V1p, entrará também a covariável V2p, pois juntas compõe os dados da covariável tipo de parto (V11).

Este cálculo é feito tomando a resultado da deviance do modelo contendo a variável resposta (VY) apenas na presença de V1p e V2p, menos a deviance entre a variável resposta (VY) na presença das variáveis V8, V1p e V2p.

O resultado é apresentado na tabela 8.

Tabela 8 – Ajuste do modelo contendo a variável resposta (VY) na presença das variáveis V1p e V2p e sem a presença da variável V8

Modelo Índice das Deviances Deviance Graus de Liberdade TRV (Dev1p-Dev1b) p-valor VY~V1p+V2p Dev12p 430,864 447 2,356 0,308000 VY~V8+V1p+V2p DevLb 388,327 446 42,536 0,0000000694

Não temos evidência para rejeitar H0 e portanto V8 permanece no modelo junto com as demais covariáveis significativas.

O mesmo processo deve ser feito com a covariável V13 e temos como resultado, que V8 permanece no modelo na presença de V13 (tabela 9).

(28)

Tabela 9 – Ajuste do modelo contendo a variável resposta (VY) na presença da variável V13 e sem a presença da variável V8

Modelo Índice das Deviances Deviance Graus de Liberdade TRV (Dev13-Dev2b) p-valor VY~V13 Dev13 429,131 448 xxx xxx VY~V8+V13 Dev2b 388,907 447 xxx xxx Resultado 40,223 0,0000000227

Verificou-se se que a covariável V8 não sai do modelo na presença das outras duas individualmente. Agora é preciso verificar se V8 continuará no modelo na presença de V1p, V2p e V13 juntas. Para isso será preciso rodar dois novos modelos, um contendo apenas as covariáveis V1p, V2p e V13 e o outro contendo as quatro covariáveis: V8, V1p, V2p e V13. O teste se baseará na seguinte hipótese:

H0: V8 não é significativo na presença de V1p, V2p e V13

A tabela 10 mostra que a covariável V8 não sai do modelo na presença de V1p, V2p e V13.

Tabela 10 – Ajuste do modelo contendo a variável resposta (VY) na presença das variáveis V8, V1p, V2p e V13

Modelo Índice das Deviances Deviance Graus de Liberdade TRV p-valor VY~V1p+V2p+V13 Dev7b 425,879 446 7,339 0,06183 VY~V8+V1p+V2p+V13 Dev8b 386,123 445 39,756 0,0000000288

O passo seguinte é verificar se a interação entre as variáveis V8, V1p, V2p e V13 ajudam a explicar o modelo em questão, isto é, se são significativas para o estudo. O resultado é apresentado na tabela 11.

O processo é o mesmo utilizado anteriormente, ou seja, através de comparações entre o modelo contendo um modelo sem interação com um modelo contendo as interações.

(29)

O modelo a ser testado será: p V V p V V p V V p V V V V V p v p V V VY Y = ~ 8+ 1 + 2 + 13+ 8: 13+ 8: 1 + 8: 2 + 13: 1 + 13: 2

Serão necessários vários testes de hipóteses até testar todas as interações, sendo o primeiro teste:

1) H0: β₁ =β₂ =β₃ =β₄ =β₅

A tabela 11 mostra que a interação leite:raça deve permanecer no modelo.

Tabela 11 – Ajuste do modelo contendo interação entre V8 e V13 Modelo Índice das

Deviances Deviance Graus de Liberdade TRV (Dev5b-Dev1b) p-valor VY~V8+V13+V1p+V2p Devint1 386,127 445 47,095 0,0000000146 VY~V8+V13+V1p+V2p + V8*V13 Devint2 384,099 444 2,023 0,15488

De acordo com o resultado expresso na tabela 4 a interação entre as covariáveis significativas não contribuem para explicar o modelo e podemos definir o nosso modelo final como :

(30)

4.2.4 - INTERPRETAÇÃO DOS PARÂMETROS

Com a ajuda do software R foi possível verificar a odds (razão de chances) de cada parâmetro separadamente tendo como resultado para a covariável V9 o valor de 5,071, o que significa que a chance de desmame precoce ocorrer quando introduzido o leite não materno antes dos 60 dias é de 5 vezes maior do que se introduzido após os 60 dias de vida da criança.

Já para a covariável V14 obteve-se a odds de 1,413 o que significa que a chance de ocorrer desmame precoce entre os não brancos, antes dos 60 dias de vida da criança é 41% maios do que entre os brancos.

Analisando agora conjuntamente as covariáveis V9 e V14, na tabela 6, nos leva as seguintes conclusões:

A probabilidade de desmame precoce em uma criança branca que teve o leite não materno introduzido após os 60 dias é de 7,45%

A probabilidade de desmame precoce em uma criança não branca que teve o leite não materno introduzido após os 60 dias é de 10,21%

A probabilidade de desmame precoce em uma criança branca que teve o leite não materno introduzido antes dos 60 dias é de 29%

(31)

A probabilidade de desmame precoce em uma criança não branca que teve o leite não materno introduzido antes dos 60 dias é de 37%

5- CONCLUSÕES:

A regressão logística é um dos métodos mais utilizados atualmente para modelagem estatística de dados, cuja resposta de interesse é dicotômica, devido principalmente a facilidade de interpretação dos parâmetros do modelo.

Com relação ao modelo ajustado, tem-se que para o estudo sobre desmame precoce até os 60 dias de vida da criança, que a introdução de leite não materno

(32)

antes destes 60 dias e o tipo de cor da criança foram significativos para o estudo. Os resultados obtidos através das estimativas dos parâmetros em regressão logística indicam que a situação de maior risco de acontecer desmame precoce é quando da introdução de leite não materno na dieta da criança antes dos 60 primeiros dias de vida e a criança ser de cor não branca.

A probabilidade de desmame precoce em uma criança não branca que teve o leite não materno introduzido antes dos 60 dias é de 37%

6- REFERÊNCIAS:

[IBFAN] International Baby Food Action Network. [online] Conselho Especialista sobre a duração do uso exclusivo da amamentação da WHO recomenda 6 meses. IBFAN, 2001. Disponível em:

http://www.ibfan.org/portuguese/newa/press/press2april01po.html (18 out 2001).

[OMS] Organização Mundial da Saúde. Aleitamento materno: proteção,

promoção e apoio: o papel especial dos serviços materno infantis. Femina

(33)

AKRÉ J. Alimentação infantil: bases fisiológicas. São Paulo:

OPS/OMS/INCAP;1994. Factores de salud que pueden interferir en la lactancia materna; p.5161.

NEWMAN J. How Breast Milk Protects Newborns. Scientific American, 1995 dec;4: 7679.

PALMA D. Alimentação da criança nos primeiros anos de vida. Rev Paul Pediatria 1998; 1(6): 21-6.

Bueno MB, Souza JMP, Souza SB, Paz SMRS, Gimeno SGA, Siqueira AAF.

Riscos associados ao processo de desmame entre crianças nascidas em hospital universitário de São Paulo, entre 1998 e 1999: estudo de coorte prospectivo do primeiro ano de vida. Cad. Saúde Pública, Rio de Janeiro, 2003; 19(5): 14531460.

HOSMER JR, R.W.; LEMESHOW, S. Applied Logistic Regression. New York? John Wiley & Sons, 1989.

KLEINBAUM, D. , Logistic Regression: a self-learning text. New York : Springer Verlag, 1994.

PAULA, G. A. Modelos de Regressão com apoio computacional – Instituto de Matemática e Estatística da USP, 2004

GIOLO, S. R. Análise de Dados Categóricos. Curitiba, 2006. Notas de aula da disciplina do curso de Estatística da Universidade Federal do Paraná.

PREGIBON, D. Logistic Regression Diagnostics, Anals of Statistics, v.9, p. 705-724, 1981