vol3 09

(1)

(2)

(3)

Estudos de Custo-efetividade na Área Médica

Caríssi Anne Polanczyk

I. CONCEITOS BÁSICOS DOS ESTUDOS DE CUSTO-EFE-TIVIDADE

A avaliação das diversas intervenções médicas, tanto do ponto de vista clínico quanto de política de saúde, pode ser descrita em cinco etapas. A primeira é a demonstração da efi cácia de uma intervenção, que pode ser atingida quando aplicada em condições ideais. A segunda envolve a avaliação da efetivi-dade, mostrando o real efeito da intervenção quando utilizada nas circunstâncias usuais. O terceiro passo avalia a efi -ciência ou custo-efetividade, que considera não apenas a efetividade de cada intervenção mas também os recursos necessários para que a mesma seja implementada. A quarta deve considerar a disponibilidade das intervenções para aquelas pessoas que necessitam. E fi nalmente, a etapa não menos importante mas freqüentemente ignorada, referente à distribuição das tecnologias e prestação de serviços, a qual deve considerar quem ganha e quem perde na escolha de uma intervenção em vez de outra. Este artigo visa avaliar de forma mais detalhada os conceitos fundamentais de estudos de efi -ciência na área de saúde, mais conhecidos como estudos de custo-efetividade, custo-benefício ou custo-utilidade.

O principal objetivo dos estudos de custo-efetividade é com-parar o valor relativo de diferentes intervenções direcionadas em promover saúde e/ou prolongar a vida, fornecendo infor-mações concretas para que a tomada de decisões na alocação de recursos seja a mais apropriada. A expressão estudo de custo-efetividade usualmente é utilizada de forma genérica do ponto de vista econômico para descrever todos os tipos de análises: custo-efetividade, custo-benefício, custo-utilidade ou custo-preferência. Entretanto estas análises apresentam diferenças metodológicas intrínsecas e têm uma interpretação prática distinta (veja adiante).

Estudos de custo-efetividade de uma intervenção médica necessitam por defi nição de uma comparação entre dois (ou mais) métodos alternativos de tratar um paciente num deter-minado estado de saúde. A maior aplicabilidade dos estudos de custo-efetividade na área de saúde envolve a comparação entre alternativas que competem na mesma condição clínica, sendo as mesmas também chamadas exclusivas. Por exem-plo, a escolha entre diferentes drogas anti-hipertensivas e hipolipemiantes, uso de dosagens alternativas de uma mes-ma droga, comparação entre tratamento não-farmes-macológico e medicamentoso, utilização de uma estratégia diagnóstico versus outra, etc. Na avaliação de duas intervenções são cal-culadas razões que expressam o custo adicional necessário para atingir uma unidade extra de benefício clínico. A razão de custo-efetividade é defi nida como a diferença entre o cus-to de duas intervenções, dividida pela diferença entre as suas efetividades, defi nidas por exemplo como anos de vida salvos ajustados para qualidade de vida (AVAQ):

De acordo com o tipo de análise realizada o benefício clínico pode ser expresso em anos de vida salvos ou expectativa de vida, na qual são estimadas ‘razões de custo-efetividade’. Se a unidade do desfecho clínico utilizada é a preferência do pa-ciente ou qualidade de vida, então o estudo avalia ‘razões de custo utilidade ou custo-preferência’. Se o estudo converte o desfecho clínico em dólares ou unidade monetária, a relação calculada é expressa como ‘custo-benefício’. Os princípios dos estudos de custo-efetividade competitivos (adicionais) estão demonstrados em um exemplo hipotético. Na Tabela 1 são comparados dois tratamentos alternativos para pacientes com a doença X. O custo estimado do tratamento está represen-tado na primeira coluna e usualmente deve considerar não apenas o custo direto do tratamento, mas potenciais custos relacionados aos efeitos adversos, falhas na terapêutica ou ambos. Nas outras colunas estão descritas diferentes formas de avaliar o benefício clínico do tratamento: sobrevida, quali-dade de vida e conversão em uniquali-dade monetária.

Anos de vida salvos ou sobrevida são medidas de desfecho clínico que o médico está acostumado a lidar e são fáceis de serem interpretados. Utilidade é uma medida quantitativa que avalia a preferência do paciente para determinada condição de saúde. Nos estudos de custo-utilidade, a unidade de medi-da do desfecho clínico é usualmente expectativa de vimedi-da ajus-tada para qualidade ou anos de vida ajustados para qualidade de vida. A diferença entre expectativa de vida e expectativa de vida ajustada para qualidade é relevante nas situações em que existe um aumento da sobrevida em condições de saúde que não são perfeitas. Por exemplo, recentemente foi demonstra-do que o implante de desfi brilademonstra-dores automáticos em pacien-tes com arritmias ventriculares e insufi ciência cardíaca grave aumenta a sobrevida, mas dados secundários sugerem que para alguns pacientes o aumento da expectativa de vida está associado com uma qualidade de vida muito baixa. Nestas si-tuações um aumento da expectativa de vida poderia não estar associado com um aumento da expectativa de vida ajustada para qualidade de vida.

Comparação entre razões médias (average) e razões adicionais (incremental) de custo-efetividade

A maior parte das publicações de análises econômicas relata e compara a média das razões de custo-efetividade. É impor-tante entender as diferenças que existem entre as duas razões. A média é calculada dividindo-se o custo pelo benefício por paciente. Na Tabela 2, por exemplo, a razão média de cus-to-efetividade de utilizar contraste não-iônico em pacientes submetidos a cateterismo cardíaco é de $1,23 por ano de vida salvo. Levando-se em consideração somente este número, a conclusão direta e mais adequada seria que esta é uma opção muito barata e custo-efetiva. Entretanto, se a situação real for de que todos os cateterismos já são realizados com contraste iônico, então a razão adicional de custo-efetividade (diferença

(4)

Tabela 2 – Comparação entre razão de custo-efetividade média e adicional.

Programa Custo ($) Expectativa de vida (anos de vida)

Uso de contraste não-iônico para cateterismo cardíaco para pacientes de alto risco $ 37 29,99

Uso de contraste iônico em todos os pacientes submetidos a cateterismo cardíaco $ 14 29,98

Razão média de custo-efetividade do uso = $ 37 = 1,23 por ano de vida

de contraste não-iônico para pacientes de alto risco 29,9

Razão adicional de custo-efetividade do uso de contraste = $ 37 - 14 = $ 2.300 por ano de vida

não-iônico para pacientes de alto risco em comparação com 29,99 - 29,98

uso de contraste iônico para todos os pacientes

Tabela 1 – Exemplo hipotético do custo e efetividade do tratamento de uma doença X com duas estratégias alternativas, Tratamento A e Tratamento B.

Tratamento Custos Efetividade

Expectativa Utilidade Expectativa de vida Benefício em de vida (qualidade ajustada para dólares

de vida) qualidade de vida

Tratamento A $ 10.000 5,6 anos 0,80 4,48 AVAQ $ 2.000

Tratamento B $ 5.000 4,1 anos 0,90 3,96 AVAQ $ 1.000

Razão adicional de custo-efetividade = $ 10.000 - $ 5.000 = $ 3.333 por anos de vida salvos 5,6 anos - 4,1 anos

Razão adicional de custo-utilidade = $ 10.000 - $ 5.000 = $ 6.329 por AVAQ 4,48 - 3,69 AVAQ

Razão adicional de custo-benefício = $ 10.000 - $ 5.000 = 5 $ 2.000 - $ 1.000 Adaptado de Detksy et al (2)

AVAQ = anos de vida ajustados para qualidade de vida

entre as duas opções) deve ser calculada. No exemplo, a ra-zão adicional para implementar contraste não-iônico seria de $2.300 por ano de vida salvo. Teoricamente, as duas razões devem ser interpretadas e utilizadas de acordo com a situa-ção vigente: (1) não existe nenhuma alternativa e a opsitua-ção é independente, quando deve ser utilizada a razão média, ou (2) já existente uma forma de tratamento e está sendo avaliada uma nova alternativa, quando então deve ser calculada a ra-zão adicional. Uma falha comum na avaliação econômica de dois tratamentos alternativos é desconsiderar a existência de opções mais baratas, embora às vezes menos benéfi cas, na análise de custo-efetividade do tratamento de uma condição

clínica em particular. Os resultados podem surpreender: o tra-tamento mais efetivo pode não ser o mais efi ciente.

II. AVALIAÇÃO DO BENEFÍCIO E DA EFETIVIDADE DAS INTERVENÇÕES MÉDICAS

Identifi cação dos desfechos clínicos

Como mencionado acima, o denominador da razão de custo-efetividade é a diferença entre a custo-efetividade de uma interven-ção e a alternativa que está sendo comparada. Para estimar o benefício “líquido” o pesquisador deve determinar o impacto

(5)

na saúde de tais intervenções, a probabilidade de que cada estado de saúde possa ocorrer, quando cada situação é mais provável que ocorra e por quanto tempo. Estes estados de saú-de são a seqüência saú-de eventos e saú-decisões conseqüentes que ocorrem durante ou seguindo uma intervenção. Uma completa e detalhada descrição da cascata de eventos que segue uma intervenção é fundamental nos estudos de custo-efetividade. É importante que tanto o pesquisador quanto o leitor crítico deste tipo de análise considere todos os eventos que tenham impacto na saúde do paciente ou que gerem custos.

Na avaliação da seqüência de eventos que segue uma interven-ção, um trabalho pode considerar a coleta prospectiva dos dados, como ocorre com os relatos de ensaios clínicos randomizados, ou mais comumente o pesquisador pode usar uma compilação de diversos estudos (dados secundários) para “simular” o que pode ocorrer com um paciente se tal intervenção for feita. Existem diversos modelos que simulam a vida real, nenhum deles é perfeito neste aspecto mas apresentam suas vantagens e desvantagens de acordo com o assunto em questão. Foge do objetivo deste artigo descrever estas técnicas em detalhes, mas a metodologia mais utilizada nestes estudos será descrita como ilustração, é a chamada análise de decisão clínica. O método de decisão clínica pode ser constituído em quatro etapas:

1. Identifi car e agrupar o problema de decisão considerando as ações alternativas disponíveis;

2. Estruturar o problema de decisão clínico, no formato de uma árvore (Figura 1), descrevendo todos os eventos que seguem de ou são conseqüência destas ações, tais como as informa-ções clínicas obtidas ou as conseqüências ao acaso ou por decisão frente ao novo cenário;

3. Caracterizar a informação necessária para que cada ramo fi nal da árvore ocorra, ou seja, estimar a probabilidade que cada evento ocorra.

4. Escolher um curso de ação preferido para cada evento e o desfecho fi nal para cada ação e suas conseqüências.

Quantifi cação dos desfechos clínicos

Após a determinação da seqüência de eventos que segue uma intervenção, é feita uma estimativa numérica dos efei-tos das intervenções médicas nos desfechos (outcomes) relacionados à saúde. Os benefícios têm sido tradicional-mente mensurados como redução da mortalidade, aumento da expectativa de vida, anos de vidas salvos, etc. Anos de vida salvos são umas das formas métricas mais convenientes de serem utilizadas em estudos de custo-efetividade e são ainda os desfechos mais relatados. Entretanto, em algumas circunstâncias, dados sobre sobrevida ou expectativa de vida não são sufi cientes para quantifi car o benefício de uma inter-venção. Por exemplo, a avaliação de programas que visam a redução de colesterol sérico não deve levar em consideração apenas a redução da mortalidade total, mas também devem

incorporar outros aspectos relacionados à saúde, como a redu-ção da morbidade por diminuir episódios de angina ou infarto do miocárdio, bem como os potenciais impactos psicossociais do diagnóstico de hipercolesteronemia.

Por estes motivos, nos últimos anos tem surgido um interes-se de quantifi car o efeito das intervenções médicas na saúde dos pacientes, procurando descrever não apenas anos de vida salvos, mas anos de vida em determinada condição de saúde. Desta forma, dados de sobrevida ou expectativa de vida podem ser combinados com medidas de qualidade de vida, permitindo que o impacto de intervenções na morbidade e mortalidade dos pacientes possa ser avaliado em uma única medida. Qualidade de vida relacionada à saúde

Qualidade de vida é um termo genérico que envolve aspectos relacionados às capacidades físicas e mentais de um indivíduo, abrangendo também componentes emocionais, sociais, econô-micos e circunstanciais. Do ponto de vista prático, entretanto, os médicos estão mais interessados em aspectos da qualidade de vida que estão diretamente relacionados com saúde. Por estes motivos, usualmente o termo qualidade de vida é restrito aos atributos relacionados à saúde.

(6)

Avaliação dos instrumentos de qualidade de vida A determinação da qualidade de vida pode ser feita através de uma pergunta simples, direta e genérica, como: ‘Qual é a sua qualidade de vida?’ Essa abordagem, embora correta, fornece-rá informações limitadas e imprecisas. Comumente, os instru-mentos de avaliação de qualidade de vida são questionários com diversos itens, agrupados em dimensões ou domínios que refl etem as diferentes áreas que estão sendo avaliadas. Os questionários ou instrumentos podem ser genéricos ou não específi cos, procurando avaliar no contexto geral a qualidade de vida. Por exemplo, o formulário utilizado no “Estudo de Desfechos Clínicos”, conhecido como SF-36, avalia 8 domínios (físico, mental, social, dor, energia e vitalidade, problemas com físico, problemas emocionais e percepção de saúde) e tem sido muito empregado em ensaios clínicos. Este tipo de instrumen-to é adequado para avaliar e comparar o impacinstrumen-to entre dife-rentes condições de saúde ou grupo de doenças. Instrumentos genéricos podem não ser sensíveis o sufi ciente para detectar alterações pequenas no estado de saúde de um indivíduo ou alterações características de uma doença em particular. Nestas situações é mais adequado utilizar instrumentos específi cos para determinadas doenças ou condições de saúde. Por exem-plo, o questionário ‘Minnesota – Vivendo com Insufi ciência Cardíaca’ foi descrito e validado em pacientes com insufi ci-ência cardíaca e avalia detalhadamente apenas três domínios: físico, psicológico e sócio-econômico.

Embora possa parecer simples a utilização e avaliação dos ins-trumentos de qualidade de vida, a interpretação dos mesmos deve ser muito cautelosa. Do ponto de vista metodológico e seguindo os preceitos da medicina baseada em evidência, o médico deve saber diferenciar um instrumento adequado, vá-lido, que traduza resultados importantes e incontestáveis para sua prática clínica. Na leitura crítica dos estudos que utilizam instrumentos de qualidade de vida, deve-se procurar evidên-cias de que os mesmos já foram adequadamente validados, em quais populações foram estudados e se o conteúdo dos domínios avaliados são generalizáveis e importantes para o paciente com uma condição clínica de interesse. No processo de validação dos instrumentos de qualidade de vida quatro atributos são essenciais para que os mesmos sejam utilizados como medidas de desfecho: (1) reprodutibilidade, (2) respon-sividade, (3) validade do conteúdo (face validity) e (4) validade do construto (construct validity). A reprodutibilidade avalia o grau de variabilidade intra-individual, demonstrando se o ins-trumento fornece resultados semelhantes quando aplicado ao mesmo indivíduo numa condição de saúde estável. Responsi-vidade refere-se à capacidade ou sensibilidade do instrumento de detectar alterações clinicamente signifi cativas entre dife-rentes estados de saúde ou após uma intervenção. Nos dois atributos de validade, o pressuposto é demonstrar que o ins-trumento mede o que realmente pretende medir, na validade do conteúdo a associação é lógica e teórica e na validade do construto deve ser relacionada com outras medidas objetivas que se propõem a avaliar o mesmo fenômeno. Por exemplo,

espera-se que um instrumento que se propõe a medir ativida-de física tenha uma boa correlação com a capacidaativida-de funcio-nal avaliada durante o teste de esforço.

Apesar dos instrumentos de qualidade de vida fornecerem in-formações úteis que permitem a comparação entre diferentes situações ou intervenções, eles não podem ser diretamente utilizados na tomada de decisões clínicas que levam em consi-deração conceitos de custo-efetividade. Para a tomada destas decisões é necessário que haja uma medida única que refl ita o impacto de diferentes intervenções (como drogas, cirurgias ou programas de reabilitação) nas mais diversas condições clínicas (insufi ciência cardíaca, hipertensão, doença pulmonar crônica, diabete mellitus). Estas medidas fornecem um valor sumariza-do de qualidade de vida e são denominadas preferências, valo-res ou utilidade. Tipicamente, escalas de utilidade variam de 0 (morte) a 1.0 (saúde perfeita). Existem diversas metodologias que podem ser empregadas para converter instrumentos de qualidade de vida em medidas de utilidade e foge do escopo desta revisão descrevê-los em detalhe. Entretanto, utilizando medidas de utilidade, dados sobre qualidade de vida e expec-tativa de vida podem ser incorporados para que tal efetividade de uma intervenção seja analisada. Teoricamente, estas duas variáveis podem ser colocadas em um continuum até o fi nal da vida e este continuum está representado na Figura 2. A área hachurada embaixo da curva representa esquematicamente a vida de um indivíduo. Diversos termos têm sido usados para descrevê-la: anos de vida ajustados para qualidade de vida, expectativa de vida ajustada para qualidade e anos de vida ajustados para condição de saúde. É evidente que a medida precisa da área, ilustrada na Figura 2, não é possível de ser

Figura 2 – Representação esquemática da incorporação de informações de qualidade de vida com quantidade de vida, expressa em anos.

(7)

obtida. Convencionalmente, entretanto, os anos de vida ajus-tados para qualidade têm sido calculados multiplicando o va-lor da qualidade de vida em um determinado estado de saúde pela duração daquele estado. A vantagem de utilizar anos de vida ajustados para qualidade como uma medida de desfe-cho é que a mesma leva simultaneamente em consideração ganhos por impacto na morbidade (melhora na qualidade) e redução da mortalidade (aumento da sobrevida).

Estimativa da efetividade das intervenções médicas Após ter sido determinada qual a melhor unidade para re-presentar o benefício de uma intervenção médica, a próxima etapa é estimar com a maior precisão a probabilidade que ocorram os eventos relacionados à saúde. As probabilidades para cada população ou grupo de indivíduos podem ser esti-madas através de estudos planejados, como ensaios clínicos randomizados, estudos de coorte ou através de observações empíricas e opiniões de especialistas.

Os ensaios clínicos randomizados são os estudos mais robus-tos para avaliar a efetividade de intervenções, tratamenrobus-tos ou procedimentos. O delineamento destes estudos permite comparar o efeito de diferentes intervenções, controlando para todos potenciais confundidores. Apesar das vantagens deste tipo de estudo, a extrapolação dos seus resultados para análises de custo-efetividade apresenta algumas desvanta-gens e limitações que devem ser consideradas e avaliadas criticamente. Algumas dessas limitações estão associadas às populações selecionadas dos ensaios clínicos. Pacientes ele-gíveis para um ensaio podem ter um desfecho clínico natural melhor que os pacientes não-elegíveis. Por exemplo, em um ensaio clínico que avaliou o efeito da cirurgia de revascula-rização miocárdica em pacientes com doença de um vaso, o grupo-controle que recebeu apenas tratamento clínico tinha uma sobrevida superior às pessoas do mesmo sexo e idade da população em geral. Embora os resultados do estudo te-nham validade interna, sua validade externa é questionável. Além da natureza selecionada dos pacientes estudados em ensaios clínicos randomizados, outros aspectos que devem ser considerados são: (1) a existência de diferenças signifi ca-tivas entre o impacto da intervenção quando implementada nas condições do estudo quando comparada com aquelas da prática clínica; (2) o limitado tempo de seguimento dos estu-dos, não permitindo descrever com segurança se os resulta-dos são mantiresulta-dos. Apesar destas ressalvas, ensaios clínicos randomizados são a fonte preferida de dados para estimar a efetividade de uma intervenção.

Estudos observacionais também auxiliam na estimativa da probabilidade de um desfecho clínico. Os mais adequados são os estudos de coorte e caso-controle. Como todos os estu-dos observacionais eles são mais sujeitos a vícios, mas têm a vantagem de apresentarem dados mais semelhantes aos da população em geral. Em algumas situações clínicas não exis-tem dados sufi cientes de uma única fonte ou os resultados de

diferentes estudos são confl itantes. Informações de estudos de boa qualidade (ensaios clínicos randomizados e coortes de indivíduos de larga escala) podem então ser combinadas para fornecer estimativas da efetividade das intervenções que estão sendo avaliadas. Meta-análises também podem ser de extre-ma valia na ausência de outros estudos extre-mais robustos. São inúmeras as fontes que podem ser utilizadas para se obter as informações necessárias em relação à efetividade de uma intervenção médica. Como assinalado acima, é importante que as fontes utilizadas sejam as mais fi dedignas e confi áveis para que os resultados das análises sejam válidos. Infelizmente, as informações necessárias para conduzir os estudos de cus-to-efetividade são usualmente incompletas, e o pesquisador utiliza metodologias específi cas para estimar a magnitude da efetividade. Modelos matemáticos foram desenvolvidos para agregar todas as informações coletadas de múltiplas fontes epidemiológicas. Estes modelos permitem combinar os resul-tados disponíveis e fornecer parâmetros para os valores das estimativas não disponíveis.

Conversão monetária da efetividade

Do ponto de vista econômico, o benefício de uma interven-ção em termos de saúde pode ser dividido em três grupos: (1) benefício direto: expressa as economias em termos de redu-ção dos gastos relacionados à saúde; (2) benefícios indiretos: são os ganhos para a sociedade em termos de produtivida-de uma vez que mais pessoas estão vivas, se sentindo bem e retornando ao trabalho; e (3) benefícios não-quantifi cáveis: representam o valor monetário da redução da dor e sofrimen-to do paciente e da família, causado pela melhora da saúde. A validade dessa metodologia para representar e quantifi car benefício em saúde é questionável. O maior viés se refere ao fato de que esta abordagem favorece programas para aque-les que trabalham e ganham, ao contrário dos programas que melhoram a saúde de crianças, donas de casa e idosos. Para que este tipo de análise possa ser utilizada na prática, ela deve também incorporar o valor do benefício (ganho de saúde) de uma intervenção expresso em unidades monetárias, além de considerar os benefícios diretos (diminuição nas despesas com saúde) e indiretos (produtividade). Do ponto de vista prático, trata-se de estimar quantas unidades monetárias indivíduos com determinada doença pagariam para recuperar a saúde, se isso fosse possível. O oposto e equivalente a este valor seria o quanto os indivíduos gostariam de receber pela perda na sua saúde. A ‘vontade de pagar’, seria o valor de compra e a ‘vontade de receber’, o valor de venda, ambos quantifi cando o valor monetário do benefício ganho em termos de saúde. Na prática, essas medidas são comprovadamente difíceis de quantifi car, muito variáveis e não têm sido muito emprega-das por médicos e profi ssionais da área de saúde na tomada de decisões clínicas. As medidas de desfechos descritas acima – sobrevida, expectativa de vida, qualidade de vida, anos de vida ajustados para qualidade – são as mais utilizadas e de maior impacto.

(8)

III. ANÁLISE E ESTIMATIVA DOS CUSTOS DAS INTER-VENÇÕES MÉDICAS

Seguindo os preceitos dos estudos de custo-efetividade, os custos são o numerador da relação e sua estimativa é de ex-trema importância para alocações de recursos baseadas neste tipo de análise. Inicialmente, serão descritos todos os tipos de custos que devem ser considerados e como devem ser estima-dos. Numa segunda etapa será enfatizada a importância da perspectiva ou ponto de vista da análise para determinação de quais custos devem ou não ser incluídos.

Identifi cação, estimativa e valorização dos custos As conseqüências econômicas de uma intervenção médica podem ser classifi cadas em três grandes grupos: (1) custos di-retos – custo médico, hospitais, medicamentos e outros custos relacionados e não relacionados à saúde; (2) custos indiretos, aqueles associados com a perda de produtividade; e (3) o valor intrínseco da melhora na saúde, conforme descrito na sessão anterior. Na Figura 3 estão esquematizados como estes fatores se interelacionam nas estimativas de custo-efetividade.

de custo-efetividade. Usualmente, é excluído das análises o valor monetário intrínseco associado com o ganho na saúde e na produtividade. Esta exclusão é válida e adequada na medi-da que a estimativa do ganho no estado de saúde é abrangen-te o sufi cienabrangen-te para levar em consideração o valor intrínseco e a capacidade do indivíduo de ser produtivo. Da mesma forma o valor monetário da perda em anos da vida não deve ser in-cluído no numerador, porque os efeitos de uma intervenção na expectativa de vida são captados no denominador.

As principais categorias de utilização de recursos (também cha-mados custos diretos) que devem ser incluídas são: custos nos serviços de saúde, custos relacionados com o tempo que o pa-ciente despende para o tratamento ou intervenção em estudo, custo associado com familiares ou outras pessoas que cuidam do paciente (pagos ou não) e outros custos associados com doenças como despesas com viagem, absenteísmo do trabalho, substituições no emprego, etc. Os custos diretos nos serviços de saúde incluem os custos de exames laboratoriais, drogas, suprimentos, do pessoal da área médica e das dependências físicas. Na determinação dos custos de uma intervenção de-vem ser computados todos os efeitos ou ações decorrentes que resultaram da intervenção. Por exemplo, na comparação de dois testes diagnósticos para cardiopatia isquêmica grave devem ser incluídos os custos e conseqüências associados com os resultados falso-positivos e falso-negativos de cada teste, as intervenções decorrentes do resultado do exame, tais como cateterismo cardíaco e procedimentos de revascularização. O tempo que o paciente dispensa para o tratamento propria-mente dito é um tema controverso, mas tem sido consistente-mente apontado como um fator importante e que não deve ser omitido nas análises econômicas. Vários autores conside-ram que o tempo gasto com o tratamento é um componente do tratamento e deve ser valorizado em termos monetários e incorporado no numerador da relação. A incorporação deste componente é relevante principalmente na comparação de tratamentos clínicos versus cirúrgicos ou intervencionistas, onde o tempo despendido pelo paciente durante o tratamento é signifi cativamente diferente. O tempo pode ser omitido das análises se for muito pequeno ou se as alternativas que estão sendo comparadas envolvem um tempo semelhante. O valor monetário do tempo de indivíduos que trabalham deve geral-mente ser estimado de acordo com o ganho mensal médio, estratifi cado para idade e sexo. Para as pessoas que não tra-balham, aposentadas ou que não são remuneradas pelo seu trabalho como donas de casa, o mesmo deve ser estimado através do ganho médio, ajustado para idade e sexo, entre aquelas que trabalham.

Na estimativa numérica dos custos alguns fatores econômicos são importantes e devem ser incorporados nas análises, tais como preços de mercado, infl ação, depreciação de bens e “va-lor de oportunidade”. O preço de mercado ou va“va-lor cobrado por uma prestação de serviço ou intervenção não necessaria-mente refl ete o custo real da intervenção, portanto é recomen-dado que sempre que possível seja utilizada a estimativa mais próxima do custo real. Os valores devem ser expressos de Figura 3

Por convenção, o denominador da relação deve conter infor-mações sobre a melhora na saúde associada com a interven-ção. Assim, os benefícios decorrentes da intervenção como au-mento da sobrevida e melhora na morbidade são incorporados no denominador da relação, bem como as alterações que a in-tervenção possa ter na produtividade de um indivíduo. As mu-danças na utilização dos recursos fi nanceiros decorrentes das intervenções são incorporadas no numerador. Nem todos os elementos descritos são utilizados para calcular uma relação

(9)

preferência em uma moeda estável e em um ano específi co. Quando dados abrangem anos diferentes, o efeito da infl a-ção deve ser removido, corrigindo os valores para os próximos anos ou para a infl ação nos anos passados.

Na teoria econômica está implícito que mesmo após ajuste da infl ação existe uma depreciação gradual do dinheiro ao longo do tempo. Seria o mesmo que dizer que, após correção para infl ação, os indivíduos não valorizam da mesma forma ter R$ 1.000 daqui a 10 anos do que no presente. Esta deprecia-ção envolve dois componentes: a preferência das pessoas de ter dinheiro ou bens no presente (agora) do que no futuro e a correção para custos de oportunidade, que se referem ao montante perdido pela perda da oportunidade de investir o dinheiro em outro empreendimento que resultaria em bene-fícios mais produtivos. A correção para esta perda ao longo dos anos é calculada através de uma “taxa de juros social” (discount rate). Diversos estudos demonstraram que a taxa de desconto anual recomendada é em torno de 3-5% ao ano, após ajuste da infl ação.

Perspectiva ou ponto de vista da análise

A decisão de quais custos devem ser identifi cados e mensu-rados para um estudo de custo-efetividade está diretamente relacionada com o ponto de vista que o mesmo assume. Por exemplo, uma análise que avalia a substituição de heparina convencional por heparina de baixo peso molecular no trata-mento da trombose venosa profunda pode mostrar-se custo-efetiva para hospitais, uma vez que reduz o tempo de interna-ção e o número de exames laboratoriais. Entretanto, do ponto de vista do paciente pode não ser custo-efetiva se o mesmo é responsável pelo seu tratamento (custo do medicamento) após a alta hospitalar. As perspectivas mais comumente des-critas focalizam o ponto de vista do paciente e da família, dos hospitais, do setor público, das companhias de seguro e da sociedade como um todo. A perspectiva da sociedade por de-fi nição é a mais abrangente, levando em consideração todas pessoas afetadas pela intervenção. Todos os efeitos na saú-de e custos resultantes são computados insaú-depensaú-dentemen- independentemen-te de quem acaba sendo afetado ou tratado. A perspectiva da sociedade representa o interesse público em geral em vez daquele de um grupo específi co. Comparações entre diferen-tes relações de custo-efetividade somente têm validade se a perspectiva do estudo for semelhante. Por este motivo, o Pai-nel de Custo-efetividade na Área de Saúde e na Medicina re-centemente publicou recomendações para que todas análises econômicas apresentem, independentemente da perspectiva primária, resultados de interesse para a sociedade como um todo (caso de referência). Entretanto, como exemplifi cado aci-ma, na medida em que este ponto de vista inclui todos custos e efeitos na saúde, não necessariamente fornecerá informa-ções específi cas para o empregador, plano de saúde, hospi-tais ou indivíduos. Por exemplo, os custos relacionados com a locomoção do paciente podem não ser relevantes em estudos de custo-efetividade direcionados para companhias de seguro ou hospitais. Na Tabela 3 estão descritas algumas perspectivas

que são utilizadas em estudos de custo-efetividade e os tipos de custos que habitualmente são incorporados.

A validade das análises de custo-efetividade está diretamente relacionada com a capacidade dos estudos de incorporar de for-ma for-mais precisa o consumo de recursos e os ganhos atribuídos a uma intervenção médica. Por causa dos numerosos fatores que afetam direta ou indiretamente os custos de uma inter-venção, não é factível para um pesquisador incorporar todos os elementos nas análises econômicas. Na prática, o pesquisador deve balançar o esforço de determinar e incluir uma determina-da categoria de acordo com a sua relevância para o estudo.

IV. ANÁLISE DE SENSIBILIDADE

Toda a avaliação econômica apresenta um certo grau de incer-teza, imprecisão ou controvérsia metodológica em relação à estimativa da efetividade das intervenções, do curso da doen-ça, das conseqüências sobre a qualidade de vida, da utilização dos recursos da saúde, dos custos, entre outras. Usualmente, na interpretação dos estudos de custo-efetividade é importan-te questionar se algumas das considerações feitas pelos auto-res fossem diferentes, como elas modifi cariam os auto-resultados. Em estudos bem delineados, os aspectos mais controversos são levados em consideração nas ‘análises de sensibilidade’. Este tipo de análise recalcula as estimativas modifi cando um ou mais parâmetros do estudo. Por exemplo, um estudo sobre uso de captopril pós-infarto pode estimar a priori que a taxa atual de utilização deste medicamento na população com a condição em estudo é de 20%. Para algumas populações este valor não é verdadeiro e seria importante saber o quanto a relação fi nal de custo-efetividade é sensível a mudanças neste parâmetro. Outro tipo de análise de sensibilidade pode reava-liar o custo das intervenções. Por exemplo, se o custo de um trombolítico variar de R$ 500 a R$ 3.000 a dose, qual o ponto de corte que defi ne que esta opção é superior ou mais custo-efetiva em relação a sua alternativa? O Painel Custo-efetividade Internacional recomenda que sempre sejam realizadas análises de sensibilidade e que as razões de custo-efetividade sejam expressas com respectivo intervalo de confi ança de 95%.

V. APLICABILIDADE DOS RESULTADOS DOS ESTUDOS DE CUSTO-EFETIVIDADE

O objetivo implícito ou explícito de qualquer análise econômi-ca das intervenções médieconômi-cas é auxiliar na decisão da aloeconômi-cação de recursos na área de saúde. Este tipo de estudo tem um papel direto muito limitado no atendimento individual do pa-ciente pelo médico. Quando o papa-ciente procura o médico, ele espera que o mesmo ofereça o melhor atendimento sem levar em consideração alternativas mais baratas, com a intenção de benefi ciar também outros pacientes. Entretanto, quando o médico participa das decisões de um grupo ou de uma institui-ção, o mesmo deve procurar otimizar o atendimento de todos pacientes atendidos. Neste contexto pode ser importante con-siderar os resultados dos estudos de custo-efetividade.

(10)

Tabela 3 – Estimativa de custos de acordo com a perspectiva do estudo.

Perspectivas ou ponto de vista

Tipos de custos Sociedade Paciente e familiares Setor público ou Companhias de seguro hospitais sem fi ns lucrativos

Tratamento Todos os custos Despesas pessoais Pagamento dos serviços Pagamento dos

Médico com tratamento utilizados serviços cobertos

médico

“unidade” Todas Somente aquelas Serviços utilizados Serviços cobertos

pagas diretamente

“preço” Oportunidade (maior Quantidade paga Quantidade paga + Custo real valor), incluindo custo diretamente custo administrativo

administrativo

Tempo do paciente Custo de todo tempo Custo de oportunidade Nenhum Nenhum com tratamento utilizado

ou intervenção

Tempo de familiares Todos os custos Somente despesas diretas Nenhum Nenhum ou terceiros

envol-vidos no tratamento

Transporte e outros Todos os custos Todos os custos Nenhum Nenhum, ou

serviços não médicos apenas cobertos

Oportunidade = valor estimado de acordo com o máximo que poderia ser obtido se o paciente não estivesse despendendo tempo com o tratamento. Adaptado de Gold et al. (1)

A quantifi cação das razões de custo-efetividade adicionais é apenas uma das etapas para determinar se um programa ou tratamento deve ser implementado ou não. Para esta decisão é necessário que a razão adicional seja comparada com todas as outras opções que competem pelos recursos disponíveis. Não existe nenhuma fórmula que determine qual a relação que defi ne um aintervenção como sendo custo-efetiva. Existem di-versas estratégias para a utilização dos resultados de análises econômicas e elas estão diretamente relacionadas com a po-lítica geral na qual as decisões para alocação de recursos são tomadas. O critério mais direto e teoricamente mais correto para julgar e aplicar uma relação de custo-efetividade é na cir-cunstância onde uma instituição utiliza claramente seus recur-sos fi nanceiros baseada no paradigma de custo-efetividade. Num exemplo hipotético ilustrado na Figura 4, uma instituição utilizando estes parâmetros não consideraria implementar uma intervenção (D) com relação custo-efetividade mais ele-vada, se as alternativas com relações mais econômicas (A, B e C) não foram ainda implementadas. Teoricamente, um plano de saúde que é conduzido baseado nas premissas dos concei-tos de custo-efetividade não adotaria um programa de cirurgia cardíaca antes de assegurar que todos os seus pacientes com cardiopatia isquêmica sejam tratados para dislipidemia.

Na prática não existe plano de saúde, instituição ou sistema governamental que na íntegra adote suas condutas baseado nestes conceitos e análises. Usualmente os mesmos são utili-zados em circunstâncias específi cas para auxiliar na escolha de uma alternativa sobre a outra. Na maioria das situações, como na tomada de decisões por agências governamentais, planos de saúde e instituições locais, para aprovação de fi nan-ciamento de novos medicamentos ou tecnologias, as condu-tas devem ser “custo-conscientes”, mas não existe nenhum planejamento explícito e nenhuma forma óbvia de antecipar quais os programas que serão deslocados em favor dos novos programas. São nestas situações que os estudos de custo-efe-tividade têm sido utilizados de forma mais prevalente. Nos últimos anos, tornou-se comum comparar intervenções na área da saúde em relação as suas razões relativas de custo-efetividade, expressas em custo por ano de vida salvo ou custo por ano de vida salvo ajustado para qualidade. Torrance e col. publicou uma lista onde as relações de custo-efetividade de diversas intervenções médicas foram categorizadas de acordo com suas razões de custo-efetividade, incluindo programas de cirurgia de revascularização miocárdica, tratamento de hiper-tensão arterial, hemodiálise, implante de prótese de quadril, unidade de tratamento intensivo neonatal para prematuros,

(11)

entre outras. Apesar das potenciais limitações metodológicas implícitas na utilização deste tipo de lista para comparações, a mesma pode auxiliar as pessoas que utilizam estudos de custo-efetividade para determinar se um programa tem uma relação que é (I) mais baixa que a relação de programas bem aceitos, (II) mais alta que todos os programas na lista e está num patamar inaceitável, ou (III) posiciona-se de forma in-termediária. Com a melhora da efetividade das intervenções, redução do custo e enriquecimento da população este limiar é variável. Alternativas que não seriam consideradas no passa-do por serem muito dispendiosas, como transplante cardíaco, hoje podem ser consideradas custo-efetivas.

Extrapolação dos estudos de custo-efetividade para população brasileira

Com base nos tópicos discutidos, o médico pode ter uma no-ção abrangente dos aspectos relevantes quando na interpreta-ção de estudos de custo-efetividade. Entretanto, é importante enfatizar a escassez de análises econômicas das intervenções médicas no Brasil. A maioria dos estudos de custo-efetividade são baseados em dados dos sistemas americano, canadense ou de países europeus.

Muitos dados utilizados nestes estudos são claramente trans-poníveis para o sistema de saúde brasileiro. Por exemplo, a

efi cácia de um tratamento anti-hipertensivo deve ser a mesma em pacientes americanos, europeus ou tratados no Brasil. O mesmo pode não ser verdadeiro em relação aos resultados de uma cirurgia realizada em países diferentes. Existem diver-sos fatores que sugerem que os resultados de análises eco-nômicas também não são facilmente transferíveis para outros contextos. Entre eles destacam-se: as diferenças demográfi cas e epidemiológicas das doenças, a disponibilidade de recur-sos médicos e variabilidade da prática médica, os incentivos e as formas de remuneração dos profi ssionais e instituições de saúde e as diferenças no custo absoluto e relativo dos as-pectos relacionados à saúde. Diversas metodologias podem ser empregadas para validar e adaptar análises econômicas para outras populações e foge do escopo desta revisão des-crevê-las. Entretanto, é importante que o médico saiba avaliar criticamente que uma opção que mostrou-se custo-efetiva em um país pode não ser em outro.

Em conclusão, a validade externa de cada estudo, ou seja, a sua capacidade de ser generalizável para outras populações, depende (1) que o mesmo tenha validade interna e (2) que as estimativas e pressupostos adotados sejam verdadeiros para outras populações.

Referências bibliográfi cas

1. Gold MR, Siegel JE, Russell LB, Weinstein MC, eds. Cost-effectiveness in Health and Medicine.

2. Detksy AS, Naglie IG. A Clinician’s guide to cost-effectiveness analysis. Ann Inter Med 1990; 113:147-54.

3. Torrance GW. Measurement of health state utilities for economic appraisal: a review. J Health Econ 1986; 5:1-30.

4. Russell LB, Gold MR, Siegel JE, Daniels N, Weinstein MC. The role of cost-effectiveness analysis in health and medicine. JAMA 1996; 276:1172-77. 5. Weinstein MC, Siegel JE, Gold MR, Kamlet MS, Russell LB. Recommendations of the panel on cost-effectiveness in health and medicine. JAMA 1996; 276:1253-58.

6. Goldman L, Weinstein MC, Goldman PA, Willians L. Cost-effectiveness of HMG-CoA reductase inhibition for primary and secondary prevention of coronary heart disease. JAMA 1991; 265:1145-51

7. Guyatt GH, Naylor CD, Juniper E, Heyland DK, Jaeschke R, Cook DJ. Users’ guides to the medical literature. XII. How to use articles about health-related quality of life. JAMA 1997; 277:1232-1237.

8. McHorney CA. Generic health measurement: past accomplishments and a measurement paradigm for the 21st century. Ann Inter Med 1997; 127:743-750. 9. Wilson IB, Cleary PD. Linking clinical variables with health-related quality of life. JAMA 1995; 273:59-65.

10. Guyatt GH, Feeny DH, Patrick DL. Measuring health-related quality of life. Ann Itern Med 1993; 118:622-629.

11. Gill TM, Feinstein AR. A critical appraisal of the quality of quality-of-life measurements. JAMA 1994; 272:619-626.

12. Rector TS, Kubo SH, Cohn JN. Validity of the Minnesota Living with Heart Failure Questionnaire as a measure of therapeutic response to enalapril or placebo. Am J Cardiol 1993; 71:1106-7.

13. Bulpitt CJ. Quality of life with ACE inhibitors in chronic heart failure. J Cardiovasc Pharmacol 1996; 27:S31-35.

Figura 4 – Paradigma de custo-efetividade. O eixo do hori-zontal representa o custo-efetividade. O eixo do horihori-zontal representa o custo de cada intervenção e o eixo vertical o benefício na saúde. A curva de distribuição das razões de custo-efetividade (C/E) das mais diversas intervenções apresenta (1) uma inclinação mais acentuada no início, onde um pequeno aumento no custo das intervenções está associado com incrementos signifi cativos em termos de benefício na saúde, (2) uma fase de menor inclinação, onde mais recursos são necessários para atingir pequenos ganhos na saúde e (3) uma fase de platô (ou decréscimo) onde um incremento signifi cativo nos recursos disponíveis oferece mínimo ou nenhum benefício na saúde.

(12)

14. Drummond MF, Stoddart GL, Torrance GW. Methods for the economic evaluation of health care programmes. New York: Oxford University Press, 1987. 15. Balas EA, Kretchmer RAC, Gnann W, West DA, Boren SA, Centor RM, et al. Interpreting cost analyses of clinical interventions. JAMA 1998; 279:54-57. 16. Stinnett AA, Mittleman MA, Weinstein MC, Kuntz KM, Cohen DJ, Willians LW, et al. The cost-effectiveness of dietary and pharmacologic therapy for cholesterol reduction in adults. In: Gold MR, Siegel JE, Russell LB, Weinstein MC, eds. Cost-effectiveness in Health and Medicine. New York: Oxford University Press, 1996: 349-91.

(13)

Quality of Life*

Erik J. Dasbach Steven M. Teutsch

Improving health-related quality of life (QoL) is an important health-care goal. When evaluating health-care programs, ac-counting for QoL benefi ts is critical to demonstrating value. The literature on QoL measurement in health care is rich with in-struments and applications. For the analyst faced with account-ing for QoL benefi ts in a decision analysis, determinaccount-ing the best approach can be challenging. The purpose of this chapter is to provide guidance when incorporating QoL benefi ts into a deci-sion analysis. Specifi cally, this chapter will focus on incorporat-ing QoL benefi ts into economic evaluations. It will also discuss how QoL measures are used in other types of evaluation initia-tive such as clinical trials and population surveillance.

WHY MEASURE QUALITY OF LIFE?

One of the primary goals in health care is to improve QoL. Many defi nitions of QoL have been proposed over the years in the scientifi c literature. While there is no universally agreed-upon defi nition of health-related QoL, the Centers for Disease Con-trol and Prevention (CDC) has defi ned it as “an individual’s or group’s perceived physical and mental health over time.”1_Key

in this as well as other defi nitions is that QoL is a multidimen-sional construct incorporating the effects of both morbidity and mortality. For example, the dimensions might include physical, mental, and social functioning. Instruments that account for these broadly are typically referred to as generic measures of QoL. A well-known generic measure of QoL is the 36-item short form (SF-36) developed for the Medical Outcomes Study.2_The

SF-36 characterizes QoL using the following domains: physical function, role-physical, general health, vitality, social function, role-emotional, mental health, and reported health transition. Most of the dimensions consist of multiple items. For example, one of the items within the physical function domain asks the respondent “How does your health now limit you climbing several fl ights of stairs?” Sometimes the items comprising a generic measure are not sensitive to measuring the effect that specifi c forms of a disease have on a person’s QoL. For example, a common condition experienced by persons with asthma is nighttime awakenings. How nighttime awakenings affect a per-son’s QoL may not be adequately captured by the domains and items in a broad and general instrument such as the SF-36. As a result, disease-specifi c measures of QoL have been developed to address these disease-specifi c conditions. An example of a disease-specifi c instrument for measuring QoL in persons with asthma is the Asthma Quality of Life Questionnaire.3_The

do-mains comprising this questionnaire include activity limitation,

asthma symptoms, emotional function, and environmental stimuli. Each of these domains contains items that are specifi c to asthma. An item represents a specifi c level or characteristic of the domain. For example, in the asthma symptoms domain, one of the items asks the respondent “How often during the past two weeks have you been awakened at night by your asthma symptoms?” A disease-specifi c item such as this would not be found in a generic measure of QoL.

In general, QoL measures can be classifi ed in two ways: ge-neric or disease-specifi c and preference-based or profi le-based (Fig. 5.1).

Most instruments reported in the literature are the profi le type. Both the SF-36 and the Asthma Quality of Life Questionnaire described above are profi le-based measures. Later in the chap-ter, profi le-based measures are differentiated from preference-based measures.

APPLICATIONS OF QUALITY OF LIFE MEASUREMENT Both generic and disease-specifi c QoL instruments are used in a variety of applicacions in health care. These include clinical trials, population surveillance, and economic evaluations. Given the variety of QoL measures available, it is important to choose one that best matches the task because different instruments provide different levels of sensitivity to specifi c components of QoL and provide different absolute values of QoL. Different applications of QoL measurement and the types of instrument that are best suited for these applications are discussed. Clinical trials

Measures of QoL are increasingly being included in clinical trials. A common objective in clinical trials is to measure the effect of an intervention on QoL. To maximize the likelihood that an effect can be detected, the right instrument needs to be matched to the task. As a result, it is not uncommon for

* Texto extraído de Prevention effectiveness: a guide to decision analysis and economic evaluation. Second Edition. Oxford University Press, 2002, p.78-91. Generic Disease-specifi c Profi re based SF-36 Asthma Quality of Life Questionnaire Preference based Quality of well-being Health Utilities index Q-TWIST4

(14)

disease-specifi c measures to be favored over generic measures in clinical trials. Moreover, it is often necessary that the dis-ease-specifi c measure selected be responsive to changes in QoL over time. Many validated QoL instruments in the litera-ture have been developed without determining whether the instrument is responsive to changes in QoL over time. As a result, such instruments may not be suitable for use in a clini-cal trial or may require further testing to determine responsive-ness and a minimal clinically important QoL change. A more detailed account of QoL measurement in clinical trials can be found in Guyatt et al.5

Population surveillance

Another application of QoL measurement is assessing the health of populations through QoL surveillance initiatives. The purposes of such initiatives include the following:

• Monitoring population health

• Planning programs and setting priorities • Evaluating quality of care

An example of such an initiative is the CDC’s survey-based population assessment of QoL using a generic measure, the Healthy Days measure.1_{The Healthy Days measure was}

devel-oped specifi cally to monitor the health of populations and is based on four simple questions:

1. Would you say that in general your health is excellent, very good, good, fair, or poor?

2. Now thinking about your physical health, which includes physical illness and injury, for how many days during the past 30 days was your physical health not good?

3. Now thinking about your mental health, which includes stress, depression, and problems with emotions, for how many days during the past 30 days was your mental health not good?

4. During the past 30 days, for about how many days did poor physical or mental health keep you from doing your usual ac-tivities, such as self-care, work, or recreation?

The Healthy Days measure has been part of the Behavioral Risk Factor Surveillance System (BRFSS) since 1993 and the National Health and Nutrition Examination Survey (NHANES) since 2000. One of the primary uses of the Healthy Days mea-sure is to support the two primary health objectives of the United States outlined in Healthy People 2010:6_{(1) to improve}

the quality and years of life and (2) to eliminate health dispari-ties. In addition to conducting QoL surveillance at the national and state level, the BRFSS has been used for QoL surveillance at the community level.7

An alternative to the Healthy Days measure is the Years of Healthy Life (YHL) measure.8_{The YHL was developed in}

re-sponse to the need to monitor changes in the healthy life span as set forth in Healthy People 2000. The construct was

developed using measures collected in the National Health Interview Survey (NHIS) and is based on two measures: per-ceived health status and activity limitation. Similar initiatives have also begun outside of the United States. For example, Statistics Canada uses the Health Utility Index (HUI) in popula-tion surveys to monitor populapopula-tion health trends in Canada.9

Another related and noteworthy initiative outside the United States is the Global Burden of Disease Study.10_{Initiated in 1992}

at the request of the World Bank and in collaboration with the World Health Organization (WHO), this study is a comprehen-sive assessment of mortality and disability from diseases, inju-ries, and risk factors from 1990 and projected through 2020. A key measure is the disability-adjusted life year (DALY).11_The

DALY accounts for premature mortality, loss of QoL, and social values for allocating resources to health programs. Overall, the DALY is intended to serve as a measure of disease burden, which can be used both to assess the health of populations as well as to set priorities for allocating resources to health pro-grams. Unlike the Healthy Days and YHL scores, DALY scores are not based on surveys of the general population but, rather, value judgments on disability and resource allocation made by regional representatives from around the world. The practical-ity of using the DALY to estimate disease burden has been questioned.12_{As a result, Hyder et al.}12_{proposed a simpler}

alternative to the DALY, the Healthy Life-Year (HeaLY). A similar use of QoL data as the Global Burden of Disease Study is the U.S. Preventive Services Task Force prioritization among recommended clinical preventive services.13_This

initia-tive prioritized 30 clinical preveninitia-tive services recommended by the U.S. Preventive Services Task Force using quality-adjusted life years (QALYs).14

A fi nal use of QoL in surveillance is for assessing quality of care. The Centers for Medicare and Medicaid Services (CMS) in conjunction with the National Committee for Quality Assur-ances (NCQA) uses the SF-36 to longitudinally evaluate the quality of care provided by Medicare managed-care plans.15

Economic evaluations

The fi nal application and focus of this chapter is the measure-ment of QoL for use in economic evaluations. One of the meth-odologic underpinnings of economic evaluation in health care is decision analysis. Decision analysis is a quantitative method from which to systematically analyze choices and the conse-quences of those choices under uncertainty. Fundamental to decision analysis is accounting for the preferences of the deci-sion maker with respect to the consequences. Traditionally, this has been done using constructs that assign preference scores to the expected outcome(s), which are often referred to as health states. For example, two of the potential consequences of diabetes are blindness and end-stage renal disease (ESRD). Choosing between two prevention programs, one of which is more likely to prevent blindness and the other of which is more likely to prevent ESRD, may depend on how an individual

(15)

values these health states. For example, does the individual feel that being blind is less desirable than having ESRD or vice versa. A number of methods (e.g., standard gamble, time trade-off, and rating scale) are available to elicit such values from an individual.

With each of these methods, the details of which are discussed later in the chapter, the numerical score represents the relative preference of the individual for the given health state. Other profi le (e.g., psychometric summated rating) non-preference-based instruments (e.g., SF-36) could be used to assign a nu-merical score to a health state. However, the resulting score would not be considered valid because it does not necessarily represent how an individual values the health state. For exam-ple, a non-preference-based instrument may assign the same health status rating to two individuals with ESRD; however, the way each individual values living with ESRD may differ consid-erably. A preference-based measure, however, would account for these differing values. A more detailed discussion of prefer-ence-based measures can be found in Neumann et al.16

Given that the other goal of health care is to improve survival, it is important that preferences for health States account for not only the desirability of the health state but also the length of time spent in the health state. For instance, to choose be-tween the two prevention programs described earlier, an indi-vidual may want to know the duration of blindness and ESRD. One method for accounting for this is to weight the amount of time spent in the health state by the preference score assigned to the health state. The QALY is one such construct to account for both QoL and survival benefi ts in a single measure.17

The QALY construct is recognized as a universal metric given that it can be used to compare the benefi ts of different health programs aimed at preventing or treating different diseases. Despite the simplicity and intuitive appeal of the QALY con-struct, some of its simplifying assumptions have been criti-cized. This has led to the development and proposal of more complex elicitation methods and constructs: the Healthy Year Equivalent (HYE),18_{the Saved Young Life Equivalent (SAVE),}19

the DALY,11_{and Person Trade-Off (PTO).}20_{Although these}

al-ternative preference measures and elicitation methods have theoretical merit, their adoption in economic evaluations by practitioners in the fi eld has been minimal.

MEASURING PREFERENCES

The key to estimating QALYs in an economic evaluation is measuring preferences for the health states of interest. One well-established theory from the fi eld of economics for guid-ing the measurement of preferences is the von Neumann-Mor-genstern expected utility theory.21_{Utilities measured in accord}

with utility theory have interval scale properties, a necessary requirement for the calculation and use of QALYs in economic evaluations. Traditionally, when estimating a utility for a health state, the range of potential values for a given health state is

bounded by 0 and 1, where 1 corresponds to the best imagin-able health and 0 corresponds to death. A QALY is then cal-culated as the sum of the product of the expected number of years of life in the health state and the QoL experienced (i.e., preference score) in each of those years. For example, if an individual assigned a preference score of 0.5 to ESRD and the life expectancy with ESRD was 10 years, then the result-ing number of QALYs would be 5 (0.5 x 10). A more detailed account of QALY measurement and utilities can be found in Torrance and Feeny.22

Given the infl uence of utility theory in decision analysis, utility has become the common term for these preference scores. However, a variant of this term is value score. Theoretically, the difference between utility and value preference scores is the method used to elicit the score. If the method involves uncertainty in the elicitation process, then the score is techni-cally a utility measure; otherwise, the preference score is a value measure.

Preference measurement methods

The three traditional methods for measuring preferences are the standard gamble, time trade-off, and the rating-scale tech-nique. The following describes in brief the mechanics of these methods. A more detailed description of the methods can be found in Froberg and Kane.23

Standard gamble

The standard gamble descends directly from utility theory. Hence, the standard gamble is considered in theory to be the gold standard elicitation method because its theoretical foun-dations are rooted in the axioms of expected utility theory. If an individual’s responses satisfy the axioms for calculating ex-pected utility, the standard gamble elicitation method results in a measure with interval scale properties. Moreover, given that the score is elicited using uncertain outcomes, the mea-sure represents a utility score.

Given that standard gamble accounts for uncertainty, the elicitation technique uses a lottery-based approach to mea-suring preferences. In this technique, an individual is asked to choose between a less desirable (but certain) chronic health state (e.g., blindness) and a gamble offering a certain prob-ability of death or having an improved state of health (e.g., healthy with full vision). For example, a healthy patient with blindness might be given the following two options: (1) do nothing and remain blind and healthy for the remainder of life and (2) a new surgery that has a p% chance of surgical death and a (1-p%) chance of restoring vision for the remainder of life. To estimate the utility score for the state of being blind and healthy, the probability of death from surgery is varied until the patient is indifferent between the two options. Thus, if the patient felt that restoring vision was worth a 5% risk of surgical death, then the preference score for being blind and healthy would be 0.95.

(16)

Time trade-off

Because the standard gamble technique can be diffi cult to ad-minister, the time trade-off technique, which many believe to be easier to administer, was developed.24_{The time trade-off}

technique is used to determine the maximum number of years of life in excellent health an individual is willing to trade-off in order to avoid living the rest of his or her life in a less desirable health state. For example, the same patient with blindness would be asked to choose between the following two options. (1) remain blind for the remainder of life (t years) and (2) sur-gery that restores vision but with a life expectancy of x years (where x # t). Time x is varied until the individual is indifferent between the choice of surgery and no surgery. The preference score is calculated as the ratio x/t. Thus, if the patient felt that 10 years of being blind and healthy was equivalent to 8 years of having full vision and being healthy, then the preference score would be 0.8 (8/10). The time trade-off technique differs from the standard gamble is that the individual is presented with a choice that does not involve risk but certain outcomes. As a result, the preference score generated using the time trade-off technique is considered a value score.

Rating Scale

Another method to elicit health utilities is the rating-scale technique. In the rating-scale technique, an individual directly relates a health state to a linear scale, for example, from 0 to 1, where 0 corresponds to the least desirable health state (e.g., death), and 1 corresponds to the most desirable state of health (i.e., best imaginable health). This kind of scale is sometimes re-ferred to as a “feeling thermometer.” In addition to the feeling thermometer, a variety of cards are used to describe particular states of health (e.g., blindness and ESRD). The analyst instructs the individual to place the various cards on the scale such that each card’s distance from the end points on the feeling ther-mometer corresponds to her or his feelings about the relative differences in desirability among the levels. If the individual places the card representing blindness at 0.8 and the card rep-resenting ESRD at 0.5, then the preference scores for these two health states would be 0.8 and 0.5, respectively. Like the time trade-off technique, the rating scale elicitation method does not involve uncertain outcomes. As a result, the preference score generated using the rating scale technique is considered a val-ue score. A widely used rating scale techniqval-ue that is available in a variety of languages is the EQ-SD visual analogue scale.25

The common theme in the measures described in this section is that they are intended to measure preferences that can then be used to construct a QALY. Moreover, the values elicited us-ing these methods should preserve how individuals rank health states in terms of preference. They differ, however, in that the values elicited from an individual typically are not equivalent at an absolute level. Since each elicitation technique measures slightly different factors using strategies with different psycho-metric properties, it is not surprising that they may yield differ-ent QALY weights at an individual level as well as a population

level. As a result, not all QALYs are measured equally if the values used to construct the QALY are based on sources that used different elicitation methods. Another criticism of these measures is that they measure only individual preferences, which when aggregated may not refl ect how society would measure preferences. As a result, Nord20_{has recommended an}

alternative preference measurement method that measures social preferences, the person trade-off method. Despite the person trade-off method’s theoretical merits, experience in the fi eld with its application relative to the standard gamble, time trade-off, and rating scale has been limited. This primarily is attributable to the diffi culty of administering the method. However, one example of where the person trade-off method has been used is in the construction of DALYs.

SOURCES OF PREFERENCE MEASURE SCORES FOR HEALTH STATES IN ECONOMIC EVALUATIONS

One of the primary challenges with estimating QALYs in an economic evaluation is estimating the preference scores for all of the health states in the decision analysis. Data for mea-suring preferences can be obtained through a variety of ap-proaches: direct, indirect, surveys, and the literature.

Direct approach

In the direct approach, one of the previously mentioned prefer-ence-measurement techniques (e.g., standard gamble) is ap-plied in a sample of subjects that are representative of the economic perspective adopted in the analysis. For instance, if a societal perspective is adopted, then a sampling of the general population is required. Given that many of the subjects may not have experienced the health states of interest (e.g., blind-ness or ESRD), hypothetical health-state descriptions need to be developed to characterize the health states for the subjects. The disadvantage of this approach is that the process can be fairly resource-intensive, requiring trained interviewers, devel-opment of health-state scenarios, and recruitment of subjects. Given the resource requirements associated with this ap-proach, an alternative option has been commonly used to elic-it preferences from a convenience sample of persons actually experiencing the health states (i.e., patients) or a surrogate familiar with the health states of interest (i.e., clinicians). The advantage of this technique is that it is less resource-intensive than measuring preferences in the general population. The dis-advantage of the technique is that the representativeness of the scores with a societal perspective can be questioned. Regardless of whether preferences are elicited from experi-enced or inexperiexperi-enced subjects, many subjects have diffi culty comprehending the tasks requested using a rating scale, the time trade-off, or the standard gamble. The task can be further complicated when the health states that are being rated are hypothetical. As a result, the analyst should critically assess the added value of directly assessing health-state utilities for the

(17)

problem relative to other approaches to assigning utilities to health states (i.e., indirect approach, surveys, or the literature). Indirect approach

If societal preferences are necessary and a direct approach is not feasible or not warranted, then as an alternative the indirect approach can provide utility scores that are population-based and consistent with a societal perspective via an HUI. An HUI classifi es a person’s health state across a number of dimen-sions and then applies a mathematical model to assign a utility score to the health state.26_{This approach works by}

administer-ing a questionnaire to a sample of persons experiencadminister-ing the health states of interest. For example, the EQ-5D HUI ques-tionnaire has fi ve dimensions from which to classify a person’s health: mobility, self-care, usual activities, pain/discomfort, and anxiety/depression. Each dimension has three levels of health. The mobility dimension, for instance, has the following three levels to categorize a person’s ability to get around:

1. I have no problems in walking about. 2. I have some problems in walking about. 3. I am confi ned to a bed.

Collectively, the EQ-5D instrument has 243 different health states from which to classify a person’s health state. Each of the 243 health states has a utility score associated with it ranging from 0 to 1. In addition to the EQ-5D, other HUIs are available in the literature: the Health Utility Index-Mark III27

and the Quality of Well-Being (QWB).28-29_{While the advantage}

of the HUI approach is that it can provide population-based preference scores, the disadvantage is that it still requires pri-mary data collection.

Data from surveys

If primary data cannot feasibly be obtained, information from national surveys can be used.30_{The National Center for Health}

Statistics (NCHS) has developed a number of algorithms for mapping the National Health and Nutrition Examination Sur-vey, the National Medical Expenditures SurSur-vey, and the Na-tional Health Interview Survey data into the QWB as well as into the HUI.8, 29, 31

Occasionally, an analyst may have access to QoL data collected using the SF-36 in the target population. A variant of this ap-proach is to translate these SF-36 QoL scores into utility scores using translation functions reported in the literature. For ex-ample, Fryback et al.32_{reported a method for predicting QWB}

scores from the SF-36, and Nichol et al.33_{reported a method}

for predicting the HUI2 from the SF-36. Data from the literature

The fi nal, and probably most common, approach to assigning preference scores to health states is to use data reported in the literature. Gold et al.34_{published catalogues of}

“off-the-shelf” preference scores for a variety of common health states. If these catalogues do not have the preference scores for the

desired health states, then the fi nal option is to search the lit-erature. To assist with such a search, Tengs and Wallace35

com-piled a catalog of 1000 original preference scores reported in the literature, published databases, books, and government documents. A similar catalogue is available from Bell et al.36

In this section, we have outlined the different sources for pref-erence-measure scores for health states in economic evalua-tions. Prior to investing considerable time into directly mea-suring preferences through primary data collection, it may be worthwhile for the analyst to determine how much the deci-sion problem depends on the values assigned to the relevant health states. If the decision depends greatly on the preference scores, then it may be worthwhile to collect primary data if none are available for the health states of interest from the lit-erature or surveys. Even when data are available for the health states of interest, the analyst should make certain that the methods used to elicit the preferences are consistent between the health states in the problem, to avoid constructing QALYs using different scales.

Recommendation 5.1: Utility assessment for use in QALYs should be preference-based and interval-scaled, on a scale where optimal health has a score of 1 and death has a score of 0. The health state classifi cation system should be generic, that is, not disease-specifi c. Community preferences are desirable; however, when not available, patient preferences may be used.

EXAMPLE OF MEASURING QUALITY ADJUSTED LIFE YEARS FOR HEALTH PROGRAM EVALUATION

In this section, a simplifi ed hypothetical example of a QALY analysis to evaluate a health program designed to prevent chronic disease at birth is presented. This example is intended to illustrate how QALYs may be incorporated into an economic evaluation of alternative health programs. The fi rst step is to identify the options being evaluated. In this example, there are two options. Option A is a program that prevents chronic dis-ease (X) at birth. Option B is a no-program option that would result in the natural progression of chronic disease (X) over an expected lifetime with the disease. The second step is to identify the health states that options A and B will follow. A minimum set of health states should include all those that re-sult in a change in QoL. In this example, two health states are assumed: excellent health and chronic disease X.

Next, life expectancy should be estimated. In this example, two assumptions are made: (1) the life expectancy of an individual for whom chronic disease X has been prevented is 75 years (option A) and (2) the life expectancy of an individual with chronic disease X from birth is 30 years (option B). The utility of living in excellent health is assumed to be 1.0. In this example, it is assumed that the utility associated with living with chronic disease X (option B) is similar to living with type 2 diabetes. Thus, the corresponding utility found in Table 5.1 (i.e., 0.70) is used for the calculations.