Departamento de Ciência da Computa¸cão Instituto de Matemática e Estat´ıstica Universidade de São Paulo Rodrigo M

(1)

Departamento de Ciˆ encia da Computa¸ c˜ ao Instituto de Matem´ atica e Estat´ıstica

Universidade de S˜ ao Paulo

Rodrigo M¨ uller de Carvalho

Implementa¸ c˜ ao de um Framework de Banco de Dados para Apoio ao Projeto e Aplica¸ c˜ ao de Question´ arios

Complexos em Entrevistas Dinˆ amicas

Trabalho de Formatura Supervisionado Supervisores: Prof. Dr. Jo˜ ao Eduardo Ferreira

Prof. Dra. Ariane Machado Lima

S˜ao Paulo, 02 de dezembro de 2013

(2)

Resumo

Carvalho, R. M.Implementa¸cão de um Framework de Banco de Dados para Apoio ao Projeto e Aplica¸cão de Questionários Complexos em Entrevistas Dinâmicas.

Monografia - Instituto de Matemática e Estat´ıstica, Universidade de São Paulo, São Paulo, 2013.

Uma entrevista diagnóstica é uma se¸cão de perguntas e respostas entre profissionais treinados e pessoas sendo investigadas em rela¸cão à presen¸ca ou não de critérios de doen-

¸cas. Entrevistas estruturadas e semi-estruturadas são utilizadas por vários motivos, desde processos de sele¸cão de recursos humanos para vagas de emprego até estudos cl´ınicos e epi- demiológicos. Na área de pesquisa em saúde, especialmente na área de pesquisa em saúde mental, há um amplo uso destas entrevistas, apresentando um desafio diferente, já que na utiliza¸cão de um método aberto é dif´ıcil seguir um padrão deixando espa¸co para interpreta¸cões pessoais, baixa confiabilidade e confusão conceitual. A maneira encontrada para contornar esses problemas foi a cria¸cão de critérios operacionais que unifiquem termos e conceitos. Em psiquiatria a entrevista Structured Clinical Interview for DSM Disorders – SCID é amplamente utilizada e é caracterizada pela cobertura de um critério operacional e por um grafo complexo de perguntas. A investiga¸cão de uma desordem psiquiátrica para um indiv´ıduo é um dos caminhos poss´ıveis deste grafo, e cada passo deste caminho é dinamicamente gerado pelas respostas dadas.

Este trabalho desenvolve um framework de banco de dados chamadoDynamic Interview Database – DIDB, que permite a cria¸cão, manuten¸cão e versionamento de questionários e a realiza¸cão destas entrevistas de acordo com suas estruturas internas, possivelmente complexas, com a utiliza¸cão de modelagem de banco de dados com alto n´ıvel de abstra¸cão e conceitos de transa¸cões longas. Mais concretamente, o DIDB deve apoiar entrevistas que são caracterizadas pela alta frequência de atualiza¸cão, número grande de perguntas de alguns tipos e muitos caminhos poss´ıveis destas perguntas baseados nas suas respostas.

(3)

Sum´ ario

1 Introdu¸c˜ao 1

2 Trabalhos Relacionados 3

2.1 Projeto de meta-question´ario e dinamismo do question´ario . . . 3

2.2 Re´uso de perguntas . . . 4

2.3 Gerenciamento de m´odulos . . . 5

2.4 Disponibilidade . . . 5

2.5 Localiza¸c˜ao da armazenagem dos dados . . . 5

2.6 Controle de acesso . . . 5

3 Conceitos Fundamentais 7 4 Implementa¸c˜ao 9 4.1 Meta-question´ario . . . 9

4.1.1 M´odulos . . . 9

4.1.2 Elementos . . . 9

4.1.3 Controle de fluxo . . . 12

4.1.4 Pergunta alternativa autom´atica . . . 14

4.1.5 Pergunta score autom´atico . . . 14

4.2 Instancia¸c˜ao do question´ario . . . 15

4.3 Ambiente de desenvolvimento do DIDB . . . 15

5 Estudo de Caso 17 5.1 Atividades . . . 19 6 Rela¸c˜ao da Experiˆencia Obtida no Trabalho com o Curso 20

7 Resultados 21

8 Conclus˜ao 22

(4)

Lista de Figuras

1 Resumo do modelo conceitual do DIDB mostrando a modelagem do questio- nário e seus elementos, são omitidos algumas entidades para melhor visualiza¸cão. 12 2 Resumo do modelo conceitual do DIDB mostrando a agrega¸cão info-pulo. São

omitidos atributos e heran¸cas para melhor visualiza¸c˜ao. . . 13 3 Resumo do modelo conceitual do DIDB mostrando a agrega¸c˜ao info-alternativa-

automática. São omitidos atributos e heran¸cas para melhor visualiza¸cão. . . 14 4 Resumo do modelo conceitual do DIDB mostrando a agrega¸cão info-score-

automático. São omitidos atributos e heran¸cas para melhor visualiza¸cão. . . 15 5 Resumo dos desvios encontrados no SCID . . . 18

(5)

1 Introdu¸ c˜ ao

Na área de saúde mental são amplamente utilizadas entrevistas diagnósticas que são se¸cões de perguntas e respostas entre profissionais treinados e pessoas sendo investigadas em rela¸cão à presen¸ca ou não de critérios de doen¸cas. Isso porque as respostas verbais de indiv´ıduos são medidos por meio de vários métodos psiquiométricos associados com as perguntas realizadas [WA11] apoiados em um critério operacional que unifica termos e conceitos[APA12][WHO92]. Essa cobertura fornece uma padroniza¸cão que diminui as interpreta¸cões pessoais, confusões conceituais e aumenta a confiabilidade de um diagnóstico e a confiabilidade de dados para pesquisas posteriores.

Uma entrevista então é a aplica¸cão de um questionário pelo profissional em uma pessoa sendo entrevistada. Esses questionários variam em rela¸cão à sua estrutura desde os que devem ser respondidos da primeira à última até os que são caracterizados por um grafo complexo de perguntas conectadas por uma ordem pré-fixada mas podendo ser alterada por pulos internos em qualquer sentido, para frente ou para trás, que dependem das respostas anteriores. Dependendo do objetivo, as entrevistas ainda podem ser realizadas com a mesma pessoa algumas vezes.

O Instituto de Psiquiatria da USP e o grupo de banco de dados do IME – USP assumiram o desafio de criar uma ferramenta automatizada para realizar tais entrevistas com o objetivo de apoiar de forma mais confiável diagnósticos e pesquisa em psiquiatria, facilitar a recupera¸cão de dados para análises estat´ısticas, por meio do armazenamento das respostas em um sistema de banco de dados, identifica¸cão de padrões nas pesquisas realizadas e mostrar as perguntas em uma interface gráfica padronizada em um sistema acess´ıvel pela Internet.

A complexidade da estrutura dos questionários apresenta um grande desafio para a área de modelagem de banco de dados, especialmente quando as entrevistas são implementadas com o aux´ılio de computadores. O framework Dynamic Interview Database – DIDB desenvolvido neste trabalho de formatura supervisionado é umframework de banco de dados que permite a cria¸cão, manuten¸cão e versionamento de questionários assim como a execu¸cão de tais entrevistas seguindo suas estruturas internas possivelmente complexas. O DIDB possui dois modos importantes: edi¸cão de questionário e resposta. No modo de edi¸cão, questioná- rios podem ser criados e editados utilizando diferentes tipos de elementos: alertas, pulos, planilhas e perguntas, que dependem do tipo de resposta esperada: numérica, texto, data, escolha simples/múltipla e automática.

O modo de resposta é automaticamente gerado pela informa¸cão armazenada no modo de edi¸cão e nesse modo um questionário escolhido é executado e respondido e as respostas são armazenadas para este entrevistado espec´ıfico. Baseado nas respostas, o framework segue o fluxo de perguntas definido para este questionário e, além disso, o DIDB gerencia a versão dos questionários e o histórico de entrevistas para cada entrevistado. Finalmente, um controle de acesso gerencia quais usuários podem criar, editar questionários ou realizar entrevistas. Com estas funcionalidades o DIDB é capaz de atender as demandas principais de questionários com estruturas complexas em estudos baseados em entrevistas.

No cap´ıtulo 2, são caracterizadas e delimitadas as solu¸cões de ferramentas que realizam os mesmos desafios desse trabalho. Os conceitos fundamentais são apresentados no cap´ıtulo 3. Os detalhes da modelagem, regras de de projeto de questionário e tecnologias utilizadas são detalhadas no cap´ıtulo 4. O estudo de caso do projeto de um questionário complexo e as atividades realizadas pelos participantes do projeto são descritos no cap´ıtulo 5. Os desafios e frustra¸cões encontrados, lista das disciplinas cursadas no BCC mais relevantes para o trabalho, a rela¸cão da experiência obtida no trabalho com o curso e que passos o aluno tomaria para aprimorar os conhecimentos relevantes para esta atividade, se o aluno

(6)

fosse continuar atuando na área em que realizou o trabalho são descritos no cap´ıtulo 6. Os resultados obtidos por esse trabalho são mostrados no cap´ıtulo 7 e a conclusão no cap´ıtulo 8.

(7)

2 Trabalhos Relacionados

Diferentes questionários eletrônicos estão amplamente dispon´ıveis, sendo utilizados para capturar dados e armazená-los em banco de dados ou outros formatos eletrônicos mais simples [HHS⁺09, LSFA09, BSB⁺11]. Entretanto, especialmente quando algum dinamismo é necessário, a maioria deles são adaptados para uma entrevista espec´ıfica ou estudo de pesquisa espec´ıfico. Então, nessa abordagem não é poss´ıvel separar a fase de projeto (descri¸cão do questionário) e a fase de instancia¸cão (aplica¸cão do questionário para uma pessoa ou paciente espec´ıfico). Um exemplo emblemático em pesquisa psiquiátrica é oComputer-Assisted SCID II System (CAS II ES) uma solu¸cão comercial para realizar o dinamismo complexo do questionário SCID-II [FGW⁺]. Entretanto, por ser espec´ıfico para esse questionário, não

´

e uma solu¸c˜ao geral.

Para permitir a cria¸cão de questionários gerais, algumas ferramentas permitem o projeto de um meta-questionário e instancia¸cões posteriores em entrevistas. Algumas dessas ferramentas são para propósitos gerais, como LimeSurvey (http://www.limesurvey.org), SurveyMonkey (http://www.surveymonkey.com), Toluna Quicksurveys (https://

www.quicksurveys.com), Google Forms (www.google.com/drive), KwikSurveys (http://kwiksurveys.com), SurveyGizmo (http://www.surveygizmo.com) e Ques- tionPro (http://www.questionpro.com). Outras são mais adequadas para estudos cl´ınicos, como o Dados-Prospective [NSH⁺06] e REDCap (Research Electronic Data Cap- ture) [HTT⁺09]. Todos eles são ferramentas web. Nessa se¸cão, nós comparamos essas ferramentas com o DIDB levando em considera¸cão algumas caracter´ısticas que consideramos importantes em um sistema para grupos de pesquisa que usam entrevistas cl´ınicas complexas:

projeto de meta-questionário, dinamismo do questionário, reúso de perguntas, gerenciamento de módulos, disponibilidade, armazenamento de dados e controle de acesso.

2.1 Projeto de meta-question´ ario e dinamismo do question´ ario

O projeto de meta-questionário é a defini¸cão de perguntas, layout e a ordem de visualiza¸cão das perguntas de um questionário espec´ıfico. Uma ferramenta desejável de projeto de meta-questionário deve permitir a especifica¸cão de diferentes tipos de perguntas e a defini¸cão do dinamismo do questionário. A disponibilidade de alguns tipos de perguntas deve permitir ao usuário definir o tipo de pergunta dependendo do tipo de resposta (numérica, texto, sele¸cão única/múltipla, etc). A defini¸cão do dinamismo do questionário permite ao usuário especificar os vários caminhos (ordens das perguntas) que um questionário pode apresentar, definindo o comportamento dinâmico do questionário. Todas as ferramentas dessa se¸cão permitem a especifica¸cão de alguns tipos de perguntas, a grande diferen¸ca entre elas é como implementam o comportamento dinâmico do questionário.

A DADOS-Prospective¹ é uma ferramenta para coleta de dados de ensaios cl´ınicos. En- tretanto, nenhum dinamismo é permitido. O questionário gerado é estático no sentido que todas as perguntas são sempre apresentadas na mesma ordem, pois não há uma maneira de criar dependências entre perguntas baseadas nas suas respostas.

As ferramentas LimeSurvey e REDCap incorporam algum dinamismo durante a fase de projeto de questionário. Ambas permitem definir uma condi¸cão para uma pergunta espec´ıfica ser exibida no questionário. Por exemplo, a pergunta “Qual a quantidade de bebiba alcoólica que você ingere?” será mostrada somente se uma pergunta anterior “Você consome bebidas alcoólicas?” tiver sido respondida como “sim”. Entretanto, a solu¸cão implementada por essas ferramentas é limitada a exibi¸cão ou não de uma única pergunta.

1Quando ferramenta é omitido para evitar redundâncias é utilizado: Anome da ferramenta.

(8)

Já as ferramentas SurveyMonkey, Toluna Quicksurveys, Google Forms e KwikSurveys implemetam lógica de ramifica¸cão baseada em uma única pergunta, um dinamismo mais poderoso do que um controle simples de visualiza¸cão de perguntas. Esse tipo de lógica de ramifica¸cão permite a um questionário pular para uma pergunta diferente para cada alternativa poss´ıvel de uma pergunta de sele¸cão única. Entretanto, SurveyMonkey eToluna Quicksurveys não permitem pular para perguntas anteriores.

A lógica de ramifica¸cão baseada em uma única pergunta tem duas limita¸cões: primeiro, a condi¸cão de pulo é baseada na resposta de uma única pergunta; segundo, o pulo é executado no momento que a pergunta é respondida. Então, esse mecanismo não é adequado para projetar um questionário que em pontos espec´ıficos, uma decisão de qual caminho deve ser escolhido é baseado em mais que uma resposta anterior (não necessariamente envolvendo a pergunta imediatamente anterior).

Esse cenário necessita de uma “ramifica¸cão postergada” baseado em algumas perguntas anteriores, que é implementado nas ferramentasSurveyGizmo eQuestionPro, mas com algumas ressalvas. NaSurveyGizmo, deve-se tomar algum cuidado para definir essa ramifica¸cão corretamente. O questionário é organizado em páginas, cada página tendo uma ou mais perguntas e condi¸cões de ramifica¸cão postergadas. Os alvos dos pulos são páginas. Então, deve ser realizada uma divisão cuidadosa de perguntas e defini¸cões das ramifica¸cões entre páginas. Além disso, para cada ramifica¸cão postergada, somente um alvo para o pulo pode ser definido quando a condi¸cão de ramifica¸cão é satisfeita. Se a condi¸cão não é satisfeita, o questionário segue para a próxima pergunta. Na QuestionPro, a condi¸cão de ramifica¸cão postergada deve ser definida como parte da pergunta imediatamente anterior da pergunta alvo, mesmo que essa pergunta não esteja envolvida na condi¸cão. Essa implementa¸cão pode introduzir erros quando o meta-questionário é editado, uma vez que uma mudan¸ca na posi-

¸cão dessa pergunta irá também alterar a posi¸cão da avalia¸cão da condi¸cão de ramifica¸cão.

Além disso, a QuestionPro não permite pular para perguntas anteriores. Diferente da Sur- veyGizmo, dois alvos da ramifica¸cão podem ser definidos: quando a condi¸cão é satisfeita e quando não é. A implementa¸cão de ramifica¸cões postergadas de SurveyGizmo e Ques- tionPro tem duas limita¸cões adicionais. Primeiro, não possuem condi¸cões aninhadas onde alguns pares condi¸cão/alvo são definidos e o fluxo se altera para o alvo da primeira condi¸cão satisfeita. Segundo, condi¸cões de ramifica¸cão são somente baseadas em conjun¸cões e disjun-

¸cões lógicas de respostas dessas perguntas, não permitindo avalia¸cões mais complexas tais como quantificadores multi-existenciais. Em lógica de predicados, o quantificador existencial é interpretado como “existe pelo menos um”. Aqui, nós definimos o termo quantificador multi-existencial para significar “existe pelo menos um x”, onde x é um inteiro positivo. Em nosso conhecimento, nenhuma ferramenta dispon´ıvel permite essa funcionalidade.

O DIDB supera todas as limita¸cões mencionadas implementando ramifica¸cão postergada com condi¸cões aninhadas, quantificadores multi-existenciais e permitindo pulos para perguntas anteriores. O “pulo” do DIDB é um elemento do meta-questionário que tem uma posi¸cão espec´ıfica (que indica o momento que deve ser avaliado) e permite múltiplos alvos poss´ıveis.

Cada alvo é um outro elemento de questionário, não podendo ser um outro pulo.

2.2 Re´ uso de perguntas

O reúso de perguntas permite ao usuário definir uma pergunta uma única vez e reutilizá-la em vários questionários diferentes.

Das ferramentas citadas, um mecanismo real de reúso de perguntas somente é poss´ıvel no QuestionPro. LimeSurvey permite algum reúso de perguntas, mas não de uma maneira direta. Cada pergunta a ser reutilizada tem que primeiro ser exportada para um arquivo se-

(9)

parado e então importada desse arquio no novo questionário. As outras ferramentas somente permitem copiar e colar um questionário inteiro ou modelo pré-existente.

O DIDB permite o reúso de todos elementos, perguntas, alertas, pulos e planilhas e todas as entidades que não sejam únicas, como respostas alternativas, textos de perguntas e módulos.

2.3 Gerenciamento de m´ odulos

Nehuma das ferramentas implementam o conceito de módulos de questionários. Dados- Prospective eREDCap implementam a no¸cão de “projeto” composto por um ou mais formulá- rios de dados, mas eles são questionários independentes conectados somente pela identifica¸cão do entrevistado. A versão mais completa da ferramenta QuestionPro permite ramifica¸cão postergada para outros questionários. Entretanto, quando o pulo é feito o questionário atual

´

e considerado finalizado. Além disso, se o alvo do pulo é um questionário já respondido, uma nova instância do questionário é apresentada. Portanto, essa não é uma solu¸cão para gerenciamento de módulos para um questionário complexo único.

Como descrito na se¸cão 4, o DIDB implementa módulos com funcionalidades distintas - screening, obrigatórios, não-obrigatórios e laudo - para poder apoiar projetos de questionários complexos de diagnóstico.

2.4 Disponibilidade

Dados-Prospective e Limesurvey são livres e de código aberto, mas eles apresentam as limita¸cões descritas anteriormente. REDCap não é de código aberto, mas é gratuito para institui¸cões participantes do REDCap Consortium Partners. Google Forms eToluna Quick- surveys são gratuitos. Para todas as outras ferramentas, somente a versão básica é gra- tuita, que geralmente não permitem as caracter´ısticas dinâmicas descritas nessa se¸cão e limitam o número de convites de email, respostas de questionário, tipos de perguntas e meta-questionários. Suas licensas das versões mais completas, que apresentam as caracter´ıs- ticas descritas nesse trabalho, custam de 19 até 159 dólares por mês.

2.5 Localiza¸ c˜ ao da armazenagem dos dados

Para alguns tipos de aplica¸cão, por exemplo, estudos cl´ınicos, a confidencialidade dos dados é obrigatória. Portanto, muitos usuários exigem que a armazenagem dos dados estejam em seus servidores para poder controlar o acesso aos dados.

QuestionPro, Toluna Quicksurvey, SurveyMonkey, KwikSurvey, SurveyGizmo e Google Forms mantém os meta-questionários e respostas de questionários em seus própios servidores, permitindo ao usuário baixar os dados. Os dados do REDCap são armazenados nos servidores da institui¸cão afiliada. LimeSurvey oferece duas op¸cões: armazenagem no ser- vidor do LimeSurvey ou baixar a ferramenta de armazenagem dos dados localmente. Já o Dados-Prospective e o DIDB permitem ao usuário possuir e gerenciar o banco de dados.

2.6 Controle de acesso

No ambiente acadêmico ou de pesquisa é comum a existência de alguns grupos de pesquisa, cada um desenvolvendo projetos diferentes com membros realizando tarefas diferentes, mas não mutuamente excludentes: projeto de meta-questionário, aplica¸cão de questionários (entrevistas), gera¸cão de relatórios, análise de dados, etc. Além disso, l´ıderes de grupos devem ser capazes de compartilhar seus projetos (dados de meta-questionário ou de respostas)

(10)

com outros l´ıderes. Portanto, um controle de acesso apropriado com diferentes pap´eis se faz necess´ario.

Toluna Quicksurveys, SurveyMonkey e Google Forms são sistemas mono-usuários. A versão mais completa das ferramentas QuestionPro, KwikSurvey e SurveyGizmo são multi- usuários oferecendo algum controle de permissões baseado em tarefas, cobrando proporci- onalmente ao número de usuários. KwikSurvey e SurveyGizmo também oferecem algum apoio ao gerenciamento de grupos e times, mas o compartilhamento de projetos não é di- reto. Dados-Prospective eLimeSurvey são multi-usuários com gerenciamento de permissões, mas sem oferecer atribui¸cão de questionários diferentes a times diferentes. REDCap tem um controle de acesso baseado em projetos. Cada projeto tem uma lista de usuários atribu´ıdos, cada um com privilégios espec´ıficos para esse projeto. O projeto pode também controlar acesso de dados a grupos, onde cada usuário pode acessar dados de resposta que foram inseridos por usuários que pertencem a seu grupo.

O DIDB fornece além do controle do banco de dados, um controle de acesso baseado em papéis, por exemplo, projetista de questionário, entrevistador, etc. Esse controle fornece servi¸cos, nesse caso páginas, que cada papel tem acesso. Ainda possui um controle de acesso a dados que relaciona um usuário a um ou mais grupos de pesquisa e o usuário somente visualiza os dados de questionário e respostas de seus respectivos grupos.

(11)

3 Conceitos Fundamentais

Conjuntos grandes de dados moleculares e cl´ınicos na biologia moderna e intitui¸cões de pesquisa em medicina têm introduzido novos requisitos para sistemas de bancos de dados e de processamento de informa¸cões. Por exemplo, em rotinas t´ıpicas de diagnóstico em medicina ou processos de negócio muitos questionários são realizados concorrentemente e respeitando as especificidades de cada paciente ou pessoa. Esses requisitos demandam um gerenciamento preciso de transa¸cões longas e projeto de banco de dados. Além disso, novos questionários são frequentemente redefinidos. Desta forma os usuários tem que ser auxiliados para exe- cutar o questionário correto no tempo apropriado. Incompatibilidades e dificuldades entre dados novos e já existentes dificultam integrar e analisar todo conhecimento descoberto.

Esse problema inclui o processo de descobrimento do conhecimento cient´ıfico, que necessita processar frequentemente atualiza¸cões para o refinamento das hipóteses cient´ıficas. Como os novos dados são automaticamente gerados e processados, abordagens manuais rapidamente se tornam muito caras ou até mesmo inviáveis. Consequentemente, uma solu¸cão de longo prazo para o problema de integra¸cão de dados requer ferramentas de processamento de informa¸cões automatizadas formalmente corretas, bancos de dados evolutivos com a abordagem de transa¸cões longas. O framework DIDB foi projetado seguindo essa abordagem de integra¸cão de dados para poder reduzir os problemas nos estudos de entrevistas baseados em questionários.

Um exemplo concreto é o gerenciamento de entrevistas utilizando um sistema de banco de dados para estudar os transtornos bipolar e obsessivo compulsivo que são caracterizados pela alta frequência de atualiza¸cões, número imenso de perguntas de alguns tipos e muitos fluxos poss´ıveis dessas perguntas guiados por suas respostas. A integra¸cão de novos dados de um questionário se torna muito lenta quando o processo de cria¸cão e altera¸cão demanda que as ferramentas de software sejam atualizadas continuamente para refletir essas altera¸cões.

Como resultado, atrasos na evolu¸cão da ferramenta, presen¸ca de erros no banco de dados e ausência de gera¸cão de interfaces de resposta podem diminuir o progresso cient´ıfico. Para poder superar esses obstáculos, um processamento não tradicional de transa¸cões e uma estrutura sofisticada de banco de dados devem acomodar essas caracter´ısticas desafiadoras e processos dinâmicos.

Em termos das caracter´ısticas do processamento de transa¸cões, a meta do DIDB é o desenvolvimento de fluxos dinâmicos que capturam as propriedades compostas de perguntas e respostas. Em contraste com abordagens orientadas a processos, nós adotamos a abordagem WED-flow (Work/Event/Data-flow) [FTMP10] [FBTP12] que propõe um mecanismo genérico de processamento de eventos para modelagem de transa¸cões longas tal que modelos possam ser facilmente alterados quando necessário. Baseado em algoritmos adaptados e ex- tendidos originalmente criados para modelagem de transa¸cões extendidas, WED-flow aplica consultas cont´ınuas [LPT99] em banco de dados relacionais para poder capturar e manipular eventos. Isso também se aplica no conceito de banco de dados multi-versionados [LBM⁺05]

para armazenar os resultados de processamentos de eventos e manter o hist´orico dos dados.

Um aspecto importante desta abordagem é o controle de fuxo como uma consequência e não como uma dependência, em oposi¸cão à modelagem a priori herdadas na maioria das linguagens executáveis e abordagens formais. O controle de fluxo ocorre quando condi¸cões são satisfeitas durante a execu¸cão do processo, o que aumenta a flexibilidade se comparado a mudan¸cas em modelos formais, por exemplo baseados em álgebras de processo ou redes de Petri, ou especifica¸cões sintáticas. Esses diferentes impactos das mudan¸cas de modelagens são mostrados em [FBTP12] e [GBPF12].

Em termos de estrutura de banco de dados, a meta do DIDB ´e armazenar dados de meta-

(12)

questionários para poder permitir abordagens históricas e multi-versionadas. Entretanto, a modelagem conceitual, lógica e f´ısica de banco de dados completa e detalhada [EN10]

antes de come¸car o desenvolvimento da aplica¸cão tem se mostrado insuficiente para lidar com dom´ınios de aplica¸cões complexas e a mudan¸cas de requisitos de negócio e pesquisa.

Uma abordagem alternativa para superar os limites impostos por uma modelagem de banco de dados a priori é o uso da abordagem de modelo de banco de dados evolucionário que é iterativo e incremental para realizar a modelagem do banco de dados utilizando a abordagem de naked objects [PM02]. No desenvolvimento do DIDB integramos o modelo de banco de dados evolucionário e abordagem de naked objects o que ajuda a fazer os modelos do sistema mais efetivos e modularizados, no sentido que esta abordagem pode acomodar mais facilmente os conceitos principais para modelagem de banco de dados especialmente para altera¸cões futuras de requisitos como mudan¸cas nas especifica¸cões da armazenagem de meta- questionários, regras internas e regulagens externas de fluxos de perguntas, e novas consultas e medidas requisitadas pelos pesquisadores.

(13)

4 Implementa¸ c˜ ao

O DIDB é baseado em dois conceitos importantes: meta-questionário² e instancia¸cão de questionário³: um meta-questionário é a representa¸cão de todos os elementos do questionário como perguntas de alguns tipos diferentes, instru¸cões para o entrevistador e regras lógicas para pulos (por exemplo, se uma resposta espec´ıfica relacionada a drogas é sim vá para uma pergunta sobre comportamento alcoólico). Uma instância de questionário é criada quando um entrevistador aplica um questionário a um entrevistado criando um histórico de todas as respostas. Para cada aplica¸cão do par entrevistado-entrevistador uma instância é criada.

Os dois conceitos, meta-questionário e instancia¸cão de questionário são armazenados em um sistema de banco de dados relacional.

4.1 Meta-question´ ario

Um meta-questionário é modelado como uma entidade questionário e é composta por um ou mais módulos, cada questionário é identificado pelo seu nome e versão.

4.1.1 M´odulos

Cada módulo é identificado pelo seu nome e pode ser de quatro tipos: obrigatório, não- obrigatório,screening e laudo.

Um questionário deve ser respondido de acordo com a seguinte ordem: Primeiramente o módulo screening, se presente, realiza a sele¸cão dos módulos não-obrigatórios que devem ser respondidos e se não estiver presente, todos os módulos não-obrigatórios devem ser respondidos. Depois os módulos obrigatórios são respondidos seguindo uma ordem pa- drão armazenada no questionário. Finalmente os módulos não-obrigatórios são respondidos usando uma ordem arbitrária que o entrevistador decide. O módulo laudo pode ser ativado em qualquer momento da entrevista e é composto de perguntas automáticas que gera uma visão resumida do questionário.

Dentro de cada m´odulo temos uma sequˆencia cadastrada de elementos, um elemento pode ser do tipo pergunta, alerta, planilha ou pulo.

Com a defini¸cão sobre a sequência de quais conjuntos de módulos são respondidos primeiro, a ordena¸cão de módulos obrigatórios e a sequência de elementos dentro dos módulos, temos o fluxo natural de um questionário. Isto é, sem alterar esse fluxo (com a inser¸cão de pulos) todas as perguntas serão respondidas em uma mesma ordem, com exce¸cão dos módulos não-obrigatórios que o entrevistador decide qual quer aplicar.

4.1.2 Elementos

Dentro de um question´ario identificamos quatro elementos fundamentais em sua estrutura: alerta, pulo, planilha e pergunta.

Um alerta é uma instru¸cão ao entrevistador como, por exemplo, “Preste aten¸cão se o entrevistado está mentindo ou omitindo algo” ou “Este módulo irá avaliar o transtorno obssessivo compulsivo”.

Um elemento pulo é um ponto de controle de fluxo que irá verificar uma ou mais condi¸cões booleanas e caso uma delas seja verdadeira irá para o elemento indicado na expressão. Se mais de uma expressão for verdadeira irá para o destino da primeira expressão com avalia¸cão verdadeira.

2Um meta-questionário é denominado também por questionário.

3A instancia¸cão de questionário também é denominada de aplicar ou responder um questionário.

(14)

Um elemento do tipo pergunta é a variável de interesse do pesquisador, por exemplo no caso de pesquisa em saúde mental em que as respostas de indiv´ıduos são medidas por métodos psicométricos, então a pergunta define o que está sendo investigado e o dom´ınio permitido para as respostas. A pergunta é classificada de acordo com seu tipo de resposta e intervalos válidos, gerando uma restri¸cão para cada tipo com o objetivo de garantir a qualidade das respostas dadas. Os tipos de perguntas do DIDB são texto, numérica, likert, alternativa e data. A cada pergunta pode-se associar um texto de pergunta que é a maneira do entrevistador realizar a pergunta ao entrevistado, por exemplo a variável de interesse (a pergunta), é “Horas de sono” e o texto da pergunta é “Quantas horas você dorme por dia?”.

Caso a pergunta seja igual à maneira de se fazer ao entrevistado, não é necessário incluir nessa pergunta um texto de pergunta. A pergunta ainda possui um código de pergunta que

´

e um identificador da pergunta no estudo ou question´ario.

Uma pergunta texto recebe um texto como resposta e define o limite de caracteres que deve ser respeitado por essa resposta. Exemplos de perguntas do tipo texto são: “Número do CPF” com limite de 12 caracteres, “Como você se sente hoje?”, com limite de 255 caracteres para indicar que a resposta não pode ser muito longa ou então com limite de 2000 caracteres para indicar que pode-se dar uma resposta mais longa.

Uma pergunta numérica que pode ser real ou inteira possui a restri¸cão de dom´ınio que garantem os intervalos dos respectivos valores numéricos. Esta restri¸cão de dom´ınio também pode ser expressa usando pergunta descore automático que dá uma resposta com valor real usando uma expressão aritmética cadastrada no meta-questionário que assegura que não exista erros de contas do entrevistador. Exemplos de perguntas númericas: no dom´ınio dos inteiros, “Qual a sua idade?” e o intervalo válido de 18 à 120, indicando uma faixa etária válida; no dom´ınio dos reais: “Qual seu salário l´ıquido atual?”, com intervalo válido de 951.40 até 2300.50 indicando uma faixa salarial válida; Já uma pergunta score automática tendo uma expressão cadastrada P1/(P2∗P2), ondeP1 e P2 são perguntasP1 é qual o peso eP2 qual a altura, responderá automaticamente a pergunta “Qual seu Índice de Massa Corporal – IMC”, desde queP1 e P2 já foram respondidas no questionário.

Uma pergunta likert é uma escala de valores fixos discretos com uma descri¸cão inicial e uma final e o entrevistado escolhe um desses valores. Podemos citar como exemplo a pergunta “Como está seu humor hoje?”, com a descri¸cão inicial “ótimo”, tendo 5 poss´ıveis escolhas até a descri¸cão final “péssimo”.

Uma pergunta alternativa possui um conjunto ordenado de valores numéricos e cada valor possui um rótulo associado que é resposta do entrevistado à pergunta. Existem três tipos de perguntas alternativas que diferem em rela¸cão à sele¸cão que permite ser feita: única, na qual somente um valor do conjunto pode ser escolhido, por exemplo, “Você sente dor nas costas?”

e o conjunto ordenado {1.0,2.0} com rótulos “sim” e “não” respectivamente; múltipla, na qual pode-se selecionar um ou mais valores do conjunto, por exemplo, “Quantos filhos você tem?” e o conjunto ordenado {−1.0,1.0,2.0,3.0} com rótulos “0”, “1”, “2” e “3 ou mais”, respectivamente; e automática, que é uma escolha única calculada pelo sistema utilizando uma expressão booleana pré-cadastrada. No exemplo dado da pergunta alternativa de sele¸cão

´

unica para cada elemento do conjunto de respostas irá ter uma expressão booleana, que será baseada em respostas dadas anteriormente, cada uma expressando quando uma delas é verdadeira, então o sistema responde esta pergunta automaticamente na primeira expressão verdadeira.

Já uma pergunta data possui como dom´ınio um intervalo de datas (m´ınimo e máximo) que são aceitas como resposta, por exemplo, “Quando foi a última vez que você fez uma doa¸cão de sangue?” e o intervalo permitido de 01/01/2010 até 01/01/2013.

Todos os tipos de pergunta podem ainda possuir 5 op¸c˜oes adicionais de respostas do

(15)

tipo sele¸cão única, para capturar semânticas de respostas que não são feitas pelas restri¸cões definidas pelo tipo e valores válidos ou comportamentos do entrevistado que podem surgir durante uma entrevista, e que são: “não se aplica”, “não quero responder”, “não sei”, “sem resposta” e “adiar resposta”. O não se aplica é utilizado quando uma restri¸cão de resposta não pode ser satisfeita, o não quero responder é utilizado quando o entrevistado não deseja responder uma pergunta, o não sei quando o mesmo não sabe responder uma pergunta, sem resposta é utilizado quando não se conhece a resposta de uma pergunta e o adiar resposta coloca a pergunta para ser respondida posteriormente durante a entrevista.

Um elemento planilha é uma combina¸cão de uma ou mais perguntas a um ou mais itens que permite uma visualiza¸cão compacta. Cada item possui um código para que combinado com o código da pergunta identifique unicamente cada célula de resposta. A planilha pode ser visualizada tanto com as perguntas na horizontal e os itens na vertical quanto o contrário.

Um exemplo ´e uma planilha com 2 perguntas e 3 itens: As perguntas s˜ao “Exame realizado?”

e “Data do exame” e os itens correspondem a cada exame “Ultrassonografia”, “Hemograma completo” e “Eletrocardiograma”. Esta planilha será visualizada no formato tabular. Sem a planilha ter´ıamos que ter 3×2 = 6 perguntas: “Você já fez ultrassonografia?”, “Quando?” e outras 4 para os exames restantes. Isso permite rapidez do preenchimento pela redu¸cão da quantidade de elementos do questionário e uma visualiza¸cão mais agradável desse tipo de agrupamento de perguntas.

Uma parte do modelo conceitual ilustrando a modelagem do questionário e elementos do questionário é mostrado na figura 1. O modelo conceitual completo pode ser encontrado em http://linux.ime.usp.br/~rmuller/mac499/modelo.html.

(16)

Figura 1: Resumo do modelo conceitual do DIDB mostrando a modelagem do questionário e seus elementos, são omitidos algumas entidades para melhor visualiza¸cão.

4.1.3 Controle de fluxo

Para realizar o controle de fluxo é inserido um pulo na posi¸cão do questionário em que se deseja que tal controle seja realizado. Para representar a informa¸cão necessária utilizamos uma agrega¸cão info-pulo. Essa agrega¸cão possui os seguintes relacionamentos: se refere à um questionário e a um módulo em que o pulo pertence, possui um destino de pulo com o elemento e o módulo em que será realizado o pulo, uma ou mais perguntas nos quais a expressão será constru´ıda e uma expressão booleana que descreve as condi¸cões necessárias para durante a instancia¸cão do questionário a ser verificada com base nas respostas dadas as perguntas.

A express˜ao booleana ´e da forma:

<expressao> ::= <termo> = VALOR | <termo> < VALOR | <termo> <= VALOR

| <termo> > VALOR | <termo> >= VALOR

<termo> ::= <soma> | <termo> E <termo> | <termo> OU <termo> | (<termo> E

(17)

<termo>) | (<termo> OU <termo>)

<soma> ::= RESPOSTA | <soma> + RESPOSTA

Na qual VALOR é um número real que diz se a expressão é verdadeira ou falsa utilizando

=, <,≤(<=), >e≥(>=) com o significado usual dos números reais e RESPOSTA é o valor real dado a uma resposta de uma pergunta, se essa tiver valor inteiro é traduzido para seu valor real.

Um exemplo de controle de fluxo pode ser dado por duas perguntas P1 e P2 dentro de um módulo qualquer e nessa sequência, onde P1 é uma pergunta alternativa única “Sexo”

com alternativas {1.0,2.0} com rótulos “masculino” e “feminino” respectivamente. A pergunta P2 é “Você já engravidou?”, com alternativas “{1.0, e 2.0}” com rótulos “sim” e “não”

respectivamente. Então coloca-se um ponto de verifica¸cão, um pulo, entre as duas perguntas (tornando essa sequência do módulo como P1 – Pulo – P2) com a seguinte expressão:

P1 = 2.0 e caso seja verdadeira aponte para uma outra pergunta que não seja exclusiva do sexo feminino. Caso a expressão seja falsa (nesse caso a pessoa é uma mulher) a pergunta P2 será feita.

Na figura 2 é mostrado a modelagem utilizada para descrever as informa¸cões necessárias para realizar o controle de fluxo: Um pulo contém um ou mais info pulo, esse info pulo faz parte de um questionário e um módulo (em que o pulo está) e irá pular para um elemento de um módulo qualquer do questionário caso a expressão, que se refere a uma ou mais perguntas, seja verdadeira.

Figura 2: Resumo do modelo conceitual do DIDB mostrando a agrega¸cão info-pulo. São omitidos atributos e heran¸cas para melhor visualiza¸cão.

(18)

Essa modelagem permite que pulos sejam feitos em qualquer dire¸cão do questionário, para partes já respondidas, pulando partes que não dizem respeito à investiga¸cão e reaproveitando módulos em algumas situa¸cões.

4.1.4 Pergunta alternativa autom´atica

Para o sistema responder uma pergunta alternativa automática é necessário para todas as respostas dessa pergunta uma agrega¸cão info alternativa automática, cujo modelo conceitual está na figura 3. Essa agrega¸cão representa a qual questionário e qual módulo a pergunta está, se refere a um conjunto de perguntas anteriores e com base nessas perguntas a expressão

´

e descrita e caso seja verdadeira ter´a como resposta a resposta alternativa selecionada.

A expressão é da mesma forma que a expressão do pulo, descrita anteriormente.

Figura 3: Resumo do modelo conceitual do DIDB mostrando a agrega¸cão info-alternativa- automática. São omitidos atributos e heran¸cas para melhor visualiza¸cão.

4.1.5 Pergunta score autom´atico

A modelagem da pergunta score automático é feita de maneira semelhante à da pergunta alternativa automática, com exce¸cão da expressão, que assume a forma:

| <expressao> + <termo> | <termo> - <termo>

<soma> ::= RESPOSTA | <soma> + RESPOSTA

(19)

<subtracao> ::= RESPOSTA | <subtracao> - RESPOSTA

De acordo com a figura 4, que mostra o modelo conceitual da agrega¸cão info score automático, uma pergunta score automático pode ter um ou mais info score automático. Esse faz parte de um módulo de um questionário, se refere a um conjunto de perguntas anteriores e calcula o valor dado pela expressão acima.

Figura 4: Resumo do modelo conceitual do DIDB mostrando a agrega¸cão info-score- automático. São omitidos atributos e heran¸cas para melhor visualiza¸cão.

4.2 Instancia¸ c˜ ao do question´ ario

A instancia¸cão do questionário primeiro envolve a caracteriza¸cão do par entrevistador- entrevistado e para cada par é criado um caminho espec´ıfico, que depende dos pulos, que armazena todas as respostas. Todos estes caminhos alternativos são projetados utilizando o conceito de transa¸cão longa [FBTP12] e [FTMP10] na qual cada pergunta é um passo.

Essa transa¸cão longa é apoiada pelas restri¸cões e condi¸cões que controlam o fluxo de um questionário. Cada passo gera um dado de resposta que é testado pela expressão booleana para poder verificar se um pulo é poss´ıvel.

Esse conceito de instancia¸cão de questionário permite o projeto e aplica¸cão de entrevistas para qualquer dom´ınio do conhecimento desde que essa flexibilidade é garantida pelo conceito de transa¸cão longa oferecida pela modelagemWED-flow. Além disso, isso facilita o gerenciamento de diferentes versões do mesmo questionário permitindo o uso de elementos, módulos e até mesmo questionários completos já cadastrados no sistema para projetos de novos questionários.

4.3 Ambiente de desenvolvimento do DIDB

Para o desenvolvimento do DIDB foi utilizado o banco de dados relacional PostgreSQL, a linguagem de programa¸c˜aoJava utilizando o gerenciador de projetos Maven [Son08] com

(20)

uma ferramenta de atualiza¸cões incrementais de banco de dados Carbon5, o que permite os desenvolvedores sempre terem a versão do banco atualizada automaticamente pelo ambiente de desenvolvimento. O mapeamento objeto-relacional foi realizada utilizando o padrãoJava Data Objects – JDO [JR03] com a implementa¸cão fornecida peladatanucleus.

A camada de negócios da aplica¸cão foi constru´ıda utilizando três camadas, para oferecer flexibilidade de altera¸cões futuras e separa¸cão de responsabilidades bem definidas:

Camada entidades: Conjunto de classes que representam as entidades na aplica¸cão e são mapeadas utilizando a técnica de mapeamento reverso que fazem o mapeamento do modelo de banco de dados para as classes em Java;

Camada DAO: Utilizando o padrão Data Access Object – DAO é o conjunto de classes que são responsáveis por conter o código de persistência, recupera¸cão e exclusão de todas as entidades da aplica¸cão por meio da ferramenta de mapeamento objeto-relacional acessando os dados armazenados no banco de dados relacional;

Camada Fa¸cade: Para termos independência do meio de persistência, por exemplo per- sistir os dados para um arquivo xml, esta camada contém classes que abstraem os detalhes de implementa¸cão espec´ıficos que estão nas classes pertencentes à camada DAO.

O DIDB é uma aplica¸cãoweb e para a constru¸cão dasinterfaces para o usuário utilizamos o padrãoModel View Controller – MVC [GHJV95] e o modelo e a visão são implementados com o aux´ılio dos frameworks Java Server Faces – JSF 1.2 [GH07] que é a especifica¸cão padrão para desenvolvimento de aplica¸cões Java Web,Facelets 1.1.4 [AW08] para podermos utilizar páginas xhtml e padrões de páginas para essa versão do JSF eRichFaces 3.3.1 [Kat08]

para termos suporte àAjax, Javascript e componentes já prontos deinterface com usuário.

(21)

5 Estudo de Caso

O Structured Clinical Interview for DSM Disorders – SCID [FSGW02] ´e uma entrevista amplamente utilizada em psiquiatria apoiada pelo crit´erio operacional APA-DSM [APA12].

As desordens psiquiatricas são classificadas em categorias multiaxiais com uma hierarquia de sintomas. Possui mais de 1000 perguntas, divididas em módulos obrigatórios, não- obrigatórios, screening e laudo. Para cada entrevista realizada é percorrido um caminho entre vários poss´ıveis que é determinado pelas respostas dadas cuja verifica¸cão ocorre em pontos pré-determinados (pulo) é realizada uma verifica¸cão de uma ou mais condi¸cões (ex- pressões de pulo) e caso uma condi¸cão seja satisfeita o entrevistador escolhe o caminho indicado. Esses pulos no SCID podem ser em qualquer dire¸cão e a complexidade das expressões pode ser alta.

O estudo de caso do DIDB foi realizado com o cadastro do meta-questionário que representa o SCID pois apresenta o desafio de representar corretamente as expressões de pulos e de perguntas automáticas, de forma a validar o uso do DIDB em entrevistas que são caracterizadas pela pela alta frequência de atualiza¸cão, número grande de perguntas de alguns tipos e muitos caminhos poss´ıveis destas perguntas baseados nas suas respostas.

A figura abaixo ilustra os principais tipos de desvios de fluxo encontrados no SCID, esse grafo foi gerado pelo DIDB e o questionário foi feito para ilustrar os desvios de fluxo encontrados no SCID de uma maneira leg´ıvel, já que um grafo parcial relevante do SCID não seria devido ao número grande de elementos que contém.

(22)

DIDB.C

DIDB.B

DIDB.D

CONDITION C (DIDB.C) Condition C is not a clinical ps ychiatric condition but can s imulate a ps ychiat...

DIDB.C1 Alternativa automática DISORDER A -- Score = 1.0 DISORDER B -- Score = 2.0

DIDB.C2 Alternativa única Yes -- Score = 1.0 No -- Score = 0.0

Pulo DIDB.C2 to DIDB.D1

DIDB.C3 Alternativa única Yes -- Score = 1.0 No -- Score = 0.0 Alerta

CONDITION D (DIDB.D) Condition D is not a clinical ps ychiatric condition but can s imulate a ...

SE DIDB.C2<1.0

DIDB.C4 Alternativa automática

CONDITION C is a cause of symptoms similar to DISORDER A -- Score = 1.0 CONDITION C is a cause of symptoms similar to DISORDER B -- Score = 2.0 CONDITION C is not a cause of symptoms similar to DISORDER A -- Score = 3.0 CONDITION C is not a cause of symptoms similar to DISORDER B -- Score = 4.0

Pulo

DIDB.C4 to CONDITION D or DISORDER A or DISORDER B SE DIDB.C2+DIDB.C3<2.0

DIDB.A8 Alternativa automática

Yes -- Score = 1.0 No -- Score = 0.0

SE (DIDB.C1=1.0EDIDB.C2+DIDB.C3=2.0)

DIDB.B7 Alternativa automática

Yes -- Score = 1.0 No -- Score = 0.0 SE (DIDB.C1=2.0EDIDB.C2+DIDB.C3=2.0) DIDB.D1

Alternativa única Yes -- Score = 1.0 No -- Score = 0.0

DIDB.B8 Alternativa automática DISORDER B -- Score = 1.0

No -- Score = 0.0 Alerta

DISORDER B (DIDB.B) The diagnos is of the dis order occurs when there are at leas t 3 s ymptoms ...

DIDB.B1 Alternativa única Yes -- Score = 1.0 No -- Score = 0.0

DIDB.B5 Alternativa automática

Yes -- Score = 1.0 No -- Score = 0.0

Pulo DIDB.B5 to End of Module B

Alerta END OF MODULE B

SE DIDB.B1+DIDB.B2+DIDB.B3+DIDB.B4<3.0 Pulo

DIDB.B6 to DIDB.C SE DIDB.B6=1.0

SE (DIDB.B5=1.0EDIDB.B6=0.0) DIDB.D2

Alternativa única Yes -- Score = 1.0 No -- Score = 0.0

DIDB.D3 Alternativa automática

CONDITION D is a cause of symptoms similar to DISORDER A -- Score = 1.0 CONDITION D is a cause of symptoms similar to DISORDER B -- Score = 2.0 CONDITION D is not a cause of symptoms similar to DISORDER A -- Score = 3.0 CONDITION D is not a cause of symptoms similar to DISORDER B -- Score = 4.0

Pulo CONDITION D to DISORDER A or B

SE DIDB.D3=1.0OUDIDB.D3=3.0

SE DIDB.D3=2.0OUDIDB.D3=4.0

Figura 5: Resumo dos desvios encontrados no SCID

O grafo é composto de três módulos: DIDB.B, DIDB.C e DIDB.D. A primeira pergunta a ser respondida é a pergunta DIDB.B1 do módulo B. E a ordem “natural” de se responder

´

e DIDB.B, DIDB.C e DIDB.D respectivamente. O primeiro pulo no módulo DIDB.B1 é um pulo simples, para frente, que verifica se o entrevistado respondeu sim a três perguntas entre DIDB.B1 a DIDB.B5, se sim, continua para a pergunta DIDB.B6 senão irá para o final desse módulo. A expressão correspondente é “SE DIDB.B1+DIDB.B2+. . . +DIDB.B5<3.0”

vá para alerta “fim de módulo”. É uma situa¸cão que ocorre várias vezes ao longo do SCID, em que é verificada alguma condi¸cão e se ela não for satisfeita, pula algumas perguntas que especificam a condi¸cão se for satisfeita.

Já nos módulos DIDB.C e DIDB.D existe um “pulo para trás”, que são o último pulo de cada módulo (embora o módulo DIDB.A seja omitido desse grafo, o elemento DIDB.A8 que pertence a esse módulo é ilustrado). A pergunta anterior ao pulo é uma pergunta alternativa automática que verifica a presen¸ca de alguma condi¸cão (C ou D nos respectivos módulos) e de qual módulo foi acessado. Por padrão uma pergunta não respondida possui resposta com valor 0.0. Por exemplo, se o módulo DIDB.B está sendo respondido e indica a presen¸ca da desordem investigada por esse módulo irá para o módulo DIDB.C que vai investigar uma condi¸cão dessa desordem, a pergunta automática DIDB.C4 irá ter como resposta as

(23)

alternativas com valor 3.0 ou 4.0, já que veio do módulo DIDB.B, então o pulo de volta irá para o módulo DIDB.B e continua o módulo DIDB.B.

Esse último tipo de fluxo, é encontrado por exemplo quando o SCID investiga transtornos ansiosos. São 10 transtornos investigados, um por módulo (no exemplo são dois transtornos e correspondem aos módulos DIDB.A e DIDB.B). Se um transtorno é presente vai para 2 módulos (no exemplo acima DIDB.C e DIDB.D) que investigam se a condi¸cão que ocasionou o transtorno é causado pelo uso de substâncias (Módulo DIDB.B) ou por uma condi¸cão cl´ınica geral (Módulo DIDB.C).

Com esses dois tipos de controle de fluxo e suas varia¸cões, expressões e elementos descritos anteriormente o DIDB consegue representar o SCID e então gerar as telas de respostas baseadas nessa informa¸cão respeitando o fluxo definido pelos pulos cadastrados e respostas dadas às perguntas.

5.1 Atividades

Esse trabalho de formatura foi supervisionado pelo Prof. Dr. João Eduardo Ferreira do Instituto de Matemática e Estat´ıstica da USP e pela Profa. Dra. Ariane Machado Lima da Escola de Artes, Ciências e Humanidades da USP que coordenaram o projeto e forneceram as hipóteses de pesquisa e abordagens tecnológicas para o DIDB. O aluno Rodrigo Müller de Carvalho desenvolveu os todos os módulos de banco de dados, o ambiente para especificar e gerenciar as restri¸cões para as transa¸cões longas e as interfaces de cadastro do DIDB. A aluna de mestrado Mina Cintho desenvolveu as interfaces de respostas e de pacientes. O Dr. Rodrigo S. Dias do Instituto de Psiquiatria da USP definiu todas as especifica¸cões e requisitos para questionários cl´ınicos e ofereceu todo o conhecimento do dom´ınio psiquiátrico.

(24)

6 Rela¸ c˜ ao da Experiˆ encia Obtida no Trabalho com o Curso

As disciplinas mais relevantes para a realiza¸c˜ao do trabalho desenvolvido foram:

• MAC0426 – Sistemas de Banco de Dados e MAC0439 – Laboratório de Banco de Dados: As duas foram fundamentais para o desenvolvimento do modelo de banco de dados e das transa¸cões longas, que é a base de todo o trabalho.

• MAC0211 – Laboratório de Programa¸cão I, MAC0242 – Laboratório de Programa-

¸cão II, MAC0332 – Engenharia de Software e MAC0441 – Programa¸cão Orientada a Objetos: Essas disciplinas foram fundamentais por desenvolverem projetos de maior complexidade, boas práticas de programa¸cão e aprendizado de linguagens orientadas a objetos (MAC0242, MAC0332 e MAC0441).

• MAC0329 – Álgebra Booleana e Aplica¸cões, MAC0239 – Métodos Formais em Pro- grama¸cão: Para o desenvolvimento das expressões de pulos e perguntas automáticas, além de permitir auxiliar os projetistas de questionários no cadastro das expressões, já que alguns projetistas não conhecem lógica boolena.

• Além dessas citadas, as outras disciplinas cursadas também foram fundamentais para a realiza¸cão do trabalho, seja por oferecer base teórica para as disciplinas citadas acima e na forma¸cão acadêmica em geral, por ensinar as técnicas de programa¸cão e como abordar e modelar problemas.

Os principais desafios que surgiram durante a execu¸cão do trabalho foram a modelagem do meta-questionário, desenvolvimento das expressões de pulos e perguntas automáticas que ao mesmo tempo fossem formalmente corretas e o mais amigável poss´ıvel para o projetista de questionário, que pode não possuir conhecimento de expressões booleanas. A gera¸cão das interfaces, que tinham como requisitos serem intuitivas e funcionais quanto poss´ıvel.

Altera¸cões de modelagem durante o desenvolvimento também foram desafiantes, quando um novo requisito era descoberto durante o desenvolvimento e envolvia altera¸cões no modelo de banco de dados e no código.

As frustra¸cões encontradas foram principalmente relacionadas a falta de tempo em algumas situa¸cões, tanto em rela¸cão a dedica¸cão no curso e no desenvolvimento do trabalho.

Surgimento de erros na ferramenta, mesmo após a realiza¸cão de testes também foram frustantes. No in´ıcio do trabalho, a falta de experiência em orienta¸cão a objetos e também em desenvolvimento para Web foram um pouco frustantes, mas o conhecimento adquirido durante esse per´ıodo compensou essa última frusta¸cão.

Para atuar na área de realiza¸cão do trabalho, acredito que os seguintes passos devem ser tomados: aprofundamento na teoria de banco de dados relacionais e transa¸cões longas. Também melhoria de técnicas e boas práticas de programa¸cão para desenvolvimento web, aprofundamento e adquirir melhor experiência em refatora¸cões, testes (unitários e de integra¸cão) mais efetivos e abrangentes também são passos interessantes.

(25)

7 Resultados

O DIDB está em fase final de implementa¸cão no IPq, existem questionários já projetados e em fase de teste antes da aplica¸cão em pacientes e o SCID está em fase final de projeto, devido à complexidade desse questionário.

Além do IPq, o DIDB está sendo utilizado pelos projetos Recipient Epidemiology and Donor Evaluation Study-III⁴ – REDS-III, em algumas entrevistas dos hemocentros participantes desse projeto e pelo projeto ADJ Diabetes Brasil⁵. Em ambos o DIDB já é utilizado para realizar entrevistas das respectivas pesquisas e no caso do REDS-III a aplica¸cão é realizada em vários estados do Brasil e ainda existem instala¸cões do DIDB distribu´ıdas em computadores móveis onde a aplica¸cão de entrevistas em locais que não possuem acesso à Internet. Essas bases locais são sincronizadas com a base central para extra¸cão posterior dos dados.

O DIDB foi registrado por meio da Agência USP de Inova¸cão e a concessão do registro foi publicado em 08/10/2013 na Revista da Propriedade Industrial - RPI Nô.2231, pág. 177.

O DIDB é um software livre. Porém a disponibiliza¸cão do código-fonte, por depender da concessão do registro que foi obtido recentemente, está em fase de estudo para a cria¸cão de um repositório público e divulga¸cão do mesmo.

4https://reds-iii.rti.org/

5http://www.adj.org.br/

(26)

8 Conclus˜ ao

Nesse trabalho de formatura supervisionado foi desenvolvido o Dynamic Interview Da- tabase – DIDB que permite a cria¸cão, manuten¸cão e versionamento de questionários e a realiza¸cão destas entrevistas de acordo com suas estruturas internas, possivelmente complexas, com a utiliza¸cão de modelagem de banco de dados com alto n´ıvel de abstra¸cão e conceitos de transa¸cões longas. Mais concretamente, o DIDB deve apoiar entrevistas que são caracterizadas pela alta frequência de atualiza¸cão, número grande de perguntas de alguns tipos e muitos caminhos poss´ıveis destas perguntas baseados nas suas respostas. A integra-

¸cão de novos itens de questionário (por exemplo, perguntas, tipos de respostas, sequências para responder perguntas) utilizando solu¸cões clássicas se torna demorada e dif´ıcil, onde o processo que cria o questionário impõe atualiza¸cões cont´ınuas nas ferramentas de software para poder atender essas mudan¸cas. Como resultado, atrasos na evolu¸cão da ferramenta, presen¸ca de erros de banco de dados e ausência de gera¸cão automática de interfaces de respostas podem diminuir o progresso cient´ıfico. Solu¸cões atuais para criar e aplicar ques- tionários não atendem as demandas de questionários complexos. Para poder superar esses obstáculos, um processamento não-tradicional de processamento de transa¸cões e uma estrutura sofisticada de banco de dados oferecidos pelo DIDB atendem essas caracter´ısticas desafiadoras usando processos dinâmicos para projeto e aplica¸cão de questionários. Essa abordagem do DIDB apoia vários tipos de dom´ınios de questionário, variando desde estudos cl´ınicos e epidemológicos até processos de sele¸cão de vagas por recursos humanos.

(27)

Referˆ encias

[APA12] APA.Diagnostic and Statistical Manual of Mental Disorders DSM-IV-TR. Fouth Edition, American Psychiatric Association, 2012.

[AW08] Bruno Aranda and Zubin Wadia. Facelets Essentials: Guide to JavaServer Faces View Definition Framework. Apress, Berkeley, CA New York, NY, 2008.

[BSB⁺11] Claudia Bausewein, Steffen T. Simon, Hamid Benalia, Julia Downing, Faith N.

Mwangi-Powell, Barbara A. Daveson, Richard Harding, Irene J. Higginson, and On behalf of Prisma. Implementing patient reported outcome measures (proms) in palliative care - users’ cry for help. Health and Quality of Life Outcomes, 9(27), April 2011.

[EN10] Ramez Elmasri and Shamkant B. Navathe. Fundamentals of Database Systems.

Addison-Wesley, Boston, MA, USA, sixth edition, 2010.

[FBTP12] Jo˜ao Eduardo Ferreira, Kelly Rosa Braghetto, Osvaldo Kotaro Takai, and Calton Pu. Transactional recovery support for robust exception handling in business process services. In ICWS, pages 303–310, 2012.

[FGW⁺] Michael B. First, Miriam Gibbon, Janet B.W. Williams, Robert L. Spitzer, and Lorna Smith Benjamin. Computer-assisted scid ii expert system for windows.

http://www.mhs.com/product.aspx?gr=cli&prod=casiies%20&id=overview.

[FSGW02] Michael B. First, Robert L. Spitzer, Miriam Gibbon, and Janet B.W. Williams.

Structured Clinical Interview for DSM-IV-TR Axis I Disorders, Research Ver- sion, Patient Edition. Biometrics Research, New York State Psychiatric Institute, 2002.

[FTMP10] J. E. Ferreira, O. K. Takai, S. Malkowski, and C. Pu. Reducing exception handling complexity in business process modeling and implementation: the wed-flow approach. Proceedings of CoopIS 2010: 18th International Conference on Coo- perative Information Systems, 2010.

[GBPF12] Marcela O. Garcia, Kelly Rosa Braghetto, Calton Pu, and Jo˜ao Eduardo Ferreira.

An implementation of a transaction model for business process systems. JIDM, 3(3):271–286, 2012.

[GH07] David Geary and Cay Horstmann. Core JavaServer Faces. Prentice Hall, Upper Saddle River, NJ, 2nd edition, 2007.

[GHJV95] Erich Gamma, Richard Helm, Ralph Johnson, and John Vlissides. Design Pat- terns: Elements of Reusable Object-Oriented Software. Addison-Wesley, Reading, MA, 1995.

[HHS⁺09] Stephen L. Harlin, Ryan D. Harlin, Thomas I. Sherman, Courtney M. Roz- sas, M. Shuja Shafqat, and William Meyers. Using a structured, computer- administered questionnaire for evaluating health-related quality of life in patients with chronic lower extremity wounds. Ostomy Wound Management, 55(9):30–39, September 2009.

(28)

[HTT⁺09] Paul A. Harris, Robert Taylor, Robert Thielke, Jonathon Payne, Nathaniel Gon- zalez, and Jose G. Conde. Research electronic data capture (redcap) - a metadata- driven methodology and workflow process for providing translational research informatics support. Journal of Biomedical Informatics, 42(2):377–381, April 2009.

[JR03] David Jordan and Craig Russell. Java Data Objects. O’Reilly, Sebastopol, CA, 2003.

[Kat08] Max Katz. Practical RichFaces. Apress, Berkeley, CA New York, NY, 2008.

[LBM⁺05] D. Lomet, R. Barga, M. Mokbel, G. Shegalov, R. Wang, and Y. Zhu. Immortal db: Transaction time support for sql server. SIGMOD’05: Proceedings of the 2005 ACM SIGMOD international conference on Management of data, pages 939–941, 2005.

[LPT99] L. Liu, C. Pu, and W. Tang. Continual queries for internet scale event-driven information delivery. IEEE Transactions on Knowledge and Data Engineering, 11(4):610–628, 1999.

[LSFA09] A. K. Langenbruch, I. Schufer, N. Franzke, and M. Augustin. Internet-supported gathering of treatment data and patient benefits in psoriasis. Journal of the European Academy of Dermatology and Venereology, 24(5):541–547, May 2009.

[NSH⁺06] Lam Nguyen, Anand Shah, Matthew Harker, Henrique Martins, Mariana Mc- Cready, Andreia Menezes, Danny O. Jacobs, and Ricardo Pietrobon. Dados- prospective: an open source application for web-based prospective data collec- tion. Source Code for Biology and Medicine, 1(7), November 2006.

[PM02] Richard Pawson and Robert Matthews. Naked Objects. John Wiley & Sons Ltd, 2002.

[Son08] Sonatype. Maven: The Definitive Guide. O’Reilly, Sebastopol, CA, 2008.

[WA11] YP Wang and LHSG Andrade. Sistema de classificac˜ao Diagnostico em Psiqui- atria. 1a edic˜ao, Manole Editores, 2011.

[WHO92] WHO. The ICD-10 Classification of Mental and Behavioural Disorders. Clinical descriptions and diagnostic guidelines. World Health Organization, 1992.