Validac¸ ˜ao - Simulação de inserção de agulha para treinamento de procedimento de anestesia od

Em geral, a validaç ão dos trabalhos considera duas vertentes: validaç ão com seres humanos e validaç ão t écnica, relacionada ao desempenho da simulaç ão.

Em relac¸ ˜ao ao desempenho computacional, foi observada uma

Figura 16 - Tipos de testes envolvendo usu ´arios

Fonte: Autor

al., 2014) (LADJAL; HANUS; FERREIRA, 2013) (LADJAL; HANUS; FER- REIRA, 2011) (GOKSEL; SAPCHUK; SALCUDEAN, 2011a) (WANG et al., 2008) (LADJAL; HANUS; FERREIRA, 2011), principalmente com relaç ão à deformaç ão de objetos 3D, que influenciam na interaç ão h áptica, a qual deve ser mantida a altas taxas de renderizaç ão.

Na Figura 16 s ão mostrados trabalhos que realizaram testes com a participaç ão de usu ários (49,4% do total).

Normalmente em projetos de simulaç ão, principalmente de RV e RA, o n´ıvel de realismo proporcionado é uma preocupaç ão recorrente, sendo men- cionado nos textos de 87,1% dos artigos. Na Figura 17 s ão apresentados dados sobre os tipos de realismo avaliados, mesmo que determinados trabalhos somente mencionem a preocupaç ão com tal aspecto, sem a realizaç ão de testes espec´ıficos para determinar o n´ıvel de realismo. As modalidades sensoriais humanas analisadas no contexto de realismo foram visual e t átil. Ressalta-se que mesmo a modalidade sonora foi pouco explorada nos trabalhos, tendo sido citada somente em (LEE et al., 2012). Os recursos visuais e h ápticos foram amplamente explorados quando comparados com simulaç ões de som, cheiro e paladar, sendo que os dois últimos n ão tiveram nenhuma representaç ão no conjunto de artigos.

Figura 17 - Natureza do realismo

Fonte: Autor

O treinamento de determinados procedimentos de inserç ão de agulha en- volveu a coordenaç ão entre m ãos e olhos, pois diversas t écnicas adotaram imagens m édicas para auxiliar a execuç ão, por isso, o realismo visual tamb ém é importante no contexto. Outros trabalhos englobaram palpaç ão inicial e pos- terior inserç ão de agulha, n ão incluindo o aux´ılio de imagens m édicas.

Outro ponto abordado foi a distinç ão entre testes objetivos e subjetivos com usu ários. Os testes objetivos est ão relacionados ao desempenho do usu ário (tempo de execuç ão de tarefa, erros e acertos durante o movimento da agulha, entre outras m étricas de desempenho) (PAOLIS, 2012) (CHAN et al., 2012).

As m étricas de desempenho diferem-se de m étricas objetivas citadas em trabalhos que visam criar t écnicas para avaliaç ão da qualidade da interaç ão h áptica com base na percepç ão do usu ário, (STEINBACH et al., 2012) (CHAUDHARI; STEINBACH; HIRCHE, 2011) (SAKR; GEORGANAS; ZHAO, 2007). A seç ão 4.6 foi elaborada para descrever m étricas objetivas perceptu- ais para avaliaç ão da interaç ão h áptica, visto que constitui um dos objetivos do presente trabalho.Em 1,6% dos artigos, as m étricas objetivas de desempenho foram definidas, mas ainda n ão aplicadas (PAOLIS, 2012) (valor n ão computado para os testes objetivos). No conjunto de estudos inclu´ıdos houve

Figura 18 - Tipos de testes estat´ısticos

Fonte: Autor

uma predomin ância dos testes puramente subjetivos, especialmente com o emprego de question ários. Foi observada a presença de 3.2% dos artigos com dois tipos de testes psicof´ısicos (PSE - Point of Subjective Equality e PMRE - Point of Motor Response Equality ) (NISKY et al., 2011) (L ´ECUYER; BURKHARDT; TAN, 2008).

Na Figura 18 s ão apresentados dados sobre os testes estat´ısticos ex- clusivamente com a participaç ão de usu ários. 55,2% dos artigos inclu´ıdos utilizaram testes estat´ısticos e 3,2% destes apresentaram mais de um teste estat´ıstico. Os testes estat´ısticos empregados com maior frequ ência foram ANOVA (Analysis of Variance) (12,9%), m édia (11,3%), desvio-padr ão (8,0%), mediana (6,4%) e t-test (6,4%). No ano de 2009 n ão foi detectada nenhuma aplicaç ão de teste estat´ıstico envolvendo usu ários.

Na Figura 19 s ão apresentados dados referentes ao n úmero de participantes dos testes conforme determinados intervalos (menos de 10, de 10 a menos de 20, de 20 a menos de 30, de 30 a menos de 40, de 40 a menos de 50, mais de 50 e N úmero n ão informado para artigos que n ão especificaram

Figura 19 - N ´umeros de particpantes dos testes

Fonte: Autor o n ´umero de participantes).

Nas Figuras 20 e 21 s ão apresentados dados sobre os n úmeros de especialistas e novatos que participaram dos testes, considerando os mesmos intervalos adotados para o n úmero de participantes. O grupo de novatos pode ser formado por iniciantes, residentes e estudantes em qualquer fase do curso, podendo possuir determinada experi ência na realizaç ão do procedimento ou tarefa a ser simulada. Os especialistas s ão professores e profissionais relacionados ao procedimento ou tarefa a ser simulada.

Na Figura 22 s ão apresentados dados sobre o n úmero de centros m édicos que participaram da validaç ão nos experimento dos artigos inclu´ıdos. Tal classificaç ão foi efetuada devido à possibilidade de especialistas de diferentes centros executarem um certo procedimento de formas distintas, apresentando mais de uma soluç ão (COLES; MEGLAN; JOHN, 2011).

A maioria das validaç ões com usu ários foi realizada com ambas classes de participantes - especialistas e novatos, com 6.4% para artigos envolvendo

somente especialistas e 9,7% somente novatos. Em 48,4% dos artigos n ˜ao

Figura 20 - N ´umeros de especialistas nos testes

Fonte: Autor

Figura 21 - N ´umeros de novatos nos testes

Fonte: Autor

Figura 22 - N ´umeros de centros m ´edicos nos testes

nada a classe dos participantes (4,8%).

O n úmero de novatos foi maior, com a exceç ão de 3,2% dos artigos (CHA- LASANI et al., 2011) (JALOTE-PARMAR; BADKE-SCHAUB, 2010). Os especialistas n ão superaram o intervalo de 20 a 30 pessoas, sendo que os novatos atingiram o intervalo m áximo especificado de mais de 50 pessoas, alcançando um valor m áximo de 63 (LUCIANO et al., 2013).

Em 6,4% dos artigos ocorreu uma variaç ão nos n úmeros de participantes de uma fase para outra do experimento por motivos diversos (exclus ão, de- sist ência, participaç ão pr évia de especialista ou grupo de calibraç ão prelimi- nar, entre outros), normalmente causando a reduç ão desses n úmeros, como em (LUBOZ et al., 2013) (CHELLALI; DUMAS; MILLEVILLE-PENNEL, 2013) (MANOHARAN et al., 2012) (NISKY et al., 2011).

Os testes foram realizados em um único centro m édico (43,5%) do total de 53,2% de artigos que mencionaram os centros, sendo que 6,4% foram em 2 centros e 1,6% em 6 centros. Um único centro m édico foi predominante nos anos de 2009, 2011 e principalmente 2012. Dois artigos (3.2%) apresentaram testes formais com especialistas de áreas distintas (computaç ão e medicina) (CHAN et al., 2010) (SOUZA et al., 2008).

Na Figura 23 é mostrada a porcentagem de artigos que empregaram question ários na validaç ão, classificados como pr é, p ós-testes e ambos. Ques- tion ários utilizando escalas Likert com 5, 6 ou 7 itens foram empregados em 11,3% dos artigos. Uma gravaç ão dos usu ários em aç ão foi observada (LE; NAHAVANDI; CREIGHTON, 2010), entretanto, acredita-se que nos testes objetivos as entradas dos usu ários tenham sido gravadas, como trajet órias, tempo de execuç ão de tarefas ou fases, n úmeros de erros e acertos, considerando tais entradas como m étricas objetivas de desempenho.

Figura 23 - Tipos de question ´arios utilizados nos testes

Fonte: Autor

Os n úmeros de question ários somente pr é-teste e ambos foram inferio- res ao n úmero de question ários p ós-teste, no entanto, s ão dados dif´ıceis de interpretar, pois informaç ões consideradas pr évias, como sexo, idade, pro- fiss ão, experi ências, entre outras, podem ser adquiridas nos question ários p ós-testes e termos de consentimento para participaç ão em experimentos. Seguindo a an álise, 3,2% dos artigos utilizaram question ários espec´ıficos - ASQ (After-Scenario Questionnaire - IBM (International Business Machines)) (CHOI; CHAN; PANG, 2012) e Coleta Bibliogr áfica e Escala de Usabilidade de Sistema com 16 itens de satisfaç ão (BIBIN et al., 2008).

Para a validaç ão de simuladores cir úrgicos, normalmente s ão utilizadas as medidas validity (MCDOUGALL, 2007). Dessa forma, os n úmeros de artigos envolvendo face validity, construct validity e content validity foram 4,8%, 1,6% e 1,6%, sendo que em 3,2% dos artigos foram utilizadas mais de uma me- dida, sempre com a presença da face validity. As medidas predictive validity e concurrent validity n ão foram adotadas.

Para finalizar, com relaç ão à validaç ão sob aspectos computacionais, o teste estat´ıstico de regress ão linear foi observado em 4,8% dos artigos, em- pregado para comparaç ão entre m étodos de Elementos Finitos Linear e N ão Linear (LADJAL; HANUS; FERREIRA, 2013) (LADJAL; HANUS; FERREIRA,

2011), al ém da comparaç ão de trajet órias (NISKY et al., 2011). Os testes estat´ısticos m édia e desvio-padr ão foram adotados para an álise de erros de processamento (MAHDAVIKHAH et al., 2014) (ZHANG et al., 2010b) (MAH- DAVIKHAH et al., 2010) (VILLARD P.F.AND VIDAL et al., 2009).

No documento Simulação de inserção de agulha para treinamento de procedimento de anestesia od... (páginas 68-76)