Aula 5 – Metodologia de Pesquisa em
Ciência da Computação
Método de Pesquisa
Agradecimentos
• Este material
• Consiste de adaptações dos slides da profa. Maria Camila Barioni, que gentilmente cedeu seus slides • É baseado no livro
Preparação de Trabalho de
Pesquisa
Preparação de Trabalho de
Pesquisa
O MÉTODO DE PESQUISA
Método de Pesquisa
• Metodologia é o estudo dos métodos
• O método consiste na seqüência de passos
necessários para demonstrar que o objetivo proposto foi atingido, ou seja, se os passos definidos no método forem executados, os resultados obtidos deverão ser convincentes
Wikipedia - Metodologia
• “A Metodologia é o estudo dos métodos. (...)
Tem como finalidade captar e analisar as
características dos vários métodos disponíveis, avaliar suas capacidades, potencialidades,
limitações ou distorções e criticar os
Wikipédia - Método
• “O método científico é um conjunto de
regras básicas para desenvolver uma experiência a fim de produzir novo
conhecimento, bem como corrigir e integrar
conhecimentos pré-existentes. Na maioria das disciplinas científicas consiste em juntar
evidências observáveis, empíricas (ou seja, baseadas apenas na experiência) e
mensuráveis e as analisar com o uso da lógica.”
Método
• Deve ser estabelecido depois que o objetivo tiver sido definido
• Revisão bibliográfica não deve fazer parte do método
Método
• O método deve então indicar, dependendo do tipo de trabalho:
• se protótipos serão desenvolvidos
• se modelos teóricos serão construídos
• quais experimentos eventualmente serão realizados
• como os dados serão organizados e comparados
Método
• A definição do método de pesquisa deve ser executada logo após a definição do objetivo • Para a definição do conjunto de passos que
Dados versus Conceitos
• O método de pesquisa não consiste apenas em coletar dados para suportar a hipótese de trabalho
• É necessário elaborar um discurso ponderado e esclarecedor a partir desses dados
• O aspecto mais importante de uma
monografia é o pensamento crítico e não apenas a coleta de informações
Pesquisa Experimental e
Não-Experimental
• A pesquisa experimental implica em que o pesquisador sistematicamente provocará
alterações no ambiente a ser pesquisado de forma a observar se cada intervenção produz os resultados esperados
Objetividade
• O pensamento humano permite a tirada de conclusões que nem sempre são objetivas, como no caso das opiniões
• Segundo Kerlinger (1980), “a condição
principal para satisfazer o critério de
objetividade é, idealmente, que quaisquer observadores com um mínimo de
competência concordem com seus resultados”
Objetividade
• Experimentos e observações devem ser tratados de maneira objetiva
• Por exemplo, um pesquisador poderia dizer que um sistema é “fácil de usar” se um determinado conjunto de tarefas predefinido puder ser
executado por um usuário com um determinado grau de treinamento dentro de um período de tempo predeterminado
Objetividade
• Em resumo:
• Deve-se definir de maneira objetiva o fenômeno que vai observar
• Deve-se convencer os demais que a definição é intuitiva e útil para chegar a algum resultado
Empirismo
• Segundo Kerlinger (1980), “empírico significa guiado
pela evidência obtida em pesquisa científica sistemática e controlada”
• A computação, enquanto ciência, fundamenta suas pesquisas no empirismo e não no princípio da
autoridade
• O empirismo é importante para a ciência porque é uma maneira sensata de olhar o mundo. Não basta
acreditar em sua intuição ou nas palavras dos mestres. É preciso verificar objetivamente se o fenômeno
Empirismo
• Duvidar das conclusões de outros cientistas e duvidar do próprio senso comum, muitas vezes, é a chave para grandes descobertas
Variáveis
• Uma variável, é um nome que se dá a um fenômeno que pode ser medido e que varia conforme a medição
Variáveis discretas e contínuas
• O domínio de uma variável pode ser discreto ou contínuo
• A ideia de contínuo vem do fato de que entre dois valores sempre existe um terceiro
• Já as variáveis discretas assumem seus
valores em conjuntos cujos elementos podem ser ordenados ou em conjuntos finitos
(categóricas)
Discretização
• Regras de transformação de valores contínuos para discretos
• Ex.: Médias numéricas em conceitos {A, B, C, E}
Variável Medida
• Uma variável medida é aquela cujo fenômeno vai ser observado pelo pesquisador
• Por exemplo: quantas vezes um usuário de uma ferramenta vai olhar no manual para
obter informações para desempenhar a tarefa que lhe foi proposta
• Essa variável tem como domínio o conjunto dos números naturais e seus valores não são
determinados pelo observador, mas simplesmente medidos
Variável Manipulada
• A variável manipulada é aquela que o
experimentador vai deliberadamente modificar para realizar seu experimento
• Por este motivo, esse tipo de variável também é chamado de variável experimental
• Exemplo de variável manipulada
Mas porque pesquisadores manipulam uma ou mais variáveis enquanto observam outras?
• É porque eles querem encontrar dependências entre essas variáveis
• A princípio pode-se testar a dependência entre quaisquer variáveis manipuladas e observadas • Mas nem sempre esse teste fará sentido
• Antes de analisar uma dependência
experimentalmente o pesquisador usualmente desenvolve uma teoria ou hipótese
Variáveis Dependentes e
Independentes
• A variável independente é aquela que, se supõe, influencia outra
• A variável dependente é a influenciada
Para chegar na correlação precisaremos de um pouco de matemática
Média
• Na pesquisa científica, frequentemente o
pesquisador defronta-se com o problema de analisar conjuntos de dados
• Por exemplo, ao avaliar um determinado
sistema, o pesquisador contabiliza o tempo de interação de cada pessoa dentre um conjunto previamente definido
• Usualmente a média é considerada uma
Média
• Por exemplo, se quatro pessoas foram
analisadas e os tempos medidos em minutos foram 10, 12, 14, 9, então se pode dizer que o tempo médio observado foi de 11,25 minutos
Variância
• Considere-se os três conjuntos de valores abaixo:
• {10, 12, 14, 9} • {1, 20, 2, 22} • {11, 11, 11, 12}
Variância
• Essa observação do distanciamento dos
elementos em relação à média é chamada de
variância
• Então, além da média, o pesquisador deve
ficar atento também à variância do conjunto de valores, já que esta complementa a
caracterização do conjunto
Cálculo da variância
• Subtraia a média do conjunto de cada elemento:
• {-1,25, 0,75, 2,75, -2,25} • {-10,25, 8,75, -9,25, 10,75} • {-0,25, -0,25, -0,25, 0,75}
• O resultado corresponde à intuição
• O terceiro conjunto tem valores absolutos
• Para obter um valor escalar que corresponda à medida da distância dos valores em relação à média do conjunto
• Eleve os valores ao quadrado:
• {1,5625, 0,5625, 7,5625, 5,0625}
• {105,0625, 76,5625, 85,5625, 115,5625} • {0,0625, 0,0625, 0,0625, 0,5625}
Cálculo da variância
• Some os resultados:
• 14,75 • 382,75 • 0,75
• Para evitar que o valor cresça com o tamanho do conjunto de dados: divida pelo número de elementos do conjunto menos 1:
• 4,9166... • 27,5833... • 0,25
Cálculo da variância
Fórmula da Variância
, onde n é o número de elementos do conjunto, x representa a média aritmética do conjunto e xi representa cada um dos elementos do
Desvio-Padrão
• O desvio-padrão é uma medida também
bastante utilizada para analisar conjuntos e é definido simplesmente como a raiz quadrada da variância
Dependência
• Variáveis manipuladas realmente influenciam as variáveis experimentais?
Covariância (exemplo)
• No caso de conjuntos que variam muito, como do tempo que se leva para programar casos de uso
• considerar que não se tem um único conjunto mas sim um certo número de subconjuntos, cada um dos quais com características distintas cada um com sua própria média e variância
Covariância (exemplo)
• Exemplo dos casos de uso
• Classificar casos de uso em simples, médios e complexos para obter conjuntos de medidas com variância menor e, portanto, mais previsíveis
• Porém, essa subclassificação gera incerteza
• Não se sabe se a forma de determinar que um caso de uso é simples, médio ou complexo realmente classifica os casos de uso em subconjuntos nos quais os valores de tempo de desenvolvimento tenham variância mais baixa
Covariância (exemplo)
• O valor de pontos de caso de uso estimado por um método Y produz uma estimativa melhor do que um outro método Y’?
• Onde “melhor” significa com “alta dependência em relação ao conjunto de tempos X”
Covariância (exemplo)
• Para testar a hipótese é necessário comparar dois conjuntos de valores
• o valor dado a um caso de uso pelo método de classificação
Exemplo de covariância
alta e direta (método Y)
Caso de
Uso Tempo conhecido (horas) - X Pontos de caso de uso - Y
Exemplo de covariância
alta e direta (método Y)
Caso de
Uso Tempo conhecido (horas) - X Pontos de caso de uso - Y
UC1 1 1 UC2 18 2 UC3 4 1 UC4 67 3 UC5 22 2 UC6 12 2 UC7 2 1 UC8 7 1
•Covariância alta: pois os menores valores da coluna X,
coincidem com os menores valores da coluna Y, e os maiores
valores da coluna X coincidem com os maiores valores da coluna Y •Covariância direta: pois quanto maior o valor da coluna X, maior
Exemplo de covariância baixa
(método Y’)
C a s o d e
uso Tempo conhecido (horas) - X Pontos de caso de uso – Y’
Covariância
• É calculada a partir dos desvios da média em cada conjunto
• Se no primeiro conjunto um valor se desvia muito para cima da sua média, espera-se que no segundo o valor correspondente também se desvie muito
para cima da sua própria média • No final
• Se todos os desvios para cima ou para baixo são semelhantes covariância alta e positiva
Covariância
Covariância de Y
Caso de uso Tempo conhecido (horas) - X Pontos de caso de uso - Y (xi - ) (yi - ) (xi - )(yi - )
Covariância de Y’
Caso de uso Tempo conhecido (horas) - X Pontos de caso de uso – Y’ (xi - ) (y’i - ) (xi - )(y’i - )
Correlação
• O valor absoluto da covariância não diz muita coisa sobre um conjunto estar influenciando o outro ou não
• Por isso, usa-se mais correlação
Correlação
• O valor absoluto da covariância não diz muita coisa sobre um conjunto estar influenciando o outro ou não
• Por isso, usa-se mais correlação
• É uma medida de variância normalizada (entre -1 e 1)
• Perto de -1 significa correlação negativa muito forte • Perto de 1 significa correlação positiva muito forte • Perto de 0 significa ausência de correlação
Voltando ao exemplo
• Correlação de Y e X: 0,928041193. • Correlação de Y’ e X: -0,39445403. • Existe correlação entre Y e X?
• Existe correlação entre Y’ e X?
• É necessário saber se o tamanho da amostra é suficiente para considerar a correlação como
Valores mínimos de correlação para ser
considerada significativa com 95% de certeza.
n mínimo n mínimo n mínimo
No exemplo
• n = 10
• Mínimo: 0,6319
A Hipótese de Pesquisa
• Um aspecto que diferencia o trabalho
científico do trabalho técnico é a existência de uma hipótese de pesquisa
• A hipótese é uma afirmação da qual não se sabe a princípio se é verdadeira ou falsa
• O trabalho de pesquisa consiste justamente em tentar provar a veracidade ou falsidade da hipótese
Hipótese
• Pergunta que surge: “e se não se conseguir provar que a hipótese era válida?”
• Reposta: vai depender de quão relevante era a
hipótese original
• Uma hipótese bem justificada no início do trabalho aumenta as chances de sucesso
1. Torna-se mais provável que ela seja verdadeira 2. Se ela for falsa, o trabalho terá o mérito de ter
Hipótese
• Três formas de coletar evidências para comprovar a validade de uma hipótese:
1. Construir uma teoria, que a partir de fatos aceitos e deduções válidas prove que a hipótese é verdadeira
2. Realizar certo número de experimentos controlados, que estatisticamente comprovem a validade da hipótese normalmente se aceita que hipóteses sejam comprovadas com 95% de certeza
3. Realizar estudos de caso, comparativos, argumentações, colher opiniões, etc. podem ser evidências da validade de uma hipótese
Hipótese
• Um problema de pesquisa, então, usualmente vai perguntar
• como é que duas ou mais variáveis se relacionam
• se existe correlação positiva ou negativa entre os valores das variáveis
• A existência dessas correlações, porém, ainda não prova causas
• Uma teoria consistente que explique causa e efeito precisa também ser elaborada, além da validação empírica
Justificativa
• Justificativa do tema (parte do problema) • Justificativa da hipótese (segurança do
pesquisador)
Resultados Esperados
• Os resultados esperados, usualmente, são situações que o autor de um trabalho espera que ocorram, caso seus objetivos sejam
atingidos
• Os resultados esperados, normalmente fogem ao escopo do trabalho
Limitações do Trabalho
• As limitações são aspectos do trabalho dos quais o autor tem consciência e reconhece a importância, mas não tem condições de abordar no tempo disponível
• É importante, em trabalhos de pesquisa, que as limitações conhecidas sejam claramente identificadas pelo autor
desde o início
• Isso evitará que o próprio autor muitas vezes se perca em divagações ou buscando aspectos que extrapolam os
objetivos iniciais
• Isso evita também que o leitor crie expectativas
demasiadamente amplas sobre o trabalho, que serão depois frustradas
Referências
• Raul Sidnei Wazlawick : Metodologia de Pesquisa em Ciência da Computação, Elsevier - Campus, 2009
PGC001 Metodologia de Pesquisa em Computação - 1° sem/2015 62
Atividade Avaliativa
Tema: Preparação do Trabalho de Pesquisa-Revisão Bibliográfica Principais Conceitos
Principais Trabalhos Relacionados Material a ser entregue
Versão preliminar do Capítulo - Referencial Teórico da dissertação/tese
Usar modelo PPGCO - latex
Aprofundar no assunto de acordo com a sua maturidade sobre o tema
Alunos ingressantes na pós focam nos conceitos
Alunos com projetos em andamento focam nos conceitos e nos trabalhos relacionados (pelo menos 2 trabalhos
Preparação para avaliação
Apresentação (15 minutos + perguntas no fim da aula) Enviar por email
O capítulo produzido - versão pdf