Caracterização da medição

4.2 Calibrac¸˜ao

5.1.4 Caracterização da medição

Para caracterizar o procedimento de medição, os valores medidos são comparados com o valor verdadeiro do mensurando. Como descrito no Cap´ıtulo 4, uma vez que o valor verdadeiro do mensurando é desconhecido, valores de referência são adotados como uma aproximação. Há duas maneiras populares para obter essas aproximações: i) realizar medições com um método de referência (um método com erros conhecidos e menores do que os erros do método sob avaliação); e ii) realizar medições com objetos de referência (objetos com pro- priedades definidas, por exemplo pesos-padrão mantidos por entidades de metrologia legal). Em nossa prova de conceito, ilustrada na Figura 5.3, os valores de referência são obtidos usando um instrumento de medição de referência para medir um objeto de referência. Nós adotamos como objeto de referência um micro-benchmark que gera chamadas ao sistema relacionadas com o sistema de arquivos em um n´ıvel de carga espec´ıfico. O n´ıvel de carga é dado pelo número de threads ativas no micro-benchmark que geram as chamadas ao sistema. Cada thread executa um número configurável de requisições continuamente e manipula um

5.1 M´etodo 39

arquivo diferente de 10GB. Nós usamos arquivos que são ao menos 4 vezes maiores do que a quantidade de memória principal dispon´ıvel; isso reduz a probabilidade de que requisições consecutivas para posições aleatórias de um arquivo sejam atendidas pela mesma página da memória em cache [65].

Figura 5.3: As ferramentas de captura interceptam cargas de trabalho geradas por micro- benchmarks. Os dados capturados são armazenados em um disco r´ıgido diferente daquele envolvido com a carga de trabalho gerada. As medições são comparadas com medições de referência, colhidas sem a necessidade da ferramenta de captura.

Para gerar as cargas de trabalho, consideramos 4 n´ıveis de carga e 4 tipos de carga. Os n´ıveis de carga variam de 1 até 4. Os tipos de carga são definidos pela chamada ao sistema requisitada pelas threads de trabalho do micro-benchmark: i) random read (chamada ao sistema pread); ii) random write (chamada ao sistema pwrite); iii) sequential read (chamada ao sistema read); e iv) sequential write (chamada ao sistema write). Cada requisição lê ou escreve em blocos de 4096 bytes. Cada thread executa uma sequência de 5000 requisições sem espera entre elas.

O sistema de medição de referência simplesmente coleta as marcações de tempo para a execução das requisições no n´ıvel da aplicação (adicionamos chamadas para a função de coleta de tempo clock gettime ao micro-benchmark), sem a necessidade de executar as instruções de interceptação presentes quando o sistema de arquivos é instrumentado. Essa abordagem fornece medições mais próximas do tempo de resposta do sistema de arquivos percebido pelas aplicações, portanto mais próximos do valor verdadeiro do mensurando do

5.1 M´etodo 40

que as medições realizada com as ferramentas de captura SystemTap e strace. Note que, na prática, não é fact´ıvel coletar as marcações de tempo no n´ıvel da aplicação em experimentos de captura de rastros; uma vez que as aplicações podem não ser conhecidas de antemão, portanto não é poss´ıvel modificá-las para adicionar o código de coleta de marcações de tempo.

Determinação da precisão da medição

Para contabilizar a precisão da medição, conduzimos 10 medições replicadas usando cada ferramenta de captura de rastros, em todas as combinações de n´ıvel de carga de trabalho e tipos de carga de trabalho. Consideramos 4 n´ıveis de carga de trabalho, variando de 1 até 4. O resultado do experimento é a média do tempo de resposta para todas as operações executadas no experimento.

Analisamos a precisão dos métodos de captura, comparando-a com a precisão do método de referência. Em outras palavras, nosso objetivo foi verificar se as ferramentas SystemTap e strace aumentam a variabilidade dos resultados medidos em comparação ao método de referência. Para isso, aplicamos um teste F para comparar a precisão dos métodos de captura: para um método de medição A, seja u(RA

w) a precis˜ao do m´etodo, ou seja, a componente da

incerteza devida aos erros aleatórios. Segundo esse teste, há evidência que um método B é menos preciso do que um método A se Fr > Fα,NB−1,NA−1, em que Fr é a razão entre as

variâncias dos métodos de medição:

Fr=

u(RB w)2

u(RA w)2

e Fα,NB−1,NA−1 é o valor cr´ıtico da distribuição F com NB− 1 e NA− 1 graus de liberdade

ao n´ıvel de significˆancia α [12].

Determinação da tendência da medição

A tendência de medição é a diferença entre os valores medidos e os valores de referência. Para analisar a tendência de medição, comparamos as medições de captura e os valores de referência obtidos nos experimentos conduzidos para determinar a precisão da medição, descritos na seção anterior, para as mesmas combinações de n´ıvel da carga de trabalho e tipo da carga.

5.1 M´etodo 41

Decidir se a tendência de medição é aceitável ou não é uma questão qualitativa espec´ıfica do propósito pretendido para o método de medição. De qualquer maneira, existe uma regra prática que pode servir de guia, independente de propósito, para decidir se a tendência é significativa, e portanto, os valores medidos devem ser corrigidos por calibração. De acordo com essa regra, a tendência é significativa caso a sua magnitude seja maior que o dobro da incerteza [37]: |¯x − ref | > 2 · r u(Rw)2 n + u(Cref) 2

em que ¯x é a média dos valores medidos, ref é o valor de referência adotado, u(Rw) é a

componente de precisão descrita no Cap´ıtulo 4, n é o número de experimentos replicados conduzidos e u(Cref) é a incerteza dos valores de referência, também descrita no Cap´ıtulo 4.

5.1.5 Calibrac¸˜ao

Tanto quanto sabemos, não há um estudo anterior que descreva os padrões de erros esperados para as medições de captura de rastros. Por essa razão, não podemos adotar antecipadamente métodos mais simples de calibração, tais como os métodos de ponto único e dois pontos; no lugar destes adotamos o método de calibração de múltiplos pontospor regressão linear. Felizmente, em nosso cenário, preparar múltiplos objetos de referência não é um problema: a única desvantagem é o tempo extra necessário para executar um número maior de experimentos.

Para construir a curva de calibração, aplicamos a mesma metodologia descrita na Seção 5.1.4, que foi usada para aferir as caracter´ısticas dos métodos de captura. Execu- tamos 10 experimentos replicados, dessa vez considerando uma faixa mais larga para o n´ıvel da carga de trabalho, variando de 1 até 8. Para quantificar os erros do procedimento de calibração, usamos o método descrito na Seção 4.2, baseado nos intervalos de predição da regressão linear.

No documento Metrologia da captura e reprodução de rastros de sistemas de arquivos. (páginas 52-55)