Apresentaç ão e an álise dos resultados

5.2.1 Especificac¸ ˜oes do

benchmark

e da m ´aquina

Para testar a viabilidade dos esquemas baseados em MLE explicados em 4.3.3, foi implementado um programa espec´ıfico à aplicaç ão. O objetivo do mesmo passa pela mediç ão de

tempos associados às t écnicas de comparaç ão e a t écnicas de baseline para interpretaç ão de resultados.

Este benchmark foi implementado em Java1_{, consistindo em cerca de 1200 linhas de c ódigo,} sendo por volta de 400 dedicadas à implementaç ão das t écnicas de MLE a serem utiliza- das. Foi utilizada a vers ão de Java 1.6.0 27 com OpenJDK Runtime Environment (IcedTea6 1.12.6), SHA-256 para funç ões de hash (2.2.1), AES, para funç ões criptogr áficas sim étricas, em modo CBC com padding PKCS5 (2.2.2). Para paralelizaç ão de processos foi utilizado a classe java.lang.Thread e, para aleatoriedade, a classe java.security.SecureRandom utilizando o construtor public SecureRandom() para inicializaç ão do algoritmo.

Os diferentes testes abordados pelo benchmark foram executados numa m ´aquina com um processador Intel(R) Core(TM)2 Duo CPU T9300 @ 2.50GHz, com 4130Mb de mem ´oria RAM e sobre o sistema operativo Ubuntu 12.04.2 LTS.

5.2.2 Resultados da perspetiva do cliente

Para recolha de tempo de execuç ão foram gerados, aleatoriamente, 40 ficheiros, com tamanho desde 250Kb a 10Mb (de 250Kb em 250Kb). Depois, foi repetida a operaç ão a testar um n n úmero de vezes para cada ficheiro gerado previamente, sendo medido o tempo de cada execuç ão. Dividindo a soma destas operaç ões pelo n escolhido obteve-se a m édia, sendo posteriormente constru´ıdo um gr áfico que ajuda a perceber como a operaç ão reage a aumentos no tamanho dos ficheiros.

Deduplicaç ão simples: o termo mais importante de comparaç ão com t écnicas de deduplicaç ão é a deduplicaç ão na sua forma mais simples. Para este teste ser á executado apenas uma operaç ão de hash, tipicamente utilizada como termo de comparaç ão entre dois ficheiros num sistema que contemple deduplicaç ão. Como pode ser observado na figura 5.1, as operaç ões de hash s ão executadas inicialmente com tempo inferior a 4ms, crescendo linearmente com o aumentar do tamanho dos ficheiros. Neste caso, o tamanho de mensagem desta operaç ão ser á apenas influenciado pela funç ão de hash (que, para este caso com SHA-256, ser á 256 bits). Sendo a mensagem M = {0, 1}n_{, o tamanho das}

mensagens ser ´a n + 256.

Figura 5.1: Tempos de execu¸cão do processo de deduplica¸cão para n opera¸cões

Figura 5.3: Tempos de execu¸c˜ao do processo de cifragem HCE para n opera¸c˜oes

Cifragem simples: neste teste ser á executada uma operaç ão de cifragem AES-CBC, utili-

zando uma chave aleat ória. O objectivo é obter um termo de comparaç ão entre o custo de operaç ão do esquema MLE com uma cifra standard sim étrica. Como pode ser observado na figura5.2, as operaç ões executadas demoram, inicialmente, cerca de 10ms, crescendo linearmente com o aumento do tamanho dos ficheiros. Para uma mensagem M = {0, 1}n, o tamanho de mensagens ser á n.

MLE-HCE: neste teste ser á executado o esquema de MLE denominado HCE (A.5). Como pode ser observado na figura5.3, as operaç ões iniciam num tempo de execuç ão de 25ms e, tal como os anteriores, v ão aumentando linearmente. Os valores obtidos s ão consisten- tes com o espect ável, uma vez que o processo sequencial seria uma operaç ão de hash e uma de cifra sim étrica, sendo o adicional provocado pela inicializaç ão de threads pela Java Virtual Machine (JVM). Para esta operaç ão, deve ser considerado o agregado da operaç ão de hash com a operaç ão de cifragem. Sendo assim, temos que o tamanho das mensagens

´e n + 256.

Os tempos obtidos das operaç ões de HCE s ão congruentes com o seu comportamento

4.3.3. De um ponto de vista funcional, pode-se aproximar o tradeoff necess ário à apli- cabilidade deste esquema ao de adicionar a operaç ão b ásica que falta a cada uma das abordagens. Isto significa que i. se quisermos partir de um sistema de deduplicaç ão, de- vemos esperar uma degradaç ão de performance ligeiramente superior a uma operaç ão de

Tabela 5.1: Eficiˆencia da deduplica¸c˜ao com blocos de 400Kb e 1 byte de salt

cifragem, e que ii. se quisermos adicionar a funcionalidade de deduplicaç ão a um sistema que j á realiza cifragem, esperamos um degradar de performance igual ável a pouco mais que uma operaç ão de hash.

A n´ıvel de tamanhos de mensagem, o aumento é quase negligenci ável. No caso de um sistema que aplique cifragem, temos o aumento equivalente ao output da funç ão de hash sendo este, pela pr ópria natureza das funç ões, reduzido.

5.2.3 Resultados da perspetiva do servidor

Para uma avaliaç ão de efici ência dos diferentes m étodos a serem testados, foi escolhida uma amostra previamente utilizada num estudo de deduplicaç ão [45, 46]. Como seriam executadas v árias operaç ões pesadas a n´ıvel de processamento, esta foi dividida em 8 sub-amostras. Estes resultados do benchmark podem ser consultados na tabela5.1. As primeiras tr ês colunas apresentam o n úmero de ficheiros e o n úmero de blocos verifica- dos em cada run, seguidas do tamanho da amostra avaliada. As operaç ões do benchmark foram executadas para blocos de 400Kb.

Seguem-se colunas que apresentam os resultados da deduplicaç ão a n´ıvel do ficheiro com- pleto (Whole File: WF) e a n´ıvel do bloco (Block : Bl). Ao contemplarem operaç ões b ásicas de deduplicaç ão, as duas primeiras colunas de resultados v ão permitir estabelecer um valor base de efic ácia, quando comparadas às restantes operaç ões.

Imediatamente ap ós a deduplicaç ão encontram-se os resultados associados à aplicaç ão da t écnica HCE, de maneira a poder avaliar um dos esquemas propostos por Bellare em [8] em termos de hits de deduplicaç ão. Tamb ém neste ponto vai ser contemplada a avaliaç ão por ficheiro completo e por blocos.

De seguida, encontram-se os resultados dos esquemas CipherCE e MLESalted. O pri- meiro apenas faz sentido ser avaliado com ficheiros completos, uma vez que tenta fazer uso do header dos mesmos, enquanto que o segundo vai avaliar tanto ficheiros completos como por blocos. Para o mesmo, foi escolhido um tamanho de salt de 1 byte.

Finalmente, como comparaç ão final, é avaliada a qualidade da deduplicaç ão quando executadas operaç ões de cifragem que n ão estejam preparadas para deduplicaç ão. Para este teste foi utilizado o AES-CBC.

Da referida tabela, podem tirar-se m ´ultiplas conclus ˜oes:

1. A efic ácia da deduplicaç ão segura (esquemas de MLE) é igual à da deduplicaç ão normal: 100%.

2. A deduplicaç ão é inaplic ável com t écnicas de cifragem habituais (AES-CBC): 0%. 3. A n´ıvel de poupança de espaço, as t écnicas de deduplicaç ão por blocos conseguem

atingir resultados superiores às que contemplam apenas ficheiros inteiros. De notar que esta é uma carater´ıstica que pode melhorar com a diminuiç ão do tamanho de blocos e que deve ser balanceada com o consequente aumento de processamento exigido.

4. A t écnica de MLESalted, cujo objetivo passava por aumentar a entropia das mensa- gens, apresentou n´ıveis extremamente reduzidos de efic ácia na deduplicaç ão, tendo esta sido reduzida para valores entre 8% e 0.2%. Daqui pode-se tirar que acr éscimos na entropia das mensagens resultam em valores baixos de deduplicaç ão.

5. A t écnica de CipherCE, que recorre ao primeiro bloco para derivar a chave, n ão con- seguiu n´ıveis de efici ência superiores ao da deduplicaç ão por ficheiro completo. Isto significa que, na execuç ão deste benchmark, n ão foram encontrados dois ficheiros com blocos deduplic áveis, que tivessem os primeiros blocos iguais.

5.3 Conclus ˜oes do impacto e da utilidade das t ´ecnicas ba-

No documento Segurança criptográfica no armazenamento e partilha de dados em ambientes cloud (páginas 70-75)