Secure communication based on ambient audio

(1)

Monografía apresentada à disciplina Computação Móvel (MAC5743/MAC0463)

Secure communication based

on ambient audio

Autores: Dominik Schürmann e Stephan Sigg

Aluno: Frank Dennis Julca Aguilar

Ministrante: Prof. Dr. Alfredo Goldman Vel Lejbman

Departamento de Ciência da Computação Instituto de Matemática e Estatística

Universidade de São Paulo

(2)

Sumário

1 Introdução 4

2 Encriptação ad-hoc baseada em áudio 5

2.1 Sincronização e captura do som . . . 5

2.2 Audio-fingerprinting . . . 5

2.3 Palavras chave. . . 6

3 Casos de estudo 6 3.1 Caso de estudo 1: office setting 1 . . . 7

3.2 Caso de estudo 2: office setting 2 . . . 8

3.3 Caso de estudo 3: Canteen setting . . . 9

3.4 Caso de estudo 4: Roadtraffic setting . . . 10

4 Conclusões 10

(3)

Resumo

(4)

1 Introdução

Um esquema de segurança que usa características contextuais comuns entre os dispositivos pode prover uma sensação de segurança que é percebido de maneira natural pelos usuários. Considere, por exemplo, uma reunião de trabalhadores de um projeto específico. Cada integrante do grupo precisa de alguma permissão para ter acesso a informação compartilhada entre os participantes, como telefones ou arquivos compartilhados; a comunicação entre os participantes deve ser protegida contra o acesso de dispositivos ou pessoas externas. A sala da reunião define as bordas que não devem ser atravessadas por nenhuma informação confidencial. Nesse tipo de cenários, a informação contextual, por exemplo o som do ambiente, pode ser usada como semente para gerar chaves secretas para realizar o intercâmbio de informação e autenticação de maneira segura.

Na literatura, vários autores consideram o uso de estímulos ambientais para realizar a autenticação espontânea ou a criação de uma canal de comunicação se-gura entre dispositivos móveis ou ad-hoc (Bichler et al.,2007;Holmquist et al.,2001;

Mayrhofer e Gellersen,2008;Varshavsky et al.,2007). EmSchurmann e Sigg(2011), é proposto um mecanismo, não intrusivo, para estabelecer uma canal de comunica-ção segura entre dispositivos. Em particular, é aproveitado o fato das características do som capturado por dispositivos, próximos uns dos outros, serem semelhantes, para criar uma canal de comunicação segura, baseada em essas características.

(5)

2 Encriptação

ad-hoc baseada em áudio

O esquema proposto para estabelecer uma canal de comunicação segura, usando o som do ambiente é o seguinte: primeiro os dispositivos que precisam estabelecer a canal de comunicação segura capturam o som do ambiente, de maneira sincronizada, usando seus próprios microfones. Logo, cada dispositivo computa uma sequência de características binarias a partir do som capturado: audio-fingerprint. Os fingerprints de sons de ambientes semelhantes são parecidos mas, devido ao ruido e a inexactitude no processo de amostragem, é pouco provável que sejam idênticos, portanto, eles precisam ser mapeados a palavras chave. No processo de mapeamento, fingerprints semelhantes são mapeados a palavras chaves idênticas. Finalmente, as palavras chave geradas são usadas como chaves compartilhadas entre os dispositivos.

As seguintes seções descrevem, com maior detalhe, as etapas do esquema pro-posto.

2.1 Sincronização e captura do som

Os dispositivos que precisam compartilhar uma chave usam seus próprios mi-crofones para capturar o som. O processo de captura precisa ser sincronizado. Nas experimentações da abordagem proposta foi implementada uma sincronização base-ada em Network Time Protocol (NTP).

2.2 Audio-fingerprinting

(6)

da matriz E: cada bit de uma fingerprint representa a diferença em bandas de frequência entre dois frames consecutivos(1 se é maior a zero e 0 em caso contrario). Nas experimentações, foram capturadas sequências de som de comprimento l = 6.375 segundos, com uma taxa de amostragem r = 44100 Hz. As sequências de som foram divididas em n = 17 frames, de d = 0.375 segundos cada uma e cada frame foi dividida em m = 33 bandas de frequência. No final são geradas fingerprints de 512 bits.

2.3 Palavras chave

É pouco provável que as fingerprints geradas no passo anterior sejam idênticas pois, entre outras coisas, os dispositivos estão separados, não estão sincronizados de maneira perfeita e possivelmente usam hardware diferente. Então, após a geração de fingerprints, eles são mapeados para para palavras chave.

Para aproveitar o fato de que fingerprints parecidos geram palavras chaves idênti-cas, em Schurmann e Sigg(2011), é proposta uma abordagem baseada em esquemas de encriptação fuzzy.

3 Casos de estudo

(7)

(a) (b)

(c) (d)

Figura 1: Configurações dos casos de estudo: (a) office setting 1, (b) office setting 2, (c) Canteen setting, (d) Roadtraffic setting.

3.1 Caso de estudo 1: office setting 1

Neste caso de estudo, são usadas duas laptops. O som do ambiente foi gerado por pessoas falando fora e dentro de um escritório. Os dispositivos e os speakers estão localizados em posições diferentes. Neste caso de estudo podem se diferenciar quatro cenários diferentes:

• 3a1. Os dois dispositivos estão dentro do escritório, nas posições a e b (veja Figura 1(a)). Uma ou duas pessoas falando nas posições 1-4.

(8)

fica aberta, posições a e c. Uma ou duas pessoas falando nas posições 1 e 5.

• 3a3. Os dois dispositivos em frente do escritório, posições c e d. Um ou duas pessoas falando nas posições 5-11.

• 3a4. As mesmas características que 3a2, mas a porta fica fechada.

Nos quatro cenários, os dispositivos foram sincronizados via NTP. Para cada caso, o processo de sincronização foi repetido dez vezes para cada cenário, com pessoas falando em diferentes posições, como descrito em cada cenário.

Os cenários 3a1 e 3a3 representam casos em que dois dispositivos tentam estabe-lecer uma comunicação segura. O cenário 3a2 representa o caso em que uma pessoa passa perto do escritorio e acidentalmente percebe parte do contexto (som). Em 3a4 é representado o caso em que a porta é fechada para manter a informação segura, e que não seja acessível por pessoas fora do escritório.

Nos cenários 3a1 e 3a3 se obteve respectivamente 0.8% e 0.9% de sincronizações correctas, o que indica uma alta probabilidade de éxito quando os dois dispositivos tem o mesmo contexto de som. Para 3a2 obteve se uma probabilidade de êxito de 0.4%, que não seria aceitável na maioria de casos. Finalmente, em 3a4não foi possível estabelecer nenhuma sincronização correta.

3.2 Caso de estudo 2: office setting 2

(9)

diferentes, a media foi 36.52%. A variância, em ambos casos, foi menor a 0.01%. A clara diferença entre os resultados obtidos quando os dispositivos estão no mesmo es-critório ou em diferentes e a baixa variância pode permitir a aplicação do algoritmos que usem algum tipo de limiar para tratar possíveis ataques.

Figura 2

3.3 Caso de estudo 3: Canteen setting

Neste caso, a abordagem foi avaliada numa cantina de TU Braunschweig. Foram usadas varias laptops localizadas em diferentes mesas. A Figura 3 mostra a media dos bits similares para as diferentes localizações dos dispositivos. Pode se notar a media diminui quando a distância entre os dispositivos aumenta.

(10)

3.4 Caso de estudo 4: Roadtraffic setting

Neste caso duas laptops foram localizadas perto de uma rua com muito tráfico, entras as 17 e 19 horas, em dias de trabalho (working days). Para as experimentações, a distância entre os dispositivos foi aumentada gradualmente nos diferentes testes. Adicionalmente, foram considerados testes nos quais os dispositivos estão em lados diferentes da rua. Os resultados deste caso de estudo são mostrados na Figura4.

Figura 4

4 Conclusões

Este trabalho descreve as principais ideias e resultados da abordagem proposta em Schurmann e Sigg (2011). Nesse artigo foi estudada a viabilidade do uso da informação contextual para estabelecer uma canal de comunicação segura entre dis-positivos (móveis).

(11)

Referências

Bichler et al.(2007) Daniel Bichler, Guido Stromberg, Mario Huemer e Manuel Löw. Key generation based on acceleration data of shaking processes. Em Pro-ceedings of the 9th international conference on Ubiquitous computing, UbiComp ’07, páginas 304–317. Citado na pág. 4

Holmquist et al.(2001) Lars Erik Holmquist, Friedemann Mattern, Bernt Schiele, Petteri Alahuhta, Michael Beigl e Hans-Werner Gellersen. Smart-its friends: A technique for users to easily establish connections between smart artefacts. Em Proceedings of the 3rd international conference on Ubiquitous Computing, Ubi-Comp ’01, páginas 116–122. Citado na pág. 4

Mayrhofer e Gellersen(2008) Rene Mayrhofer e Hans Gellersen. Spontaneous mobile device authentication based on sensor data. Inf. Secur. Tech. Rep., 13(3): 136–150. ISSN 1363-4127. Citado na pág. 4

Schurmann e Sigg(2011) Dominik Schurmann e Stephan Sigg. Secure commu-nication based on ambient audio. IEEE Transactions on Mobile Computing, 99 (PrePrints). ISSN 1536-1233. Citado na pág. 3, 4, 6, 10