• Nenhum resultado encontrado

2.5. Desafios das técnicas de inferência contextual

2.5.1. Localização interna

O contexto localização é um dos contextos mais utilizados nas propostas de sensibilidade ao contexto pois, através dele, é possível obter otimizar um conjunto de informação que é mais relevante ao utilizador do que seria ao apresentar uma listagem não otimizada.

O contexto localização varia ao nível da granularidade que se pretende, podendo variar de zona, (pais, região ou cidade) ou mais detalhado (bairro, rua ou posição especifica GPS), ou até mesmo dentro de edifícios em qual das salas ou lojas se encontra. Relativamente às primeiras categorias de localização a problemática é facilmente resolvida com a utilização do sistema GPS, mas quando se pretende obter a informação relativa ao interior de edifícios, a situação fica muito mais complicada, uma vez que devido às características do sinal GPS, este não se propaga muito bem no interior destes.

Devido ao interesse nesta problemática, existem várias possibilidades de realizar a localização interna, com algumas propostas que visam localizar um utilizador invisual utilizando a tecnologia RFID (Fernandes, Faria, Martins, Paredes, & Barroso, 2013; Fernandes,

Filipe, Costa, & Barroso, 2014). No entanto, propostas que necessitem de equipamentos externos não são muito interessantes para dar resposta ao nosso desafio, uma vez que aumenta a complexidade de instalação dos mesmos, e a granularidade que se pretende obter não necessita de uma precisão tão elevada, uma vez que o que principalmente se pretende é saber a sala onde este se encontra, e não o qual a cadeira específica.

FIGURA 2-2–TÉCNICAS DE LOCALIZAÇÃO INDOOR (ADAPTADO DEKJÆRGAARD,2007)

Como é possível verificar na Figura 2-2, existem várias técnicas que visam a localização interna, que começam pelas mais simples, utilizando a proximidade a um determinado transmissor, à tri-lateração e angulação que utiliza 3 dispositivos e as distâncias ou os ângulos entre eles e os transmissores. Existem, por fim, técnicas mais avançadas como o Dead

Reckoning, que a partir de um ponto inicial conhecido e tem em conta as deslocações realizadas

para o cálculo da posição atual, e por fim, através do reconhecimento de padrões, que utilizando técnicas de aprendizagem artificial, que tentam calcular a posição com base em mapeamentos anteriores. É neste ultimo tipo que se irá focar a nossa revisão devido à simplicidade de implementação e reconhecimento de novas zonas.

equipamento, que pode ser correlacionada com a distância ao mesmo. Esta informação é recolhida pelo equipamento móvel sempre que ele realiza um scan de redes Wi-Fi disponíveis, e constrói uma lista com a força de sinal em cada local. A Figura 2-3, representa uma visualização desse conceito, onde é possível verificar que a força de sinal varia com a proximidade a cada um dos emissores WiFi e, por isso, é possível assim inferir qual a divisão onde o mesmo de encontra.

FIGURA 2-3 – LOCALIZAÇÃO BASEADA EM IMPRESSÃO DIGITAL POR WIFI (FIND PROJECT, 2016).

No entanto, este problema de categorização é um pouco mais complexo, pois existem diversos problemas que prejudicam o sinal e, nem sempre, se consegue realizar um mapeamento direto entre a força de sinal e a sala onde se encontra. Por esse motivo é necessário aplicar técnicas de que permitam a melhoria continua do algoritmo aplicado. Sendo um problema de categorização, uma abordagem que tem apresentado resultados muito interessantes é a localização em interiores utilizado classificadores baseados em árvores como o Random Forest (Breiman, 2001), que apresenta uma boa solução para o problema, principalmente ao nível da precisão e robustez de funcionamento e melhoramento contínuos (Calderoni, Ferrara, Franco, & Maio, 2015; Górak & Luckner, 2016).

A técnica Random Forest, é um classificador que consiste numa coleção de

classificadores hierárquicos do tipo árvore {ℎ(𝒙, 𝜃𝑘), 𝑘 = 1, … } onde o {𝜃𝑘} é um vetor

independente dos vetores anteriores {𝜃1,…,𝜃𝑘−1}, mas com a mesma distribuição. Assim, uma

árvore é construída a partir do conjunto de treino e 𝜃𝑘, resultando num classificador ℎ(𝒙, 𝜃𝑘),

onde 𝒙, é o vetor de entrada. Após a construção de um largo conjunto de árvores, elas irão votar na classe mais popular em obtida de cada árvore a partir da entrada 𝒙 (Breiman, 2001).

Assim, dado o conjunto de classificadores, ℎ1(𝒙), ℎ2(𝒙), … , ℎ𝑘(𝒙), com o conjunto de

treino obtido aleatoriamente a partir da distribuição do vetor aleatório Y, X, permite definir a função de margem que mede a média do número de votos obtidos em X,Y, para a classe que excede a votação média de qualquer outra classe. Assim, quanto maior a margem, maior a confiança. A função de margem para a Random Forest é então:

𝑚𝑟(𝐗, 𝑌) = 𝑃𝜃(ℎ(𝐗, 𝜃) = 𝑌) − max

𝑗≠𝑌 𝑃𝜃(ℎ(𝐗, 𝜃) = 𝑗)

onde a força de cada conjunto de classificadores {ℎ(𝐗, 𝜃)} é

𝑠 = 𝐸𝑿,𝑌 𝑚𝑟(𝑿, 𝑌)

Assumindo que 𝑠 ≥ 0, erro de generalização, que nos permite verificar se a probabilidade é superior ao espaço X,Y é

𝑃𝐸∗ ≤ 𝑣𝑎𝑟(𝑚𝑟)/𝑠2

No entanto é possível expandir a variância de mr derivando-a da seguinte forma: onde 𝑗̂(𝐗, 𝑌) = arg max

𝑗≠𝑌 𝑃𝜃(ℎ(𝐗, 𝜃) = 𝑗)

então,

𝑚𝑟(𝐗, 𝑌) = 𝑃𝜃(ℎ(𝐗, 𝜃) = 𝑌) − 𝑃𝜃(ℎ(𝐗, 𝜃) = 𝑗̂(𝐗, 𝑌))

No entanto, existem algumas considerações a tomar relativamente a aplicação de

Random Forests, quando aplicada a mais que 2 classes, nomeadamente relativo à função s uma

vez que está depende não só da floresta em si, mas também das árvores individuais, uma vez que é a floresta que determina 𝑗̂(𝐗, 𝑌). Assim

𝑃𝐸∗ = 𝑃 𝑿,𝑌(𝑃𝜃(ℎ(𝐗, 𝜃) = 𝑌) − max 𝑗≠𝑌 𝑃𝜃(ℎ(𝐗, 𝜃) = 𝑗) < 0) ≤ ∑ 𝑃𝑿,𝑌(𝑃𝜃(ℎ(𝐗, 𝜃) = 𝑌) − 𝑃𝜃(ℎ(𝐗, 𝜃) = 𝑗) < 0) 𝑗 define 𝑠𝑗 = 𝐸𝑿,𝑌(𝑃𝜃(ℎ(𝐗, 𝜃) = 𝑌) − 𝑃𝜃(ℎ(𝐗, 𝜃) = 𝑗) < 0)

como sendo a força de cada conjunto de classificadores {ℎ(𝒙, 𝜃𝑘)} em relação à classe

j.

Modelo de localização

Com base nesta implementação, Górak e Luckner (2016), propõe o seguinte modelo de localização, onde define o seguinte conjunto de pressupostos:

(i) AP é o conjunto de Pontos de acesso utilizados para a localização;

(ii) 𝐹 = 𝑹2×𝒁×𝑹×𝑹𝑛é o espaço de todas as possíveis amostras (fingerprints - 𝑓), onde 𝑛 = #𝐴𝑃, onde para 𝑓 ∈ 𝐹:

a. As primeiras coordenadas 𝑓1[𝑚], 𝑓2[𝑚] representam a posição

horizontal onde a amostra foi recolhida, 𝑓3 ∈ 𝑍, é o número do andar;

b. 𝑓4[𝑠] é o registo temporal da amostra;

c. 𝑓𝑘[𝑑𝐵𝑚], onde 4 ≤ 𝑘 ≤ 𝑛 + 4, é o RSS (potencia de sinal) da amostra

(iii) 𝐿 = (𝐿𝑥, 𝐿𝑦, 𝐿𝑓) ∶ 𝐹 → 𝑅2×𝑍 é a projeção para o modelo de 3 coordenadas

onde o conjunto F e 𝜋 ∶ 𝐹 → 𝑅𝑛 é a projeção para as ultimas n coordenadas.

Assim 𝐿𝑓 representa a associação entre a localização de uma amostra 𝑓, e 𝜋(𝑓)

é o vector de RSS (sinal) associado com essa amostra.

Assim, o autor propõe o modelo de localização como a função 𝐿̂: 𝑅𝑛 → 𝑅2×𝑍 que dado

um registo de sinal 𝑣 ∈ 𝑹𝑛, 𝐿̂(𝑣) prevê a localização onde essa amostra 𝑣 foi recolhida. Assim

para cada 𝑎 ∈ 𝐴𝑃, é construído 𝐿̂𝑎𝑥, 𝐿̂𝑎𝑦 𝑒 𝐿̂𝑓𝑎 com 𝐿̂(𝜋(𝑣)) = (𝑥̂, 𝑦̂, 𝑓̂)

𝑥̂ = 𝑚𝑒𝑎𝑛{𝐿̂𝑎𝑥(𝑣) ∶ 𝑎 ∈ 𝑠𝑢𝑝𝑝(𝑣)}

𝑦̂ = 𝑚𝑒𝑎𝑛{𝐿̂𝑎𝑦(𝑣) ∶ 𝑎 ∈ 𝑠𝑢𝑝𝑝(𝑣)}

𝑓̂ = 𝑚𝑒𝑎𝑛{𝐿̂𝑓𝑎(𝑣) ∶ 𝑎 ∈ 𝑠𝑢𝑝𝑝(𝑣)}

O exemplo aqui apresentado demonstra a implementação da técnica Random Forest para a construção de um modelo de localização que permite a localização interna dentro de edifícios com uma precisão significativa, com Górak e Luckner (2016) a obter taxas de erro perto dos 4,1m horizontal e 4,7 vertical no percentil 90, o que é bastante significativo dada as condições de detioração que o sinal WiFi sofre com os obstáculos.

Documentos relacionados