2.3 Big DATA
2.3.3 Data Analytics
O estudo do ambiente da an´alise dos dados sensoriais, seja nas medi¸c˜oes dos poluentes no ar baseados em dados em ferramentas de Big Data e IoT conhecido como DA (Data Analytics).
Em termos computacionais, deve haver uma estrutura razo´avel para o armazenamento dos dados, de maneira que isso seja expans´ıvel para contemplar o aumento na gera¸c˜ao dos dados, por exemplo, amplia¸c˜ao de sensores. Nesse sentido emergem dois outros concei- tos: O primeiro deles ´e a distribui¸c˜ao de dados, possibilitando a amplia¸c˜ao dos recursos computacionais de armazenamento de dados e o processamento dos mesmos de forma paralela, discutido em detalhes a seguir. O outro conceito ´e o de paradigma de banco de dados n˜ao relacional ou como popularmente chamado, (do inglˆes, Not only Structu- red Query Language (NoSQL)), o qual tem como propriedade a alta disponibilidade para armazenamento e possibilidade de se expans´ıvel conforme a demanda do volume de dados.
Os bancos de dados NoSQL s˜ao uma solu¸c˜ao eficaz para o processamento de grandes dados, mas esses bancos de dados s˜ao heterogˆeneos. Eles oferecem diferentes modelos de armazenamento de dados, idiomas para desenvolvedores e usu´arios. Esta grande variedade de plataformas dificulta a interoperabilidade dos dados, a integra¸c˜ao de dados e migra¸c˜ao de dados de um sistema para outro (HAJOUI et al., 2016).
Atualmente, existem mais de 50 bancos de dados NoSQL com recursos e otimiza¸c˜oes. Cada um fornece diferentes mecanismos de armazenamento e recupera¸c˜ao de dados, que desempenho, consistˆencia e disponibilidade. Contudo, como v´arias bases de dados NoSQL tˆem diferentes desempenhos e comportamento diferente em termos de consistˆencia e dis- ponibilidade, ´e significativas para ter aplica¸c˜oes que n˜ao est˜ao satisfeitas com apenas um
deles (HAJOUI et al., 2016).
Hajoui et al. (2016) define um m´etodo chamado (do inglˆes, Analytic Hierarchy Process (AHP )) representado na Tabela 5, ou processo de hierarquia anal´ıtica como sendo multi crit´erios para uma tomada de decis˜ao, o qual permite aos decisores modelar um complexo problema em uma hierarquia de estrutura, mostrando as m´etricas, crit´erios, objetivos e alternativas. A AHP ´e composta por v´arios componentes como estrutura¸c˜ao hier´arquica da complexidade, compara¸c˜oes por pares, julgamentos, um m´etodo derivando pesos e considera¸c˜oes de consistˆencia. A an´alise do processo de hierarquia AHP consiste nas seguintes etapas:
1) Definir os crit´erios de decis˜ao sob a forma de uma hierarquia de objetivos. A AHP utiliza uma escala de compara¸c˜ao normalizada importˆancia relativa mostrada na Tabela 5, as compara¸c˜oes s˜ao feitas nos ´ındices usando os crit´erios de proporcionalidade entre 1-9.
2) Ap´os a gera¸c˜ao do vetor de prioridade, a inconsistˆencia de compara¸c˜ao de empare- lhamento pode ocorrer devido o erro de subjetividade humana.
Tabela 5: Compara¸c˜ao escalas de atributos (HAJOUI et al., 2016).
Intensidade Defini¸c˜ao
1 Igual Importˆancia.
2 Intermedi´ario entre 1 e 3.
3 Importˆancia Moderada.
4 Intermedi´ario entre 3 e 5.
5 Fortemente mais importante.
6 Intermedi´ario entre 5 e 7.
7 Fortemente importante.
8 Intermedi´ario entre 7 e 9.
9 Extremamente Importante.
1/2, 1/3, 1/4, 1/5, 1/6, 1/7, 1/8, 1/9
Rec´ıprocos de 2,3,4,5,6,7,8 e 9.
Um grande problema de interoperabilidade de dados ´e quando desejam explorar e analisar dados armazenados em Sistemas. O armazenamento de dados em diferentes
representa¸c˜oes dificulta a consulta e interpreta¸c˜ao de dados. V´arias abordagens foram propostas para facilitar o acesso ao banco de dados NoSQL. Alguns s˜ao baseados na defini¸c˜ao de uma API gen´erica ou capaz de suportar o acesso aos diferentes dados, outros s˜ao baseados em abordagens federadas.
(HAJOUI et al., 2016) define seis crit´erios oriundos do Big Data de interoperabilidade e outros complementares fazem parte dos padr˜oes essenciais de qualidade em engenharia de software:
1 - Modelos de dados (C1): modelos de dados utilizados nesta abordagem, armazena- mento de chaves / valores, armazenamento de documentos e armazenamento baseado em colunas, uma abordagem apropriada ´e aquela que inclui os trˆes modelos de dados, com isso, m˜ao tem limita¸c˜ao de modelo de dados na escolha de banco de dados NoSQL.
2 - Quering (C2): define a complexidade das consultas que podem ser executadas, este crit´erio ´e muito importante para aplica¸c˜oes que exigem grandes dados anal´ıticos ou estat´ısticos, at´e mesmo muito determinantes na escolha de uma solu¸c˜ao.
3) Desempenho (C3): avalia a latˆencia da solu¸c˜ao, este crit´erio ´e muito importante, em grandes aplica¸c˜oes a resposta pode ser em tempo real.
4) Portabilidade (C4): pode ser implementada em uma nuvem num ambiente de forma flex´ıvel ou n˜ao, pode ser implementadas no mesmo, porque n˜ao precisar alterar o c´odigo. A menos que, as bases de dados NoSQL oferecidas pela operador s˜ao diferentes. neste caso, devemos reescrever o c´odigo de a solu¸c˜ao.
5) Integra¸c˜ao (C5): a capacidade de adicionar facilmente um novo NoSQL em base de dados em uma solu¸c˜ao.
6) Mapeamento (C6): se a solu¸c˜ao integrar um (do inglˆes, Object Relational Mapper (ORM )) em API para bases de dados NoSQL, uma variante do Java formar´a uma API. Dado o n´umero de bases de dados NoSQL, o mapeamento facilita o desenvolvimento de aplicativos para usar em NoSQL.
Al´em disso, a arquitetura orientada por modelo modeldriven e a metodologia de enge- nharia podem ser solu¸c˜ao para problema em grandes dados de sensores IoT (HAJOUI et al., 2016), o termo Big Data Analycs mais detalhado ser´a apresentado na pr´oxima se¸c˜ao 2.7.
O processo de hierarquia anal´ıtica (AHP), ´e um multi crit´erio de decis˜oes certas, os quais permitem aos decisores modelar um problema complexo e uma estrutura hier´arquica, mostrando as rela¸c˜oes da meta, objetivos (crit´erios) e alternativas. O AHP ´e composto por v´arios componentes, tais como a estrutura¸c˜ao hier´arquica da complexidade, compara¸c˜oes por pares, julgamentos, um m´etodo de de considera¸c˜oes de consistˆencia. A an´alise processo de hier´arquico (AHP), conforme apresentado na ordem de prioridades da Tabela 5.