3.2 Modelo de dados
3.2.3 Base de dados – PiasaInfo
A base de dados PiasaInfo é usada para guardar os resultados produzidos e sintetizados durante a execução do projeto. Dispõe de um conjunto de tabelas para armazenar toda a informação processada.
55
Figura 3.5 - Base de dados PisaInfo
Tal como a base de dados InfoTemp, também nesta existem atributos do tipo typeless para poderem lidar com possíveis erros de construção de valores, proveniente das diferentes tabelas fontes. As tabelas que incorporam esta base de dados são:
a) Identity
A tabela Identity é uma tabela central canónica usada para guardar toda a informação acerca das identidades sintetizadas, ou seja, toda a informação que constitui uma identidade ou personalidade mestre.
A tabela é assim constituída:
Atributo Descrição
Identity_Id Identificador interno da tabela Identity_Type Tipo de Identidade
Os valores possíveis são: NormalUser, SysAdmin, DBA, Application, SysAdminTool, DBATool, MonitorTool, Unknown
FullName Nome completo da Identidade FirstName Primeiro nome
LastName Último nome MidName Nome intermédio
Id_NM Número mecanográfico ou colaborador PT
Id_NC Número de identificação fiscal ou número de contribuinte Id_BI Número de bilhete de identidade ou cartão do cidadão Id_PA Número de identificação de passaporte
Id_AR Número de autorização de residência Id_NC_Hash Hash de NC
Id_BI_Hash Hash de BI Id_PA_Hash Hash de PA Id_AR_Hash Hash de AR
AD_Users Nome de utilizadores de rede AD_Domains Domínios de rede
56
AD_Emails Endereços de email da identidade Ad_Users_Num Número total de utilizadores de rede Ad_Emails_Num Número total de endereços de email
Company_PT Nome da empresa interna da Identidade Company_Ext Nome da empresa externa da Identidade Association_PT Nome da direção interna da Identidade
Sponsor_PT Responsável pelas aberturas de contas Creation_Date Data de criação da Identidade
Last_Access_Date Data do último acesso realizado por uma conta da Identidade Last_Validation_Date Data da última validação ou modificação da Identidade
Activity_Level Número de acessos efetuados por dia
Accum_Risk_Level Valor que relaciona o nº de contas com perfil de risco, nº de incidentes nos últimos 90 dias e nº passwords falhadas
Recomended_Action Ação recomendada a realizar à Identidade
Os valores possíveis são: N=None, V=Validate, M=Monitor, S=Suspend R=Remove, I=Inform
Matches_Num Número de combinações da identidade
Tainted Indicador de identidade "estragada" ou "contaminada". Significa que foi violada uma regra de unificação e não conseguiu realizar a combinação com outra identidade, requerendo assim intervenção humana.
Os valores possíveis são: True, False
Annotations Anotações informativas acerca da identidade
Source_Etl Nome da rotina de ETL que deu origem à criação da identidade Fail_Ids Conjunto de identificadores de identidades que falharam a
unificação com a identidade corrente
Tainted_Number Número de identidades marcadas como tainted dos clusters
Tabela 3.2 – Tabela Identity
Como esta tabela vai guardar todos os detalhes que caracterizam uma identidade, alguns dos atributos aqui listados vão conter mais do que um único valor.
b) Account
A tabela Account é usada para guardar apenas todas as contas de acesso com diferentes perfis, sejam elas aplicacionais ou de bases de dados ou de sistema, associadas a uma identidade da tabela Identity, excluindo assim quaisquer registos provenientes da plataforma OIM e Pulso/Acessos. Isto porque um determinado evento de login referirá uma dessas contas. É uma tabela central canónica que armazena informação mínima que constitui uma conta ou personalidade operacional.
A tabela é assim constituída:
Atributo Descrição
Id Identificador interno da tabela Application_Id Nome da aplicação da conta
57
Source_Acc_Table Nome da fonte de dados (tabela de origem) da conta Account_Type Tipo de conta
Os valores possíveis são: NormalUser, SysAdmin, DBA, Application, SysAdminTool, DBATool, MonitorTool, Unknown
Profile_Names Nomes de perfis associados à conta Basic_Risk_Level Nível de risco da conta
Identity_Id Identificador da identidade associada à conta (referência ao atributo Identity_Id da tabela Identity)
Confidence_Level Grau de certeza ou confiança da identidade associada à conta Os valores possíveis são: Strong, Weak
Confidence_Source Origem da certeza ou confiança da identidade associada à conta Os valores possíveis são: PIASA_ILA, PIASA_ARM, Manual Account_State Estado da conta
Os valores possíveis são: Active, Suspended, Removed
GUI_Match Número de identificação do ticket da plataforma Pulso/Acessos Creation_Date Data de criação da conta
Last_Access_Date Data do último acesso efetuado Activity_Level Número de acessos efetuados por dia
Accum_Risk_Level Valor que relaciona o nº de incidentes nos últimos 90 dias Recomended_Action Ação recomendada a realizar à conta
Os valores possíveis são: N=None, V=Validate, M=Monitor, S=Suspend, R=Remove, I=Inform
Annotations Anotações informativas acerca da conta
Tabela 3.3- Tabela Account
Apenas o atributo Profile_Names pode conter mais do que um valor.
O atributo Confidence_Level representa o grau de credibilidade do relacionamento da identidade com a respetiva conta expresso através de dois valores, “Strong” e “Weak”. Este nível indica a relação da personalidade operacional com a personalidade mestre associada. Antes do processo de unificação de registos, este atributo tem o valor “Strong” porque cada conta de origem é diretamente transformada numa personalidade mestre (identidade) e numa personalidade operacional (conta), existindo assim um relacionamento direto. Contudo, após o processo de unificação desta identidade com outra identidade, o atributo Confidence_Level é recalculado, isto é, tem o valor “Strong” se a unificação foi desencadeada por um dos cinco números identificativos (Id_NM, Id_NC, Id_BI, Id_PA ou Id_AR), caso contrário terá o valor “Weak” se forem usados os restantes atributos, sendo estes considerados menos credíveis para efeitos de unificação.
c) List_[NM | NC | BI | PA | AR | AD_User | AD_Email]
Cada uma destas tabelas guarda os respetivos tipos de valores utilizados por identidades, e ainda um conjunto de informação que os caracteriza. São tabelas centrais canónicas. Estas tabelas são assim constituídas:
58
Atributo Descrição
Value Valor do atributo
Recs Conjunto de identificadores das identidades que usam o valor (referência ao atributo Identity_Id da tabela Identity)
Recs_Number Número de identidades que usam o valor do atributo
Tainted Indicador de valor "estragado" ou "contaminado". Significa que a unificação de identidades desencadeada por este valor de atributo falhou devido a uma violação das regras de unificação, requerendo assim intervenção humana.
Os valores possíveis são: True, False
Error_Tag Código de erro resultante da aplicação do módulo de validação de dados
Tabela 3.4 – Tabelas List
Apenas o atributo Recs pode conter mais do que um valor.
Todos os atributos indicados neste subcapítulo que agregam mais do um valor utilizam o carater vírgula para a separação de valores. Alguns desses atributos são inicialmente deste tipo mas grande parte aparecem somente após o processo de sintetização de identidades, mais especificamente durante a unificação ou combinação de atributos. No entanto, existem casos especiais de alguns atributos nunca armazenarem mais do que um valor, como por exemplo, Id_NM, Id_NC, Id_BI, Id_PA e Id_AR.