• Nenhum resultado encontrado

Armazenamento de Dados. e Indexação

N/A
N/A
Protected

Academic year: 2021

Share "Armazenamento de Dados. e Indexação"

Copied!
33
0
0

Texto

(1)

Armazenamento de Dados

e Indexação

(2)

Armazenamento

(3)

Introdução

Dados: O que é?

Qualquer coisa contendo informação

Enciclopédia

Fita cassete

Cartas

(4)

Introdução

Dados: O que é?

Tudo que um computador processa ou é capaz de processar

E-mails

Arquivos texto

Fotos digitais

Base de dados

(5)

Armazenamento de Dados

Informação estruturada em uma forma que pode ser armazenada, e consequentemente, utilizada

Armazenamento Primário

Armazenamento Secundário

(6)

Armazenamento Primário

Principal dispositivo

Corrente elétrica

Alta velocidade

Acesso direto por CPUs

Barramento de memória

(7)

Armazenamento Secundário

Armazenamento magnético

Mantém dados até que sejam apagados

Não são diretamente conetados à CPU

Não são tão rápidos

(8)

Armazenamento de Base de Dados

Crescente aumento de armazenamento

Dobra a cada 2-3 anos

Aumento de custo

Elementos mais caros

Queda no desempenho

Muitos dados

Orçamento vs Desempenho

(9)

Armazenamento de Base de Dados

Empresas possuem DB gigantes

Muitos dados poucos acessados

Outros sempre utilizados

Manter qualidade de acesso para todos os dados

Muito custoso

Ineficiente

Arquiteturalmente impossível

(10)

Armazenamento de Base de Dados

STORAGE TIERING (ST)

Dividir dados em blocos/camadas

Dados “frios” são movidos

Retirados dos blocos mais custosos e rápidos

Continuam disponíveis

Acesso mais lento

Baixa velocidade de acesso

(11)

Armazenamento de Base de Dados

STORAGE TIERING (ST)

Efeito mínimo do desempenho

Dados “frios” são raramente acessados

Dados “frios” também são comprimidos

Information Lifecycle Management (ILM)

Classifica os dados e estabelece políticas de migração de dados em um TIER apropriado

ILM inclui todas as fases de um registro, desde o início até o fim

(12)

STORAGE TIERING (ST)

(13)

Armazenamento de Base de Dados

STORAGE TIERING

Diferentes porções de dados são atribuídos à diferentes TIERS baseado em:

Demanda

Custo

Desempenho

Disponibilidade

Segurança

(14)

Armazenamento de Base de Dados

COMPRESSION TEARING (CT)

Usada além de ST

Dados “frios” são comprimidos:

Ganho de espaço

Perca de desempenho

IML:

Super Ativo → Ativo → Pouco Ativo → Histórico

(15)

Armazenamento de Base de Dados

TIERING

Mesmo com ST e CT é um grande desafio decidir qual aonde e quando um conjunto de dados deve se manter ou migrar para outro TIER

Métodos:

Heat Map

Automatic Data Optimization

(16)

Armazenamento de Base de Dados

HEAT MAP (HM)

Otimiza a organização dos dados

Forma que dados estão sendo acessados

Informa como os padrões de acesso mudam com o tempo

Utilização feita por PL/SQL

(17)

Armazenamento de Base de Dados

HEAT MAP (HM)

(18)

Armazenamento de Base de Dados

Automatic Data Optimization (ADO)

Usuário cria políticas para compressão e deslocamento de dados – SmartCompression

SmartCompression

Utiliza HM para determinar momento de execução de uma operação

ADOs criadas, avaliadas e executadas a qualquer momento por um DBA

Políticas ADOs especificam condições para inicializar uma Operação ADO

(19)

Armazenamento de Base de Dados

Automatic Data Optimization (ADO)

Reduz espaço utilizado por dados antigos

Aumenta o desempenho de Queries

(20)

Armazenamento de Base de Dados

Automatic Data Optimization (ADO)

Exemplo 1

ALTER TABLE orders ILM ADD POLICY

ROW STORE COMPRESS ADVANCED SEGMENT AFTER 30 DAYS OF NO MODIFICATION;

Um segmento é um conjunto de extensões que contém todos os dados para uma estrutura de armazenamento lógico específico dentro de uma tabela.

(21)

Armazenamento de Base de Dados

Automatic Data Optimization (ADO)

Exemplo 2

ALTER TABLE orders ILM ADD POLICY

ROW STORE COMPRESS ADVANCED ROW AFTER 3 DAYS OF NO MODIFICATION;

(22)

Armazenamento de Base de Dados

Automatic Data Optimization (ADO)

Exemplo 3

ALTER TABLE orders ILM ADD POLICY tier to low_cost_store;

(23)

Indexação

(24)

Conceito

Um índice é uma estrutura de dados que associa

uma determinada propriedade de um registro(chave de pesquisa) à sua localização.

Dessa forma a indexação permite encontrar e acessar um registro mais rapidamente.

Índices podem ser densos ou esparsos.

(25)

Estruturas de índices

Índice primário;

Índice de agrupamento (clustering);

Índice secundário;

Índices multiníveis;

Arvores B e B+;

Tabelas Hash;

(26)

Tabela Hash

Hashing é uma forma de indexação de dados onde o índice é gerado à partir da chave de cada registro, utilizando uma função.

Os possíveis índices são inicialmente fixos.

A função hash deve distribuir as chaves o mais

uniformemente possível nos índices.

(27)

Tabela Hash

O algoritmo deve tratar colisões de chaves em um mesmo índice.

Os registros podem ser armazenados em:

Vetor simples

Vetor de listas

Vetor de Buckets

(28)

Tabela Hash

Tabelas Hash podem ser estáticas ou dinâmicas.

É rápido para busca, inserção e remoção, desde que hajam muitas colisões.

Pode usar espaço desnecessário.

(29)

Tabela Hash

(30)

Árvore B

Consegue armazenar índice e dados na mesma estrutura (mesmo arquivo físico)

Características de uma árvore B de ordem d

A raiz é uma folha ou tem no mínimo 2 filhos

Cada nó interno (não folha e não raiz) possui no mínimo d + 1 filhos

Cada nó tem no máximo 2d + 1 filhos

Todas as folhas estão no mesmo nível

Um nó de uma árvore B é também chamado de página

Uma página armazena diversos nós da tabela

(31)

Árvore B+

É semelhante a árvore B, exceto por duas características muito importantes:

Armazena dados somente nas folhas – os nós internos servem apenas de ponteiros

As folhas são encadeadas

Isso permite o armazenamento dos dados em um arquivo, e do índice em outro arquivo separado

Árvore B+ na prática

(32)

Referências

Automatic Data Optimiization with Oracle Database 12c

August, 2013

Author: Kevin Jernigan

Contributing Authors:

Gregg Christman, Cris Pedregal

(33)

Referências

Slides Módulo V: Indexação em Banco de Dados

http://www.inf.unioeste.br/~clodis/BDI/BDI_2007_Modulo5_1.pdf

Hash-Based Indexes Chapter 10

Database Management Systems 3ed

R. Ramakrishnan and J. Gehrke

Referências

Documentos relacionados

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

Seu interesse abrange temas como a diversidade e a sistematização das teorias, de modo que a epistemologia se ocupa não apenas de teorias isoladamente, mas da relação entre elas

Na 73ª SBEn, a ABEn-DF, em parceria com as escolas, serviços de Saúde, Órgãos Estaduais e Federais, Entidades de Classe, Centros Acadêmicos de Enfermagem,

Dessa maneira, os resultados desta tese são uma síntese que propõe o uso de índices não convencionais de conforto térmico, utilizando o Índice de Temperatura de Globo Negro e

OBJETIVOS ESPECÍFICOS  Avaliar a formação de complexos de inclusão finasterida–ciclodextrina e testosterona-ciclodextrina;  Realizar ensaios toxicológicos em peixes

Changes in the gut microbiota appears to be a key element in the pathogenesis of hepatic and gastrointestinal disorders, including non-alcoholic fatty liver disease, alcoholic

O TBC surge como uma das muitas alternativas pensadas para as populações locais, se constituindo como uma atividade econômica solidária que concatena a comunidade com os

Figura 37 – Diagrama classificado de perdas, segundo uma distribuição de Rayleigh, para um sistema de transmissão em HVAC, para um parque de 225 MW, tensão de 138 kV a uma