Tipos de Dados. George Darmiton da Cunha Cavalcanti

(1)

Tipos de Dados

George Darmiton da Cunha Cavalcanti ([email protected])

(2)

Tópicos

• Introdução

• Tipos de Dados Primitivos • Tipos Cadeia de Caracteres • Tipos Definidos pelo Usuário • Tipos Matriz • Matrizes Associativas • Tipos Registro • Tipos União • Tipos Conjunto • Tipos Ponteiro

(3)

Introdução

• Um tipo de dado define uma coleção de dados e um conjunto de operações pré-definidas sobre esses

dados

• Um descritor é um conjunto de atributos de uma variável

• Um objeto representa uma instância de um tipo de dado abstrato definido pelo usuário

• Uma questão fundamental de projeto:

– Quais operações são fornecidas para variáveis do tipo e como elas são especificadas?

(4)

Tipos de Dados Primitivos

• Tipos de dados não-definidos em termos de outros tipos são chamados tipos de dados primitivos

• Praticamente todas as linguagens de programação oferecem um conjunto de tipos de dados primitivos • Alguns tipos de dados primitivos são reflexos do

hardware

– Por exemplo: os inteiros

• Outros exigem um pequeno suporte de software para sua implementação

(5)

Tipos de Dados Primitivos:

Inteiro

• Quase sempre um reflexo do hardware

– Assim, seu mapeamento é trivial

• Muitos computadores suportam

diferentes tamanhos para inteiros

• Em Java, diferentes tamanhos para

inteiros

(6)

Tipos de Dados Primitivos:

Ponto-flutuante

• Modelam os números reais, mas são

aproximações

• Linguagens para fins científicos

suportam pelo menos dois tipos

ponto-flutuante (float e double)

(7)

Tipos de Dados Primitivos:

Ponto-flutuante

(8)

Tipos de Dados Primitivos:

Decimal

• Para aplicações comerciais (moeda)

– Essencial para COBOL

– C# oferece um tipo de dado decimal

• Armazena um número fixo de dígitos decimais • Vantagem

– Precisão

• Desvantagens

– Faixa de valores restrita – Desperdício de memória

(9)

Tipos de Dados Primitivos: Booleano

• Mais simples de todos

• Faixa de valores

– Dois elementos, um para “true” e um para “false”

• Pode ser implementado como bits, mas

geralmente são como bytes

(10)

Tipos de Dados Primitivos: Caractere

• Armazenados como codificações numéricas • O código mais usado: ASCII

• Uma alternativa, codificação de 16-bit: Unicode

– Inclui caracteres da maioria das linguagens naturais – Usado em Java

(11)

Tipos Cadeia de Caracteres

• Valores consistem em seqüências de

caracteres

• Questões de projeto:

– É um tipo primitivo ou apenas um tipo especial de vetores de caracteres?

– As cadeias devem ter tamanho estático ou dinâmico?

(12)

As Cadeias e Suas Operações

• Operações típicas:

– Atribuição e cópia – Comparação (=, >, etc.) – Concatenação – Referências a subcadeias – Pattern matching

(13)

Cadeias nas Linguagens

• C e C++

– Não primitivo

– Usam vetores char e uma biblioteca de funções que oferecem operações (string.h)

• SNOBOL4 (uma linguagem de manipulação de cadeias)

– Primitivo

– Muitas operações, incluindo pattern matching elaborados

• Java

(14)

Opções de Tamanho da Cadeia

• Estático

– COBOL, FORTRAN 90, Pascal, Ada e Java classe String

• Tamanho dinâmico limitado: C e C++

– Um caractere especial é usado para indicar o final da cadeia, em vez de manter seu tamanho

• Dinâmico (sem máximo): SNOBOL4, Perl, JavaScript • Ada suporta todas as opções acima

(15)

Tipos Cadeia de Caracteres:

Avaliação

• São importantes para a capacidade de

escrita de uma linguagem

• Como um tipo primitivo com tamanho

estático, não é caro

– Por que não usá-las?

• Tamanho dinâmico é mais flexível

(16)

Implementação dos Tipos Cadeias de Caracteres

• Tamanho estático

– descritor em tempo de compilação

• Tamanho dinâmico limitado

– Podem exigir um descritor em tempo de execução para armazenar tanto o tamanho máximo como o tamanho atual (mas não em C e C++)

• Tamanho dinâmico

– Exigem um descritor em tempo de execução

– Exigem um gerenciamento de armazenagem mais complexo

(17)

(18)

(19)

Tipos ordinais definidos pelo

usuário

• Um tipo ordinário é aquele cuja faixa de valores possíveis pode ser associada ao conjunto dos números inteiros positivos

– Tipos Enumeração – Tipos Subfaixa

• Exemplos de tipos ordinários em Java

– integer – char

(20)

Tipos Enumeração

• Todos os valores possíveis, os quais se

tornam constantes simbólicas, são

enumerados na definição

• Exemplo C#

enum days {mon, tue, wed, thu, fri, sat, sun};

(21)

Tipos Enumeração

• Questões de projeto

– Deve-se permitir que um literal constante apareça em mais de uma definição de tipo e, se assim for, como o tipo de uma

ocorrência desse literal é verificado no programa?

– É possível fazer coerção de valores de enumeração para inteiros?

(22)

Tipos Enumeração: Avaliação

• Vantagens em termos de legibilidade

– Não é necessário codificar uma cor como um número

• Vantagens em termos de confiabilidade

– Operações (não permite adicionar cores) – Nenhum variável de enumeração será

(23)

Tipos Subfaixa

• É uma subsequência de um ordinal

– Exemplo: 12..18 é uma subfaixa dos inteiros

• Projeto em Ada

type Days is (mon, tue, wed, thu, fri, sat, sun); subtype Weekdays is Days range mon..fri;

subtype Index is Integer range 1..100; Day1: Days;

Day2: Weekday; Day2 := Day1;

(24)

Tipos Subfaixa: Avaliação

• Legibilidade

– Informam ao leitor que as variáveis podem armazenar apenas uma faixa de valores

• Confiabilidade

– A atribuição de um valor a uma variável fora de sua faixa pode ser detectado pelo

(25)

Tipos Matriz

• Uma matriz é um agregado homogêneo

de dados cujo elemento individual é

identificado por sua posição no

agregado em relação ao primeiro.

(26)

Questões de Projeto

• Quais tipos são legais para os subscritos?

• As expressões de subscrito nas referências a elementos são verificados quanto à faixa?

• Quando as faixas de subscrito são vinculadas? • Quando a alocação da matriz se desenvolve? • Quantos subscritos são permitidos?

• Matrizes podem ser inicializadas quando têm seu armazenamento alocado?

(27)

Matrizes e Índices

• Índices (ou subscritos) fazem

mapeamento para elementos

array_name(index_value_list) → element

• Sintaxe do Índice

– FORTRAN, PL/I e Ada usam parênteses

• Ada usa parênteses para mostrar uma

uniformidade entre matrizes e chamadas de funções, pois ambos são mapeamentos

(28)

Tipos dos Índices

• FORTRAN, C: apenas inteiros • Pascal: qualquer tipo ordinário

– inteiro, Boolean, Char, enumeração

• Ada: inteiro ou enumeração (incluindo Boolean e Char)

• Java: apenas inteiros

• C, C++, Perl e Fortran não especificam faixa para checagem

(29)

Vinculações de Subscritos e Categorias de Matrizes

• Matriz Estática

– As faixas de subscrito estão estaticamente

vinculadas e a alocação de armazenamento é estática (feita antes da execução)

– Vantagem: eficiência (em alocação dinâmica)

• Matriz Fixa Dinâmica na Pilha

– Faixas de subscrito estão estaticamente

vinculadas, mas a alocação é feita no momento da declaração durante a execução

(30)

• Matriz Dinâmica na Pilha

– Faixas de subscritos estão dinamicamente

vinculadas e a alocação de armazenamento é dinâmica (feita durante a execução)

– Vantagem: flexibilidade (o tamanho de uma matriz não precisa ser conhecido antes da sua utilização)

• Matriz Dinâmica no Monte

– A vinculação das faixas dos índices e a alocação são dinâmicas e podem mudar várias vezes

– Vantagem: flexibilidade (matrizes podem crescer ou encolher durante a execução do programa)

Vinculações de Subscritos e Categorias de Matrizes

(31)

• Matrizes C e C++ que incluem static são estáticas

• Matrizes C e C++ sem static são fixas dinâmicas na pilha

• Matrizes Ada podem ser dinâmicas na pilha

• C e C++ também oferecem matrizes dinâmicas (malloc e free)

• Perl e JavaScript suportam matrizes dinâmicas Vinculações de Subscritos e

(32)

Inicialização de Matrizes

• Algumas linguagens permitem a inicialização no momento em que o armazenamento é

alocado

– Exemplos: C, C++, Java e C#

• int list [] = {4, 5, 7, 83}

– Cadeias de caracteres em C e C++

• char name [] = “freddie”;

– Matrizes de strings em C e C++

• char *names [] = {“Bob”,“Jake”,“Joe”];

– Java inicialização de objetos String

(33)

Operações com Matrizes

• APL permite poderosas operações para

matrizes, como também operadores unários

– Exemplo: inverte os elementos das colunas

• Ada permite atribuição e concatenação de matrizes

• FORTRAN oferece operações elementares pois são operações entre pares de elementos de matriz

– Exemplo: operador + entre duas matrizes resulta em uma matriz que é a soma dos pares de elementos das duas matrizes

(34)

Fatias

• Uma fatia (slice) de uma matriz é

alguma subestrutura desta

• Fatias são úteis em linguagens que

possuem operadores sobre matrizes

(35)

Fatias: Exemplos

• Fortran 95

Integer, Dimension (10) :: Vector Integer, Dimension (3,3) :: Mat

Integer, Dimension (3,3,3) :: Cube Vector (3:6) é um vetor de 4 elementos

(36)

(37)

Acessando Matrizes (multidimensionais)

• Duas maneiras comumente usadas

– Ordem da linha maior (por linhas)

• Usado na maioria das linguagens

– Ordem da coluna maior (por colunas)

(38)

Acessando Matrizes (multidimensionais)

• Exemplo de matriz

3

4

7

6

2

5

1

3

8

• Ordem da linha maior (por linhas)

– 3,4,7,6,2,5,1,3,8

• Ordem da coluna maior

(39)

Localizando um elemento em uma matriz multidimensional

Formato geral

location (a[i,j]) = address of a[row_lb,col_lb] + (((I - row_lb)*n) + (j - col_lb)) * element_size

(40)

Matrizes Associativas

• Uma matriz associativa é um conjunto não-ordenado de elementos indexados por um número igual de valores chamados chaves

– Chaves definidas pelos usuários devem ser armazenadas

• Questões de projeto

– Qual é a forma de referência dos elementos?

– O tamanho de uma matriz associativa é estático ou dinâmico?

(41)

Matrizes associativas em Perl

• Nomes começam com %; literais são

delimitados por parênteses

%hi_temps = ("Mon"=>77, "Tue"=>79, “Wed”=>65, …);

• Os nomes de variáveis escalares

iniciam-se com $

$hi_temps{"Wed"} = 83;

– Elementos podem ser removidos delete $hi_temps{"Tue"};

(42)

Tipos Registro

• Um registro é um agregado possivelmente homogêneo de elementos de dados

• Cada elemento individual é identificado por seu nome

• Questões de projeto

– Qual é a forma sintática das referências a campos? – São permitidas referências elípticas?

(43)

Definições de Registros

COBOL usa números para aninhar registros; outras linguagens usam definições recursivas

01 EMP-REGISTER. 02 EMP-NAME. 05 FIRST PIC X(20). 05 MID PIC X(10). 05 LAST PIC X(20). 02 HOURLY-RATE PIC 99V99.

(44)

Definição de Registros em Ada

type Emp_Rec_Type is record

First: String (1..20);

Mid: String (1..10);

Last: String (1..20);

Hourly_Rate: Float;

end record;

Emp_Rec: Emp_Rec_Type;

(45)

Referências a Campos do Registro

• A maioria das linguagens usam um ponto na notação

– Emp_Rec.Name

• Referências elípticas (exemplo em Pascal)

empregado.nome := ‘Bob’; empregado.idade := 42; empregado.salario := 23750.0; with empregado do begin nome := ‘Bob’; idade := 42; salario := 23750.0; end;

(46)

Avaliação e comparação com matrizes

• O projeto de registros é direto e, seu uso, seguro

• Registros são usados quando os dados formam uma coleção heterogênea

• Acesso aos elementos das matrizes são mais lentos do que para registros, pois os índices são dinâmicos (nomes de campos são estáticos)

• Índices dinâmicos podem ser usados para acessar campos dos registros, mas rejeitaria a verificação de tipos e também seria mais lento

(47)

(48)

Tipos União

• Uma união é um tipo que pode

armazenar diferentes valores de tipo

durante a execução do programa

• Questões de projeto

– A verificação de tipos deve ser exigida?

• Note que qualquer verificação de tipos deve ser dinâmica.

(49)

Discriminantes vs. Uniões Livres

• Fortran, C e C++ oferecem construções de união que não há nenhum suporte na

linguagem para verificação de tipos

– A união nessas linguagens são chamadas de

uniões livres

• A verificação de tipos em uniões exige que cada construtor de união inclua um indicador de tipo, chamado discriminante

(50)

Uniões em Ada

type Shape is (Circle, Triangle, Rectangle); type Colors is (Red, Green, Blue);

type Figure (Form: Shape) is record Filled: Boolean;

Color: Colors; case Form is

when Circle => Diameter: Float; when Triangle =>

Leftside, Rightside: Integer; Angle: Float;

when Rectangle => Side1, Side2: Integer; end case;

(51)

Estrutura de um registro variante

(52)

Avaliação de Uniões

• Construções potencialmente inseguras

– Não permitem verificação de tipos das referências a uniões

– Um dos motivos pelos quais FORTRAN, Pascal, C e C++ não são fortemente

tipificadas

• Java e C# não suportam uniões

– Reflexo da crescente motivação por

(53)

Tipos Ponteiro

• Um tipo ponteiro é aquele em que as variáveis têm uma faixa de valores que

consistem em endereços de memória e um valor especial, nil

• Oferece o poder de endereçamento indireto • Oferece uma alternativa para gerenciar

(54)

Questões de projeto de ponteiros

• Quais são o escopo e o tempo de vida de uma variável de ponteiro?

• Qual é o tempo de vida de uma variável dinâmica no monte?

• Os ponteiros são restritos quanto ao tipo de valor para o qual eles apontam?

(55)

Operações com Ponteiros

• Duas operações fundamentais

– Atribuição e desreferenciamento

• Atribuição é usada para fixar o valor de uma variável de ponteiro em um endereço útil

• Desreferenciamento referencia o valor da célula de memória (não apenas o endereço)

– Dereferenciamento pode ser implícito ou explícito – C++ usa uma operação explícita *

j = *ptr

(56)

Ilustração de atribuição de ponteiro

(57)

Problemas com Ponteiros

• Ponteiros Pendurados (Dangling pointers)

– Um ponteiro que contém o endereço de uma variável dinâmica no monte desalocada

• Variáveis dinâmicas no monte perdidas

– Uma variável dinâmica no monte alocada não mais acessível ao programa usuário (geralmente chamada de lixo)

• Ponteiro p1 é ajustado para apontar para uma variável dinâmica no monte recém-criada

• Mais tarde, ponteiro p1 é ajustado para outra variável dinâmica no monte recém-criada

(58)

Sumário

• Os tipos de dados de uma linguagem são uma grande parte daquilo que determina o seu estilo e seu uso

• Os tipos de dados primitivos da maioria das

linguagens imperativas incluem os tipos numérico, caractere e booleano

• Os tipos enumeração e a subfaixa definidos pelo

usuário são convenientes e aumentam a legibilidade e a confiabilidade dos programas

• Matrizes e registros estão presentes na maioria das linguagens de programação

• Ponteiros são usados para dar flexibilidade de

endereçamento e para controlar o gerenciamento de armazenamento dinâmica