Natureza da Informação
Profª Ana Carolina Lorena
Bacharelado em Ciência e Tecnologia Universidade Federal do ABC
Setembro 2010
Representação de bit
Um bit: útil para situações com duas
possibilidades
Jogar uma moeda
Cara ou coroa
Gênero de uma pessoa
Feminino ou masculino
Veredito de juri
Inocente ou culpado
Verdade de asserção
Modelo de sistema de comunicação
Modelo simplificado
Entrada (símbolos) ( Codificador (Arrays de bits) d Canal (Arrays de bits) d Decodificador Saída (símbolos) (Códigos
Como desenvolver?
Letras: EBCDIC, ASCII, Unicode, BCD, Morse
Inteiros: binário, Gray, complemento de 2
Números: ponto flutuante
Proteínas: código genético
Telefones: NANP, códigos internacionais
Hosts: ethernet, IP, nomes de domínio
Imagens: TIFF, GIF, JPEG
Audio: MP3
Video: MPEG
Tamanho do espaço de símbolos
Dependendo do número de símbolos que precisa
codificar
⇒
diferentes considerações
Número de símbolos em um código =
tamanho
do espaço de símbolos
Alguns tamanhos que serão considerados:
2
Potência de 2 Finito
Infinito, contável Infinito, incontável
Tamanho do espaço de símbolos
Número de símbolos n = 2
Pode ser codificado com um único bit
Número de símbolos n = potência de2
Pode ser codificado com log
2
n bits
Ex.: 2 bits para naipe de cartas
Tamanho do espaço de símbolos
Número de símbolos n = finito, mas não potência
de 2
Pode ser codificado com número de bits de próximo
inteiro superior, que é potência de 2
Ex.: 3 bits para resultado de um dado
Leva a algumas sequências de bits não utilizadas
Ex.: usa só de 000 a 101 para o dado Dois não são usados: 110 e 111
Tamanho do espaço de símbolos
Número de símbolos n = infinito contável
Infinito contável: pode ser mapeado em relação
um-a-um com os inteiros
Cadeia de bits pode denotar apenas número finito dos
símbolos
Ex.: 4 bits podem representar os inteiros 0 a 15
Tamanho do espaço de símbolos
Número de símbolos n = infinito incontável
Ex.: voltagem, pressão
Deve ser usada técnica para substituir por um número
finito de valores que é aproximadamente o mesmo
Ex.: Representando números entre 0 e 1 com dois bits
Aproximação não é reversível
0 0,25 0,5 0,75 1
0,125 0,375 0,625 0,875 00 01 10 11
Mas, usando número grande de bits, decodificação pode ser feita para número próximo o suficiente (ex. representação floating-point)
Uso de capacidade extra
Situações em que há mais padrões de código
que número de símbolos
Ex. inteiros que não são potência de 2
O que fazer com os bits adicionais?
1.
Ignorar
2.
Mapear para outros valores
3.
Reservar para futura expansão
4.
Usar para códigos de controle
Código BCD
Binary Coded Decimal
Sistema de representação dos dígitos decimais de
0 até 9 com um código binário de 4 bits
Ex.: inteiro decimal 834 em BCD é 1000 0011 0100 ;
0,764 é 0.0111 0110 0100 em BCD
• Menos eficiente que o código binário puro (mais bits para representar mesmo número)
( Ex.: 83 = 1000 0011 BCD = 10100112
• Operações aritméticas com BCD também são mais complexas
• Há padrões desperdiçados • Mas entendimento é mais fácil
Código BCD
Alternativas para lidar com os bits extra:
1.
Ignorando padrões de bits extra
Decodificador retorna nada ou
Decodificador sinaliza erro
2.
Mapendo para valores legais
Todos os extras representam o dígito 9 ou
Decodifica extras para 2, 3, 4, 5, 6, 7, supondo que o bit
Código genético
Blocos de construção dos organismos:
células
Dois ou mais grupos de células formam tecidos
Ex.: ossos, músculo
Tecidos organizam-se e formam órgãos
Ex.: coração, cérebro
Órgãos formam sistemas
Ex.: sistema circulatório, sistema nervoso
Código genético
Células podem ser:
Eucariotas
Com núcleo
Armazena material genético
Animais, plantas, fungos
Procariotas
Sem núcleo
Material genético disperso na célula
Código genético
Núcleo: compartimento
separado
Serve como centro de
armazenamento para
informação hereditária
das células eucariotas
Informação genética
armazenada em
cromossomos dentro do
núcleo
Código genético
Humano sadio: 23 pares de cromossomos
Código genético
Cada cromossomo contém uma molécula de
DNA
Ácido Desoxirribonucleico
Genes são regiões das cadeias de DNA
Unidades fundamentais que carregam a informação
de hereditariedade
Informação codificada nos genes direciona a
manutenção e o desenvolvimento das células e
organismos
Código genético
Moléculas de DNA são formadas por duas cadeias
interconectadas de nucleotídeos
Cada nucletídeo é composto de:
Açúcar Fosfato
Uma de quatro bases
Adenina (A) Guanina (G) Citosina (C) Timina (T)
Cada molécula pode ter centenas de
Código genético
Cadeias individuais são interconectadas por
pareamen-tos entre as bases em uma estrutura de dupla hélice
Regras de pareamento: • C com G
Código genético
Informação dos genes realiza um caminho da
entrada até a saída:
DNA (genes)
⇒
mRNA
⇒
ribossomo/tRNA
⇒
proteína
Proteína é o produto final
Código genético
Mensagem genética é comunicada do DNA
no núcleo da célula para os ribossomos fora
do núcleo via o mRNA (RNA mensageiro)
Ribossomos auxiliam na construção da proteína
Transcrição é o processo no qual mRNA é
Código genético
mRNA é cadeia única de nucleotídeos
Igual a DNA exceto por diferenças no açúcar e no
nucleotídeo Timina, que é substituído por Uracila
(U)
Mesmas regras de pareamento, com T
substituído por U
Regras de pareamento: • C com G
Código genético
Código genético
T A C G G C T C C G G A C T C C A T . . . RNA Polimerase promotorTranscrição
DNA
mRNA
T
A
Código Genético
Código Genético
T A C G G C T C C G G A C T C C A T . . . RNA Polimerase promotorTranscrição
A
C G A G G C C U G A G G U A . . .
DNA
mRNA
U G C
Código genético
Proteínas:
Componentes estruturais do corpo
Ex.: fibras dos músculos
Componentes funcionais
Ex.: enzimas (regulam processos bioquímicos)
Acredita-se que todas atividades celulares envolvem proteínas
Código genético
Proteínas são constituídas de cadeias de
polipeptídeos, que são cadeias de aminoácidos
Aminoácidos são componentes orgânicos com um
átomo central de carbono e:
Um átomo de hidrogêneo H Um grupo amina NH2 Um grupo carboxila COOH
Código genético
Cadeias laterais variam de um único hidrogêneo
(aminoácido glicina) a estruturas com até 18
átomos (arginina)
Código genético
Há 20 diferentes tipos de aminoácidos
10 são considerados essenciais
Não são produzidos pelo corpo humano
Devem ser adquiridos por alimentação
Além disso:
9 são hidrofílicos (solúveis em água)
2 têm carga negativa, sendo ácidos 3 têm carga positiva e são básicos 4 não possuem carga
8 são hidrofóbicos
Código genético
mRNA é traduzido no corpo da célula em
cadeia de aminoácidos (proteínas)
Com auxílio de ribossomos e moléculas de tRNA
Ribossomo “prende” mRNA
tRNA (RNA transportador) coloca o aminoácido
Código genético
Código genético
T A C G G C T C C G G A C T C C A T . . . RNA Polimerase promotorTranscrição
A U G C C G A G G C C U G A G G U
A . . .
DNA
mRNA
Met
Ribossomo
A U G
Tradução
códonCódigo genético
Código genético
T A C G G C T C C G G A C T C C A T . . . RNA Polimerase promotorTranscrição
A U G C C G A G G C C U G A G G U
A . . .
DNA
mRNA
Tradução
Ribossomo
Val
Glu
Pro
Arg
Pro
Met
Código genético
Há 20 tipos de aminoácidos que precisam
ser codificados por 4 diferentes bases
Uma base só: 4 possibilidades
×
Duas bases: 4 . 4 = 16 possibilidades
×
Três bases: 4 . 4 . 4 = 64 possibilidades
Códon
⇒
Código possui bastante redundância
Razões biológicas
Código genético
3 códons são de parada (indicam fim da
proteína) = código de parada
(informação de controle)
Código
Resumindo:
Difícil haver milhões de estruturas de manufatura de
proteínas, uma para cada tipo de proteína
Alternativa: procedimento genérico monta proteínas
Guiado por descrição contida no DNA e RNA
Código genético é uma descrição de como uma sequência
de nucleotídeos especifica um aminoácido
Proteína pode ser especificada por uma sequência linear de
nucleotídeos
Representação padrão permite o mesmo aparato de
Referências
Material de: