Preservação de Documentos
Preservação de Documentos
Digitais utilizando o formato
Digitais utilizando o formato
PDF/A:
PDF/A:
ISO 19005
ISO 19005
João Lima
joaolima@senado.gov.brMembro da Câmara Técnica de Documentos Eletrônicos do Conselho Nacional de Arquivos
Agenda
Contexto
PDF/A (ISO 19005)
○PDF/A-1 (ISO 19005-1:2005)
○PDF/A-2 (ISO 19005-2:2011)
○PDF/A-3 (ISO 19005-3:2012)
Tópicos
○Fontes Embutidas
○Metadados
○Assinatura Digital
○Verificação de Conformidade
○Geração de Arquivo PDF/A
Exemplo de PDF/A
• Alguns slides foram baseados em slides enviados por Leonard Rosenthol (Adobe)
• I Simpósio Nacional sobre Gestão, Preservação e Acesso aos Documentos Arquivísticos (Rio de Janeiro - 10/04/2013)
Littera Florentina
Imperador Justiniano - 530-533 d.C
- corpus iuris civilis
- Pergaminho (907 folhas)
- Redescoberta por volta de 1100 - É preservada na
Normas Jurídicas inscritas em
pedra
Código de Hamurabi - 1700 a.C.
Pedra de Roseta (196 a.C.)
- Decreto de Ptolomeu V escrito em
Outros suportes e o Suporte Digital
Barro
Madeira
Papiro
Papel
Preservação do Documento =
Preservação do Suporte
Suporte Digital
Preservação do Documento Digital ≠
Contexto
Documentos Digitais
Suporte + Mediação
Preservação
○ Migração de formato > Perda de Informação
Criado pela Adobe em 1993
○ Documentos orientados à página ○ Independente de plataforma
○ Representação visual exata ○ Compacto
Padrão “de facto”
Aberto, Proprietário
8 versões em 13 anos
○ 1.1 (1994), 1.2 (1996), 1.3 (2000), 1.4 (2001), 1.5 (2003),
Problemas de Visualização/Impressão
Exemplos
Esquema de cores dependente de dispositivo
PDF e padronização ISO
PDF – ISO 32.000 = PDF 1.7
2008
PDF > Padrão de jure
Não proprietário
Novas versões do PDF serão definidas pela ISO
Especializações
PDF/X – ISO 15930 - Print Publishing
PDF/A – ISO 19005 - Long Term Archiving
PDF/E – ISO 24517 – Engineering
PDF/A
Formato definido pela ISO para a preservação de
documentos digitais.
Preservação a Longo Termo
○ Aparência visual estática (propósito primário)
Origem, 2002
AIIM (Association for Information and Image Management) NPES (Association for Suppliers of Printing, Publishing and
Converting Technologies)
NARA, LoC, Admin. Office of the US Courts
Publicação ISO, 2005
ISO 19005-1 (Parte 1)
○ Document Management – Electronic document file format for
long term preservation – Part 1: Use of PDF 1.4 (PDF/A-1)
O que é “Longo Termo” na
ISO?
“Long Term”
“period of time long enough for there to be
concerned about the impacts of changing
technologies, including support for new
media and data formats, ..., which may
extend into the indefinitive future”
PDF/A-1 “Versão Simplificada”
Auto contido
Não dependência de recursos externos
○ Ex: os arquivos de definição de fontes tipográficas devem
ser embutidos no próprio PDF
Auto documentado
Metadados obrigatórios
Esquema de cores independente de dispositivo
Permite formulário (sem alterar) e anotações (sem
áudio, vídeo e arquivos externos)
Proibido
Links, Criptografia, Javascript, Postscript Embutido,
Multimídia (vídeo, áudio, 3D), Security Settings,
Transparência, Camadas, JPEG2000, Anexos
PDF/A-1 – Níveis de Conformidade
PDF/A-1b (basic)
garante a reprodução confiável da
aparência visual do documento
PDF/A-1a (accessible)
“A-1b”
+ Tagged PDF
+ Unicode mapping
+ Especificação de idioma
> Estrutura Lógica
PDF/A-2 - 2011
Parte 2 (não substitui a Parte 1)
Permite algumas características proibidas no
PDF/A-1
Transparência
Camadas
Compressão JPEG 2000
Anexos no formato PDF/A
Assinatura Digital Avançada (PaDes)
Define um novo “nível de conformidade”
PDF/A-2b – básico
PDF/A-2u – texto em Unicode = A-2b + Unicode
PDF/A-2a - avançado (completo)
PDF-A/3 - 2012
Permite Anexos (“Associated Files”) em
qualquer formato
Ex: XML, RTF, PPT, etc
Usos
“Data” - Arquivo de Dados
“Alternative” - Renderização Alternativa
“Source” - Arquivo Fonte (originário)
CUIDADO:
Está fora do escopo da ISO 19005-3 a
preservação dos arquivos anexados que não
sejam do formato PDF/A.
PDF/A
PDF/A-1 PDF/A-2 PDF/A-3
Notas:
- Não é necessário converter PDF/A-1 em PDF/A-2 ou PDF/A-3 - Um programa leitor de PDF/A-3 deve OBRIGATORIAMENTE ler arquivos nos formatos PDF/A-1 e PDF/A-2.
Programa leitor de PDF/A
Ignorar qualquer informação que não
esteja no padrão PDF e PDF/A;
Utiliza apenas as fontes embutidas
(ignorar as fontes locais);
Mostrar imagens utilizando a profile de
cores embutida;
Apresentar corretamente os campos de
formulários e as anotações;
Desabilitar mudança no documento;
Quadro Resumo
PDF A-1 PDF A-2 PDF A-3
Fontes Embutidas
Metadados
Javascript e EPS (Postscript)X
X
X
MultimídiaX
X
X
TransparênciaX
CamadasX
JPEG2000X
Anexos
X
PDF/A
Qq formato
Assinatura Digital Básica Avançada PAdES Avançada PAdES
PDF/A – Adoção
Fontes Embutidas
Os arquivos de fontes
são incluídos no PDF/A (arquivo completo ou um subconjunto)
A visualização/impressão
não utiliza as fontes da estação de trabalho local fiel à intenção do autor
Licenças
No Embedding [ CUIDADO ] Embedding
○ Preview & Print ○ Editable
○ Installable
Fontes do Adobe Type Library
Podem ser embutidas em PDF
Fontes Gratuitas na Web
Metadados
Auto-documentação
Formato XMP
Encapsula elementos do Dublin Core e de
outros vocabulários
Extensível
Padrão ISO
16684-1:2012
○
Graphic technology – Extensible metadata
platform (XMP) specification – Part 1: Data
model, serialization and core properties
Assinatura Digital em PDF
Integridade, autenticidade, não repudiação
É possível
associar uma representação gráfica
associar um certificado com carimbo de tempo assinaturas em série
PAdES
PDF Advanced Eletronic Signatures
○ ETSI 102778
Permite associar dados de validação
Conversão
& Verificação do PDF/A
Adobe Acrobat
Preflight
Geração de PDF/A
Software
Livre: iText, Apache FOP, Ghostscript, etc.
Proprietário: Adobe, Microsoft, etc…
Adobe Acrobat
PDF Maker
MS Office 2010
Rede de Informação Legislativa e Jurídica
Ferramenta de Autoria de Documentos do Processo Legislativo
Mais Informações sobre o LexML e o LexEdit em: http://youtube.com/lexmlbrasil
http://github.com/lexml
PL
EMENDA
EMENDA
PL’
Proposição Emendas Parecer
Considerações Finais
PDF + XML
Melhor dos dois mundos
○
Visualização universal e estável
○Informação estruturada
PDF/A não é a solução,
mas é parte da solução.
CTDE – 2013/2014
Nota técnica sobre o formato PDF/A
Biblioteca do Senado Federal
Preservação de Documentos
Preservação de Documentos
Digitais utilizando o formato
Digitais utilizando o formato
PDF/A:
PDF/A:
ISO 19005
ISO 19005
João Lima
joaolima@senado.gov.brMembro da Câmara Técnica de Documentos Eletrônicos do Conselho Nacional de Arquivos