PDF/A-2



Preservation Planning


Catégorie

Formats textuels

Abréviations

PDF/A, PDF/A-2, PDF/A-2a, PDF/A-2b, PDF/A-2u
.pdf
application/pdf
fmt/476, fmt/477, fmt/478

Titre

Portable Document Format (Archival)

Versions

PDF/A-2 (correspond à ISO-32000-1 ou à la version PDF 1.7) avec PDF/A-2a, PDF/A-2b et PDF/A-2u (2011)
PDF/A-1 et PDF/A-3 sont également publiés. Comme aucune des versions PDF/A ne remplace une autre, toutes les versions sont valables au même titre.

Description

PDF/A-2 est un «Portable Document Format» conçu pour l’archivage. Le format a été spécifié dans la norme «ISO-19005-2 – Document management – Electronic document file format for long-term preservation». Cette norme correspond à la version PDF ISO 32000-1. La norme ne donne que la liste des fonctions de chacune des versions PDF qui sont obligatoires, recommandées, restreintes ou interdites.
On fait la distinction entre
PDF/A 2a: conformité intégrale à la norme PDF/A;
PDF/A 2b: satisfait aux exigences minimales de PDF/A (l’accessibilité, conformément au paragraphe 508 de l’acte juridique «US Rehabilitation Act», fait défaut);
PDF/A-2u: comme PDF/A-2b, à ceci près que l'ensemble du texte est reproduit en Unicode afin qu'il puisse être indexé et affiché

Evaluation


Ouverture du format: 4

PDF/A-2 est fondé sur la version ISO-32000-1 du cahier des charges PDF, qui repose elle-même sur la version 1.7 élaborée par l’entreprise Adobe Systems. PDF/A-2 est publié en tant que norme ISO 19005-2 et donc ouvert.

Licence libre: 4

Le critère de licence libre est rempli, en particulier car il n'est pas possible d'utiliser tous les algorithmes de compression.

Diffusion: 3

PDF/A-2 correspond à la version PDF ISO-32000-1 (avec certaines restrictions). Cette version est de plus en plus utilisée. PDF/A-2 lui-même est encore peu répandu et peu connu, mais sa diffusion va progresser.

Fonctionnalités: 3

L’extraction de texte et l’ordre naturel de lecture sont conservés dans PDF/A-2. Contrairement à la version PDF ISO-32000-1, la production de son/vidéo et les objets JavaScript ne sont pas autorisés. Les objets structurés (textes, graphiques vectoriels, graphiques matriciels) sont conservés pour autant qu’ils soient encapsulés.
Contrairement à PDF/A-1, la transparence, la compression JPEG2000, les couches et le portfolio PDF ou les fichiers encapsulés PDF/A-1 ou PDF/A-2 sont autorisés.
WYSIWYG est assuré moyennant quelques petites restrictions. La reproduction à long terme (lisibilité et compréhension) est garantie dans le cas de PDF/A-2a. Dans le cas de PDF/A-2b, il manque ce que l’on nomme «Tagged PDF» qui permet l'affichage correct sur différents appareils de sortie (PDA, appareils conformément au paragraphe 508 de l’acte juridique «US Rehabilitation Act»). PDF/A-2u correspond à PDF/A-2b, à ceci près que tout le texte est reproduit en Unicode.

Implémentation: 3

Il existe différents outils permettant de créer des documents PDF/A (Adobe Acrobat Professional, entre autres). Les fichiers PDF/A peuvent être lus avec tous les lecteurs de PDF (p. ex. Adobe Reader). Il existe cependant très peu de lecteurs permettant de lire la structure d'un portfolio PDF. Dans la pratique, il arrive que les documents PDF/A d'un autre outil que l'outil producteur ne soient pas reconnus comme valides en raison de leur complexité.

Densité de mémorisation: 3

PDF/A-2 est en règle générale compact. Au contraire de PDF/A-1, la compression JPEG2000 est autorisée et la densité de mémorisation peut ainsi aussi être plus élevée. L'encapsulation des polices nécessite toutefois davantage de mémoire que dans PDF.

Vérifiabilité: 4

Les fichiers PDF/A-2 peuvent être reconnus au moyen de la séquence d'octets. Il existe de nombreux validateurs.

Bonnes pratiques: 3

PDF/A-2 est certes encore peu utilisé, mais il est accepté comme format d'archivage par plusieurs services.
PDF/A-2 convient particulièrement à l'archivage à long terme, mais il ne peut pas être imprimé sans perte d'informations.

Perspectives: 3

La norme PDF/A-2b s'imposera très vraisemblablement pour l'archivage à long terme aux côtés de PDF/A-1b.
De nouvelles versions sont développées, mais elles n'annulent pas cette version.

Classes de formats: C

PDF/A-2 a été conçu spécifiquement pour l’archivage et ne va pas à l'encontre des exigences relatives à l'archivage à long terme.


Conclusion

PDF/A-2 est un format approprié pour l’archivage à long terme.
Les services d’archivage devraient encourager le stockage des documents administratifs dans la norme PDF/A-1 ou PDF/A-2. Si des documents sont enregistrés sous forme de portfolio PDF/A-2, il faut veiller à ne pas utiliser une structure de contenu importante. Les bonnes pratiques montrent clairement que pour les PDF/A-1, le niveau de conformité b est préféré au a. Il n'est cependant pas clairement établi si le niveau de conformité u est préféré au b.

Planification de la pérennisation

La méthode de compression JBIG2 autorisée dans le PDF/A sauvegarde une seule fois des symboles d’égale valeur et les utilise à plusieurs reprises dans tout le document. Ce procédé appelé pattern matching and subsititution (PMS) a pour conséquence, lors de certaines implémentations et configurations, de remplacer des signes par d’autres dans les textes. Comme l’erreur est irréversible et qu’il est impossible d’établir si le procédé PMS erroné a été utilisé ou pas, le CECO recommande de renoncer pour le moment à la compression JBIG2 lors de la création de fichiers PDF. Pour plus de détails, voir https://kost-ceco.ch/cms/index.php?jbig2-compression_fr.

Références

ISO 19005-2:2011
Document management — Electronic document file format for long-term preservation — Part 2: Use of ISO 32000-1 (PDF/A-2)
http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=50655
[payant]
ISO 32000-1:2008
Document management — Portable document format — Part 1: PDF 1.7
http://www.iso.org/iso/catalogue_detail.htm?csnumber=51502
[payant]

Bibliographie

CECO
PDF/A-2 et PDF/A-3: quelles nouveautés?
Etude du CECO, 2013
https://kost-ceco.ch/cms/index.php?pdf-a-2_3_study_fr
PDF Tools AG (ed)
Diverses informations relatives au PDF/A
http://www.pdf-tools.com/pdf/pdfa-langzeitarchivierung-iso-19005-pdf.aspx
Callas Software GmbH (ed)
PDF/A compact
http://www.callassoftware.com/callas/doku.php/de:pdfakompakt:start

Articles connexes

PDF, PDF/A-1, PDF/A-3

last update: martin.kaiser - Tue, 05 Jul 2016 [16:24:30]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques