Preservation Planning


PDF/A-2 contenant des images


Certains documents sauvegardés dans un format image ont cependant une fonction plutôt textuelle. On pensera notamment ici à des documents numérisés issus d'imprimés officiels ou d’ensembles de fiches en papier. Dans cette configuration, le choix du format d'archivage doit prendre en compte la nature particulière de ces documents. On trouvera donc ci-dessous des éléments d'évaluation relatifs aux choix du format PDF/A-2 dans ce cas de figure. Cette solution apporte deux avantages essentiels : mettre à disposition une séquence de pages de manière simple et compréhensible tout en utilisant un format d'archivage permettant également l'affichage.

Le format PDF/A-2 peut contenir des images sous plusieurs formes de codages et de compressions dont le potentiel en matière d'archivage doit être évalué. Pour le type de documents mentionnés, la possibilité d'une compression avec perte ne doit cependant pas être écartée pour les raisons suivantes :
  1. Toute numérisation – quelle que soit sa résolution – provoque une perte d'information. Par conséquent, son résultat ne peut être considéré comme un original. La compression avec perte du résultat doit donc être évaluée en tenant compte de cette limitation. (Pour une comparaison des écarts résultants d'une numérisation recourant à une compression modérée avec pertes, voir le rapport du colloque du CECO sur la compression des données images, audio et vidéo, http://kost-ceco.ch/cms/index.php?compression_fr ).
  2. Les caractéristiques essentielles des imprimés officiels et des fiches sont le texte lui-même et sa disposition sur la page; un rendu en haute résolution n'est pas reconnu comme étant la règle.

Les propriétés techniques du PDF/A-2 sont décrites en détail dans le chapitre sur les données textuelles. Une comparaison plus détaillée avec les versions 1 et 3 du format PDF est également possible. La version 2 est particulièrement recommandée comme format d'archivage pour les images, car elle permet l'utilisation de la compression JPEG2000 qui est expressément recommandée.

On trouvera ici une brève évaluation du PDF/A-2 pour son utilisation comme format d’archivage pour les images.

Evaluation


Ouverture du format: 4

Le format PDF/A est une norme ISO.

Licence libre: 4

Ce critère est rempli pour le PDF/A-2; il faut toutefois veiller à n’utiliser aucune police sous licence, aucun algorithme de compression ou de chiffrement.

Diffusion: 3

Le PDF/A-2 s'est largement répandu au cours de ces dernières années dans le monde des archives publiques et d'entreprises.

Fonctionnalités: 3

En principe, la fonctionnalité du PDF/A-2 en tant que format d'archivage pour les images dépend du format graphique encapsulé et des éventuels algorithmes de compression utilisés. Le PDF/A reproduit idéalement les caractéristique d'originaux basés sur des pages, comme les livres, les imprimés officiels ou les fiches. JPEG2000 est recommandé comme algorithme de compression.

Implémentation: 3

Il existe différents outils permettant de créer des documents PDF/A-2 (Adobe Acrobat Professional, p. ex.; voir à ce propos l'étude correspondante du CECO). Les fichiers PDF/A-2 peuvent être lus au moyen de tous les lecteurs dédiés au format PDF (p. ex. Adobe Reader).

Densité de mémorisation: 3

PPDF/A-2 sert de conteneur pour divers formats graphiques et algorithmes de compressions. En principe, une compression avec ou sans pertes peut être acceptée pour l'archivage de documents textuels numérisés organisés page par page. La densité de mémorisation peut, en conséquence, être relativement élevée.

Vérifiabilité: 4

Les fichiers PDF/A-2 peuvent être reconnus avec un haut taux de succès par des logiciels de reconnaissance automatique de format. Il existe plusieurs validateurs pour ce format.

Bonnes pratiques: 3

Ce format sera de plus en plus utilisé pour l’archivage et il est accepté par de nombreux services d'archives. Il n’a par contre pas encore pris une importance significative dans le domaine de la photographie numérique.

Perspectives: 3

Ce format a été conçu comme format d’archivage et son développement se poursuit dans cette direction.

Classes de formats: C

Ce format est nouveau.


Conclusion

Le format PDF/A-2 est adapté à l'archivage d'images numériques. Nous le recommandons en particulier pour l'archivage de documents textuels numérisés sous la forme de pages, comme les imprimés officiels ou les fiches de catalogues de bibliothèques. Le PDF/A-2 permet l'utilisation de divers formats graphiques et d'algorithmes de compressions qui influent de manière importante sur les propriétés archivistiques. Ceux-ci doivent donc être choisis avec soin. L'utilisation de PDF/A-2 avec la compression JPEG2000 est recommandée.

Planification de la pérennisation

La méthode de compression JBIG2 autorisée dans le PDF/A sauvegarde une seule fois des symboles d’égale valeur et les utilise à plusieurs reprises dans tout le document. Ce procédé appelé pattern matching and subsititution (PMS) a pour conséquence, lors de certaines implémentations et configurations, de remplacer des signes par d’autres dans les textes. Comme l’erreur est irréversible et qu’il est impossible d’établir si le procédé PMS erroné a été utilisé ou pas, le CECO recommande de renoncer pour le moment à la compression JBIG2 lors de la création de fichiers PDF. Pour plus de détails, voir http://kost-ceco.ch/cms/index.php?jbig2-compression_fr.


last update: martin.kaiser - Tue, 05 Jul 2016 [16:25:27]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques