Catalogue des formats de données d'archivage (Cfa, v2)

Données textuelles


Sous données textuelles, nous entendons des données permettant la représentation de textes peu structurés, tels qu’ils sont produits par les logiciels de traitement de texte ou les éditeurs de texte. Pour l’archivage de données textuelles, il est traditionnellement proposé de convertir les formats naturels de tels logiciels dans des formats plus appropriés aux formats d’archivage, p. ex. PDF et depuis peu, PDF/A. Lors du passage de formats de fichiers ouverts, fondés sur XML, la question se pose de savoir si ceux-ci pourraient également se prêter aux formats d’archivage.

Il faut faire attention à la distinction fondamentale entre les formats basés sur les pages et ceux non basés sur les pages. Les formats basés sur les pages comme les PDF et PDF/A sont optimaux pour l’impression car le saut de page et la mise en page sont déterminés. Pour les formats non basés sur les pages, comme tous les formats de traitement de texte, le texte lui-même est la préoccupation centrale; le saut de page est seulement déterminé lors de l’impression (ou lors de la conversion dans un format basé sur les pages).

Le passage de fichiers textuels aux fichiers graphiques, p. ex. TIFF, est déconseillé. En plus de l’économie de place en mémoire, c’est surtout la perte des possibilités d’exportation des textes qui parle en sa défaveur.

Formats analysés

Dans l’ordre de leur aptitude à l’archivage:


Recommandation

Dans la mesure du possible, les données textuelles devraient déjà être transposées par l’office en format PDF/A sous lequel elles pourront être directement archivées.