Catalogue des formats de données d'archivage (
Cfa, v2)
Données structurées: Tableurs
Le logiciel tableur représente des données numériques et alphanumériques et permet en particulier de les traiter au moyen de fonctions. Les applications de gestion de tableaux sont fournies pour diverses plates-formes par des producteurs commerciaux et sont aussi disponibles sous forme de projets source ouverte. Chacune possède son propre format.
Il n’existe actuellement aucun format de fichier de tableur qui ait réussi à s’imposer dans le domaine de l’archivage. Il est nécessaire de tenir compte de trois aspects différents dans les considérations sur un format d’archivage approprié pour les tableurs (documents provenant de tableurs):
- La fonctionnalité (aspect calcul). Pour assurer celle-ci, il est indispensable d’archiver en format original du tableur, c’est-à-dire en XLS ou OOXML.
- La nature du tableau. Celle-ci peut être prise en considération en traitant la feuille de calcul comme une base de données. On est alors renvoyé aux formats d’archivage des bases de données. En particulier, la possibilité d’exporter en XML est assurée par le format SQLX.
- L’aspect visuel. Celui-ci peut être reproduit par une conversion en PDF/A.
Le choix d’un format d’archivage dépend donc de l’aspect des données du tableur considéré comme essentiel. Il est malaisé de donner une recommandation générale.
Il est possible de recourir à une solution provisoire qui tienne compte des deux principes fondamentaux du choix de format, à savoir éviter les migrations superflues tout en se réservant le plus grand nombre d’options possibles. Les tableurs commerciaux disposent généralement d’une rétrocompatibilité avec quelques versions. Par conséquent, il y a toutes les raisons de penser qu’un fichier en format courant pourra être lu sans problème pendant les dix années à venir par les versions suivantes du programme. Il est donc inutile de procéder à une migration. Dans le cas d’un fichier dans une version ancienne du format, il faut procéder à une migration dans le format actuel au moyen du logiciel correspondant (selon les investigations du «Digital Preservation Testbed» [p. 20], il est préférable de sauter chaque fois une ou deux versions). Dans le cas d’applications périmées en format propriétaire, il est indispensable d’effectuer une migration dans le format d’une application actuelle.
Ces considérations s’appliquent en particulier au format
XLS de Microsoft Excel qui domine le marché. Bien que ce format ne réponde pas aux exigences de l’archivage, il est plus judicieux d’archiver les fichiers MS Excel dans ce format propriétaire plutôt que d’effectuer une migration dans un format plus approprié mais n’ayant pas fait ses preuves et dont la diffusion est faible. La lisibilité de 10 ans, atteinte grâce à la compatibilité descendante, accorde au service d’archivage un délai lui permettant de chercher un format d’archivage futur plus approprié.
Bibliographie
AHDS Preservation Handbook: Spreadsheets
Version 0.5, 2005
http://ahds.ac.uk/preservation/spreadsheets-preservation-handbook.pdf
Digital Preservation Testbed: From digital volatility to digital permanence. Preserving spreadsheets
2003
http://www.digitaleduurzaamheid.nl/bibliotheek/docs/volatility-permanence-spreadsh-en.pdf
Formats examinés
Dans l’ordre de leur aptitude à l’archivage:
Recommandations
- Lorsque la préservation de la fonctionnalité des données du tableur archivées est essentielle, il faut archiver dans le format d’origine, en général XLS ou OOXML. Cela peut aussi être considéré comme une solution provisoire en attendant un format d’archivage futur plus approprié.
- Les formats d’archivage sous forme de base de données sont à conseiller lorsque l’aspect tabulaire est considéré comme essentiel.
- Si seul l’aspect visuel constitue une propriété essentielle, mais pas la fonctionnalité, il est possible de convertir les feuilles de calcul en PDF/A.