Catalogue des formats de données d'archivage (
Cfa, v2)
Introduction
Le catalogue des formats de données d'archivage a pour but de rendre deux types de services aux Archives suisses: d'une part il montre quels formats sont aptes à l'archivage dans l'état actuel de nos connaissances et peuvent servir de formats de destination pour la migration; d'autre part, lors des contacts avec l'administration, il sert de référence pour déterminer les formats utilisables dans les cycles de vie actifs de l'archivage (et recommandables à ce titre).
Catégories de formats
Au début du travail, une liste des différentes
catégories de formats présentant un intérêt pour les archives a été établie. Le catalogue présente des recommandations de formats de
données textuelles et
graphiques, de
données audio et
vidéo ainsi que de
tableurs et de
bases de données.
Catalogue provisoire
La préparation du catalogue s'est appuyée sur une abondante
littérature relative aux recommandations de formats pour l’archivage numérique. Sur cette base, un catalogue provisoire a été élaboré avec les formats potentiellement aptes à l’archivage, puis a été épuré et complété en cours de travail. La mise sur pied d’un catalogue provisoire a nécessité un premier travail de tri: les formats manifestement non aptes à l’archivage ont pu être exclus de l’analyse.
Analyse et évaluation
Les formats contenus dans le catalogue provisoire ont fait l'objet d'une analyse selon différents points de vue:
- Une évaluation sous l’angle des critères archivistiques révèle la mesure dans laquelle un format satisfait aux exigences de l’archivage et son aptitude à l’archivage ainsi que les risques potentiels de son utilisation. Dans ce but, un catalogue de six critères a été conçu.
- Une analyse des bonnes pratiques établit l’évaluation de chaque format dans le monde archivistique. Etant donné qu’actuellement, aucun format ne s’est clairement révélé apte à l’archivage, cette information relative aux bonnes pratiques est particulièrement utile. Cette vision se traduit par deux nouveaux critères.
- Une classification des formats permet de comprendre les différentes évaluations selon les deux premiers points de vue et contribue au choix de l’une des recommandations. Des distinctions sont opérées entre les formats bien connus, largement utilisés et aptes à l'archivage du fait de leur stabilité, les formats potentiels qui sont certainement appelés à se répandre largement, et les formats potentiels, pour la conception desquels l'aptitude à l'archivage a été déterminante, mais dont l'avenir est encore incertain.

Les trois dimensions de l’analyse des formats
Ces trois points de vue entraînent deux résultats complémentaires. D’une part, ce catalogue des critères d’archivage et des bonnes pratiques permet d'identifier dans chaque catégorie le format le plus approprié à l'archivage et de classifier tous les formats examinés dans une hiérarchie correspondant à leur aptitude à l'archivage. Ainsi, chaque format sera évalué selon le catalogue des critères et se verra attribuer pour chaque critère une note de 1 (non satisfait) à 4 (pleinement satisfait). Ces évaluations seront multipliées selon la pondération des critères puis additionnées. Pour obtenir un classement pertinent, nous calculons le logarithme au moyen de la valeur moyenne d’une catégorie. Les valeurs plus grandes que 1 peuvent être considérées comme particulièrement aptes à l’archivage.
D’autre part, l’analyse selon les classes de formats ne peut être convertie en valeur numérique. Elle aide cependant à l’interprétation des résultats. Elle explicite en particulier l’appartenance de formats aux classes A ou B, qui sont susceptibles d’être proposées dans un avenir proche pour une utilisation archivistique. Les formats de la classe C ne semblent pas encore entrer en ligne de compte pour une transmission. Les formats de la classe D doivent retenir notre attention et pourront être recommandés si l'évolution leur est favorable.
Les résultats de l’analyse tridimensionnelle sont résumés dans une
matrice d'évaluation.
Catalogue définitif des formats
Le catalogue des formats se compose des formats aptes à l’archivage ou identifiés comme intéressants pour les archives en raison de leur large diffusion. Un article de synthèse résume l’analyse des formats d’une même catégorie. Il dispense des informations générales ainsi que des recommandations concrètes, fondées sur le classement résultant du catalogue.
Certains formats de ce catalogue sont qualifiés d'"inaptes à l'archivage" parce que leur mode de compression des données entraîne des pertes. La migration de ces formats dans un format apte à l'archivage ne doit toutefois pas nécessairement avoir lieu au moment où ils sont transmis. L'on peut attendre la fin du cycle de vie du format et prolonger ainsi le cycle de migration (ex.:
JPEG,
MP3,
MPEG-2).