Catalogue des formats de données d'archivage (Cfa, v2)

Introduction


Le catalogue des formats de données d'archivage a pour but de rendre deux types de services aux Archives suisses: d'une part il montre quels formats sont aptes à l'archivage dans l'état actuel de nos connaissances et peuvent servir de formats de destination pour la migration; d'autre part, lors des contacts avec l'administration, il sert de référence pour déterminer les formats utilisables dans les cycles de vie actifs de l'archivage (et recommandables à ce titre).

Catégories de formats


Au début du travail, une liste des différentes catégories de formats présentant un intérêt pour les archives a été établie. Le catalogue présente des recommandations de formats de données textuelles et graphiques, de données audio et vidéo ainsi que de tableurs et de bases de données.

Catalogue provisoire


La préparation du catalogue s'est appuyée sur une abondante littérature relative aux recommandations de formats pour l’archivage numérique. Sur cette base, un catalogue provisoire a été élaboré avec les formats potentiellement aptes à l’archivage, puis a été épuré et complété en cours de travail. La mise sur pied d’un catalogue provisoire a nécessité un premier travail de tri: les formats manifestement non aptes à l’archivage ont pu être exclus de l’analyse.

Analyse et évaluation


Les formats contenus dans le catalogue provisoire ont fait l'objet d'une analyse selon différents points de vue:


Les trois dimensions de l’analyse des formats


Ces trois points de vue entraînent deux résultats complémentaires. D’une part, ce catalogue des critères d’archivage et des bonnes pratiques permet d'identifier dans chaque catégorie le format le plus approprié à l'archivage et de classifier tous les formats examinés dans une hiérarchie correspondant à leur aptitude à l'archivage. Ainsi, chaque format sera évalué selon le catalogue des critères et se verra attribuer pour chaque critère une note de 1 (non satisfait) à 4 (pleinement satisfait). Ces évaluations seront multipliées selon la pondération des critères puis additionnées. Pour obtenir un classement pertinent, nous calculons le logarithme au moyen de la valeur moyenne d’une catégorie. Les valeurs plus grandes que 1 peuvent être considérées comme particulièrement aptes à l’archivage.

D’autre part, l’analyse selon les classes de formats ne peut être convertie en valeur numérique. Elle aide cependant à l’interprétation des résultats. Elle explicite en particulier l’appartenance de formats aux classes A ou B, qui sont susceptibles d’être proposées dans un avenir proche pour une utilisation archivistique. Les formats de la classe C ne semblent pas encore entrer en ligne de compte pour une transmission. Les formats de la classe D doivent retenir notre attention et pourront être recommandés si l'évolution leur est favorable.

Les résultats de l’analyse tridimensionnelle sont résumés dans une matrice d'évaluation.



Catalogue définitif des formats


Le catalogue des formats se compose des formats aptes à l’archivage ou identifiés comme intéressants pour les archives en raison de leur large diffusion. Un article de synthèse résume l’analyse des formats d’une même catégorie. Il dispense des informations générales ainsi que des recommandations concrètes, fondées sur le classement résultant du catalogue.
Certains formats de ce catalogue sont qualifiés d'"inaptes à l'archivage" parce que leur mode de compression des données entraîne des pertes. La migration de ces formats dans un format apte à l'archivage ne doit toutefois pas nécessairement avoir lieu au moment où ils sont transmis. L'on peut attendre la fin du cycle de vie du format et prolonger ainsi le cycle de migration (ex.: JPEG, MP3, MPEG-2).