La question des formats dans le contexte général de l’informatique et dans une approche historique


D’une définition large ...

Le format des données est la manière utilisée en informatique pour représenter des données sous forme de nombres binaires. C'est une convention pour représenter des données, soit des informations représentant un texte, une page, une image, un son, un fichier exécutable, etc. On appelle format de fichier la manière dont des données sont enregistrées dans un fichier.

Une telle convention permet d'échanger des données entre divers programmes informatiques ou logiciels, soit par une connexion directe soit par l'intermédiaire d'un fichier. Le rôle des différents formats de codage est de permettre de présenter l’information afin de la rendre lisible, sous forme textuelle, image, audio, vidéo ou mixte.

... à une chaîne d’éléments qui s’enchaînent

Un format est un élément qui implique un autre (le logiciel) qui, à son tour, en exige un troisième (la version) et un quatrième (le système d’exploitation) pour aboutir sur un cinquième (le matériel). Tous ces éléments forment une chaîne, soit dans le sens d’une série de maillons, solidaires l’un de l’autre, soit dans l’idée qu’elle peut être une entrave si un des éléments vient à manquer ou à faire défaut. Autrement dit, le format peut déterminer toute la chaîne des éléments nécessaires à son utilisation. Les types de format peuvent être classés du plus fermé au plus ouvert, certains sont définis par des normes, le plus grand nombre sont standardisés.

La banalisation du document numérique, depuis l'apparition de l'informatique, n'est pas sans poser de nombreux problèmes d'ordre technique, culturel, économique ou juridique. On est passé, en quelques années, d'une logique de stockage à une logique de flux et d'une gestion de document à une gestion de contenu. La question des formats est fondamentale dans ce contexte, car elle agit sur la communication et la pérennité des données. En raison à la fois de sa complexité technique et de son existence dans un monde sans frontières, le document numérique a débouché sur la création de nombreux standards et des normes internationales

Deux dates pour situer le contexte:

1962: En France, Philippe Dreyfus invente le mot informatique pour désigner la science du traitement de l'information et des ordinateurs.

1964: Création du code ASCII (American Standard Code for Information Interchange), normalisé en 1966 par l'ISO pour simplifier l'échange de données entre ordinateurs. Malgré cela, IBM maintient sa propre norme propriétaire EBCDIC (Extended Binary Coded Decimal Interchange Code).

Les premiers formats sont des formats de description de pages, se contentant de la description physique du document, sans s’intéresser ni à son contenu ni à sa structure logique.


Histoire des formats archivistiques


Bien que le mot interopérabilité puisse revêtir des acceptions différentes en fonction du contexte, il est généralement pris dans le sens de «capacité des produits et services informatiques disparates à échanger et à utiliser des données et des informations (c’est-à-dire «communiquer») en vue de fonctionner ensemble dans un environnement en réseau».

L’histoire de l’informatique a été marquée depuis son origine par une quête – certains diront sans fin – d’interopérabilité, à savoir la possibilité de faire travailler ensemble des logiciels en provenance de divers fournisseurs.

L’interopérabilité constitue, depuis toujours, une sorte de Graal de l’informatique. Elle peut être obtenue par de nombreux moyens complémentaires, dont celui qui intéresse la question de la publication des formats, API ou protocoles. Ainsi, il peut s’agir de formats de fichiers permettant l’interopérabilité au niveau de l’échange de fichiers (par exemple, les schémas XML qui ont été publiés dès 2003 par Microsoft pour les principales applications de sa suite Office ou les formats ODF d’OpenOffice.org qui ont été publiés avant que ces derniers ne soient normalisés), d’API permettant l’interopérabilité au niveau de la programmation entre une application et une plate-forme sous-jacente, et de protocoles qui définissent la façon selon laquelle les logiciels dialoguent directement sur le réseau.

L’industrie informatique est, aujourd’hui, certainement plus harmonisée dans son approche générale que par le passé.

Bibliographie

De la Théorie à la Pratique. Didacticiel d'Imagerie Numérique, 2000-2003, Bibliothèque d l'Université Cornell/Département de Recherches,
http://www.library.cornell.edu/preservation/tutorial-french/contents.html

CHAUMIER, Jacques, Document et numérisation. Enjeux techniques, économiques, culturels et sociaux, Paris, Association des professionnels de l'information et de la documentation, 2006. 199 p.

last update: georg.buechler - Mon, 17 Dec 2012 [14:10:08]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques