Compression des données


Les données numériques (en particulier les données graphiques, les données audio et les données vidéo, mais en principe toutes les données) sont fréquemment comprimées en raison de leur taille afin de pouvoir gagner de la place en mémoire et en capacité de communication. Nous différencions les algorithmes de compression sans perte et avec perte. La compression sans perte est fondée sur la réduction des redondances des fichiers existants. Pour la décompression, ils sont restaurés de manière à rétablir l’état de départ. La compression avec perte est fondée (exclusivement ou de manière subsidiaire) sur la réduction des non pertinences, c’est-à-dire des renseignements qui sont superflus pour l'utilisateur, par exemple parce qu'il ne peut pas de toute façon les percevoir. Ces informations sont toutefois perdues après la compression et l’original ne peut plus être rétabli. La compression avec pertes entraîne des artéfacts de compression plus ou moins élevés, à savoir des modifications caractéristiques et perceptibles du résultat.

En principe, pour l’archivage numérique, il convient d’éviter les algorithmes de compression entraînant des pertes. Etant donné qu’il est pratiquement impossible d’évaluer l’utilisation future des documents archivés, l’archivage doit viser à contenir toutes les informations d’origine dans toutes leurs variantes possibles. La compression temporelle de ((Données vidéo|données vidéo)), notamment, conduit à des problèmes lors du traitement ultérieur éventuel.

Trois objections importantes ont été formulées dernièrement à l'encontre de ce principe:
  1. La notion de «perte» doit être définie avec plus de précision pour les numérisations (d'images, manuscrits, actes officiels, etc.). Une première perte de données irrévocable a en effet lieu lors du processus de numérisation. On peut démontrer que les dénaturations dues à une compression peuvent être moins importantes que celles de la variance produite par numérisation.
  2. Pour les documents d’archives, dont le format est graphique et la fonction textuelle, comme les rétro-numérisés des imprimés officiels ou des fiches, la reconstruction photographique détaillée n'est pas une propriété importante.
  3. Au cours des dernières années, les coûts de l'espace mémoire de l'archivage numérique ont pu être déterminés avec plus de précision. Il s'est avéré que l'espace mémoire nécessaire aux documents d’archives non comprimés, en particulier dans les domaines des images, de l’audio et de la vidéo, conduisait à des coûts inacceptables.
Pour cette raison et bien d'autres, il faut envisager des cas où les données doivent absolument être prises en charge par les archives dans un format comprimé. On évitera dans tous les cas les algorithmes de compression non publiés ainsi que la compression de données déjà comprimées.

Bibliographie

Wikipédia: compression de données
http://fr.wikipedia.org/wiki/Compression_de_donn%C3%A9es
Dale, Robin
Lossy or Lossless? File Compression Strategies Discussion at ALA
in: RLG DigiNews 3,1; février 1999
http://worldcat.org/arcviewer/1/OCC/2007/08/08/0000070513/viewer/file1380.html#technical1
International Association of Sound and Audiovisual Archives IASA
"Die Bewahrung von Schallaufnahmen. Ethische Aspekte, Prinzipien, Strategien (IASA-TC 03)"
Version 2005, à partir du chapitre 10
http://www.iasa-web.org/downloads/publications/TC03_German.pdf
CECO/Memoriav
Colloque: compression des données images, audio et vidéo.
11.11.2009.
http://kost-ceco.ch/cms/index.php?compression_fr

last update: georg.buechler - Tue, 19 Mar 2013 [14:13:10]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques