Chargement ...

Le groupe Serda / Conseil / Dématérialisation Workplace / En quel format numériser ?

En quel format numériser ?

La dématérialisation s’impose aujourd’hui dans toutes les organisations. Beaucoup de documents sont dès lors numérisés, encore faut-il savoir sous quel format les conserver. 

Le Référentiel Général d’Interopérabilité version 2 (RGI) recommande 5 formats utilisables pour les objets images :

TIFF : Tag Image File Format
GeoTIFF : Geographical Tag Image File Format
PNG : Portable Network Graphics
JPEG : Joint Photographic Experts Group
PDF : Portable Document Format

GeoTIFF est une standardisation particulière du format TIFF et PNG est un format peu pratique à utiliser pour la numérisation.

Le format JPEG

Défini par et pour la photographie, ce format présente des inconvénients pour la numérisation de documents. Les techniques de compression utilisées par JPEG, ne sont pas optimales pour le texte. L’utilisation du format JPEG à la numérisation interdit quasiment tout traitement ultérieur sur l’image.

Le format TIFF

Ce format est couramment utilisé par les logiciels de numérisation. Il permet de créer des fichiers multipages, ce qui est intéressant pour la numérisation de documents plus ou moins volumineux.
L’inconvénient de ce format est double :

  • Sa pérennité dans le temps n’est pas garantie, car il n’est pas soutenu par une organisation internationale de normalisation, à l’exception de ses deux variantes qui sont des standards de la télécopie noir et blanc ou couleur, gérés par l’UIT-(Union Internationale des Télécommunications).
  • Les visionneuses TIFF sont des outils propriétaires, même s’il existe des logiciels gratuits comme IrfanView ou XnView et une bibliothèque OpenSource : LibTIFF.

Il est le format privilégié pendant la phase de traitement post-numérisation des documents. Mais il est préférable de le convertir ensuite en PDF pour la conservation.

Le format PDF

PDF (ISO 32000) est un format normalisé internationalement. Disposant de visionneuses gratuites il est le format préférentiel de tout document numérisé.

  • Il est multipage et multi documents ;
  • Il permet d’intégrer les métadonnées documentaires, 
  • Il peut sécuriser le document électronique, 
  • Il permet la signature électronique des documents.

La norme ISO 19005 définit un PDF Archive pour la conservation.
Elle a 3 versions publiées et une quatrième en cours de publication.
La version PDF/A-1, antérieure à l’adoption de la norme ISO 32000, est basée sur la version 1.5 d’Adobe PDF. Elle ne dispose pas des technologies de compression les plus modernes ; elle ne permet pas l’encapsulation de plusieurs documents dans le PDF.
La version PDF/A-2 est basée sur l’ISO 32000. C’est la version recommandée pour l’archivage. Elle peut archiver en un seul fichier un dossier de documents PDF.
La version PDF/A-3 répond à un besoin spécifique d’archivage de documents d’origine numérique, lorsqu’il est souhaité de conserver le format original en plus de sa conversion en PDF. 

Enfin la norme ISO32000 étant en révision pour incorporer entre autres les nouveaux formats 3D, une version PDF/A-4 est en développement.
Note  : quel que soit la version de PDF, les documents numérisés seront pérennes, car par nature ils ne comportent pas d’éléments susceptibles d’empêcher leur lecture ultérieure.

Michel THOMAS
MT CONSEIL