Guide méthodologique : les outils de validation du format PDF/A (3)

Ce guide constitue la troisième et dernière partie de l'étude sur les formats PDF, menée par CINES (Centre Informatique National de l'Enseignement Supérieur) en collaboration avec la société NUMEN,  à la demande des archives de France et de la TGIR Huma-Num.

Consacrée aux outils de validation du format PDF/A, l'étude se concentre plus particulièrement sur les formats PDF/A-1b, PDF/A-2b et PDF/A-3b. L'objectif d'un outil de validation est de s'assurer qu'un document déclaré comme du PDF/A respecte bien les spécifications propres à cette norme.

Huit validateurs, dont un libre (Apache PDFBOX), ont été sélectionnés pour réaliser des tests. Des fichiers volontairement erronés leur ont été soumis, afin de contrôler leur capacité à repérer correctement les erreurs « attendues ». Ces erreurs, introduites manuellement, sont considérées comme possibles ou courantes. Après l'analyse des résultats, l'étude propose quelques scénarios de validation en fonction des besoins.

Auteur : 
Nick Parker (NUMEN), Alexandre Granier, Franklin Boumda (CINES)