Présence-PC s'interroge : Le futur internet sera-t-il en PDF ? Le titre est mal formulé et devrait s'intituler : l'avenir de la publication web passe-t-il par le format PDF ? Question qui va certainement interloquer tous les webmasters. Il y a de quoi rester la bouche ouverte, en un cri étranglé.
Comme la plupart des internautes confirmés le savent, le format PDF a été créé par Adobe et est destiné à l'origine à l'impression et à la lecture de documents quelle que soit la plateforme de destination. Ces documents sont réalisables grâce à Adobe Acrobat (payant) ou quelques outils indépendants dont le coût varie en fonction du nombre de possibilités offertes. OpenOffice permet d'en faire autant.
Quant à l'utiliser pour le web, sous prétexte que la mise en page est plus aisée qu'en XHTML/CSS et qu'il est possible d'y intégrer des "des liens, des images, du son, de la vidéo", c'est une idée d'hérétique. Tout ceci est déjà faisable en HTML et largement répandu. Même si la notion de plugin à installer introduit une contrainte supplémentaire. Dire que le PDF pourrait remplacer les pages HTML à terme est ignorer la partie cachée de l'iceberg.
Avantages et inconvénients s'entrechoquent. Il est plus facile de sauver l'intégralité d'un document PDF car celui-ci est constitué d'un seul fichier (texte + images) tandis qu'un document HTML impose de conserver la multitude de fichiers liés, en modifiant au besoin les chemins d'accès. C'est délicat même avec les navigateurs modernes qui associent un sous-répertoire contenant les annexes au document HTML lors de son enregistrement. Même constat pour les polices utilisées dans le texte ou pour les graphiques vectoriels (inexistants en HTML sauf via l'utilisation de Flash ou SVG). Et si, au contraire, Adobe voulait se rapprocher de Flash, dont Macromedia - son grand concurrent - est à l'origine ? Pourtant...
- Le PDF n'a pas été pensé "web". C'est-à-dire distribution segmentée du contenu à la demande.
- Le PDF ne sépare pas la mise en page du contenu d'où d'évidents problèmes d'accessibilité.
- La sémantique des documents PDF n'est pas aussi forte qu'en HTML d'où une indexation moins fiable par les moteurs de recherche.
- Générer dynamiquement du PDF reste infiniment plus lourd que générer du HTML à la volée (cas des sites en PHP, ASP, Perl, Coldfusion...).
- Le PDF n'est pas épaulé par des langages permettant de dynamiser la présentation (JavaScript, CSS).
- Le PDF manque de formulaires adaptés et d'interactivité forte.
- Le PDF reste actuellement extrêmement minoritaire.
- C'est un format propriétaire.
- C'est un format lourd.
En résumé on peut déjà faire tout ce qu'Adobe propose avec le PDF mais en plus léger, de manière universelle et adaptée à de multiples supports *sauf* pour l'impression qui reste délicate. En somme, aucun avantage pour 99.99% des cas d'utilisation du web. Ce n'est pas pour rien que Google indexe la plupart des documents PDF en proposant une version HTML plus ou moins lisible.