C’est à un étonnant concours d’innovation, ou hackathon, que le numérique de l’État, la DINUM, a convié une soixantaine de développeurs et codeurs informatiques : travailler en vase clos pendant deux jours pour proposer une amélioration de l’accessibilité des documents en PDF (Portable Document Format) et des procédés de validation d’accès ou de formulaire Captcha (Completely Automated Public Turing test to tell Computers and Humans Apart). Sur quels projets ont travaillé quelques-unes des équipes réunies à Paris les 11 et 12 février dernier, au moment des célébrations des 20 ans de la loi du 11 février 2005 ?
Accessibiliser les PDF
Pourquoi ce hackathon portait-il sur la création de documents PDF accessibles puisque le procédé existe, proposé par Acrobat qui est l’éditeur du logiciel de création de ce type de documents ? Sauf qu’en pratique peu de documents sont créés avec ce logiciel, la plupart l’étant au moyen de modules intégrés dans des outils bureautiques. « Notre projet doit faciliter la vérification du balisage PDF, et de rendre accessible cette chose-là sur laquelle il y a besoin d’une expertise, explique Théo François, chef de projet PDF Warriors. Il vise à le rendre plus compréhensible à des personnes qui ne savent pas ce que c’est ou ne savent pas corriger ce qu’ils ont potentiellement mal structuré. »
Ce balisage permet la lecture du texte dans le bon ordre par synthèse vocale ; s’il est défectueux, les paragraphes, titres et sections sont en effet lus en désordre : « On demande à beaucoup de personnes de faire des PDF accessibles, poursuit-il, sans leur donner le moyen de le faire. » Acrobat contient en effet une fonction d’ajout de balises d’accessibilité, mais elle ne permet pas de vérifier la cohérence du document final qui repose sur l’expertise du créateur dudit document. « On travaille sur un service web de conversion des balises du PDF en HTML pour accompagner l’utilisateur au moyen d’un outil open source de vérification d’accessibilité pour qu’il corrige ce qui est identifié comme fautif dans le balisage. Puis on réintègre tout cela dans le PDF d’origine. »
Un autre groupe a travaillé sur la restitution de documents PDF pour des personnes malvoyantes ou avec une déficience visuelle temporaire, rencontrant des difficultés de lecture. « Pour permettre aux gens d’y accéder, on propose une solution open source qui s’adapte aux préférences visuelles de chacun, explique Dorothée Blocks du projet Prisme qui a remporté une mention spéciale. Le texte est affiché dans une visionneuse alternative avec réglage de la taille de la police de caractères et de sa couleur par rapport au fond, ou permettant de changer cette police pour une autre, par exemple adaptée aux dyslexiques. » Ce procédé fonctionnerait également pour les documents scannés et enregistrés au format image. Selon Dorothée Blocks, les PDF non accessibles représenteraient 97% des documents en circulation.
Rendre le captcha transparent
Le captcha est une fenêtre de validation d’un formulaire ou d’une procédure en ligne. Dès sa création, il a constitué un obstacle insurmontable pour les usagers déficients visuels puisqu’il consiste à saisir au clavier des lettres et chiffres déformés sur fond à motifs, ou à sélectionner des images contenant un élément précis (bus, feux de signalisation, etc.). Des procédés de contournement ont été élaborés, telle la lecture vocale des lettres à saisir au clavier, mais peu déployés. « On travaille sur le captcha, commente Gauthier Fiorentino, consultant au sein de l’incubateur Beta.gouv. On aimerait créer une solution qui ne perturberait pas l’utilisateur, où tout se passerait de manière invisible, pour des personnes avec plusieurs handicaps, sourdaveugles, etc. »
L’affaire est compliquée par la diversité des captcha et de leur hiérarchie, ces dispositifs étant conçus pour bloquer les robots qui tentent d’entrer dans les plateformes numériques afin d’en siphonner les données, ou le contenu pour l’agréger ailleurs, entre autres dégâts possibles. Son équipe travaille sur un captcha invisible : « Il se base sur de la donnée, l’approche de travail en demandant à la machine de l’utilisateur d’effectuer un calcul compliqué et d’augmenter potentiellement les coûts pour une personne qui tenterait d’envoyer de nombreuses requête à un service numérique. D’autres solutions peuvent se baser sur l’historique de navigation de l’utilisateur : est-ce que sa métrique correspond au comportement d’un humain ou à ce qu’on trouve dans un robot, comme beaucoup de requêtes dans un même site web ? » Le captcha vise également à protéger des intrusions de systèmes d’Intelligence Artificielle cherchant en permanence à s’entraîner sur de la donnée : « C’est une façon de se protéger de tous les acteurs malveillants ou indifférents au concept de propriété intellectuelle. »
L’Agence pour l’Informatique financière de l’État (AIFE) a également participé à ce hackathon : « Notre projet porte sur le captcha de l’État, Captch’État utilisé par plus de 200 services publics, pour améliorer son accessibilité », présente le chef du projet du groupe, qui préfère rester anonyme mais a toutefois été gratifié d’une mention spéciale. Le contraste des lettres et chiffres a été amélioré, mais la lisibilité reste médiocre même s’il est possible de changer le fond tout en conservant les mêmes lettres/chiffres. Il est complété d’une lecture vocale répétitive.
Ces deux journées d’innovation devraient permettre d’améliorer quelques aspects de l’accessibilité numérique. Reste le gros du travail : créer des sites web nativement accessibles, et là, le numérique de l’État a du pain sur la planche…
Laurent Lejard, mars 2025.