vendredi 1 février 2013

Synthèse vocale

J'ai eu envie de dessiner un bonhomme. Ça peut arriver à tout le monde, d'avoir envie de dessiner un bonhomme. Et j'ai réalisé que je n'avais jamais étudié l'anatomie. Donc, logiquement, j'ai regardé dans ma bibliothèque. Il y a des années, j'avais acheté un reprint du Traité d'anatomie artistique de Paul Richer, qui m'avait fait rigoler, avec ses dessins d'hercules de foire à moustaches en guidon de vélo (la mode des moustaches en guidons de vélo a un peu passé, certes, mais l'anatomie n'a pas franchement changé depuis 1890, et puis j'avais le choix entre ça et comment dessiner les superhéros ou comment dessiner les mangas), j'avais montré le type avec ses biscotos et sa moustache à tous mes potes, et on avait bien rigolé, puis j'ai mis le bouquin dans l'étagère. Donc, là, je suis allé chercher le bouquin, j'ai enlevé la poussière, et je l'ai feuilleté, pour voir ce qu'il y avait dedans… du texte, des tartines de texte, des montagnes de texte, et à la fin, les dessins du moustachu. Et j'ai réalisé que je ne lirai jamais tout ce texte.
Donc je me suis assis et j'ai réfléchi.

Et soudain, j'ai su : le seul moyen (que je connaisse) de lire tous les mots de cette chiée de texte, c'est de mettre le bouquin sur Wikisource. C'est certes complètement ridicule, peut-être aussi une mauvaise raison, mais ça ne fait de mal à personne, le bouquin sera disponible pour qui voudra après et je pourrai dire que je l'ai lu (pas forcément tout compris, mais tout lu).
Donc j'ai cherché un scan du livre, j'ai remarquablement échoué à en faire un djvu, j'ai fait faire le boulot par quelqu'un qui sait faire (c'est assez efficace comme méthode, quand on y réfléchit), et j'ai commencé à corriger l'OCR en partant du début…
Je mets ici des points de suspension parce que ça prend du temps.

Première constatation, ce n'est pas vraiment un texte palpitant. C'est rempli de phrases à rallonges, avec des tas de virgules, de points-virgules, de mots plus ou moins aléatoirement en italique, il y a même des tirets cadratins. Et il n'y a pas forcément de verbe dans les phrases. Du coup, je me suis retrouvé à relire des paragraphes 5 ou 6 fois avant de comprendre ce que l'auteur avait voulu dire.
Seconde constatation, l'OCR n'a jamais entendu parler d'italique. Du coup, il faut un peu d'imagination pour retrouver que « le6’ arclbrln&x inférieures de ctuocL’rose lelHore » veut en fait dire : « fibres arciformes inférieures de l’aponévrose fémorale » en italique.
Toujours est-il que je suis arrivé au bout du bouquin, à faire le gros de la mise en forme, et à remplacer les trucs bizarres par des mots qui existent.
J'étais content, je me disais que j'avais fini le boulot, et j'ai essayé de lire le début. C'est là que j'ai réalisé que les mots qui existent ne sont pas forcément les bons, et que malgré toute la peine que je m'étais donné, il restait plein de trucs à corriger.
Le seul problème, c'est que je ne voyais pas les coquilles.

À ce niveau-là, il faut changer de support, pour lire le truc avec des yeux neufs et repérer les erreurs, c'est là qu'il faudrait imprimer et corriger sur papier. Sérieusement, j'ai déjà le bouquin, j'ai fait tout ça pour ne pas le lire sur papier, ce n'est pas pour l'imprimer avec des fautes (d'autant que ça commence à faire un paquet de pages à imprimer).

Et je me suis souvenu que j'avais un chose de synthèse vocale installé quelque part sur mon ordinateur, et que ça serait peut-être une bonne idée de faire une relecture à la synthèse vocale, avec l'OCR dans l'oreille et les yeux sur le scan.
L'avantage de la synthèse vocale, c'est que ça lit impitoyablement le texte, aussi bizarre soit-il, et qu'on repère assez bien un mot à la place d'un autre. Ça fait aussi une espèce d'intonation et ça fait des pauses pour les virgules, on peut même corriger la ponctuation.
Ça ne voit pas les fautes d'orthographe, bien sûr, mais on a tous un correcteur orthographique pour ça.

Je sais bien que je n'ai pas inventé l'eau tiède, mais je n'ai pensé à relire à la synthèse vocale que récemment, et en en parlant autour de moi, j'ai réalisé que tout le monde n'y a pas forcément pensé. Donc voila, amusez-vous bien à faire parler vos ordinateurs avec leur voix insupportable pour relire vos textes.

D'un point de vue pratique, il y a des tas de logiciels de synthèse vocale, des gratuits, des payants, des bons, des moins bons, des vieux et des nouveaux et que sais-je encore… Ça se trouve en cherchant un peu avec un moteur de recherche.
La chose importante à savoir, c'est que l'informatique étant anglophone d'une manière générale, les trucs savent lire l'anglais. Pour leur faire lire du français, il faut leur mettre une voix en français (je ne refais pas mes recherches, mais si je me souviens bien, il en existe, mais le choix est plus restreint).

Et tant que j'en suis à parler de ça, si vous voulez écouter vos articles de Wikipédia, il existe Pediaphon qui fait ça en anglais, allemand, français, espagnol et polonais.

Et je vous laisse, il me reste encore 250 pages à écouter.