jeudi 20 août 2009

Gallica et Google Books, armistice ou capitulation?


Il y eut une sorte de combat, ou au moins de résistance. Mais toute position de principe finit par s'assouplir face aux exigences de la réalité. Et, devant les moyens ainsi que les appétits presque illimités du géant américain, la BnF (Bibliothèque nationale de France) semble revenir sur son intransigeance passée. Les signes d'armistice (ou de capitulation?) se multiplient. Il n'est donc plus irréaliste d'envisager, à moyen terme, une participation de Google aux numérisations de Gallica. Les âmes pures s'insurgent: brader un patrimoine national à de troubles intérêts? jamais! Les pragmatiques se réjouissent: tout est bon pour accélérer l'accès universel aux collections qui sommeillent à la BnF.
Personne n'est dupe. Google n'est pas une association caritative. Et ses positions sur le droit d'auteur sont aussi innovantes qu'inquiétantes. Mais, pour ce qui concerne le domaine public, je me range résolument du côté des pragmatiques. J'utilise en permanence les services de Gallica et de Google Books - ce dernier surtout à travers la plateforme Internet Archive, qui ajoute aux numérisations de Google Books celles d'universités, il en existe encore, ayant leur propre programme en la matière. J'ai même, à l'intention de ceux qui cherchent à lire des ouvrages anciens sur Madagascar, intégré à mon blog Actualité culturelle malgache des liens (via un fil RSS) vers les dernières numérisations disponibles chez Gallica comme chez Internet Archive. Un outil dont je suis le premier à me servir, et qu'on peut adapter à n'importe quel centre d'intérêt. Depuis que j'ai installé ces liens, devinez qui, de Gallica ou d'Internet Archive, est le plus riche?
J'ai lu quelque part, puisque les commentaires sur le sujet abondent ces jours-ci (pardon de vous en imposer encore un) que les numérisations de Google Books étaient parfois médiocres. Je confirme. Mais j'ajoute que celles de Gallica aussi. Je ne sais pas quelles sont les techniques utilisées de part et d'autre, elles ne doivent en tout cas pas être très différentes, puisque le résultat est comparable. Du coup, la révolution, ou annoncée comme telle, de la recherche sur le texte reste relative. Allez, vous, fouiller un texte bourré de mots non reconnus!
Rendre accessibles des livres anciens est évidemment une excellente chose et prolonge la mission des bibliothèques publiques (ce que Google Books n'est pas, je sais, et il faudra rester attentif). Mais les passer à la volée, après une numérisation approximative, dans un logiciel de reconnaissance optique de caractères, ne suffit pas. On me dira, comme le serinent les optimistes, que ce type de logiciel est de plus en plus performant. Bien sûr. Mais je m'énerve quand un livre oppose à ma lecture une coquille toutes les dix pages. Bien qu'il ait été relu par un correcteur. Alors, qu'on ne me dise pas qu'un logiciel fera mieux qu'un spécialiste bardé de grammaires et de dictionnaires. Je n'arrive pas à y croire.
Je sens que je m'éloigne, là. Pas tant que cela. Car j'aimerais que l'on prenne en compte, aussi, la qualité des ouvrages fournis aux internautes. Comme le font, à des degrés divers, le projet Gutenberg, Ebooks libres & gratuits ou Wikisource. Comme je m'efforce de le faire, dans un domaine précis, dans la Bibliothèque malgache. C'est-à-dire avec une intervention humaine destinée à rendre le texte final digne d'une authentique réédition. C'est une autre histoire? Voire!

Aucun commentaire:

Enregistrer un commentaire