Des livres numériques gratuits mais…il faut bosser (ensemble ?) un peu!

Il y a quelques semaines, j’ai publié un billet sur E-Discover the Classics, une initiative qui permet d’importer dans le catalogue un lot de près de 500 livres numériques issus du Project Gutenberg. On y propose une sélection en langue anglaise orientée vers les livres numériques téléchargeables parmi des classiques tels que Pride and Prejudice, The Time Machine, A Christmas Carol, Jane Eyre et d’autres encore. Les bibliothécaires du Colorado ont nettoyé les notices bibliographiques en format MARC de ces oeuvres et les mettent à la disposition de la communauté à partir de ce site.

Il est possible de consulter la liste des livres et des livres audio accessibles.

Or, François Renaville, auteur du blogue biblio|ê|thique (qu’on recommande en passant), a tenté l’expérience d’importer les notices et a eu l’heureuse idée de partager son point de vue sur cette initiative par le biais d’un commentaire à la suite de mon billet. Je crois que son évaluation, très pertinente merci!, méritait largement la scène d’un article.

Je cite le contenu de son commentaire :

« Oui, ce genre d’initiative est en effet toujours à saluer.
Et curieux comme je suis, j’ai importé les 415 notices d’ebooks ce matin dans notre catalogue (http://bit.ly/g4UAjw). Comme nous sommes en marc21, cela simplifiait grandement le travail. Mais je reste sur ma faim quant à deux points :
1) Comment cette sélection d’un peu plus de 400 ebooks a été effectuée? Si « Pride and Prejudice », « Alice’s Adventures in Wonderland », « A Christmas Carol », « Jane Eyre », etc. ont tout à fait leur place, qu’est-ce qui justifie la présence de « Harper’s New Monthly Magazine, Vol. 3, July, 1851″, de « Latin for Beginners » ou encore du volume 1 de « On War » de Clausewitz (et le vol. 2 ?) ?

2) Les données Marc laissent selon moi souvent à désirer:
– codage erroné en position 17 du guide (K ?),
– valeurs obsolètes en 008,
– ouvrages codés en 008 comme en anglais mais le titre et la note 546 sur la langue indiquent clairement autre chose,
– gros problèmes de conversion de caractères dans les noms (« Moliáere », « Dumas páere », « Dillmont, Thâeráese de ») et les titres (surtout les chinois!),
– quasi jamais aucune indication permettant de distinguer une édition d’une autre, alors que ces infos sont parfois disponibles sur la page même du titre sur le site du Projet Gutenberg: deux « Heart of Darkness » de 2006 (mais quelle différence entre ces deux éditions?), deux « Beowulf » (mais j’ai dû aller rechercher les traducteurs car cette info est pourtant essentielle [du moins pour mon public])

Bref, un gros nettoyage m’attend encore. Sans compter que comme nous utilisons les vedettes autorités BnF, et non celles de la LC, j’ai dû procéder à quelques corrections manuelles supplémentaires quand la correction ne s’est pas faite automatiquement…

Néanmoins, l’un dans l’autre, je ne regrette pas d’avoir importé ces quelque 400 notices. Mais si l’échantillon venait à passer à quelques milliers de notices, je m’attarderai un peu plus sur les titres sélectionnés et sur la qualité des notices.

Sinon, un autre projet très intéressant, et que je trouve trop méconnu, c’est les Classiques des sciences sociales (http://classiques.uqac.ca/), et eux aussi mettent à disposition de milliers de notices Marc21 de qualité ! Merci, amis québécois! »

———-

Oui mon ami, les Classiques des sciences sociales c’est bien, on peut même y dénicher l’oeuvre de Camus, libre de droit au Canada.

😉

Et maintenant, je réitière ma question : à quand un consortium de ce type pour nettoyer et mutualiser les notices des oeuvres numériques en langue française? Ou même, à quand un projet de cette nature pour l’ensemble du corpus francophone à la manière de Open Library ainsi que nous l’évoquions récemment avec Christian Liboiron ?

8 thoughts

  1. Ta réflexion est basée sur l’idée que les bibliothèques doivent gérer le référencement des ressources de leurs collections par un système classique de notices MARC. Ce système a démontré ses faiblesses quand vient le temps de gérer des ressources autre que des éléments physiques comme les livres.
    Je crois qu’il faudrait explorer des outils comme des résolveurs d’OpenURL pour des ressources de ce type.

  2. Je partage partiellement ton avis. Mais selon moi, le mode classique ne s’oppose nullement au mode, disons, plus moderne (résolveurs de liens, interrogation via l’OAI-PMH…). Les deux ne sont pas ni antinomiques ni exclusifs, mais complémentaires. Toutes les bibliothèques n’ont ainsi pas de résolveur de liens ou la maîtrise suffisante de la technologie pour travailler avec d’autres formats. Aussi, le Marc21 constitue-t-il au moins un acquis, quelque chose qu’elle maîtrise et peuvent utiliser facilement et directement, ici et maintenant.

    Il est de bon ton de dire que « Marc must die » ! En attendant, le Marc existe et on est bien content de s’en servir. Il n’est pas parfait et n’est certainement plus trop adéquat par rapport à nos besoins actuels (je n’ai toujours pas compris la nécessité de codage de nombreux indicateurs : à quoi cela sert-il de coder le premier indicateur du 100 à 0, 1 ou 3 ? Pourquoi diable le nombre de caractères à ignorer dans le classement est-il tantôt indiqué par le premier indicateur, tantôt par le second ?….)

    Si le projet E-Discovering the Classics a généreusement mis des notices Marc21 à disposition de la communauté, c’est pour que cette dernière puisse s’en servir à sa guise. Je me vois mal me dire : c’est du Marc21, donc c’est vieux et ringard et donc je ne les importe pas dans mon catalogue. Moi je me dis plutôt : je peux disposer d’un échantillon de 400 notices, j’importe, j’analyse la qualité des données et des métadonnées, je vois s’il faut du temps pour des corrections complémentaires batch et/ou manuelles (et il en a fallu, je n’ai même pas encore fini de corriger ces p_ta1ns de notices !) et puis seulement après je décide, en connaissance de cause, si cela en valait la peine et si je remets cela si jamais on vient à me proposer un nombre plus important de notices (ici et maintenant, franchement, je ne serais pas trop partant, mais bon cela dépend aussi du contenu proposé et du degré qualitatif minimum que j’attends au final).

    Mais indépendamment du format proposé ou de la technologie utilisée pour accéder à ces contenus (après tout, c’est bien là l’essentiel), la nature des contenus (quels titres ?) et la qualité des données et des métadonnées restent à mon sens les deux aspects les plus importants! Je ne vois pas grand intérêt à faciliter l’accès à des contenus qui n’ont pas beaucoup de chance d’intéresser mon public (je n’aurais ainsi que faire des grands classiques de la littérature d’expression wolof). De même, si les contenus, aussi intéressants soient-ils, sont mal structurés et décrits, cela me fait une belle jambe. Quand on a « Faust, eine Tragödie » et qu’on dit que c’est de l’anglais, c’est risible et incompréhensible (pour l’usager et le bibliothécaire). Sauf à imaginer que tout est codé comme en anglais par défaut et que quelques titres seulement ont pu bénéficier d’une correction. .. Bien entendu, le résolveur de liens (ou toute autre technique « moderne ») pourrait être utilisé pour accéder à des contenus de ce type, mais derrière (ou en amont) je considère toujours que la qualité des données et des métadonnées est essentielle. Et ce n’est pas la qualité des notices e-books ou e-journaux issues de SFX qui me rassure : ok pour le linking, mais n’en espérez pas trop en matière de contenu et de structure du contenu… (Ca me fait penser que je dois vérifier si les Classiques des Sciences sociales existent déjà comme target SFX. Sinon, c’est un bon plan de les faires ajouter. Surtout que ces e-books ont tous un ISBN).

    En attendant, tout cela ne répond pas non plus à la question « à quand un consortium de ce type pour nettoyer et mutualiser les notices des oeuvres numériques en langue française? »… 😦

  3. Merci François pour ta brillante et, encore une fois, si généreuse réponse! Comme tu le démontres bien, l’enjeu est de nature pragmatique. D’un côté, on a le MARC, et pour un bout de temps encore, et de l’autre, il y a cette demande en matière de livres numériques. Comment tirer son épingle du jeu dans ce contexte qui est le nôtre? Une initiative telle que celle du Colorado, perfectible soit, pourrait nous suggérer une voie pour être un peu plus des « fast-response libraries »…

  4. J’ai eu les même problèmes avec les records Marc des 500 eLivres, et ça a pris beaucoup du temps pour faire toutes les corrections nécessaires. Mais j’aime l’idée d’avoir des livres digitales gratuites pour notre bibliothèque. Merci pour l’information.

  5. hé bien voilà qui met de l’eau au moulin des militants du liv_num
    Pour faire ça, je pense spontanément à : BnF d’abord, BPI ensuite, réseau de bibs enfin
    La discute sur les formats MArc21 ou Unimarc ou carrément virage vers les métadonnées mériterait en soi une autre présentation : c’est ce qui freine un peu, des formats différents.
    Bon, qui commence ???

  6. Je suis justement en train de pointer les ebooks gutenberg issus de gallica, il y en a plein, pour y mettre des liens vers les fichiers déjà convertis en epub. J’imagine que nous pourrons ensuite partager les métadonnées Gallica des fichiers Gutenberg avec les bibliothèques françaises, via l’OAI-PMH par exemple…

  7. Cette notice tirée de la deuxième page d’un des ouvrages de Camus proposé par Les Classiques des sciences sociales ne vous gêne pas dans votre travail de bibliothécaire?

    « Toute reproduction et rediffusion de nos fichiers est interdite,
    même avec la mention de leur provenance, sans l’autorisation for-
    melle, écrite, du fondateur des Classiques des sciences sociales,
    Jean-Marie Tremblay, sociologue.
    Les fichiers des Classiques des sciences sociales ne peuvent
    sans autorisation formelle:
    – être hébergés (en fichier ou page web, en totalité ou en partie)
    sur un serveur autre que celui des Classiques.
    – servir de base de travail à un autre fichier modifié ensuite par
    tout autre moyen (couleur, police, mise en page, extraits, support,
    etc…), »

    Ce sont des ouvrages du domaine public comme ceux du projet Gutenberg. Si on ne peut héberger les fichiers, la distribution en bibliothèque devient problématique.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s