lundi 6 février 2012

Le monde complexe des livres numérisés

Dans le milieu des sciences de l'information, on entend souvent parler des ententes entre Google et les grandes bibliothèques pour la numérisation de leurs fonds. Il est plutôt rare d'avoir accès aux contrats. TeleRead a annoncé que la bibliothèque nationale des Pays-Bas a mis en ligne le fameux contrat qu'elle a signé avec l'entreprise.

Avec les nombreux projets de numérisation, des textes fondateurs sont maintenant disponibles en version originale et pour ceux qui savent les lire, ils ne sont plus obligés de se baser sur les transcriptions d'autres personnes. Cet accès à la connaissance permet de libérer un savoir autrefois réservé à certaines élites. Wired a publié un billet intéressant à ce sujet en partant de la numérisation des manuscrits de la Mer Morte.

Voici un petit vidéo d'Erez Lieberman Aiden et Jean-Baptiste Michel qui présentent certaines découvertes qu'ils ont faites en s'amusant avec Google Labs' Ngram Viewer qui permet de faire des recherches de mots à travers une base de données de plus de 5 millions de documents. Par exemple, les périodes de censure sont clairement visiblea.

Pour conclure, un article très intéressant sur CampusTechnology au sujet des problèmes qu'amène la mise en commun des documents numérisés de 60 institutions de recherche. En fait, comment HathiTrust aborde le problème de la mise à la disposition du public (comment est-ce que les usagers s'y retrouveront) et quels moyens ils emploient pour s'assurer de la pérénité des données. Tout un casse-tête!

Aucun commentaire:

Enregistrer un commentaire