Bibliothèque numérique

Un article de Wikipédia, l'encyclopédie libre
Aller à la navigation Aller à la recherche

Une bibliothèque numérique , également appelée bibliothèque en ligne , bibliothèque Internet , référentiel numérique ou collection numérique est une base de données en ligne d'objets numériques pouvant inclure du texte, des images fixes, de l'audio, de la vidéo, des documents numériques ou d'autres formats de médias numériques ou une bibliothèque accessible par Internet . Les objets peuvent consister en un contenu numérisé comme des imprimés ou des photographies , ainsi qu'en un contenu numérique produit à l' origine comme des fichiers de traitement de texte oupublications sur les réseaux sociaux . En plus de stocker du contenu, les bibliothèques numériques fournissent des moyens pour organiser, rechercher et récupérer le contenu contenu dans la collection. Les bibliothèques numériques peuvent varier énormément en taille et en portée, et peuvent être gérées par des individus ou des organisations. [1] Le contenu numérique peut être stocké localement ou accessible à distance via des réseaux informatiques. Ces systèmes de recherche d'informations sont capables d'échanger des informations entre eux grâce à l' interopérabilité et à la durabilité . [2]

Historique

L'histoire des débuts des bibliothèques numériques n'est pas bien documentée, mais plusieurs penseurs clés sont liés à l'émergence du concept. [3] Les prédécesseurs incluent le Mundaneum de Paul Otlet et Henri La Fontaine , une tentative commencée en 1895 pour rassembler et cataloguer systématiquement les connaissances du monde, avec l'espoir d'apporter la paix mondiale. [4] Les visions de la bibliothèque numérique se sont largement concrétisées un siècle plus tard lors de la grande expansion d'Internet, avec l'accès aux livres et la recherche des documents par des millions d'individus sur le World Wide Web. [5]

Vannevar Bush et JCR Licklider sont deux contributeurs qui ont fait progresser cette idée dans la technologie actuelle. Bush avait soutenu la recherche qui a conduit à la bombe qui a été larguée sur Hiroshima . Après avoir vu la catastrophe, il a voulu créer une machine qui montrerait comment la technologie peut conduire à la compréhension plutôt qu'à la destruction. Cette machine comprendrait un bureau avec deux écrans, des interrupteurs et des boutons, et un clavier. [6] Il l'a appelé le " Memex ". De cette façon, les individus pourraient accéder aux livres et fichiers stockés à une vitesse rapide. En 1956, la Fondation Ford a financé Licklider pour analyser comment les bibliothèques pourraient être améliorées grâce à la technologie. Près d'une décennie plus tard, son livre intitulé "Les bibliothèques du futur " incluaient sa vision. Il voulait créer un système qui utiliserait des ordinateurs et des réseaux afin que les connaissances humaines soient accessibles pour les besoins humains et que la rétroaction soit automatique pour les besoins de la machine. Ce système contenait trois composants, le corpus de connaissances, la question et la réponse. Licklider l'a appelé un système procognitif.

Les premiers projets étaient centrés sur la création d'un catalogue électronique sur fiches connu sous le nom de catalogue d' accès public en ligne (OPAC). Dans les années 1980, le succès de ces efforts a conduit l'OPAC à remplacer le catalogue sur fiches traditionnel dans de nombreuses bibliothèques universitaires, publiques et spécialisées. Cela a permis aux bibliothèques d'entreprendre des efforts de coopération gratifiants supplémentaires pour soutenir le partage des ressources et étendre l'accès aux documents de bibliothèque au-delà d'une bibliothèque individuelle.

Un des premiers exemples de bibliothèque numérique est le Centre d'information sur les ressources éducatives (ERIC), une base de données de citations, de résumés et de textes sur l'éducation qui a été créée en 1964 et mise en ligne via DIALOG en 1969. [7]

En 1994, les bibliothèques numériques sont devenues largement visibles dans la communauté de la recherche grâce à un programme géré par la NSF de 24,4 millions de dollars soutenu conjointement par le programme Intelligent Integration of Information (I3) de la DARPA , la NASA et la NSF elle-même. [8] Les propositions de recherche réussies sont venues de six universités américaines. [9] Les universités comprenaient l'Université Carnegie Mellon , l' Université de Californie-Berkeley , l' Université du Michigan , l' Université de l'Illinois , l' Université de Californie-Santa Barbara et l'Université de Stanford .. Les articles des projets ont récapitulé leur progrès à leur point à mi-chemin en mai 1996. [10] La recherche de Stanford, par Sergey Brin et Larry Page , a mené à la fondation de Google .

Les premières tentatives de création d'un modèle pour les bibliothèques numériques comprenaient le modèle de référence de bibliothèque numérique DELOS [11] [12] et le cadre 5S. [13] [14]

Terminologie

Le terme bibliothèque numérique a été popularisé pour la première fois par la NSF / DARPA / NASA Digital Libraries Initiative en 1994. [15] Avec la disponibilité des réseaux informatiques, les ressources d'information devraient rester distribuées et accessibles selon les besoins, alors que dans l'essai de Vannevar Bush Comme We May Think (1945), ils devaient être collectés et conservés dans le Memex du chercheur .

Le terme bibliothèque virtuelle était initialement utilisé de manière interchangeable avec la bibliothèque numérique, mais est maintenant principalement utilisé pour les bibliothèques qui sont virtuelles dans d'autres sens (telles que les bibliothèques qui regroupent le contenu distribué). Au début des bibliothèques numériques, on discutait des similitudes et des différences entre les termes numérique , virtuel et électronique . [16]

Une distinction est souvent faite entre le contenu qui a été créé dans un format numérique, connu sous le nom de « born-digital » , et l'information qui a été convertie à partir d'un support physique, par exemple le papier, par numérisation . Tous les contenus électroniques ne sont pas au format de données numériques . Le terme bibliothèque hybride est parfois utilisé pour les bibliothèques qui ont à la fois des collections physiques et des collections électroniques. Par exemple, American Memory est une bibliothèque numérique au sein de la Bibliothèque du Congrès .

Certaines bibliothèques numériques importantes servent également d'archives à long terme, telles que arXiv et Internet Archive . D'autres, comme la Digital Public Library of America , cherchent à rendre les informations numériques de diverses institutions largement accessibles en ligne. [17]

Types de bibliothèques numériques

Dépôts institutionnels

De nombreuses bibliothèques universitaires participent activement à la création de référentiels des livres, articles, thèses et autres œuvres de l'institution qui peuvent être numérisés ou sont « nés numériques ». Beaucoup de ces référentiels sont mis à la disposition du grand public avec peu de restrictions, conformément aux objectifs du libre accès , contrairement à la publication de la recherche dans des revues commerciales, où les éditeurs limitent souvent les droits d'accès. Les référentiels institutionnels, véritablement gratuits et d'entreprise sont parfois appelés bibliothèques numériques. Le logiciel de référentiel institutionnel est conçu pour archiver, organiser et rechercher le contenu d'une bibliothèque. Les solutions open source populaires incluent DSpace , EPrints , Digital Commons etSystèmes basés sur Fedora Commons Islandora et Samvera . [18]

Collections de la bibliothèque nationale

Le dépôt légal est souvent couvert par la législation sur le droit d'auteur et parfois par des lois spécifiques au dépôt légal, et exige qu'une ou plusieurs copies de tous les documents publiés dans un pays soient soumises pour conservation dans une institution, généralement la bibliothèque nationale . Depuis l'avènement des documents électroniques , la législation a dû être modifiée pour couvrir les nouveaux formats, comme l'amendement de 2016 au Copyright Act 1968 en Australie. [19] [20] [21]

Depuis lors, divers types de dépôts électroniques ont été construits. Le portail de soumission des éditeurs de la British Library et le modèle allemand de la Deutsche Nationalbibliothek ont ​​un point de dépôt pour un réseau de bibliothèques, mais l'accès public n'est disponible que dans les salles de lecture des bibliothèques. Le système de dépôt électronique national australien a les mêmes fonctionnalités, mais permet également un accès à distance par le grand public pour la plupart du contenu. [22]

Archives numériques

Les archives physiques diffèrent des bibliothèques physiques de plusieurs manières. Traditionnellement, les archives sont définies comme :

  1. Contenant des sources primaires d'information (généralement des lettres et des articles directement produits par un individu ou une organisation) plutôt que les sources secondaires trouvées dans une bibliothèque (livres, périodiques, etc.).
  2. Avoir leur contenu organisé en groupes plutôt qu'en éléments individuels.
  3. Avoir un contenu unique.

La technologie utilisée pour créer des bibliothèques numériques est encore plus révolutionnaire pour les archives puisqu'elle décompose la deuxième et la troisième de ces règles générales. En d'autres termes, les « archives numériques » ou les « archives en ligne » contiendront toujours généralement des sources primaires, mais elles seront probablement décrites individuellement plutôt que (ou en plus) en groupes ou collections. De plus, parce qu'ils sont numériques, leur contenu est facilement reproductible et peut en effet avoir été reproduit d'ailleurs. L' Oxford Text Archive est généralement considérée comme la plus ancienne archive numérique de documents de source primaire physique académique.

Les archives diffèrent des bibliothèques par la nature des documents détenus. Les bibliothèques rassemblent des livres et des publications en série publiés individuellement, ou des ensembles limités d'éléments individuels. Les livres et les revues détenus par les bibliothèques ne sont pas uniques, car il existe plusieurs exemplaires et un exemplaire donné s'avérera généralement aussi satisfaisant que n'importe quel autre exemplaire. Le matériel des archives et des bibliothèques de manuscrits est "les archives uniques des personnes morales et les papiers des individus et des familles". [23]

Une caractéristique fondamentale des archives est qu'elles doivent conserver le contexte dans lequel leurs documents ont été créés et le réseau de relations entre eux afin de préserver leur contenu informatif et de fournir des informations compréhensibles et utiles dans le temps. La caractéristique fondamentale des archives réside dans leur organisation hiérarchique exprimant le contexte par le biais du lien archivistique .

Les descriptions archivistiques sont les moyens fondamentaux pour décrire, comprendre, récupérer et accéder aux documents archivistiques. Au niveau numérique, les descriptions archivistiques sont généralement encodées au moyen du format XML de description archivistique encodée . L'EAD est une représentation électronique normalisée de la description archivistique qui permet de fournir un accès collectif à des descriptions archivistiques détaillées et à des ressources dans des dépôts répartis dans le monde entier.

Compte tenu de l'importance des archives, un modèle formel dédié, appelé NEsted SeTs for Object Hierarchies (NESTOR), [24] construit autour de leurs constituants particuliers, a été défini. NESTOR est basé sur l'idée d'exprimer les relations hiérarchiques entre objets par la propriété d'inclusion entre ensembles, par opposition à la relation binaire entre nœuds exploitée par l'arbre. NESTOR a été utilisé pour étendre formellement le modèle 5S afin de définir une archive numérique comme un cas particulier de bibliothèque numérique capable de prendre en considération les particularités des archives.

Caractéristiques des bibliothèques numériques

Les avantages des bibliothèques numériques comme moyen d'accéder facilement et rapidement à des livres, des archives et des images de divers types sont désormais largement reconnus par les intérêts commerciaux et les organismes publics. [25]

Les bibliothèques traditionnelles sont limitées par l'espace de stockage ; les bibliothèques numériques ont le potentiel de stocker beaucoup plus d'informations, simplement parce que l'information numérique nécessite très peu d'espace physique pour la contenir. [26]En tant que tel, le coût de maintenance d'une bibliothèque numérique peut être bien inférieur à celui d'une bibliothèque traditionnelle. Une bibliothèque physique doit dépenser de grosses sommes d'argent pour payer le personnel, l'entretien des livres, le loyer et les livres supplémentaires. Les bibliothèques numériques peuvent réduire ou, dans certains cas, supprimer ces frais. Les deux types de bibliothèques nécessitent une entrée de catalogage pour permettre aux utilisateurs de localiser et de récupérer du matériel. Les bibliothèques numériques peuvent être plus disposées à adopter des innovations technologiques offrant aux utilisateurs des améliorations dans la technologie des livres électroniques et audio ainsi que la présentation de nouvelles formes de communication telles que les wikis et les blogs ; les bibliothèques conventionnelles peuvent considérer que fournir un accès en ligne à leur catalogue OP AC est suffisant. Un avantage important de la conversion numérique est une accessibilité accrue pour les utilisateurs.

  • Aucune limite physique : L'utilisateur d'une bibliothèque numérique n'a pas besoin de se rendre physiquement à la bibliothèque ; des personnes du monde entier peuvent accéder aux mêmes informations, tant qu'une connexion Internet est disponible.
  • Disponibilité 24 heures sur 24 : Un avantage majeur des bibliothèques numériques est que les gens peuvent accéder à l'information 24 heures sur 24 et 7 jours sur 7.
  • Accès multiple : Les mêmes ressources peuvent être utilisées simultanément par plusieurs institutions et mécènes. Cela peut ne pas être le cas pour les documents protégés par le droit d'auteur : une bibliothèque peut avoir une licence pour « prêter » une seule copie à la fois ; ceci est réalisé avec un système de gestion des droits numériques où une ressource peut devenir inaccessible après l'expiration de la période de prêt ou après que le prêteur a choisi de la rendre inaccessible (ce qui équivaut à restituer la ressource).
  • Recherche d'informations : l'utilisateur peut utiliser n'importe quel terme de recherche (mot, phrase, titre, nom, sujet) pour effectuer une recherche dans l'ensemble de la collection. Les bibliothèques numériques peuvent fournir des interfaces très conviviales, donnant un accès cliquable à ses ressources.
  • Préservation et conservation : La numérisation n'est pas une solution de préservation à long terme pour les collections physiques, mais réussit à fournir des copies d'accès pour des documents qui, autrement, se dégraderaient en raison d'une utilisation répétée. Les collections numérisées et les objets nés numériques posent de nombreux problèmes de préservation et de conservation que les matériaux analogiques ne posent pas. Veuillez consulter la section "Problèmes" suivante de cette page pour des exemples.
  • Espace : Alors que les bibliothèques traditionnelles sont limitées par l'espace de stockage, les bibliothèques numériques ont le potentiel de stocker beaucoup plus d'informations, simplement parce que les informations numériques nécessitent très peu d'espace physique pour les contenir et que les technologies de stockage multimédia sont plus abordables que jamais.
  • Valeur ajoutée : Certaines caractéristiques des objets, principalement la qualité des images, peuvent être améliorées. La numérisation peut améliorer la lisibilité et éliminer les défauts visibles tels que les taches et la décoloration. [27]

Logiciel

Il existe un certain nombre de progiciels à utiliser dans les bibliothèques numériques générales (pour les plus notables, voir Catégorie : Logiciel de bibliothèque numérique ). Le logiciel de référentiel institutionnel, qui se concentre principalement sur l'ingestion, la préservation et l'accès aux documents produits localement, en particulier les résultats académiques produits localement, peut être trouvé dans le logiciel de référentiel institutionnel . Ce logiciel peut être propriétaire, comme c'est le cas de la Library of Congress qui utilise Digiboard et CTS pour gérer le contenu numérique. [28]

La conception et la mise en œuvre des bibliothèques numériques sont construites de manière à ce que les systèmes informatiques et les logiciels puissent utiliser les informations lorsqu'elles sont échangées. Celles-ci sont appelées bibliothèques numériques sémantiques. Les bibliothèques sémantiques sont également utilisées pour socialiser avec différentes communautés à partir d'une masse de réseaux sociaux. [29] DjDL est un type de bibliothèque numérique sémantique. La recherche basée sur les mots-clés et la recherche sémantique sont les deux principaux types de recherches. Un outil est fourni dans la recherche sémantique qui crée un groupe pour l'augmentation et l'affinement de la recherche basée sur des mots-clés. Les connaissances conceptuelles utilisées dans DjDL sont centrées autour de deux formes ; l' ontologie du sujet et l'ensemble des modèles de recherche de concepts basés sur l'ontologie. Les trois types d'ontologies associées à cette recherche sontontologies bibliographiques , ontologies sensibles à la communauté et ontologies sujet.

Métadonnées

Dans les bibliothèques traditionnelles, la capacité de trouver des œuvres intéressantes est directement liée à la qualité de leur catalogage. Alors que le catalogage des œuvres électroniques numérisées à partir du fonds existant d'une bibliothèque peut être aussi simple que de copier ou de déplacer un enregistrement de l'imprimé vers la forme électronique, les œuvres complexes et nées numériques nécessitent beaucoup plus d'efforts. Pour gérer le volume croissant de publications électroniques, de nouveaux outils et technologies doivent être conçus pour permettre une classification et une recherche sémantiques automatisées efficaces. Bien que la recherche en texte intégral puisse être utilisée pour certains articles, il existe de nombreuses recherches courantes dans le catalogue qui ne peuvent pas être effectuées en utilisant le texte intégral, notamment :

  • trouver des textes qui sont des traductions d'autres textes
  • différencier les éditions/volumes d'un texte/périodique
  • descripteurs incohérents (en particulier les titres de sujet)
  • pratiques taxonomiques manquantes, déficientes ou de mauvaise qualité
  • relier des textes publiés sous des pseudonymes aux véritables auteurs ( Samuel Clemens et Mark Twain , par exemple)
  • différencier la non-fiction de la parodie ( The Onion du New York Times )

Recherche

La plupart des bibliothèques numériques offrent une interface de recherche qui permet de trouver des ressources. Ces ressources sont généralement des ressources Web profondes (ou Web invisibles), car elles ne peuvent souvent pas être localisées par les robots d'exploration des moteurs de recherche . Certaines bibliothèques numériques créent des pages spéciales ou des sitemaps pour permettre aux moteurs de recherche de trouver toutes leurs ressources. Les bibliothèques numériques utilisent fréquemment le protocole OAI-PMH ( Open Archives Initiative Protocol for Metadata Harvesting ) pour exposer leurs métadonnées à d'autres bibliothèques numériques et à des moteurs de recherche comme Google Scholar , Yahoo! et Scirus peut également utiliser OAI-PMH pour trouver ces ressources Web approfondies. [30]

Il existe deux stratégies générales pour effectuer des recherches dans une fédération de bibliothèques numériques : la recherche distribuée et la recherche de métadonnées précédemment récoltées .

La recherche distribuée implique généralement qu'un client envoie plusieurs demandes de recherche en parallèle à un certain nombre de serveurs de la fédération. Les résultats sont rassemblés, les doublons sont éliminés ou regroupés, et les éléments restants sont triés et présentés au client. Des protocoles comme Z39.50 sont fréquemment utilisés dans la recherche distribuée. L'avantage de cette approche est que les tâches gourmandes en ressources d'indexation et de stockage sont laissées aux serveurs respectifs de la fédération. Un inconvénient de cette approche est que le mécanisme de recherche est limité par les différentes capacités d'indexation et de classement de chaque base de données ; il est donc difficile d'assembler un résultat combiné composé des éléments trouvés les plus pertinents.

La recherche dans les métadonnées précédemment collectées implique la recherche d'un index stocké localement d'informations qui ont été précédemment collectées auprès des bibliothèques de la fédération. Lorsqu'une recherche est effectuée, le mécanisme de recherche n'a pas besoin d'établir des liens avec les bibliothèques numériques qu'il recherche - il a déjà une représentation locale de l'information. Cette approche nécessite la création d'un mécanisme d'indexation et de récolte qui fonctionne régulièrement, se connectant à toutes les bibliothèques numériques et interrogeant l'ensemble de la collection afin de découvrir des ressources nouvelles et mises à jour. OAI-PMHest fréquemment utilisé par les bibliothèques numériques pour permettre la récolte de métadonnées. Un avantage de cette approche est que le mécanisme de recherche a un contrôle total sur les algorithmes d'indexation et de classement, permettant éventuellement des résultats plus cohérents. Un inconvénient est que les systèmes de récolte et d'indexation sont plus gourmands en ressources et donc coûteux.

Conservation numérique

La préservation numérique vise à garantir que les médias numériques et les systèmes d'information sont toujours interprétables dans un avenir indéfini. [31] Chaque composant nécessaire de ceci doit être migré, préservé ou émulé . [32] Généralement, les niveaux inférieurs des systèmes ( disquettes par exemple) sont émulés, les flux binaires (les fichiers réels stockés sur les disques) sont préservés et les systèmes d'exploitation sont émulés en tant que machine virtuelle . Ce n'est que là où le sens et le contenu des médias numériques et des systèmes d'information sont bien compris que la migration est possible, comme c'est le cas pour les documents de bureau. [32] [33] [34] Cependant, au moins une organisation, le Wider Net Project, a créé une bibliothèque numérique hors ligne, le eGranary , en reproduisant des documents sur un disque dur de 6 To . Au lieu d'un environnement de flux binaire, la bibliothèque numérique contient un serveur proxy intégré et un moteur de recherche permettant d'accéder aux documents numériques à l'aide d'un navigateur Internet . [35] De plus, les matériaux ne sont pas conservés pour l'avenir. L'eGranary est destiné à être utilisé dans des endroits ou des situations où la connectivité Internet est très lente, inexistante, peu fiable, inadaptée ou trop chère.

Au cours des dernières années, les procédures de numérisation de livres à grande vitesse et à un coût relativement faible se sont considérablement améliorées, de sorte qu'il est désormais possible de numériser des millions de livres par an. [36] Le projet de numérisation de livres de Google travaille également avec des bibliothèques pour proposer des livres numérisés faisant avancer le domaine des livres numérisés.

Droit d'auteur et licence

Les bibliothèques numériques sont entravées par la loi sur le droit d' auteur car, contrairement aux œuvres imprimées traditionnelles, les lois sur le droit d'auteur numérique sont encore en cours d'élaboration. La republication de matériel sur le Web par les bibliothèques peut nécessiter l'autorisation des titulaires de droits, et il existe un conflit d'intérêts entre les bibliothèques et les éditeurs qui peuvent souhaiter créer des versions en ligne de leur contenu acquis à des fins commerciales. En 2010, on estimait que vingt-trois pour cent des livres existants avaient été créés avant 1923 et donc hors droits d'auteur. Parmi ceux imprimés après cette date, seuls cinq pour cent étaient encore imprimés en 2010. Ainsi, environ soixante-douze pour cent des livres n'étaient pas accessibles au public. [37]

Il y a une dilution de la responsabilité qui se produit en raison de la nature distribuée des ressources numériques. Des questions complexes de propriété intellectuelle peuvent être impliquées puisque le matériel numérique n'appartient pas toujours à une bibliothèque. [38] Le contenu est, dans de nombreux cas, du domaine public ou du contenu auto-généré uniquement. Certaines bibliothèques numériques, telles que Project Gutenberg , s'efforcent de numériser des œuvres non protégées par le droit d'auteur et de les rendre librement accessibles au public. Une estimation du nombre de livres distincts encore présents dans les catalogues de bibliothèques de 2000 av. J.-C. à 1960 a été faite. [39] [40]

Les dispositions d' utilisation équitable (17 USC § 107) en vertu de la loi sur le droit d'auteur de 1976 fournissent des directives spécifiques dans lesquelles les bibliothèques sont autorisées à copier des ressources numériques. Les quatre facteurs qui constituent une utilisation équitable sont "l'objectif de l'utilisation, la nature de l'œuvre, la quantité ou l'importance utilisée et l'impact sur le marché". [41]

Certaines bibliothèques numériques acquièrent une licence pour prêter leurs ressources. Cela peut impliquer la limitation du prêt d'un seul exemplaire à la fois pour chaque licence et l'application d'un système de gestion des droits numériques à cette fin (voir également ci-dessus).

Le Digital Millennium Copyright Act de 1998 est une loi créée aux États-Unis pour tenter de faire face à l'introduction des œuvres numériques. Cette loi incorpore deux traités de l'année 1996. Elle criminalise la tentative de contourner les mesures qui limitent l'accès aux documents protégés par le droit d'auteur. Il criminalise également le fait de tenter de contourner le contrôle d'accès. [42] Cette loi prévoit une exemption pour les bibliothèques et les archives à but non lucratif qui permet de faire jusqu'à trois copies, dont une peut être numérique. Cependant, cela ne peut pas être rendu public ou distribué sur le Web. De plus, il permet aux bibliothèques et aux archives de copier une œuvre si son format devient obsolète. [42]

Les problèmes de droit d'auteur persistent. À ce titre, des propositions ont été avancées suggérant que les bibliothèques numériques soient exemptées de la loi sur le droit d'auteur. Bien que cela soit très bénéfique pour le public, cela peut avoir un effet économique négatif et les auteurs peuvent être moins enclins à créer de nouvelles œuvres. [43]

Un autre problème qui complique les choses est le désir de certaines maisons d'édition de restreindre l'utilisation de documents numériques tels que les livres électroniques achetés par les bibliothèques. Alors qu'avec les livres imprimés, la bibliothèque est propriétaire du livre jusqu'à ce qu'il ne puisse plus être distribué, les éditeurs veulent limiter le nombre de fois qu'un livre électronique peut être emprunté avant que la bibliothèque n'ait besoin de racheter ce livre. "[HarperCollins] a commencé à autoriser l'utilisation de chaque copie de livre électronique pour un maximum de 26 prêts. Cela n'affecte que les titres les plus populaires et n'a aucun effet pratique sur les autres. Une fois la limite atteinte, la bibliothèque peut racheter les droits d'accès à un prix inférieur. coût que le prix d'origine." [44]Bien que du point de vue de l'édition, cela ressemble à un bon équilibre entre les prêts des bibliothèques et la protection contre une baisse redoutée des ventes de livres, les bibliothèques ne sont pas configurées pour surveiller leurs collections en tant que telles. Ils reconnaissent la demande accrue de documents numériques disponibles pour les clients et le désir d'une bibliothèque numérique de s'étendre pour inclure les best-sellers, mais les licences des éditeurs peuvent entraver le processus.

Systèmes de recommandation

De nombreuses bibliothèques numériques proposent des systèmes de recommandation pour réduire la surcharge d'informations et aider leurs utilisateurs à découvrir la littérature pertinente. Quelques exemples de bibliothèques numériques offrant des systèmes de recommandation sont IEEE Xplore , Europeana et GESIS Sowiport . Les systèmes de recommandation fonctionnent principalement sur la base du filtrage basé sur le contenu, mais d'autres approches sont également utilisées, telles que le filtrage collaboratif et les recommandations basées sur les citations. [45] Beel et al. rapportent qu'il existe plus de 90 approches de recommandation différentes pour les bibliothèques numériques, présentées dans plus de 200 articles de recherche . [45]

En règle générale, les bibliothèques numériques développent et maintiennent leurs propres systèmes de recommandation basés sur des cadres de recherche et de recommandation existants tels qu'Apache Lucene ou Apache Mahout . Cependant, il existe également des fournisseurs de recommandation en tant que service spécialisés dans l'offre d'un système de recommandation pour les bibliothèques numériques en tant que service .

Inconvénients des bibliothèques numériques

Les bibliothèques numériques, ou du moins leurs collections numériques, ont malheureusement aussi apporté leurs propres problèmes et défis dans des domaines tels que :

De nombreux projets de numérisation à grande échelle perpétuent ces problèmes.

Développement futur

Des projets de numérisation à grande échelle sont en cours chez Google , le Million Book Project et Internet Archive . Avec des améliorations continues dans les technologies de manipulation et de présentation des livres telles que la reconnaissance optique des caractères et le développement de dépôts alternatifs et de modèles commerciaux, les bibliothèques numériques gagnent rapidement en popularité. Tout comme les bibliothèques se sont aventurées dans les collections audio et vidéo, il en va de même pour les bibliothèques numériques telles que Internet Archive. Le projet Google Livres a récemment reçu une victoire judiciaire en poursuivant son projet de numérisation de livres qui a été interrompu par la guilde des auteurs. [47]Cela a ouvert la voie aux bibliothèques pour travailler avec Google afin de mieux atteindre les clients habitués aux informations informatisées.

Selon Larry Lannom, directeur des technologies de gestion de l'information à la Corporation à but non lucratif pour les initiatives nationales de recherche (CNRI), "tous les problèmes associés aux bibliothèques numériques sont liés à l'archivage". Il poursuit en déclarant : "Si dans 100 ans les gens peuvent encore lire votre article, nous aurons résolu le problème." Daniel Akst, auteur de The Webster Chronicle, propose que "l'avenir des bibliothèques - et de l'information - est numérique". Peter Lyman et Hal Variant, scientifiques de l'information à l' Université de Californie, Berkeley, estiment que "la production mondiale annuelle totale de contenu imprimé, film, optique et magnétique nécessiterait environ 1,5 milliard de gigaoctets de stockage". Par conséquent, ils pensent que "bientôt, il sera technologiquement possible pour une personne moyenne d'accéder à pratiquement toutes les informations enregistrées". [48]

Les archives numériques sont un support évolutif et elles se développent dans diverses circonstances. Parallèlement aux dépôts à grande échelle, d'autres projets d'archivage numérique ont également évolué en réponse aux besoins de la recherche et de la communication de la recherche à différents niveaux institutionnels. Par exemple, pendant la pandémie de COVID-19 , les bibliothèques et les établissements d'enseignement supérieur ont lancé des projets d'archivage numérique pour documenter la vie pendant la pandémie, créant ainsi un enregistrement numérique et culturel des souvenirs collectifs de l'époque. [49] Les chercheurs ont également utilisé l'archivage numérique pour créer des bases de données de recherche spécialisées. Ces bases de données compilent des enregistrements numériques pour une utilisation aux niveaux international et interdisciplinaire. COVID CORPUS, lancé en octobre 2020, est un exemple d'une telle base de données, construite en réponse aux besoins de communication scientifique face à la pandémie. [50] Au-delà du milieu universitaire, des collections numériques ont également été récemment développées pour plaire à un public plus général, comme c'est le cas avec le contenu sélectionné pour le grand public de l'Internet-First University Press développé par l'Université Cornell. Cette base de données grand public contient des informations de recherche spécialisées, mais est organisée numériquement pour l'accessibilité. [51] La création de ces archives a facilité des formes spécialisées d'archivage numérique pour remplir diverses niches dans la communication en ligne basée sur la recherche.

Voir aussi

Références

  1. ^ Witten, Ian H.; Bainbridge, David Nichols (2009). Comment construire une bibliothèque numérique (2e éd.). Morgan Kaufmann. ISBN 9780080890395.
  2. ^ Lanagan, James; Smeaton, Alan F. (septembre 2012). "Vidéothèques numériques : contributives et décentralisées". Journal international des bibliothèques numériques . 12 (4): 159–178. doi : 10.1007/s00799-012-0078-z . S2CID 14811914 . 
  3. ^ Lynch, Clifford (2005). "Où allons-nous à partir de là ? La prochaine décennie pour les bibliothèques numériques" . D-Lib Magazine . 11 (7/8). doi : 10.1045/july2005-lynch . ISSN 1082-9873 . Il s'agit d'un domaine avec une préhistoire et une histoire ancienne incroyablement riche, et encore mal documentée. Il existe un flux de travaux et d'idées qui remonte au moins au tournant du XXe siècle et comprend des penseurs tels que HG Wells et Paul Otlet ; Vannevar Bush et JCR Licklider ont également contribué plus tard à la préhistoire des visions de nouveaux moyens technologiques d'organisation, d'accès et de distribution des connaissances. 
  4. ^ Stocker, Gerfried (1er janvier 2014). "Au-delà des archives (ou Internet 100 ans avant Internet)" . À Magalhães, Ana Gonçalves ; Beiguelman, Giselle (dir.). Futurs possibles : art, musées et archives numériques . ISBN 9788575963548. Récupéré le 30 avril 2018 . En fait, c'est en 1895 que Paul Otlet et Henry La Fontaine, qui reçut plus tard le prix Nobel de la paix, lancèrent un projet - Mundaneum - qui fut initié et guidé par leur idée que, s'ils pouvaient rassembler toutes les connaissances humaines et faire accessible à tous dans le monde entier, cela apporterait la paix sur Terre.
  5. ^ Schatz, Bruce (1997). "Recherche d'informations dans les bibliothèques numériques : amener la recherche sur le Net" . Sciences . 275 (5298): 327–334. doi : 10.1126/science.275.5298.327 . PMID 8994022 . 
  6. ^ Bush, Vannevar (juillet 1945). "Comme nous pouvons le penser" (PDF) . Le mensuel de l'Atlantique : 101–108. Archivé de l'original (PDF) le 21 avril 2018 . Récupéré le 30 avril 2018 .
  7. ^ Bourne, Charles P.; Hahn, Trudi Bellardo (2003). Une histoire des services d'information en ligne, 1963–1976 . Presse du MIT. p. 169–170. ISBN 9780262261753. Récupéré le 30 avril 2018 . 1696 Milestone - DIALOG, avec la base de données ERIC, a fourni le premier exemple de disponibilité étendue de résumés en ligne pour les résultats de recherche.
  8. ^ Wiederhold, Gio (1993). "Intégration intelligente de l'information". Enregistrement ACM SIGMOD . 22 (2): 434–437. doi : 10.1145/170036.170118 .
  9. ^ Besser, Howard (2004). "Le passé, le présent et l'avenir des bibliothèques numériques" . Dans Schreibman, Susan; Siemens, Ray; Unsworth, John (éd.). Compagnon des humanités numériques . Blackwell Publishing Ltd. pp. 557–575. doi : 10.1002/9780470999875.ch36 . ISBN 9781405103213. Archivé de l'original le 10 août 2017 . Récupéré le 30 avril 2018 .
  10. ^ Schatz, Bruce (1996). Chen, Hsinchun (éd.). "Construire des bibliothèques numériques à grande échelle". Ordinateur IEEE . 29 (5) : 22-25. doi : 10.1109/2.493453 . hdl : 10150/106127 .
  11. ^ Candela, Léonard; Castelli, Donatella; Pagano, Pasquale; Thanos, Constantino; Ioannidis, Yannis ; Koutrika, Géorgie ; Ross, Seamus ; Schek, Hans-Jörg; Schuldt, Heiko (2007). "Établir les fondations des bibliothèques numériques" . D-Lib Magazine . 13 (3/4). ISSN 1082-9873 . Archivé de l'original le 16 janvier 2018 . Récupéré le 1er mai 2018 . 
  12. ^ L. Candela et al .: Le modèle de référence de bibliothèque numérique DELOS: Fondations pour les bibliothèques numériques . Version 0.98, février 2008 ( PDF archivé le 19/02/2014 sur la Wayback Machine )
  13. ^ Gonçalves, Marcos André; Fox, Edward A.; Watson, Layne T.; En ligneKipp, Neill A. (2004). "Flux, structures, espaces, scénarios, sociétés (5s) : Un modèle formel pour les bibliothèques numériques". Transactions ACM sur les systèmes d'information . 22 (2): 270–312. doi : 10.1145/984321.984325 . S2CID 8371540 . 
  14. ^ Isah, Abdulmumin; Serema, Batlang Virgule ; Mutshewa, Athulang; Kenosi, Lekoko (2013). « Bibliothèques numériques : analyse du modèle de référence de Delos et de la théorie des 5 S » . Journal de la théorie et de la pratique des sciences de l'information . 1 (4) : 38–47. doi : 10.1633/JISTaP.2013.1.4.3 .
  15. ^ Renard, Edward A. (1999). "L'initiative des bibliothèques numériques : mise à jour et discussion" . Bulletin de la Société américaine des sciences de l'information . 26 (1). ISSN 2373-9223 . Archivé de l'original le 3 avril 2018 . Récupéré le 30 avril 2018 . 
  16. ^ "bibliothèques numériques, bibliothèques électroniques et bibliothèques virtuelles" . www2.hawaii.edu . Archivé de l'original le 2016-03-07 . Récupéré le 18/01/2016 .
  17. ^ Yi, Esther, Inside the Quest to Put the World's Libraries Online Archivé le 19/11/2016 à la Wayback Machine , The Atlantic, 26 juillet 2012.
  18. ^ Castagné, Michel (2013). Comparaison des logiciels de référentiel institutionnel : DSpace, EPrints, Digital Commons, Islandora et Hydra (Report). Université de la Colombie-Britannique. doi : 10.14288/1.0075768 . Récupéré le 25/04/2016 .
  19. ^ "Qu'est-ce que le dépôt légal ?" . Bibliothèque nationale d'Australie . 17 février 2016 . Récupéré le 3 mai 2020 .
  20. ^ "Dépôt légal en Australie" . Bibliothèques nationales et d'État Australie . 1 juin 2019 . Récupéré le 3 mai 2020 .
  21. ^ "Loi sur la révision des lois (n ° 1) 2016" . Registre fédéral de la législation . 12 février 2016 . Récupéré le 3 mai 2020 .
  22. ^ Citron, Barbara; Blinco, Kerry; Somes, Brendan (8 avril 2020). "Construire NED : accès ouvert au patrimoine documentaire numérique de l'Australie" . Publications . 8 (2): 19. doi : 10.3390/publications8020019 . ISSN 2304-6775 . Numéro spécial 14e Conférence internationale sur les référentiels ouverts 2019 - Tous les besoins des utilisateurs 
  23. ^ Pitti, D. et Duff, WM (2001). Introduction. Dans Pitti, D. et Duff, WM, éditeurs, Description archivistique codée sur Internet, pages 1–6. Haworth Press, Inc.
  24. ^ N. Ferro et G. Silvello. NESTOR : un modèle formel pour les archives numériques. Traitement et gestion de l'information (IP&M), 49(6):1206-1240, 2013.
  25. ^ La Commission européenne intensifie ses efforts pour mettre la mémoire de l'Europe Archivé le 16/10/2007 à la Wayback Machine sur le Web via un communiqué de presse Europa "Bibliothèque numérique européenne", 2 mars 2006
  26. ^ Pomerantz, Jeffrey; Marchionini, Gary (2007). "La bibliothèque numérique comme lieu". Revue de Documentation . 63 (4): 505–533. CiteSeerX 10.1.1.112.2139 . doi : 10.1108/00220410710758995 . 
  27. ^ Gert, Janet. "Sélection pour la préservation à l'ère numérique." Ressources de la bibliothèque et services techniques. 44(2) (2000):97-104.
  28. ^ "Programme DPOE - Gérer et mettre en œuvre les exigences pour la gestion à long terme" . La Bibliothèque du Congrès. Archivé de l'original le 29 janvier 2013 . Récupéré le 27 février 2013 .
  29. ^ Pavlova, Shukerov, Pavlov, Maria Nisheva, Dicho, Pavel (2016). "Conception et réalisation d'une bibliothèque numérique sémantique sociale" (PDF) . Services d'information et utilisation . 35 (4): 273–284. doi : 10.3233/ISU-150784 . S2CID 1557700 . Archivé de l'original (PDF) le 2020-12-12.   {{cite journal}}: Maint CS1 : noms multiples : liste des auteurs ( lien )
  30. ^ Koehler, Amy CE (2013). "Quelques réflexions sur la signification du libre accès pour les services techniques des bibliothèques universitaires". Revue des périodiques . 32 (1): 17-21. doi : 10.1080/00987913.2006.10765020 . S2CID 220292279 . 
  31. ^ Ross, Seamus (2006), "Approaching Digital Preservation Holistically" , dans Moss, Michael; Currall, James (éd.), Gestion et préservation de l'information , Oxford : Chandos Press, pp. 115–153, ISBN 978-1-84334-186-4
  32. ^ un b Caïn, Marc. "Gestion de la technologie : être une bibliothèque d'archives à l'ère numérique", Journal of Academic Librarianship 29: 6 (2003).
  33. ^ Élevage, maréchal. « Préservation des informations numériques ». Information Aujourd'hui 19:5 (2002).
  34. ^ Ltaper, Thomas H. "Où ensuite? Considérations à long terme pour les initiatives numériques." Bibliothèques du Kentucky 65(2)(2001):12-18.
  35. ^ "Wider Net: À propos du e Granary" . Archivé de l'original le 15/04/2012.
  36. ^ Comité de coopération institutionnelle : partenariat annoncé entre CIC et Google Archivé le 14/06/2007 à la Wayback Machine , 6 juin 2007, récupéré 7.
  37. ^ Van Le, Christopher, "Ouvrir les portes aux bibliothèques numériques : une proposition visant à exempter les bibliothèques numériques de la loi sur le droit d'auteur", Case Western Reserve Journal of Law, Technology & The Internet , 1.2 (printemps 2010),135.
  38. ^ Pym, Bob. "Construire des collections pour tous les temps : la question de l'importance." Bibliothèques universitaires et de recherche australiennes. 37(1) (2006):61-73.
  39. ^ Livres anciens archivés le 27/10/2005 à la Wayback Machine
  40. ^ Kelly, Kevin (2006-05-14). "Scannez ce livre !" . Revue du New York Times . Archivé de l'original le 12/10/2012 . Récupéré le 07/03/2008 . Lorsque Google a annoncé en décembre 2004 qu'il numériserait les livres de cinq grandes bibliothèques de recherche pour rendre leur contenu consultable, la promesse d'une bibliothèque universelle a été ressuscitée. ... Depuis l'époque des tablettes d'argile sumériennes jusqu'à aujourd'hui, les humains ont "publié" au moins 32 millions de livres, 750 millions d'articles et d'essais, 25 millions de chansons, 500 millions d'images, 500 000 films, 3 millions de vidéos, émissions de télévision et courts métrages et 100 milliards de pages Web publiques.
  41. ^ Hirtle, Peter B., "Préservation numérique et droit d'auteur", Archivé le 19/04/2008 aux bibliothèques de l'Université Wayback Machine de Stanford . Consulté le 24 octobre 2011.
  42. ^ a b United States Copyright Office, "The Digital Millennium Copyright Act of 1998 - US Copyright Office Summary" Archivé le 08/08/2007 à la Wayback Machine 1998, 2.
  43. ^ Van Le, Christopher, "Ouvrir les portes aux bibliothèques numériques : une proposition visant à exempter les bibliothèques numériques de la loi sur le droit d'auteur", Case Western Reserve Journal of Law, Technology & The Internet , 1.2 (printemps 2010),145.
  44. ^ Stross, Randall (6 mars 2013). "Pour les bibliothèques et les éditeurs, un tir à la corde du livre électronique" . Le New York Times . Archivé de l'original le 26 juin 2017.
  45. ^ un b Beel, Joeran; Gipp, Bela; Lange, Stefan; Breitinger, Corinna (2015-07-26). "Systèmes de recommandation de documents de recherche: une étude de la littérature" . Journal international des bibliothèques numériques . 17 (4): 305–338. doi : 10.1007/s00799-015-0156-0 . ISSN 1432-5012 . S2CID 207035184 .  
  46. ^ Robinson, John D. (2015). "Les chiens aboient et le cirque continue" (PDF) . La ligne de fond . 28 (1/2) : 11–14. doi : 10.1108/BL-01-2015-0002 .
  47. ^ "L'utilisation équitable triomphe alors que la Cour suprême des États-Unis rejette la contestation du projet de numérisation de livres Google" . 2016-04-18.
  48. ^ Akst, D. (2003). La bibliothèque numérique : son avenir est arrivé. Carnegie Reporter, 2(3), 4-8.
  49. ^ Zulkey, Claire (2020-11-02). « Collecter des histoires de coronavirus » . Magazine des bibliothèques américaines . Récupéré le 15/11/2020 .
  50. ^ Henderson, Emily (2020-10-14). "Une nouvelle base de données de recherche peut aider à façonner la réponse la plus efficace et la plus efficiente au COVID-19" . News-Medical.net . Récupéré le 15/11/2020 .
  51. ^ "Le référentiel numérique éclate la collection grand public" . Chronique de Cornell . 4 juin 2020 . Récupéré le 15/11/2020 .

Lectures complémentaires

Liens externes