Partage de données : Le protocole OAI en quelques mots

9 05 2009

Bibliothèque, musée ou université, le protocole OAI vous permet de valoriser vos collections numériques sans nécessiter un lourd investissement.

.

L’Open Archives Initiative’s Protocole for Metadata Harvesting (ou OAI-PMH) est un outil qui permet de créer d’immenses réservoirs d’enregistrements, de les alimenter et de les mettre à jour de façon automatique. Les enregistrements signalent, décrivent et rendent possible l’accès aux collections numériques d’un musée ou d’une bibliothèque par exemple. Le protocole OAI facilite le partage de métadonnées scientifiques ou culturelles.

.

L’échange de données et le partenariat

  • Grâce au protocole OAI, toute bibliothèque offre une visibilité accrue de ses publications électroniques ou de son fonds spécialisé. Elle est alors un fournisseur de données.

.

  • Cette même bibliothèque, inversement, met en place un portail documentaire ou réalise une base de données dans un domaine spécialisé en rassemblant des données descriptives de ressources accessibles via Internet dans des entrepôts OAI. Elle est alors un fournisseur de service.

La complémentarité de certaines collections par exemple est aussi l’occasion de partenariats entre universités. Le protocole OAI permet de faire communiquer entre elles des bases de données diverses.

.

La notion d’entrepôt OAI

Lorsqu’une bibliothèque cherche à valoriser et à diffuser son fonds documentaire en ligne, elle constitue une base de données compatible avec le protocole OAI. Cette base est appelée entrepôt OAI. L’accès à ces données est rendu possible grâce à un moissonneur OAI.

.

Qu’appelle-t-on un moissonneur OAI ?

Lorsqu’une bibliothèque cherche à collecter de l’information pertinente, elle peut développer son moissonneur OAI. Le moissonneur est un programme lancé par le fournisseur de service. Son travail est de collecter les métadonnées auprès d’un ou plusieurs entrepôts OAI.

.

Ressources utiles pour commencer :

Objectif : Fédérer les initiatives des pays européens pour le développement des archives ouvertes. Établir un lieu d’expertise et d’échanges sur les développements en cours. Mener des études comparatives au niveau technique et organisationnel.

Documents indispensables

.

(d’après Le protocole OAI et ses usages en bibliothèque par Fr. Nawrocki)





    HAL : un exemple français d’archive ouverte de publications scientifiques

    9 05 2009
    tamponHAL
    ©CCSD

    Basé sur les principes du libre accès et de l’auto-archivage, HAL permet aux chercheurs de déposer leur propre production au sein d’un dépôt. Les articles de bénéficient pas d’une évaluation scientifique de leurs pairs tant qu’ils n’ont pas été soumis à une revue scientifique.

    .

    Avec HAL, il est possible de créer des environnements personnalisés de dépôt et de consultation pour des communautés scientifiques particulières comme les éditeurs d’un journal électronique ou encore les participants à un congrès. HAL propose aussi des services qui permettent d’augmenter la visibilité internationale : transfert automatique des documents vers ArXiv (archive ouverte internationale).

    .

    Dépôt par auto-archivage et indexation en quelques mots.

    HAL permet une communication directe entre chercheurs. Le dépôt est définitif mais il est possible de déposer des versions corrigées par la suite.

    Comparé à une publication sur une archive locale ou sur un site web personnel, la mise en ligne est rapide et simple et la diffusion des travaux est très large (cf. le taux de citation des articles en Open Access par rapport aux originaux dans les revues papier).

    Autre aspect très important : l’archivage est assuré également grâce à la pérennité et à la stabilité des URL. L’accès nomade aux données qui sont consultables et extractibles est un plus.

    Des métadonnées structurées sont fournies par les déposants qui sont aussi selon les cas les documentalistes de l’institution. L’enrichissement des documents déposés par ces métadonnées permet des recherches précises, la navigation par sujet et l’extraction automatique des documents.

    .

    Interface de recherche et résultats : la consultation de la base par deux onglets

    .

    Onglet Consultation

    • Par domaine
    • Les 30 derniers dépôts
    • Par année de publication, rédaction, dépôt
    • Par type de publication
    • Par collection
    • Les portails de l’archive ouverte HAL
    • Par établissement (extraction automatique)
    • ArXiv
    • Les Thèses (TEL)
    Onglet Recherche (sur les références uniquement)

    • Recherche simple
    • Recherche avancée (champs qui remplissent la fonction de booléens et stricte avec guillemets)
    • Accès par identifiant
    • Les Thèses (TEL)

    .

    Les résultats sont donnés sous la forme d’une liste de références classées par date de publication avec leur date de dépôt.

    Pour info : les différents formats rencontrés pour les publications déposées dans HAL sont : HTML, DOC, LaTeX et PDF.

    .

    Ressources utiles pour commencer :

    .

    D’après l’article en ligne de Jean-Pierre Lardy : HAL-Hyper Article en ligne