Pôle Interopérabilité des données

Dernière modification le 26 mai 2015

Le pôle Interopérabilité des données est en charge de la réalisation d'ISIDORE, l'accès unifié aux données numériques produites par les communautés scientifiques des sciences humaines et sociales.<--break->

A ce titre, il assure les tâches suivantes :

  • Pilotage d'ISIDORE (réalisations, évolution)
  • Assistance aux communautés scientifiques souhaitant proposer des données pour ISIDORE.
  • Assistance aux utilisateurs d'ISIDORE
  • Expertises dans les équipes et laboratoires en matière d'interopérabilité des données de la recherche
  •  Rédaction de guides de bonnes pratiques

A propos de l'interopérabilité

Les données numériques sont de plus en plus présentes dans l'environnement du chercheur et couvrent, dans certaines disciplines, l'ensemble du processus de recherche : de l'utilisation de données nativement numériques (données « primaires » ou « sources », regroupées en corpus ou faisant partie d'un fonds d'archives),  à l'organisation de séminaires numériques,  jusqu'à la publication en ligne de revues ou d'ouvrages. Ce tournant numérique touche l'ensemble des disciplines des sciences humaines et sociales et pose de nouvelles questions en matière d'exploitation et d'utilisation des données. Le développement de corpus de données numériques pour la recherche implique une réflexion sur la  structuration de l’information contenue dans ces  données, sur les formats et le système de diffusion utilisés, et sur les réutilisations possibles.   Il s'agit de faire des choix et de les expliciter publiquement afin que d'autres puissent, dans le futur, utiliser ces sources dans un processus de recherche différent.

Assurer l'interopérabilité des données nécessite de mettre en œuvre une politique scientifique et technologique permettant :

  • de rendre accessible ses propres données dans des langages documentaires partagés par le plus grand nombre
  • de garantir l'accessibilité aux données dans le temps pour en garantir la citabilité. Cela implique, par exemple, d'attribuer un identifiant unique à chaque donnée et d'en maîtriser les processus d'attribution et d'exploitation dans le temps. C'est à ce titre qu'ISIDORE attribue un numéro handle à chacune des ressources moissonnées et que nous permettrons aux producteurs de données d'exploiter pour eux-mêmes ce système d'URI pérenne
  • de préserver la réutilisation des données numériques : ajout de classifications, de schémas de description (documentaires dans un premier temps), prise en charge de la pérennité des données par le développement de formats pivots pour la préservation.

Cela nécessite également d'avoir la maîtrise de l'environnement juridique des données afin de savoir si tel ou tel corpus est partageable et,  si oui, selon quelles conditions d'accès.

Les données numériques en SHS sont, le plus souvent,  « moissonnables »  par des machines, via des descriptions de données (des "métadonnées") exprimées dans des standards ouverts et partagés par le plus grand nombre d'équipes de recherche.

L'interopérabilité des données entre machines, via des métadonnées, consiste donc à établir un certain nombre de règles communes de présentation de ces  métadonnées. Ces règles d'exposition peuvent être très simples et universelles : c'est le cas par exemple du schéma de métadonnées Dublin Core, qui avec 15 champs (titre, auteur(s), etc.) permet d'avoir un socle de base pour décrire des données.

L'interopérabilité des métadonnées, dans ces conditions minimales, est la première marche vers le web de données, cette extension du web qui permet de diffuser et d'interconnecter non seulement des métadonnées, mais les données elles-mêmes. Dans le web de données, les données sont structurées selon des standards internationaux interopérables et exprimés selon le modèle Resource Description Framework ou RDF.