Signaler ses données avec Isidore

Dernière modification le 27 septembre 2016

ISIDORE est un service qui collecte, enrichit et offre un signalement et un accès unifié aux documents et données numériques des sciences humaines et sociales.

ISIDORE « moissonne » - c'est le terme consacré - les notices, les métadonnées et le texte intégral issus des publications électroniques, des corpus, des bases de données et des actualités scientifiques, accessibles sur le web et proposés dans des standards ouverts d'interopérabilité. ISIDORE moissonne principalement des données francophones produites en France ou dans le monde francophone mais intègre aussi des données en anglais et en espagnol. Enfin ISIDORE valorise les données en libre accès (open access).

Une fois moissonnées, ces informations sont enrichies en trois langues (anglais, espagnol et français) par croisement avec des référentiels métiers (listes de vocabulaires, thésaurus, référentiels) produits soit par la communauté scientifique (GeoEthno, Pactols...), soit par les grandes institutions du domaine de l'enseignement supérieur et de la recherche (Rameau, LCSH, BNE, Gemet, Lexvo, GeoNames…). Les enrichissements multilingues permettent de relier les données entre-elles. Ces informations constituent des points d’entrée vers le texte intégral qui est lui aussi indexé quand cela est possible.

ISIDORE s’inscrit dans la longue tradition des instruments documentaires forgés par les SHS pour le repérage des sources de données quelles soient textuelles, audio-visuelles, sérielles, ou encore – depuis l’arrivée massive des données numériques – complexes et hybrides. L’importance de la citabilité et de la garantie de l’accès dans le temps aux documents, publications, objets de recherche se voit renforcée avec le support qu’est le web, qui évolue tous les jours et mute régulièrement. L’accès multidisciplinaire et les besoins de réutilisation des données de la recherche obligent à proposer des outils puissants pour le signalement et le repérage des données, forgés par les SHS, c’est-à-dire correspondants à leurs paradigmes.

Si les SHS évolues, le web change aussi : il devient de plus en plus hétérogène et la mise en place du web de données en est la dernière grande évolution. Le web est non seulement le support des sites mais aussi un espace (au sens d'environnement de stockage, d'édition et de diffusion des données) dans lequel se construisent des territoires pour y stocker à la fois des documents non structurés sémantiquement et des documents contenant une information « structurée », c'est-à-dire une proposition de qualification sémantique de l'information. Dans ce cadre, les outils de recherche doivent s'adapter, changer profondément afin de tirer parti de ces espaces structurés, ouverts et normalisés. Utilisant les méthodes et principes du web de données (modèle RDF) et du linked data (URIs), ISIDORE est le plus gros projet d'open data scientifique en France. Il propose l'accès à plus de trois millions de documents numériques. Il n’est donc pas un moteur de recherche classique : c'est une plateforme de recherche modulable qui a vocation à fédérer l'accès aux données numériques de la recherche en SHS et d’en offrir, pour les enseignants, chercheurs, doctorants et étudiants, un accès unifié tout en reliant les données entre-elles au moyen d’enrichissements multilingues.

ISIDORE associe plus d'une centaine de producteurs de données et moissonne plus de 3000 sources de données : les principales plateforme d’édition électronique, un très grand nombre de bibliothèques (de recherche, universitaires, municipales) mais aussi de nombreuses bases de données des SHS.

ISIDORE est utilisable de plusieurs façons et par plusieurs types de public :

Pour les utilisateurs recherchant de l’information et des documents :

Pour les développeurs, architecte de données, documentalistes et webmestres :

  • Des widgets de développement « ISIDORE à la demande » dans le cadre de l'application IMOCO
  • Une API du moteur de recherche ISIDORE (en cours de refonte)
  • Une interface d’interrogation SPARQL (endpoint) pour interroger en SPARQL les triplets RDF enrichis et contenus dans le triple-store ISIDORE
  • Via la technologie OpenSearch

ISIDORE est en exploitation depuis 2011 et fonctionne en mode 24/7. La TGIR Huma-Num en assure la maîtrise d'ouvrage et le Centre pour la communication scientifique directe (CCSD) la maîtrise d’œuvre. Ce projet a été mené avec l’aide et le savoir-faire des sociétés Antidot, Sword et Mondeca. En amont, une phase d'étude des besoins (2008-2010) avait été confiée à Atos Consulting.