PROJETS

HNSO : Huma-Num Science Ouverte

Le projet d’Huma-Num, intitulé Huma-Num Science Ouverte (HNSO), est conçu pour développer une mise à niveau rapide de ses services de stockage et publication des données scientifiques.  Il s’agit tout d’abord d’améliorer les plateformes NAKALA (stockage et documentation de documents et données SHS) et ISIDORE (moteur de recherche pour les publications et données en SHS) afin de les rendre pleinement compatibles avec les principes FAIR  – Facile à trouver, Accessible, Interopérable et Réutilisable. L’objectif est également de renforcer l’écosystème de travail intégré que propose la TGIR Huma-Num dans le but d’accroître la découvrabilité des données des SHS.

Ce projet a ainsi pour ambition de favoriser l’appropriation des outils de la science ouverte pour les acteurs des disciplines SHS. L’amélioration continue et la constance dans l’accès aux données représentent, plus que jamais, un enjeu majeur pour une science étayée, cumulative et en mouvement.

Huma-Num Science Ouverte est un projet soutenu par le Fonds national pour la science ouverte (FNSO) dans le cadre du volet « infrastructure de recherche » de son premier appel à projet. Le projet a été lancé début 2021 pour une durée de 3 ans.

Matilda

Le projet ANR Matilda (ANR-19-DATA-0002) vise à élaborer un outil bibliographique/bibliométrique pour la science ouverte ayant pour objectif de changer la situation des données de références/citations en tant que parent pauvre de la science ouverte.

Il s’agit d’une part de redonner une place équitable aux contenus académiques exclus des outils propriétaires actuellement utilisés, WoS et Scopus, en adoptant un principe d’égal traitement de l’ensemble des textes scientifiques et de leurs métadonnées. Et d’autre part, de donner aux milieux académiques et aux chercheurs le plus grand contrôle possible sur la façon dont ils recherchent les informations textuelles et les métadonnées.

Matilda s’inscrit dans un double héritage de conception et d’utilisation avec, d’une part, Google Scholar, qui a popularisé le libre accès au suivi des citations et aux métadonnées de contenus scientifiques, en dehors du circuit des bibliothèques et des sites d’éditeurs, ainsi que l’intervention des utilisateurs comme enrichisseurs. D’autre part, il hérite de la philosophie d’ISIDORE, et d’autres moteurs de recherche fondés sur le moissonnage OAI-PMH, avec recherche plein texte et indifférence au « prestige » des supports. L’objectif est donc de compléter/remplacer ces différentes utilisations, ainsi que celles des bases de données commerciales (WoS/Scopus), qui sont utilisées de manière quasi-exclusive dans certaines disciplines.

Outre l’utilisation de l’infrastructure de Huma-Num, ce projet ANR a été rendu possible par le développement d’une preuve de concept (POC) d’un outil bibliographique au cours de l’année 2019. Utilisant certaines méthodes d’enrichissement de ISIDORE, ce POC moissonnait des bases comme Crossref, arXiv, PubMed, utilisait les APIs de Unpaywall et GROBID et indexait les documents enrichis dans le cluster Elasticsearch de la TGIR. Huma-Num fait appel à une prestation de services informatiques  auprès de la société Foxcub pour l’aider à la réalisation de la chaîne de traitement pour les données du projet ANR.
Le projet a démarré le 1er mai 2020 et se terminera fin octobre 2021.

 

Projets européens en cours

Triple

Le projet est piloté par Huma-Num et vise au développement d’une plateforme européenne de découverte des données, des projets de recherche et des profils de chercheurs : GOTRIPLE.

Celle-ci doit permettre aux chercheurs en sciences humaines et sociales non seulement de découvrir et de réutiliser des données et des projets disponibles en 9 langues, mais aussi de développer un réseau au-delà des frontières disciplinaires et linguistiques grâce à des différents services innovants : 

  • Une plateforme de crowdfunding a vocation à valoriser et lancer des petits projets de recherche et à participer ainsi au développement de la science citoyenne.
  • Un système de recommandations (ScAR) et un outil de réseau basé sur la confiance (Trust Building System)
  • Un outil d’annotation et de visualisation pour mettre en évidence la pertinence des données disponibles selon les besoins des chercheurs. 

Le projet se fonde sur une approche de co-design et d’implication des utilisateurs tout au long du projet. Une analyse poussée des besoins a permis d’établir des profils types d’utilisateurs pour dresser des scénarios. Ces analyses sont actuellement utilisées pour définir les pages et fonctionnalités de l’interface pour une expérience utilisateurs optimale. Cette approche utilisateurs sera pérennisée au-delà de la période de développement du projet sous forme d’un forum composé d’une large panel de chercheurs mais aussi d’ingénieurs.

GOTRIPLE s’inscrit dans un contexte européen d’une part en tant que service de découverte de l’infrastructure de recherche européenne OPERAS (Open Scholarly Communication in the European Research Area for Social Sciences and Humanities) que coordonnent de manière conjointe les infrastructures françaises OpenEdition et Huma-Num et d’autre part au sein de l’EOSC (European Open Science Cloud) en intégrant les principes et recommandations de la Science Ouverte telles que les données FAIR.

Coordonné par le GARR, le réseau national italien de recherche et d’éducation (NREN), ce projet réunit ainsi des représentants d’infrastructures nationales de 5 États membres : l’Allemagne, l’Autriche, la Belgique, l’Italie et la France. Plus particulièrement, il implique les organisations suivantes : Université de Vienne (Autriche), Université de Gand (Belgique), CINES, CNRS, IFREMER, INRA, INRIA et INSERM (France), DKRZ, Fraunhofer, GFZ et KIT (Allemagne) et CINECA, CMCC, CNR, INFN et Trust IT (Italie).

Du côté du CNRS, 12 instituts de recherche participent à EOSC-Pillar. L’IN2P3, également impliqué dans l’EOSC, coordonne cette participation alors que la TGIR Huma-Num est impliquée au titre de ses missions sur les données en SHS.

La TGIR Huma-Num participe ainsi activement à deux des sept Work Packages (WP) du projet EOSC-Pillar. En premier lieu le WP 6 « EOSC in action : Use cases and community-driven pilots » coordonné par l’IN2P3 et dont la TGIR Huma-Num dirige une tâche sur les données FAIR en SHS. Cette tâche est l’occasion de mettre en avant des cas pratiques sur les données en SHS en impliquant les communautés françaises par le biais des consortiums de la TGIR et en renforçant les liens avec le réseau d’implémentation sur la fairisation des données en SHS, CO-OPERAS. Un des cas d’utilisation donnera lieu à une preuve de concept menée à bien en collaboration avec le Centre pour la Communication Scientifique Directe (CCSD) et visant à lier les publications déposées dans HAL à des données entreposées dans NAKALA.

Huma-Num apporte également son expertise sur cette question dans le cadre du WP5 intitulé « The data layer: establishing FAIR data services at the national and transnational level » en participant à la tâche 5.4 consacrée à la formation et à la production de supports pédagogiques liés aux données FAIR en SHS.

Dans ce contexte, Huma-Num renforcera les liens avec d’autres infrastructures nationales et d’autres organismes français impliqués (CCSD, CINES, IFREMER, INRA, INRIA, INSERM, IN2P3). Ce projet permet également de contribuer au renforcement de la structuration des infrastructures françaises pour mettre en avant les services et outils français à l’Europe.

SSHOC est un projet de type cluster pour les SHS qui implique la majorité des acteurs en SHS, notamment les ERICs, dans la construction de l’EOSC. A ce titre, ce projet a pour objectif de porter la voix des SHS auprès du cloud européen. Conformément aux principes FAIR, les partenaires du projet travaillent à la création d’outils et services numériques dédiés à leur communauté de recherche, à les rendre accessibles via l’EOSC, et à les maintenir. 

Dans cette optique, une des créations majeures du projet est le SSH Open Marketplace : une plateforme de découverte d’outils et de services pour les chercheurs en SHS. Cette plateforme se propose d’accompagner l’utilisateur à toutes les étapes du cycle de vie de la donnée en lui offrant des solutions dites “contextualisées”. Plus concrètement, un chercheur à la recherche d’un outil, se verra également suggérer d’autres items pour enrichir sa solution : des publications, tutoriels, etc. 

L’objectif est donc de créer un écosystème européen ouvert pour les SHS, doté d’une composante infrastructurelle et humaine. Le développement, la réalisation et la maintenance d’outils et de services conviviaux, couvrant tous les aspects du cycle complet des données de recherche, seront mis en place, en tenant compte de l’approche centrée sur l’homme et en créant des liens entre les personnes, les données, les services et la formation.

Le projet SSHOC encourage la création d’environnements sûrs pour le partage et l’utilisation de données sensibles et confidentielles. SSHOC contribuera ainsi à l’agenda de la science ouverte et à la réalisation de l’EOSC. En outre, le cloud SSH prévu est essentiel au multilinguisme de l’Europe ; les données en Europe sont souvent disponibles dans plusieurs langues, ce qui incite fortement à la recherche comparative des phénomènes sociétaux et culturels qui se reflètent dans l’utilisation des langues. Le cloud SSH contribuera aux innovations découlant du couplage de ces types de données hétérogènes – et travaillera sur le principe d’interopérabilité de FAIR.

 

Operas-P

Le projet OPERAS-P soutient la création de l’infrastructure européenne de recherche pour les publications en accès libre dans les sciences sociales et humaines (OPERAS). Plus précisément, il vise à élaborer un plan de gouvernance, une vision et un modèle d’activités concernant la durabilité à long terme de l’infrastructure. 

Dans l’ensemble, le projet soutient la mise en œuvre de services innovants pour répondre à l’accès transnational aux services de publication sur la base de l’interopérabilité entre les services de publication et la transition vers le marché européen de l’Open Science Cloud (EOSC), qui a été conçu pour habiliter 1,7 million de chercheurs européens et 70 millions de professionnels de la science et de la technologie.

Quelques ressources

ariadneplus

ARIADNEplus fait suite à ARIADNE, un projet de recherche en archéologie financé par la Commission européenne qui a débuté en 2013 et s’est terminé en 2017. ARIADNE visait à l’intégration d’entrepôts de données issues de la recherche archéologique européenne. Il a abouti à la création d’un catalogue consultable en ligne (aujourd’hui portail ARIADNEplus) de jeux de données archéologiques ARIADNEplus est ainsi le prolongement d’ARIADNE et se propose d’améliorer son infrastructure tout en maintenant la même approche méthodologique.

Deux consortiums de la TGIR Huma-Num participent, au titre du CNRS et de l’Université de Tours (tierce partie) à ce projet H2020 au carrefour de leurs domaines d’expertise.

En effet, constatant la prolifération des jeux de données archéologiques, variant dans leurs structures et leurs formats, le Consortium MASA de la TGIR Huma-Num s’est donné pour mission de mettre en ligne ces jeux de données en les rendant interopérables selon les principes FAIR. Centré autour des modèles de données 3D en SHS, le Consortium 3D-SHS œuvre lui aussi pour la mise en place de bonnes pratiques pour l’acquisition, mais aussi pour la diffusion et l’archivage des modèles 3D.

Ensemble, ces deux Consortiums de la TGIR Huma-Num associent leurs compétences pour participer au programme européen ARIADNEplus depuis 2019. Dans le cadre de ce programme, les Consortiums MASA et 3D-SHS se sont engagés à partager l’ensemble de leurs données et les outils expérimentaux qui ont été conçus pour les exploiter. Parmi ces outils, on notera OpenArchaeo plateforme user-friendly pour interroger de manière fédérée plusieurs jeux de données archéologiques, ou aLTAG-3D, plateforme d’archivage pérenne pour les modèles 3D.

Projets européens terminés

Le projet Humanities At Scale visait à soutenir la phase de consolidation de l’ERIC DARIAH. Ses différents work packages comportaient des activités spécifiques destinées à accompagner le développement de DARIAH :

  • Développement de la communauté DARIAH
  • Aide à la recherche de financements pour les projets
  • Diffusion de  connaissance par des écoles d’été et des échanges inter-européens
  • Mise en oeuvre de services à destination de la communauté DARIAH
  • Travail d’inventaire sur les méthodes et les plates-formes utilisées pour les Humanités Numériques en Europe etc.

Il s’agit du premier projet H2020 dans lequel Huma-Num a été naturellement impliquée, la France étant l’un des membres fondateurs de DARIAH. HN a ainsi été actif sur la plupart des WPs (7/8) et notamment leader sur le WP4 « Training and Education ».

La participation au projet HaS a permis :

  • D’étendre les communautés impliquées dans DARIAH ;
  • De stabiliser et renforcer la structuration de l’ERIC, tel qu’avec la gestion des in kinds où un outil a été spécifiquement créé ;
  • de créer un programme des ambassadeurs DARIAH et de multiples formations, notamment pour des pays ayant peu d’activités autour des Humanité Numériques (création de supports multilingues) ;
  • de commencer à développer un prototype  pour le Marketplace de DARIAH ;
  • de développer un projet collaboratif autour des publications en Humanités Numériques, MétaBlog OpenMethods hébergé par Huma-Num.
Parthenos

Le projet H2020 PARTHENOS (2015-2019) visait à promouvoir la définition et l’utilisation de normes communes, à initier des activités en commun, à définir et mettre en œuvre des politiques concertées (cycle de vie des données, notamment dans une optique de réutilisation réelle des données, qualité et de la gestion des DPI), et à développer des services mutualisés et des solutions partagées dans le domaine des humanités numériques, particulièrement dans les disciplines dont l’objet a un caractère patrimonial.

En tant que Très Grande Infrastructure de Recherche dédiée aux humanités numériques, Huma-Num était impliquée dans quatre des huit work packages que comptait le projet. Ceux-ci étaient consacrés à l’étude des besoins des communautés en matière de digital humanities ; à la définition et à l’implémentation de politiques communes et de solutions partagées concernant des questions d’intérêt commun ; à la question de la standardisation ; et à la communication interne et externe du projet. Dans ce cadre, Huma-Num a valorisé les initiatives et réalisations de ses consortiums, particulièrement dans le cadre du work package 4 dédié à la standardisation en intégrant au Standard Survival Kit (produit du WP4) plusieurs scénarii de recherche issus et construits par les Consortiums-HN.

Suite à son extension de 6 mois, le projet H2020 PARTHENOS débuté en mai 2015 a pris fin le 31 octobre 2019. L’évènement de clôture s’est tenu le 4 octobre 2019 au Musée national de Rome.

ANR

Le projet DISPOSED-H visait à donner une visibilité aux ressources et données SHS sur le plan européen et international en préparant la mise en œuvre d’une plateforme de services multilingue dédiée. Le projet DISPOSED-H ne proposait pas une alternative à l’édition scientifique en SHS mais il marquait la transition vers la Science Ouverte en proposant un environnement multilingue et en s’engageant fortement en faveur de l’accès ouvert aux publications et aux données. 

Le projet DISPOSED-H est venu nourrir la future infrastructure OPERAS, dont l’objectif est justement de s’engager dans la communication scientifique ouverte en SHS. Le réseau s’est en majeure partie construit à partir du consortium OPERAS, mais pas uniquement.