Diffuser ses données

Dernière modification le 27 mai 2017

Présentation

Le service de diffusion des données regroupe un ensemble d'outils permettant de diffuser des données en ligne, sur le web. Ce service favorise le libre accès aux données (et aux bases de données) et a minima le libre accès aux metadonnées (condition obligatoire pour accéder à ce service). Il s'inscrit dans un cadre favorisant la réutilisation maitrisée des données et des métadonnées en sensibilisant en particulier les communautés aux licences de diffusion (creatives commons, Etalab, etc.). Les sites web qui éditorialisent des bases de données ou des corpus en SHS sont invités à rendre interopérable leurs données via des métadonnées normalisées et cela afin d'être signalé dans ISIDORE (un guide est à votre disposition : "Comment contribuer à ISIDORE avec ses données numériques ?".

Une large palette de solutions et d'outils est offerte et vise à couvrir sur une large échelle, tous les niveaux de besoins, du plus basique au plus expert. Il s'agit d'offrir une progessivité dans les solutions de diffusion en adaptant les outils aux besoins scientifiques et au contexte des programmes de recherche. Ainsi, l'offre de service sur le plan de la diffusion s'étend de la mise à disposition de « packs » logiciels déjà pré-configurées et optimisés pour l’écosystème des SHS (formats de métadonnées, interopérabilité vers ISIDORE, Gallica/BnF, Europeana, etc.) à la fourniture de machines virtuelles pré-configurées pour les communautés SHS (exemple : mise en œuvre de CentOS et BaseX pour la diffusion et l'édition de corpus de sources en XML/TEI).

Ainsi, le service diffusion s'adresse à la fois aux programmes de recherche qui se lancent pour la première fois dans la mise en oeuvre de site web donnant accès à des données SHS (ex. programmes ANR, ERC, etc.) mais aussi aux équipes confirmées ayant besoin de multiples outils de diffusion et souhaitant développer elles-mêmes des solutions qui leurs seraient propres.

Ce que la TGIR ne fait pas

Une limite importante est à noter : l'équipe de la TGIR Huma-Num ne peut se substituer aux équipes d'ingénieurs pour développer, maintenir des applications forgées dans les équipes (ou par des prestataires de services). Ainsi, nous ne développons pas de logiciels propres pour les programmes de recherche.

Ainsi, les équipes de recherche qui n'ont pas d'informaticien (développeurs, etc.) sont invitées à utiliser nos solutions "clés en main" : NAKALONA (voir ci-dessous), NAKALA, ISIDORE ou bien sur à constituer des programmes de recherche embarquant des développeurs et en nous sollicitant pour tous avis et conseils en amont de la construction du programme.

Offres disponibles à la TGIR en matière de diffusion

1. Le pack NAKALONA

La TGIR Huma-Num propose aux programmes de recherche souhaitant débuter dans la diffusion de données éditorialisés (corpus autour d'une ANR, mise en ligne de collections de données numériques textuelles, audiovisuelles, etc.) un pack de diffusion des données de la recherche associant le système de gestion de données Omeka et notre service NAKALA.

Nakalona

Géré et administré par la TGIR Huma-Num (en mode SAAS) et d'accès gratuit, ce pack contient :

  • Le logiciel Omeka installé par Huma-Num
  • Un nom de domaine en nakalona.fr géré par Huma-Num
  • 3 thèmes de présentations
  • Plusieurs modules pré-installés (voir ci-dessous)
  • Une interface d'import/export vers NAKALA.
  • Une sauvegarde quotidienne

Naturellement, ce pack est entièrement compatible avec une interopérabilité permettant le signalement et l'enrichissement des métadonnées dans ISIDORE.

OMEKA est développé par le Roy Rosenzweig Center for History and New Media, George Mason University.

Les modules pré-installés sont :

Les thèmes Roy, Berlin et Avantgarde sont disponibles dans NAKALONA.

N'hésitez pas à nous écrire pour nous suggérer d'autres modules et compléter ainsi le pack.

En savoir plus ? voir le site NAKALONA

2. Le "cluster web" mutualisé de la TGIR Huma-Num

Au delà, l'ensemble des technologies libres, notamment celles autour du web et des bases de données, peuvent être mises en oeuvre sur la grille de service d'Huma-Num dans le cadre d'un "cluster web" mutualisé et entièrement dédié aux programmes de recherche en SHS. Ce "cluster web", regroupant plusieurs centaines de sites web, est mise en oeuvre par la TGIR Huma-Num et propose :

  • Des langages de programmation et scripts : C, C++, PHP (5.x et 7), Python, Java
  • Des logiciels de bases de données relationnelles : MySQL, PostgreSQL, PostGIS
  • Des logiciels XML et autres bases de données : BaseX, eXist, couchdb, mongodb, redis
  • Des serveurs d'applications : Tomcat, Jetty
  • Des triplestores RDF : Virtuoso, Sesame
  • Des moteurs de recherche : Elasticsearch, Solr

N'hésitez pas à demander l'installation d'autres outils suivant vos besoins.

Avec ces briques de base fournies et gérées par la TGIR Huma-Num, il est possible de gérer un site web pour diffuser ses données. Des accès interactifs permettent de gérer facilement son arborescence de fichiers et sa base de données. Concernant les conditions d'éligibilité, nous vous renvoyons à la page "Services et outils" de ce site web.

Cependant il revient à la charge de l'utilisateur dans le cadre de son programme de recherche d'assurer la maintenance technique des outils logiciels qu'il met en oeuvre. Ceci est notamment vrai pour les outils de gestion de contenus Web (ou CMS), nécessitant de régulières et rapides mises à jour, liées à des annonces de vulnérabilités.

De même l'évolution sur le long terme des technologies employées, l'administration fonctionnelle du site et son évolution restent à la charge de l'utilisateur (et donc du programme de recherche).

3. Les machines virtuelles

Dans le cas où un hébergement sur le cluster web mutualisé ne convient pas, il convient de contacter Huma-Num, afin d'envisager l'usage d'une machine virtuelle, permettant plus d'autonomie et une intégration plus facile de plusieurs composants logiciels, mais nécessitant une prise en charge de son administration. Le système d'exploitation sera alors installé par Huma-Num, et une co-administration sera mise en place pour s'adapter au mieux aux besoins exprimés. Dans ce cadre, la TGIR huma-Num propose sur ses machines virtuelles :

  • Les systèmes Linux : Debian, Ubuntu, CentOS
  • Windows : 2012