Diffuser ses données

Dernière modification le 26 septembre 2016

Le service de diffusion des données regroupe un ensemble d'outils permettant de diffuser des données en ligne, sur le web. Ce service favorise le libre accès aux données (et aux bases de données) et a minima le libre accès aux metadonnées (condition obligatoire pour accéder à ce service). Il s'inscrit dans un cadre favorisant la réutilisation maitrisée des données et des métadonnées en sensibilisant en particulier les communautés aux licences de diffusion (creatives commons, Etalab, etc.). Les site web qui éditorialisent des bases de données ou des corpus en SHS sont invités à rendre interopérable leurs données via des métadonnées normalisées en utilisant des protocoles tel que OAI-PMH, RSS, Atom, sitemap XML + métadonnées RDFa et cela afin d'être signalé dans ISIDORE.

Une large palette de solutions et d'outils est offerte et vise à couvrir sur une large échelle, tous les niveaux de besoins, du plus basique au plus expert. Il s'agit d'offrir une progessivité dans les solutions de diffusion en adaptant les outils aux besoins scientifiques et au contexte des programmes de recherche. Ainsi, l'offre de service s'étend de la mise à disposition de « packs » logiciels déjà pré-configurées et optimisés pour l’écosystème des SHS (formats de métadonnées, interopérabilité vers ISIDORE, Gallica/BnF, Europeana, etc.) à la fourniture de machines virtuelles pré-configurées pour les communautés SHS (exemple : mise en œuvre de CentOS et BaseX pour la diffusion et l'édition de corpus de sources en XML/TEI).

1. Le pack NAKALONA

La TGIR Huma-Num propose aux programmes de recherche souhaitant débuter dans la diffusion de données éditorialisés (corpus autour d'une ANR, mise en ligne de collections de données numériques textuelles, audiovisuelles, etc.) un pack de diffusion des données de la recherche associant le système de gestion de données Omeka et notre service NAKALA.

Nakalona

Géré et administré par la TGIR Huma-Num (en mode SAAS) et d'accès gratuit, ce pack contient :

  • Le logiciel Omeka installé par Huma-Num
  • Un nom de domaine en nakalona.fr géré par Huma-Num
  • 3 thèmes de présentations
  • Plusieurs modules pré-installés (voir ci-dessous)
  • Une interface d'import/export vers NAKALA.
  • Une sauvegarde quotidienne

Naturellement, ce pack est entièrement compatible avec une interopérabilité permettant le signalement et l'enrichissement des métadonnées dans ISIDORE.

OMEKA est développé par le Roy Rosenzweig Center for History and New Media, George Mason University.

Les modules pré-installés sont :

Les thèmes Roy, Berlin et Avantgarde sont disponibles dans NAKALONA.

N'hésitez pas à nous écrire pour nous suggérer d'autres modules et compléter ainsi le pack.

En savoir plus ? voir le site NAKALONA

2. Le cluster web mutualisé d'Huma-Num

Au delà, l'ensemble des technologies libres, notamment celles autour du web et des bases de données, peuvent être mises en oeuvre sur la grille d'Huma-Num dans le cadre d'un cluster web mutualisé et entièrement dédié aux programmes de recherche en SHS. Ce cluster web, mise en oeuvre par la TGIR Huma-Num propose :

  • Des langages de programmation et scripts : C, C++, PHP (5.x et 7), Python, Java
  • Des logiciels de bases de données relationnelles : MySQL, PostgreSQL, PostGIS
  • Des logiciels XML et autres bases de données : BaseX, eXist, couchdb, mongodb, redis
  • Des serveurs d'applications : Tomcat, Jetty
  • Des triplestores RDF : Virtuoso, Sesame
  • Des moteurs de recherche : Elasticsearch, Solr

Ne pas hésiter à demander l'installation d'autres outils.

Avec ces briques de base fournies et gérées par Huma-Num, il est possible de gérer un site Web pour diffuser ses données. Des accès interactifs permettent de gérer facilement son arborescence de fichiers et sa base de données.

Cependant il revient à la charge de l'utilisateur dans le cadre de son programme de recherche d'assurer la maintenance technique des outils logiciels qu'il met en oeuvre. Ceci est notamment vrai pour les outils de gestion de contenus Web (CMS), nécessitant de régulières et rapides mises à jour, liées à des annonces de vulnérabilités.

De même l'évolution sur le long terme des technologies employées, l'administration fonctionnelle du site et son évolution restent à la charge de l'utilisateur.

3. Les machines virtuelles

Dans le cas où un hébergement sur le cluster web mutualisé ne convient pas, il convient de contacter Huma-Num, afin d'envisager l'usage d'une machine virtuelle, permettant plus d'autonomie et une intégration plus facile de plusieurs composants logiciels, mais nécessitant une prise en charge de son administration. Le système d'exploitation sera alors installé par Huma-Num, et une co-administration sera mise en place pour s'adapter au mieux aux besoins exprimés. Dans ce cadre, la TGIR huma-Num propose sur ses machines virtuelles :

  • Les systèmes Linux : Debian, Ubuntu, CentOS
  • Windows : 2012