L’architecture logicielle de la plateforme de TDM (Text and Data Mining) OpenMinTeD (OMTD) s’articule autour de trois services principaux.
Le service Registry (catalogue) prend en charge le stockage, la navigation, le téléchargement, la recherche et la gestion de ressources comme les publications scientifiques, les composants de traitement (par exemple un étiqueteur morpho-syntaxique) et les ressources de la langue (lexiques, thesauri). Ces ressources sont téléchargées, puis enregistrées dans OpenMinTeD à travers un certain nombre de protocoles tels que Maven ou docker. Elles sont rigoureusement documentées grâce à un système riche de descriptions de métadonnées pour être réutilisables.
Le service d’édition de Workflow assiste l’utilisateur à la création de workflows interopérables à base de composants TDM. Ces composants sont exécutés par le service de Workflows dans une infrastructure Cloud (ou sur une machine locale).
Au travers du service d’édition d’annotation, l’utilisateur a la possibilité de créer des ensembles de données en annotant des textes, données qui peuvent ensuite  être utilisées dans des workflows, dans un but d’évaluation par exemple.

Une vue complète de l’ensemble des couches de l’architecture OpenMinTeD est présentée en détail ci-dessous :

Le back-end d’exécution de workflows est responsable de l’orchestration/exécution des workflows conçus et soumis dans le cadre de l’exploitation de la plate-forme.

L’Exécution de workflow se déroule selon le schéma suivant :

  • L’utilisateur de la plate-forme OpenMinTeD se connecte au service Registry pour rechercher des corpus existants, télécharger ses propres données, enregistrer des applications TDM, concevoir des workflows et les soumettre pour exécution au moteur de workflow.
  • L’exécution de workflow est déléguée à Galaxy (moteur de workflow) au travers du service Workflow. Le workflow est soumis pour exécution au Stack Scheduler (Chronos et Mesos).  L’exécution de chaque étape du workflow (composants TDM dans des images dockers) s’opère sur un pool dynamique de Machines Virtuelles  (un docker engine par VM avec, au préalable, récupération des images dockers sur le service registry Docker d’OpenMinTeD.
  • Le Service de Stockage met en œuvre l’API de stockage du Cloud. Ce service est responsable de l’organisation des données en entrée et en sortie avant et à la fin de l’exécution des workflows.