Attribution d’un RNSR à une affiliation (Apprentissage)

Le RNSR, Référentiel National des Structures de Recherche (français), référence les structures de recherche publiques et privées au niveau national. Il est administré par le ministère chargé de la recherche.

En particulier, cet identifiant attribue à chaque structure de recherche un identifiant (par exemple 199213009E), et recense différents éléments décrivant la structure comme la date de création, l’éventuelle date de fermeture, l’adresse, le sigle, l’intitulé etc.

Ce web service permet, à partir d’une adresse d’affiliation d’auteur de trouver un identifiant. Il utilise un modèle de classification type réseau de neurones, entraîné par apprentissage supervisé en utilisant la bibliothèque FastText. Sa précision est évaluée entre 0.95 et 0.98 et son silence entre 0.05 et 0.07.

Un autre web service similaire est disponible à ce lien, à la différence que l’entrée attendue est une affiliation et une année et qu’il fonctionne par règles.

Exemple textuel du traitement

Le format d'entrée :
[
  {
    "id": 1,
    "value": "UAR 76, Inist-CNRS, 2 rue Jean Zay 54500 Vandoeuvre-lès-Nancy"
  },
  {
    "id": 2,
    "value": "Institut Charles Gerhardt, Université de Montpellier"
  },
  {
    "id": 3,
    "value": "UMR 7272 - CNRS, 06100 Nice"
  },
  {
    "id": 4,
    "value": "Affiliation trop imprécise ou non reconnue"
  }
]
Le résultat :
[
  {
    "id": 1,
    "value": "198822446E"
  },
  {
    "id": 2,
    "value": "200711918D"
  },
  {
    "id": 3,
    "value": "201220250N"
  },
  {
    "id": 4,
    "value": "n/a"
  }
]