rnsrRuleDetect - Attribution d’identifiant(s) RNSR à une adresse (Alignements)

Niveau d'utilisation :  Avancé
Niveau de validation :  Validé
Objectif

Le web service attribue, à l’aide de règles, un ou plusieurs identifiants RNSR à partir d’une adresse d’affiliation d’auteur et d’une année de publication.

Quand aucun code RNSR n’est trouvé, le service renvoie un tableau vide.

Méthode

Règles

Les règles certaines utilisées par affAlign, appliquées à l’adresse de l’affiliation à aligner sont les suivantes:

  • le code_postal ou la ville_postale de la structure doivent être présents,
  • et pour au moins une des tutelles (etabAssoc.*.etab, et etabAssoc.*.etab.natTutEtab vaut «TUTE») :
    • soit etabAssoc.*.etab.sigle ou le etabAssoc.*.etab.libelle sont présents,
    • soit etabAssoc.*.etab.libelle commence par «Université» et le etabAssoc.*.etab.libelle est présent (mais pas le etabAssoc.*.etab.sigle).
  • et on trouve la bonne structure :
    • soit etabAssoc.*.label et etabAssoc.*.numero sont présents proches et en séquence (ex: « GDR2945 », « GDR 2945 » ou « GDR mot 2945 »),
    • soit sigle est présent,
    • soit intitule est présent.
  • et la structure existait lors de la publication : la date de publication est entre annee_creation et l’éventuelle an_fermeture.

Sachant qu’on appauvrit (casse, accents, tiret, apostrophe) tous les champs.

Ressource

Le RNSR, Référentiel National des Structures de Recherche (français), référence les structures de recherche publiques et privées au niveau national. Il est administré par le ministère de l’enseignement supérieur de la recherche et de l’innovation (MESRI). Il attribue à chaque structure de recherche un identifiant (par exemple 199213009E), et recense différents éléments décrivant la structure comme la date de création, l’éventuelle date de fermeture, l’adresse, le sigle, l’intitulé etc.

Les données actuelles remontent à 2021.

Métriques

Précautions :

  • Quand l’année n’est pas précisée, plusieurs codes RNSR peuvent être associés à un même établissement. Il est donc préférable de renseigner l’année.
  • Comme il s’agit d’une recherche de chaîne de caractères, des termes fréquents (comme « DES », « CASE », « PASTEUR », « IMAGES », …) peuvent être repérés comme des sigles de laboratoires.
  • Les développés des sigles présentent une écriture complète contrairement à celle du WoS qui les abrège et les traduit (ex: « Institut de Physique » ==> « Inst. of Phys. »).
  • La ressource est en français ; les résultats seront meilleurs sur des adresses en français.
Variantes

Informations complémentaires

Une variante de ce service web renvoie aussi des informations associées au code RNSR, telles que l’intitulé, le sigle, les tutelles, des données géographiques, le code labo…

https://affiliations-tools.services.istex.fr/v1/rnsr/info

Données en CSV

Vous pouvez aussi utiliser la variante de ce service qui prend un CSV (séparateur: virgule), et qui en sortie renvoie un CSV (séparateur : point-virgule) qui reprend les données envoyées et leur ajoute une colonne RNSR.

https://affiliations-tools.services.istex.fr/v1/rnsr/csv

 

Exemple textuel du traitement
Le format d'entrée :

Chaque entrée doit contenir l’adresse d’une affiliation (exemple : « University of Bordeaux, IMS, CNRS UMR5218, Talence, F-33405, France »), et éventuellement une année.

[
  { "id": 1,
    "value": {
      "year": "2021",
      "address": "CNRS UMR AMAP MONTPELLIER FRA"
    }
  }, { 
    "id": 2,
    "value": {
      "year": "2021",
      "address": "IRD UMR AMAP MONTPELLIER FRA"
    }
  }, { 
    "id": 3,
    "value": {
      "year": "2021",
      "address": "University of Bordeaux, IMS, CNRS UMR5218, Talence, F-33405, France"
    }
  }, { 
    "id": 4,
    "value": {
      "year": "2021",
      "address": "CENBG, CNRS/IN2P3, Chemin du Solarium B. P. 120, Gradignan, F-33175, France"
    }
  }, { 
    "id": 5,
    "value": {
      "year": "2021",
      "address": "Nulle part"
    }
  }, { 
    "id": 6,
    "value": {
      "address": "Intemporel"
    }
  }, { 
    "id": 7,
    "value": {
      "address": "Inist-CNRS, UPS76, 2 rue Jean Zay, Vandoeuvre-lès-Nancy"
    }
  }]
Le résultat :

Le résultat est au format JSON et donne un tableau d’identifiants RNSR (dans la majorité des cas, il n’y en a qu’un).

[
    { "id": 1, "value": ["200317641S"] },
    { "id": 2, "value": ["200317641S"] },
    { "id": 3, "value": ["200711887V"] },
    { "id": 4, "value": [] },
    { "id": 5, "value": [] },
    { "id": 6, "value": [] },
    { "id": 7, "value": ["198822446E"] }
]

Vous souhaitez connaître les entités de recherche à partir d’une adresse ou d’une affiliation ? Vous souhaitez les homogénéiser ? Vous souhaitez mettre en évidence les coopérations entre ces entités ?
En lançant rnsrRuleDetect sur vos données depuis Lodex, logiciel libre de visualisation, vous obtiendrez les codes RNSR et leur verbalisation ainsi que des représentations graphiques liées.

Graphes issus d’une étude réalisée pour la Direction des Données Ouvertes de la Recherche (DDOR) (Comptes rendus annuels d’activité des chercheurs CNRS 2020-2021).

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres