rnsrRuleDetect - Attribution d’identifiant(s) RNSR à une adresse (Alignements)
Le web service attribue, à l’aide de règles, un ou plusieurs identifiants RNSR à partir d’une adresse d’affiliation d’auteur et d’une année de publication.
Quand aucun code RNSR n’est trouvé, le service renvoie un tableau vide.
Règles
Les règles certaines utilisées par affAlign, appliquées à l’adresse de l’affiliation à aligner sont les suivantes:
- le
code_postal
ou laville_postale
de la structure doivent être présents, - et pour au moins une des tutelles (
etabAssoc.*.etab
, etetabAssoc.*.etab.natTutEtab
vaut «TUTE
») :- soit
etabAssoc.*.etab.sigle
ou leetabAssoc.*.etab.libelle
sont présents, - soit
etabAssoc.*.etab.libelle
commence par «Université
» et leetabAssoc.*.etab.libelle
est présent (mais pas leetabAssoc.*.etab.sigle
).
- soit
- et on trouve la bonne structure :
- soit
etabAssoc.*.label
etetabAssoc.*.numero
sont présents proches et en séquence (ex: «GDR2945
», «GDR 2945
» ou «GDR mot 2945
»), - soit
sigle
est présent, - soit
intitule
est présent.
- soit
- et la structure existait lors de la publication : la date de publication est entre
annee_creation
et l’éventuellean_fermeture
.
Sachant qu’on appauvrit (casse, accents, tiret, apostrophe) tous les champs.
Ressource
Le RNSR, Référentiel National des Structures de Recherche (français), référence les structures de recherche publiques et privées au niveau national. Il est administré par le ministère de l’enseignement supérieur de la recherche et de l’innovation (MESRI). Il attribue à chaque structure de recherche un identifiant (par exemple 199213009E), et recense différents éléments décrivant la structure comme la date de création, l’éventuelle date de fermeture, l’adresse, le sigle, l’intitulé etc.
Les données actuelles remontent à 2021.
Précautions :
- Quand l’année n’est pas précisée, plusieurs codes RNSR peuvent être associés à un même établissement. Il est donc préférable de renseigner l’année.
- Comme il s’agit d’une recherche de chaîne de caractères, des termes fréquents (comme « DES », « CASE », « PASTEUR », « IMAGES », …) peuvent être repérés comme des sigles de laboratoires.
- Les développés des sigles présentent une écriture complète contrairement à celle du WoS qui les abrège et les traduit (ex: « Institut de Physique » ==> « Inst. of Phys. »).
- La ressource est en français ; les résultats seront meilleurs sur des adresses en français.
Informations complémentaires
Une variante de ce service web renvoie aussi des informations associées au code RNSR, telles que l’intitulé, le sigle, les tutelles, des données géographiques, le code labo…
https://affiliations-tools.services.istex.fr/v1/rnsr/info
Données en CSV
Vous pouvez aussi utiliser la variante de ce service qui prend un CSV (séparateur: virgule), et qui en sortie renvoie un CSV (séparateur : point-virgule) qui reprend les données envoyées et leur ajoute une colonne RNSR.
https://affiliations-tools.services.istex.fr/v1/rnsr/csv
- Enrichissement RNSR dans LODEX : https://services.istex.fr/2022/06/20/enrichissement-rnsr-dans-lodex/
- Règles utilisées : https://github.com/Inist-CNRS/ezs/tree/master/packages/conditor#r%C3%A8gles-certaines
- Répertoire du fichier RNSR utilisé : https://github.com/Inist-CNRS/ezs/tree/master/packages/conditor/data
Attribution d’identifiant(s) RNSR à une adresse (Apprentissage)
Attribution de noms d’instituts CNRS à partir d’identifiants RNSR
Chaque entrée doit contenir l’adresse d’une affiliation (exemple : « University of Bordeaux, IMS, CNRS UMR5218, Talence, F-33405, France »), et éventuellement une année.
[
{ "id": 1,
"value": {
"year": "2021",
"address": "CNRS UMR AMAP MONTPELLIER FRA"
}
}, {
"id": 2,
"value": {
"year": "2021",
"address": "IRD UMR AMAP MONTPELLIER FRA"
}
}, {
"id": 3,
"value": {
"year": "2021",
"address": "University of Bordeaux, IMS, CNRS UMR5218, Talence, F-33405, France"
}
}, {
"id": 4,
"value": {
"year": "2021",
"address": "CENBG, CNRS/IN2P3, Chemin du Solarium B. P. 120, Gradignan, F-33175, France"
}
}, {
"id": 5,
"value": {
"year": "2021",
"address": "Nulle part"
}
}, {
"id": 6,
"value": {
"address": "Intemporel"
}
}, {
"id": 7,
"value": {
"address": "Inist-CNRS, UPS76, 2 rue Jean Zay, Vandoeuvre-lès-Nancy"
}
}]
Le résultat est au format JSON et donne un tableau d’identifiants RNSR (dans la majorité des cas, il n’y en a qu’un).
[
{ "id": 1, "value": ["200317641S"] },
{ "id": 2, "value": ["200317641S"] },
{ "id": 3, "value": ["200711887V"] },
{ "id": 4, "value": [] },
{ "id": 5, "value": [] },
{ "id": 6, "value": [] },
{ "id": 7, "value": ["198822446E"] }
]
Vous souhaitez connaître les entités de recherche à partir d’une adresse ou d’une affiliation ? Vous souhaitez les homogénéiser ? Vous souhaitez mettre en évidence les coopérations entre ces entités ?
En lançant rnsrRuleDetect sur vos données depuis Lodex, logiciel libre de visualisation, vous obtiendrez les codes RNSR et leur verbalisation ainsi que des représentations graphiques liées.
Graphes issus d’une étude réalisée pour la Direction des Données Ouvertes de la Recherche (DDOR) (Comptes rendus annuels d’activité des chercheurs CNRS 2020-2021).