Normaliser un texte ou un terme
Ce service permet de normaliser un texte, un terme ou plus généralement une chaîne de caractères. Ici la normalisation sous-entend supprimer les caractères accentuées, supprimer les caractères spéciaux, supprimer les blancs inutiles et redondants pour in fine mettre tous les caractères restant en majuscule.
Ce service très simple peut servir dans Lodex à la génération rapide de facettes en regroupant les valeurs des champs qui sont proches par leurs graphies.
URL DU WEB SERVICE à renseigner dans LODEX est :
https://terms-extraction.services.inist.fr/v1/tools/normalize
UTILISER

SE DOCUMENTER

Exemple textuel du traitement
Le format d'entrée :
[
{
"id": 1,
"value": "café !"
},
{
"id": 2,
"value": "Côte d'Ivoire"
},
{
"id": 3,
"value": "Le café (de l'arabe قهوة : qahwa, 'boisson stimulante') est une boisson énergisante psychotrope stimulante, obtenue à partir des graines torréfiées de diverses variétés de caféier, de l'arbuste caféier, du genre Coffea. Il fait partie des trois principales boissons contenant de la caféine les plus consommées dans le monde, avec le thé et le maté."
}
]
Le résultat :
[
{
"id": 1,
"value": "CAFE"
},
{
"id": 2,
"value": "COTE D IVOIRE"
},
{
"id": 3,
"value": "LE CAFE DE L ARABE قهوة QAHWA BOISSON STIMULANTE EST UNE BOISSON ENERGISANTE PSYCHOTROPE STIMULANTE OBTENUE A PARTIR DES GRAINES TORREFIEES DE DIVERSES VARIETES DE CAFEIER DE L ARBUSTE CAFEIER DU GENRE COFFEA IL FAIT PARTIE DES TROIS PRINCIPALES BOISSONS CONTENANT DE LA CAFEINE LES PLUS CONSOMMEES DANS LE MONDE AVEC LE THE ET LE MATE"
}
]