Détection de la langue d’un texte
Le web-service detect-lang
détecte la langue d’un document texte et renvoie le code langue et la probabilité correspondante. Dans le cas où le résultat est trop incertain, le service renverra unknown
.
À noter que la détection de langue a besoin d’un texte suffisamment long pour fonctionner correctement. Avec un nombre de mots trop réduit le résultat sera très incertain.
Le code langue renvoyé correspond aux étiquettes d’identification de langues IETF que l’on peut trouver ici.
La capture d’écran ci-contre illustre l’utilisation de ce web-service dans Lodex en saisissant son url

URL DU WEB SERVICE à renseigner dans LODEX est :
https://nlp-tools2.services.inist.fr/v1/detect-lang
UTILISER

SE DOCUMENTER

Exemple textuel du traitement
Le format d'entrée :
[
{
"id": 1,
"value": "Primero, caminó por La Rambla, la calle más famosa de Barcelona, llena de gente, tiendas y restaurantes."
},
{
"id": 2,
"value": "The latter is tested in the presence and absence of vectors in order to check that they do not inhibit the detection of recombinants."
}
]
Le résultat :
Le résultat donne le code langue détecté, « unknown » dans le cas ou le résultat est incertain.
[
{
"id": 1,
"value": "es"
},
{
"id": 2,
"value": "en"
}
]