Lemmatiseur_ENG

Ce service permet de lemmatiser des termes en anglais.

En linguistique informatique, la lemmatisation est une procédure permettant de ramener un mot portant des marques de flexion (par exemple, la forme conjuguée d’un verbe : aimerions) à sa forme de référence (dite lemme : aimer).

Ainsi, par exemple, , les noms, les adjectifs,  au pluriel vont être ramenés à leur forme singulier, les verbes conjugués seront mis à l’infinitif.

Un lemmatiseur dépend de la langue. Ici nous ne traiterons que l’anglais.

Même si ce lemmatiseur peut prendre en compte des mots-clés, des listes de mots ou du texte, les résultats seront meilleurs dans le cas de mots mis en contextes.

Comme toute méthode automatique, il peut y avoir des erreurs du fait de l’ambiguïté de certains termes quant à leur catégorie grammaticale.

Ce web-service prend en entrée du JSON avec deux champs: `id` et `value`, et renvoie un JSON avec le(s) terme(s) lemmatisé(s) dans le champ `value`.

WS mis à jour le 16 Mai 2023

Exemple textuel du traitement

Le format d'entrée :
[{ "id": 1, "value": ["rocks","are","images analysis"]},
{ "id": 2, "value": "Computers"},
{ "id":3,"value": "As of 2 April 2021, more than 129 million cases have been confirmed, with more than 2.82 million deaths attributed to COVID-19, making it one of the deadliest pandemics in history."}]
Le résultat :

 

[{
"id": 1,
"value": ["rock","be","image analysis"]
},
{
"id": 2,
"value": "computer"
},
{
"id":3,
"value": "as of 2 April 2021 , more than 129 million case have be confirm , with more than 2.82 million death attribute to COVID-19 , make -PRON- one of the deadly pandemic in history ."
}]