geoTag - Extraction d’entités géographiques
Niveau d'utilisation :
Débutant
Niveau de validation :
Validé
Objectif
Ce web service détecte des entités géographiques dans un texte en anglais et renvoie la liste des localisations trouvées dans ce texte.
Méthode
Pour l’extraction, le modèle utilisé par ce web service, “ner-english”, est disponible à ce lien huggingface.
Aucun fine-tuning n’a été opéré : nous mettons simplement le modèle à disposition via un web service.
Métriques
Le modèle a une f-mesure de 0.93 (CoNLL-03)
Précautions :
- Le web service fonctionne uniquement sur du texte anglais.
- Fonctionnant avec de l’apprentissage, il est nécessaire d’utiliser ce web service sur des phrases pour un résultat plus fiable.
Ces web services qui peuvent vous intéresser
Extraction d’entités nommées de maladies
Extraction d’entités nommées en astronomie
URL DU WEB SERVICE à renseigner dans LODEX est :
https://ner-tagger.services.istex.fr/v1/geoTagger/geoTagger
Exemple textuel du traitement
Le format d'entrée :
[{"id":"2","value":"The COVID-19 pandemic, also known as the coronavirus pandemic, is an ongoing global pandemic of coronavirus disease 2019 (COVID-19) caused by severe acute respiratory syndrome coronavirus2 (SARS-CoV-2). It was first identified in December 2019 in Wuhan, China. The World Health Organization declared the outbreak a Public Health Emergency of International Concern on 20 January 2020, and later a pandemic on 11 March 2020. As of 2 April 2021, more than 129 million cases have been confirmed, with more than 2.82 million deaths attributed to COVID-19, making it one of the deadliest pandemics in history."}]
Le résultat :
[{"id":"2","value":["Wuhan","China"]}]