geoTag - Extraction d’entités géographiques

Niveau d'utilisation :  Débutant
Niveau de validation :  Validé
Objectif

Ce web service détecte des entités géographiques dans un texte en anglais et renvoie la liste des localisations trouvées dans ce texte.

Méthode

Pour l’extraction, le modèle utilisé par ce web service, “ner-english”, est disponible à ce lien huggingface.
Aucun fine-tuning n’a été opéré : nous mettons simplement le modèle à disposition via un web service.

Métriques

Le modèle a une f-mesure de 0.93 (CoNLL-03)

Précautions :

  • Le web service fonctionne uniquement sur du texte anglais.
  • Fonctionnant avec de l’apprentissage, il est nécessaire d’utiliser ce web service sur des phrases pour un résultat plus fiable.
Références

Modèle ner-english

Bibliothèque python Flair

Exemple textuel du traitement
Le format d'entrée :

[{"id":"2","value":"The COVID-19 pandemic, also known as the coronavirus pandemic, is an ongoing global pandemic of coronavirus disease 2019 (COVID-19) caused by severe acute respiratory syndrome coronavirus2 (SARS-CoV-2). It was first identified in December 2019 in Wuhan, China. The World Health Organization declared the outbreak a Public Health Emergency of International Concern on 20 January 2020, and later a pandemic on 11 March 2020. As of 2 April 2021, more than 129 million cases have been confirmed, with more than 2.82 million deaths attributed to COVID-19, making it one of the deadliest pandemics in history."}] 
Le résultat :

[{"id":"2","value":["Wuhan","China"]}] 
En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres