Extraction de concepts

Il s’agit d’un service permettant d’extraire d’un texte tous les concepts qui le caractérisent. Par exemple, à partir de cet article le service extraira des concepts tels que : Google,  Street Viewcartographieenquête officielle,  photographie,  réseaux Wi-Fi,  données,  garde-fous,  M. Blumenthal.

Le service est capable d’extraire les phrases qui caractérisent le mieux le contenu de l’article. Il peut s’agir de mots simples (« cartographie »), d’expressions normalisées (« enquête officielle ») ou d’entités nommées (« M. Blumenthal »). Grâce à l’intervention de l’analyse linguistique symbolique, le service est capable de filtrer toutes les associations de mots qui, bien que statistiquement significatives, ne constituent pas un concept bien formé (par exemple « plus sensibles », « responsable de »).

L’Extraction de concepts est fondamentale dans toutes les applications d’indexation et de stockage sémantique. Elle peut être aussi utilisée pour donner à l’utilisateur un premier aperçu de l’argument du texte (résumé). Grâce à l’extraction de concepts, on peut facilement créer des applications composites ou « mashups » reliant plusieurs sources d’information (par exemple, les concepts extraits et des articles de Wikipedia).

Grâce à ses nombreux travaux de recherche, Ho2S a mis au point une technologie hybride d’extraction de concepts. Cette technologie est basée sur l’interaction entre des algorithmes d’apprentissage automatique et un analyseur fonctionnel de la langue française basé sur des grammaires écrites par nos linguistes. Ces grammaires interviennent en même temps dans la phase précédant l’analyse du texte par les algorithmes d’apprentissage (pour nettoyer le texte et identifier les segments significatifs) et après cette phase (pour sélectionner les bons candidats et identifier les phrases qui sont sémantiquement équivalentes).

Ho2S peut vous fournir un accès dédié à un service d’extraction de concepts paramétré selon vos exigences en termes de domaine métier et d’applications spécifiques. Ho2S peut aussi fournir un système personnalisé de « matching » entre les termes extraits et un thésaurus tel que Eurovoc, MESH, Wordnet etc.