Extraction des connaissances

Structurez les données de manière à pouvoir extraire les informations clés dans un format convivial.
CONTACTEZ-NOUS
Imaginez que vous êtes assis sur des tonnes de données qui doivent être traitées pour être comprises, ou sur des Big Data qui doivent être traitées tous les jours. Ces données proviennent d’une variété de sources. Il s’agit en grande partie de documents, mais il y a également des e-mails, des enregistrements vocaux au format mp3, des clips d’actualités sous forme de texte, des interviews à la radio, des sites Web, des documents de tiers au format PDF, des images et du texte scannés, des vidéos.

Ou bien, vous recevez des informations financières clés de diverses banques, fonds et institutions financières, à partir desquelles vous devez simplement compiler des informations essentielles comme les noms de personnes et d’institutions ou les taux de change entre plusieurs devises.

Outil d’ingénierie et d’extraction des connaissances

L’outil d’ingénierie et d’extraction des connaissances (Knowledge Discovery) de PangeaMT est justement là pour le faire à votre place : peu importe la source, nous la transformerons en texte afin qu’elle puisse être traitée. Grâce à une série de techniques de TALN, nous structurerons les données de manière à ce que les informations clés puissent être extraites pour vous dans un format convivial. Il peut s’agir d’une liste d’actions ou de personnes, de mots clés, de montants extraits de tableaux de différentes formes, de phrases clés ou d’un étiquetage complet des documents afin que tout type d’information pouvant faire l’objet d’une action puisse être pris en compte à l’avenir.

L’extraction des connaissances ne doit pas être confondue avec l’e-Discovery car elle ne fait pas qu’extraire des informations provenant d’un texte à partir d’une liste donnée de mots clés, laissant la source intacte. L’extraction des connaissances fournit une structure au texte source de sorte que les méthodes d’apprentissage automatique et de fouille automatique des données puissent être appliquées à tout type de recherche d’informations structurées à un stade ultérieur. Elle est différente de la synthèse car elle ne vise pas à créer une représentation résumée de la signification pour un traitement rapide par l’homme (ce qui peut être une utilisation finale de l’extraction des connaissances).

Elle applique des connaissances à la source afin que de nombreux types d’actions puissent être entrepris et que plusieurs types d’usages puissent en être dérivés.

Cas typiques d’ingénierie et d’extraction des connaissances

null

Créer des formats csv ou des feuilles de calcul avec des données financières provenant des banques centrales et des institutions financières sur les prévisions concernant les devises.

null

Fournir un rapport synthétisé sur un sujet en extrayant des données de plusieurs sources

null

Baliser les Big Data avec les balises typiques de la TALN pour l’apprentissage artificiel

null

Extraire des noms, des lieux et des actions d’une série de programmes télévisés, de vidéos Internet ou d’interviews à la radio, en utilisant d’abord le principe du synthétiseur de parole en texte

null

Trouver des sentiments à partir des résultats sur les réseaux sociaux et baliser chaque tweet ou commentaire comme positif ou négatif

null

Classer automatiquement les documents en fonction d’un domaine prédéfini et créer un abstract

Pour en savoir plus sur nos services basés sur l’IA : e-Discovery
CONTACTEZ-NOUS