Plateforme VITAL

Contexte

Aujourd’hui, en une minute, plusieurs milliers voire millions de contenus sont créés et échangés sur des sites institutionnels, des plateformes de blogging et des réseaux sociaux. Ces flux de données, dits non structurés, sont une source d’information importante pour les acteurs de la veille informationnelle. Ils sont généralement consultés  à  l’aide  de  moteurs de recherche via un processus manuel et limité. Comment garantir la couverture des média ? Comment recouper des informations exprimées dans différentes langues ? Comment être alerté sur un fait qui nécessite de consulter plusieurs documents pour en tirer les bonnes conclusions ? La plateforme VITAL (Veille Intelligente pour le Traitement Automatique des Langues) s’inscrit dans cette démarche de collecte et d’analyse de données.

Enjeux

  • Disposer d’un large éventail de capacités pour le traitement des contenus en langage naturel non structurés ou semi-structurés (collecte, filtrage, traduction, transcription, recherche d’information, extraction d’information sémantique, analyse de graphes) dans un même environnement.
  • Mesurer la qualité de ces traitements et les améliorer grâce à des corpus d’évaluation de référence.
  • Faciliter les expérimentations qui nécessitent de mettre en jeu des enchaînements de ces mêmes traitements, sur de gros volumes de données sélectionnées dans un domaine.

Valeur ajoutée / Services offerts

La plateforme VITAL permet d’appréhender des données non structurées sur sources ouvertes à des fins de veille ainsi que l’évaluation et l’expérimentation d’applications de traitements de haut niveau à partir de traitements linguistiques. Elle favorise la constitution automatisée de bases de connaissances à partir de collectes ciblées et l’évaluation de nouveaux usages que ce type de  fonctions de haut niveau vont rendre possible :

  • Instancier, déployer et administrer différentes chaînes de traitements multimédia/multilingues selon le cas d’usage à adresser.
  • Prendre en charge le dimensionnement des machines pour l’adapter au volume de données à traiter.
  • Assister  l’industriel  de  la  langue  pour  le  développement  d’applications dédiées à l’analyse de contenus multimédia et multilingues.

C0705_Plateforme_VITAL

Typologie de plateformes