MRIM - Bâtiment B - CLIPS - IMAG - BP 53, 38041 Grenoble Cedex 9
Téléphone : +33 4.76.51.45.15 - Télécopie : +33 4.76.44.66.75
Responsable : Marie-France BRUANDET 
MRIM
Présentation
Thématique
Réalisations
Projets
Annuaire
CLIPS
Accueil
Annuaire
Démonstrations
Publications
Plan d'accès

Thématisation par Reconnaissance vocale des Médias (THEOREME)
Project RNRT-1999-97 Décembre 1999-Mars 2003

Responsable : Georges Quénot,
Participants : Jean-Pierre Chevallet, Christophe Brouard, Mathias Géry, Hatem Haddad.

Présentation générale
Présentation des tâches de MRIM
Documents de travail et liens intéressants

 
Présentation générale

THEOREME est un projet du Réseau National de Recherche en Télécommunication (RNRT) de 2 ans et demi (début le 1er décembre 1999, décalé au 1er septembre 2000) Il implique les partenaires suivants:

  1. La sociétéVECSYS
  2. L'équipe Traitement du Langage Parlé (TLP) du labobatoire LIMSI-CNRS
  3. L'équipe Modélisation et Recherche d'Inofrmation Multimédia (MRIM) du labobatoire CLIPS-IMAG,
  4. La sociétéSECODIP

La pige de l'information revêt une importance stratégique pour de nombreux organismes ou entreprises. Les méthodes actuellement utilisées ne pourront faire face à la croissance soutenue des volumes d'information audiovisuelle émanant de sources de plus en plus nombreuses. Développer un système pour automatiser la pige d'information spécifique présente deux avantages : d'une part accroître le nombre des usagers de ce type de service par réduction des coûts de production, d'autre part élargir la palette des médias pigés pour améliorer la qualité du service. Le projet THEOREME a pour but de démontrer que l'état de l'art en reconnaissance de la parole associé à des algorithmes de segmentation de documents audio et d'identification automatique de thèmes rend possible la réalisation d'un système de pige automatique d'informations audiovisuelles. Un démonstrateur sera évalué et mis en place chez le leader français de la pige d'information. Ce démonstrateur réalisera automatiquement la thématisation de la bande son d'un média audiovisuel. En cas d'alerte sur l'un des thèmes clés recherchés pour un client, un message électronique sera automatiquement envoyé à ce dernier. S'il se déclare interessé, il pourra recevoir, sous forme d'un document HTML, la transcription (vérifiée manuellement) de la portion d'émission jugée pertinente ainsi qu'une mosaïque d'images clés associées aux différents segments de ce document. La figure 1 donne le synoptique de l'architecture prévue pour le démonstrateur THEOREME.

Figure 1 : synoptique de l'architecture prévue pour le démonstrateur THEOREME.

Présentation du projet THEOREME sur le site du RNRT


Présentation des tâches de l'équipe MRIM

L'équipe MRIM participe à tous les sous-projets du projet THEOREME à l'exception du sous-projet 3 (segmentation et transcription de la bande audio). Sa contribution principale se situe au niveau des tâches 4.2, 5.1 et 5.2 :

  • La tâche 4.2 a pour objet le développement d'un module d'analyse de la terminologie et d'identification de thèmes fondé sur cette analyse. L'idée à la base de ce travail repose sur l'hypothèse qu'un thème peut être décrit par un ensemble de termes composés, de même un document est vu comme un ensemble de termes composés. Le but est donc de sélectionner des groupes de mots identifiés comme des termes à l'aide d'une analyse morpho-syntaxique de surface. La terminologie comprend à la fois des occurrences de substantifs propres et des groupes nominaux. Dans l'analyse morphologique les catégories grammaticales sont choisies pour faciliter la construction des groupes nominaux et pour favoriser leur désambigüisation qui est fondée sur deux niveaux de filtrages positionnels. Les mots catégorisés suivent ensuite une chaîne de traitements statistiques basée sur des cooccurrences. L'identification d'un thème dans un document repose sur une mesure relative au nombre d'appariement termes à termes. Cet appariement peut nécessiter des traitements sur les termes pour "prouver" la correspondance. Par exemple un document parlant "d'aide économique limitée aux pays en voie de développement" correspond au thème (sur un seul terme) "Aide économique aux pays en voie de développement". Le calcul de la correspondance nécessite une cassure du terme en "Aide économique" et "pays en voie de développement", puis une recomposition où l'adjectif de liaison "limité" disparaît.
  • La tâche 5.1 a pour objet la sélection, la mise en oeuvre et l'évaluation des techniques permettant la détection des changements de plans (transitions brutales, fondus enchaînés, effets spéciaux), la détection de mouvements globaux (zooms, translations, rotations), la détection de similarité entre différentes prises de vues, et l'extraction d'images clés. Elle a également pour objet l'utilisation et l'adaptation de ces différentes techniques dans le but d'obtenir une segmentation globale et un ensemble d'images clés coïncidant avec la segmentation thématique issue du traitement de la bande audio (sous-projet 4). Un système capable d'effectuer ces traitements sera intégré au démonstrateur (sous-projet 6).
  • La tâche 5.2 a pour objet la segmentation et l'indexation globale des documents vidéo en fonction d'une segmentation thématique issue du traitement de la bande audio. Elle sera effectuée sous la forme d'un enrichissement de la forme SGML de cette même segmentation thématique incluant les segments vidéo (sous forme de pointeurs sur des fichiers MPEG générés simultanement) et des images clés correspondantes organisés suivant la hiérarchie des thèmes et mots-clés pertinents.

Liens
  • THEOREME - LaTeX typesetting language
  • THEOREME - pdfTeX project to compile latex source into pdf
  • THEOREME - XML site officiel de XML

 Documents de travail

 

 
MRIM

Modélisation et Recherche d'Information Multimédia

Contacter le Webmaster