Coord.
français: Georges
Quénot., CLIPS-IMAG
Coord. québécois: Jean Rouat, UQAC Présentation
générale
|
|
Présentation généraleLe projet U11 est une Coopération France-Québec soutenue par le Consulat Général de France à Québec d'une durée de 2 ans (1er janvier 2001 au 31 décembre 2002). Il implique les partenaires suivants:
Enjeux et environnements :
- L'équipe Modélisation et Recherche d'Inofrmation Multimédia (MRIM) du labobatoire CLIPS-IMAG,
- L'équipe ERMETIS du Département des Sciences Appliquées de l'Université du Québec à Chicoutimi
Il existe de nombreux outils de recherche permettant de retrouver assez facilement sur Internet des documents écrits ou préalablement archivés. On peut par exemple citer les portails tels que yahoo! et altavista. Par contre, les documents multimédias qui intègrent à la fois des signaux sonores et vidéos doivent être préalablement indexés et étiquetés afin de pouvoir réaliser des recherches et analyses de documents par contenu.
L'indexation de tels documents est actuellement réalisée de façon manuelle et offre peu de souplesse. Le problème est d'autant plus important que la quantité de documents multimédias placés sur le réseau Internet est appelée à croître de façon phénoménale.Objectifs et résultats attendus :
- Nous souhaitons permettre une plus grande place du français sur Internet. En effet, la mise aux points d'outils d'indexation de documents comprenant le son nécessite de tenir compte de la langue. Les systèmes de reconnaissance de parole que nous utiliseront seront adaptés au français.
- La disponibilité d'outils automatisés d'indexation en français permettra une plus grande disponibilité de documents multimédias en français sur Internet.
- Nous souhaitons maintenir un niveau de compétitivité suffisant de la langue française vis-à-vis de l'anglais.
- La valorisation se fera dans un premier temps en rendant disponible les résultats de l'étude sur le réseau Internet via le site web. À plus long terme, il y aura lieu de songer à la mise en place d'un portail francophone équipé d'outils de recherche et d'indexations adéquats
Présentation des tâches de l'équipe française MRIM
- Mise en place d'une base de données multimédia commune,
- Extraction de segments vidéos contenant des personnages,
- Indexation thématique,
- Indexation couplée son-image des documents vidéo,
- Mise en place du prototype.
Présentation des tâches de l'équipe québécoise ERMETIS
- Analyse de la trame sonore d'un film de fiction en regard de la discrimination parole/musique,
- Mise au point d'une technique de discrimination parole, musique, chants, bruits et détermination du sexe des acteurs,
- Mise en oeuvre de l'identification de la voix des acteurs,
- Rehaussement des segments bruités dans la perspective de l'utilisation de la reconnaissance de parole,
- Indexation couplée son-image des documents vidéo,
- Mise en place du prototype.
Personnel et étudiants
- Équipe française:
Georges Quénot, cherch. CNRS; Elise Taillant, étud. DEA, Philippe Boigné, étud. DEA.- Équipe québécoise:
Jean Rouat, prof. titulaire; Hassan Ezzaidi, chargé de recherche, Ramin Pichevar, étud. Ph.D., Stéphane Loiselle, étud. ing.Liens et documents
- Gouvernement français:
année 2001: Une mission de G. Quénot au Québec; année 2002: Une mission de J. Rouat en France ainsi que les déplacements de deux étudiants de DEA au Québec.- Équipes MRIM et ERMETIS:
Ces deux équipes utilisent par ailleurs leurs infrastructures de recherche ainsi que leurs subventions pour financer les activités de recherche (bourses d'études, salaires et matériels variés);
- Séminaires
- Séminaire de Georges Quénot à ERMETIS du 11/10/2001.
- Séminaire de Jean Rouat au CLIPS du 18/04/2002.
- Publications
- Wavelet speech enhancement based on the Teager Energy Operator,
M. Bahoura and J. Rouat, IEEE SPL, vol. 8, January 2001.- A new approach for wavelet speech enhancement,
M. Bahoura and J. Rouat, dans proceedings of Eurospeech 2001, September 2001. Paper nb: 1937.- Towards combining pitch and MFCC for speaker identification systems,
H. Ezzaidi, J. Rouat, and D. O'Shaughnessy, dans proceedings of Eurospeech 2001, September 2001. Paper nb: 2825.- Speech, music and songs discrimination in the context of handsets variability,
H. Ezzaidi and J. Rouat, in proceedings of ICSLP 2002, 16-20 September 2002.- Nonlinear speech processing with oscillatory neural networks for speaker segregation,
J. Rouat and R. Pichevar, in proceedings of EUSIPCO 2002, September 2002. invited paper.- Discrimination Parole/Musique/Bruit/Silence et détection du locuteur dans le contexte de trames sonores de films,
Élise Taillant, Rapport de DEA, septembre 2002.- Réhaussement de la parole vis à vis du bruit dans le contexte de trames sonores de films,
Philippe Boigné, Rapport de DEA, septembre 2002.- Liens