Programme de la réunion du 11 juillet 2006

Conception de système de vision

Journée coordonnée par : Céline Hudelot, Frédéric Jurie

Présentation

Un système de vision est un système capable de percevoir, analyser et comprendre son environnement au moyen d'images ou de séquences d'images. Bien que  des avancées considérables ont été faites dans le domaine de la vision notamment pour la réalisation de tâches telles que la reconstruction, la reconnaissance et le suivi, l'intégration de ces techniques pour la construction de systèmes de vision opérationnels reste encore un problème ouvert. Le constat général est que les systèmes de vision manquent souvent de robustesse et d'adaptabilité et qu'ils sont souvent trop dépendants de leur domaine d'applications.

Les domaines d'applications actuels de la vision étant de plus en plus complexes (applications médicales: aide au diagnostic, aide et apprentissage du geste médical; robotique et inspection industrielle; applications de vidéosurveillance; navigation autonome; gestion de grandes bases de données multimédia, ...), il est nécessaire de concevoir des systèmes de vision robustes et capables de s'adapter à la réalisation d'un grand nombre de tâches et aux changements imprévus d'environnements et de contextes. Dans un tel contexte, la construction des systèmes de vision soulève un certain nombre de problèmes parmi lesquels:
- le pilotage et le contrôle des tâches de vision,
- la conception d'architectures fonctionnelles mais aussi logicielles pour des systèmes impliquant des tâches diverses complexes mais aussi des modalités multiples,
- le développement de méthodes pour l'automatisation du paramétrage et de l'adaptation des systèmes de vision,
- le développement de méthodes d'évaluation des techniques et des systèmes de vision,
- la prise en compte de contraintes de temps réel...

L'objectif premier de cette journée est d'abord de faire le point sur l'état de la recherche actuelle sur la construction des systèmes de vision. On s'intéressera tout particulièrement aux différents problèmes cités précedemment. Il s'agira ensuite, lors d'une discussion, d'identifier les besoins pour repenser ou améliorer la conception des systèmes de vision.

Programme de la journée

RESUMES

James Crowley - (GRAVIR, Grenoble)

Titre: Applying Autonomic System Techniques for designing Computer Vision Systems.

Résumé : Non disponible


Monique Thonnat - (INRIA, Sophia Antipolis)

Titre: Program Supervision Techniques for Easy Configuration of Video Understanding Systems.

Résumé : Non disponible


Hugues Mounier (AXIS, IEF, Orsay)

Titre: Vision située et commande multimodale temps réel

Résumé : Nous présentons notre point de vue sur la conception d'architectures logicielles pour des systèmes complexes à modalités multiples et à contraintes temps réel. Cette conception touche aux domaines de la vision située et de la commande pour le suivi de trajectoires.


Thinh Van Vu (INRIA, Sophia Antipolis)

Titre: Méthodes génériques pour la reconnaissance d'activités complexes à partir de données audio-visuelles

Résumé : One direction in current Scene Understanding research consists in studying a combination of algorithms to process signals coming from different sources including video cameras, microphones and dedicated sensors. Multimedia information fusion involves research in both low level signal processing and high level semantic activity recognition.
This talk focuses on the recognition of complex activities from audio-video data and its impact on real applications. To cope with a huge amount of data coming from different sensors, we have defined (1) a generic language for representing several types of events combining information coming from different sensors and (2) a generic algorithm for recognising in real time the pre-defined complex activities. This language and this recognition algorithm are currently used by different real-world video understanding applications including inside aircraft/train surveillance, public space security.


Céline Hudelot (ENST, Paris)

Titre: Vers une plate forme de vision cognitive pour l'interprétation sémantique d'images

Résumé : Non disponible


Vincent Martin (INRIA, Sophia Antipolis)

Titre: Illustration de l'utilisation de la Plate-forme de Vision Cognitive (PVC) : Application à la détection de parasites du rosier

Résumé : Dans cet exposé, nous décrirons une application de la PVC pour la détection d'objets naturels (mouches blanches nommées Aleurodes) dans leur environnement (feuille de rosier). Nous montrerons comment la connaissance de l'expert du domaine ainsi que celle de l'expert en traitement d'images est intégrée et utilisée au sein de la plate-forme pour accomplir la tâche de détection et d'interprétation. Au travers de l'analyse des résultats obtenus, nous mettrons en évidence les limites actuelles du sytème et les améliorations nécessaires. Cet exposé a donc pour but de démontrer, au travers d'une application concrète, l'efficacité de la PVC mais aussi ses limites, intimement liées aux problèmes sous-jacents de ce type de système, à savoir, la capacité à adapter les traitements au contexte, le contrôle des tâches et l'automatisation de la paramétrisation.


Rémi Emonet (GRAVIR, Grenoble)

Titre: O3MiSCID, a middleware for pervasive computing

Résumé : Non disponible


Vincent Martin (INRIA, Sophia Antipolis)

Titre: Vision Cognitive : Apprentissage pour la Segmentation d'Images

Résumé : Après avoir introduit la segmentation d'images dans les systèmes de vision et ses défis , nous proposons une méthode pour l'apprentissage de la segmentation en termes de sélection d'opérateurs et de paramétrisation adaptée à la tâche. Nous montrerons comment cette approche permet de palier au manque de flexibilité et de contrôle de la segmentation dans les systèmes de vision. Enfin, nous exposerons les différentes possibilités d'intégration de cette méthode dans la PVC afin de mettre à profit la connaissance a priori pour dynamiser la segmentation.


Julien Letessier (GRAVIR, Grenoble)

Titre: Vision pour l'interaction: une approche orientée services

Résumé : Non disponible