EnglishPrecedentSuivant

Les lèvres parlantes / IMIMA


Copyright

Grandes Image(s): 640*480



Image Jpeg (18 Ko)


Auteur(s)

Institut(s)

Projet : Synthèse de visages parlants

  • URL : http://ophale.icp.grenet.fr/synth.html

    Film(s) et Image(s) Extraite(s): 320*240

    Film
    1
    Video QuickTime -> Film/Video (2.2 Mo)
    Images Jpeg -> (13 Ko)

    Film
    2
    Video QuickTime -> Film/Video (3.0 Mo)
    Images Jpeg -> (11 Ko) (8 Ko)



    Description



    Méthode d'analyse - synthèse de lèvres et visages parlants

    Information d'ordre technique

    Analyse d'image, synthèse d'image, synchronisation audio, naturel-visage synthétique

    Complément d'information


    • Bibliographie :

      cf Actes Imagina 1994, p144-163 : Perception, synthèse et analyse des lèvres parlantes

    • Résumé :

      Un acteur virtuel ne peut prétendre à une qualité "anthropomorphique" que si les mouvements de ses lèvres et de son visage en général sont cohérents avec le message acoustique qu'il est censé produirm e. En effet la modalité auditive est dominante dans la perception de la parole par les entendants normaux, mais la modalité visuelle leur permet de mieux comprendre la parole : si l'information visue lle fournie par les mouvements des lèvres, du menton, des dents, des joues, etc...n'offre pas en tant que telle une intelligibilité normale de la parole, en revanche la vue du visage de l'interlocuteur "restitue", par compensation naturelle, une grande partie de l'information orale manquante quand les conditions de transmission accoustique sont dégradées.
      Nous avons quantifié le gain d'intelligibilité apporté par l'information visuelle à de la parole dégradée par du bruit sous différentes conditions de test incluant de la parole naturelle ou synthétique, synchronisée avec un visa ou à différentes parties d'un visage synthétique (modelé 3D des lèvres de l'ICP et du visage de Parke). Les paramètres anatomiques et géométriques les plus caractéristiques de la production et de la perception de la parole visuelle ont été identifiés à partir de l'analyse multidimensionnelle d'un très large corpus du français. Un logiciel d'extraction automatique de ces paramètres a été implanté sur une station d'acquisition et de traitement d'images...




    • Pointeurs :

      (oo) Publications en analyse/synthèse de parole, acoustique et visuelle
      http://ophale.icp.grenet.fr/publis.html
    • Commentaires supplementaires :

      ces informations proviennent d'un fax de C.Benoît.

    EnglishPrecedentSuivant
  • Copyright © 1994-2024 mediaport.net
    Autres Sites : afromix.org | Ai Girls | Ai Creations