Commit c2efedebde101bea7216da52303d416e093d955b

Authored by quillotm
1 parent 5e5fa6bf43
Exists in master

Repaired some details

Showing 1 changed file with 2 additions and 2 deletions Side-by-side Diff

parties/introduction/content.tex
... ... @@ -33,7 +33,7 @@
33 33  
34 34  
35 35 % Information personnage
36   - Dans la théorie de l'information de Shannon, l'information peut se décrire comme l'ensemble des symboles qui donnent forme à une idée. Nous nous reposons sur cette définition et posons dans ce manuscrit "l'information personnage" comme l'ensemble des signes acoustiques dans un enregistrement vocal qui caractérisent l'identité du personnage joué. Les résultats des expériences des articles (X) réalisées sur les systèmes de similarité ont prouvé l'existence de cette information dans la voix, du moins, dans le contexte du jeu vidéo MassEffect 3. Les auteurs des articles (Y) ont alors proposé de construire un espace de représentation vectoriel dédié à la caractérisation du personnage joué qu'ils ont nommé $p$-vecteur pour \textit{personnage-vecteur}. La méthode d'extraction des $p$-vecteurs pose ses fondements sur celle de plongement de réseaux de neurones. Ils sont extraits d'un réseau de neurones auquel on a préalablement appris à reconnaitre le personnage. Les entrées qui lui sont fournies proviennent d'un extracteur de séquence orienté locuteur du type $i$-vecteur ou $x$-vecteur. Le volume du corpus d'apprentissage est limité et profiter d'un extracteur de séquence pré-entraîné sur un large corpus comme Voxceleb permet de profiter d'une connaissance générale des voix. De cette manière, les $p$-vecteurs ont montré leur efficacité en améliorant les performances des systèmes de similarité de voix au sens du personnage.
  36 + Dans la théorie de l'information de Shannon, l'information peut se décrire comme l'ensemble des symboles qui donnent forme à une idée. Nous nous reposons sur cette définition et posons dans ce manuscrit "l'information personnage" comme l'ensemble des signes acoustiques dans un enregistrement vocal qui caractérisent l'identité du personnage joué. Les résultats des expériences des articles (X) réalisées sur les systèmes de similarité ont prouvé l'existence de cette information dans la voix, du moins, dans le contexte du jeu vidéo MassEffect 3. Les auteurs des articles (Y) ont alors proposé de construire un espace de représentation vectoriel dédié à la caractérisation du personnage joué qu'ils ont nommé $p$-vecteur pour \textit{personnage-vecteur}. La méthode d'extraction des $p$-vecteurs pose ses fondements sur celle de plongement de réseaux de neurones. Ils sont extraits d'un réseau de neurones auquel on a préalablement appris à reconnaitre le personnage. Les entrées qui lui sont fournies proviennent d'un extracteur de séquence orienté locuteur du tels que les $i$-vecteurs ou $x$-vecteurs. Le volume du corpus d'apprentissage est limité et utiliser un extracteur de séquence pré-entraîné sur un large corpus comme Voxceleb permet de profiter d'une connaissance générale des voix. De cette manière, les $p$-vecteurs ont montré leur efficacité en améliorant les performances des systèmes de similarité de voix au sens du personnage.
37 37  
38 38  
39 39  
... ... @@ -48,7 +48,7 @@
48 48  
49 49  
50 50 % SICI
51   - Bien que les $p$-vecteurs améliorent les performances, l'information qui y est véhiculée reste entièrement un mystère. Dans nos travaux, nous supposons que l'information personnage n'est qu'en partie dépendante du locuteur. Autrement dit, un acteur est reconnaissable lorsqu'il joue un personnage mais il ajoute à sa voix une information additionnelle qui vient lui donner du caractère. Il est probable que les systèmes de similarité de voix apprennent à associer des identités de locuteurs sans prendre en compte la partie personnage qui en est indépendante. Dans le but de vérifier cette hypothèse, nous introduisons dans ce manuscrit l'\textit{Information Personnage Indépendante du Locuteur} (IPIL) et proposons une méthode pour mesurer sa présence dans des représentations vectorielles telles que les $p$-vecteurs et les $x$-vecteurs. Cette méthode consiste à modifier les associations entre les locuteurs dans le but de neutraliser l'information personnage. Le système apprend alors seulement à associer des identité de locuteur. Une perte de performance observée est conséquemment le signe de l'existence d'une information qui a été neutralisée; celle du personnage.
  51 + Bien que les $p$-vecteurs améliorent les performances, les $p$-vecteurs véhiculent de l'information dont subsistent encore des zones d'ombre. Dans nos travaux, nous supposons que l'information personnage n'est qu'en partie dépendante du locuteur. Autrement dit, un acteur est reconnaissable lorsqu'il joue un personnage mais il ajoute à sa voix des signes acoustiques qui viennent lui donner du caractère. Il est probable que les systèmes de similarité de voix apprennent à associer des identités de locuteurs sans prendre en compte la partie personnage qui en est indépendante. Dans le but de vérifier cette hypothèse, nous introduisons dans ce manuscrit l'\textit{Information Personnage Indépendante du Locuteur} (IPIL) et proposons une méthode pour mesurer sa présence dans des représentations vectorielles telles que les $p$-vecteurs et les $x$-vecteurs. Cette méthode consiste à modifier les associations entre les locuteurs dans le but de neutraliser l'information personnage. Le système apprend alors seulement à associer des identité de locuteur. Une perte de performance observée est conséquemment le signe de l'existence d'une information qui a été neutralisée; celle du personnage.
52 52  
53 53  
54 54 % Application du SICI