LIA_topic_seg
Class DefaultBoundaries

java.lang.Object
  extended by LIA_topic_seg.DefaultBoundaries
All Implemented Interfaces:
Boundaries

public class DefaultBoundaries
extends java.lang.Object
implements Boundaries

Cette classe implŽmente des calculs de frontires consŽcutifs aux calculs de valeurs des intervalles entre les unitŽs de traitement effectuŽs dans DefaultGapScores. Elle permet de dŽduire les frontires ˆ partir des similaritŽs cosine, ou des profondeurs de similaritŽs. Dans le premier cas on cherchera ˆ minimiser les scores, dans le second ˆ les maximiser. Pour les similaritŽs, lissŽes ou non, on peut Žgalement rechercher des minimas locaux dans une certaine fentre, ce qui revient en fait ˆ fixer une taille minimale des segments. Ces fonctions peuvent retourner un nombre de frontires prŽdŽfini dans le constructeur, ou bien peuvent retourner les frontires en deˆ ou au delˆ d'un certain seuil, calculŽ en fonction de la moyenne et l'Žcart type de l'ensemble des scores des intervalles entre unitŽs de traitement. Toutes les fonctions travaillent directement sur l'attribut topic_boundaries et le mettent ˆ jour.


Field Summary
(package private)  int boundaries
           
(package private)  float[] gaps_scores
           
(package private)  int[] topic_boundaries
           
 
Constructor Summary
DefaultBoundaries(GapsScores bw)
          Constructeur de la classe avec un nombre inconnu de frontires thŽmatiques
DefaultBoundaries(GapsScores bw, int n)
          Constructeur de la classe avec un nombre prŽdŽfini de frontires thŽmatiques
 
Method Summary
 void compute_loc_min(int window)
          Cette fonction calcule les frontires en recherchant les plus petites similaritŽs, puis en vŽrifiant que ces frontires ont une valeur infŽrieurs ˆ leurs voisines.
 void compute_max_depth()
          Cette fonction dŽduit les frontires thŽmatiques on sŽlectionnant les n plus grandes valeurs si le nombre de frontires ˆ sŽlectionners est prŽdŽfini, ou en sŽlectionnant toutes celles au dessus un certain seuil (moyenne + ecart-type) sinon.
 void compute_min_similarities()
          Cette fonction dŽduit les frontires thŽmatiques on sŽlectionnant les n plus petites si le nombre de frontires ˆ sŽlectionners est prŽdŽfini, ou en sŽlectionnant toutes celles sous un certain seuil (moyenne - ecart-type) sinon.
 int count_boundaries()
          permet de conna”tre le nombre de frontires thŽmatiques ˆ l'intŽrieur du texte Il se peut que ce nombre soit infŽrieur ˆ un nombre initialisŽ.
 int count_segments()
          renvoie le nombre de segments thŽmatiques dŽduits
 int[] position_boundaries()
          retourne les numŽros des phrases aprs lesquelles se trouvent les frontires thŽmatiques
 java.lang.String to_string()
           
 
Methods inherited from class java.lang.Object
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 
Methods inherited from interface LIA_topic_seg.Boundaries
toString
 

Field Detail

gaps_scores

float[] gaps_scores

topic_boundaries

int[] topic_boundaries

boundaries

int boundaries
Constructor Detail

DefaultBoundaries

public DefaultBoundaries(GapsScores bw,
                         int n)
Constructeur de la classe avec un nombre prŽdŽfini de frontires thŽmatiques

Parameters:
bw - : le calcul des scores de tous les intervalles
n - : le nombre de frontires ˆ rechercher

DefaultBoundaries

public DefaultBoundaries(GapsScores bw)
Constructeur de la classe avec un nombre inconnu de frontires thŽmatiques

Parameters:
bw - : le calcul des scores de tous les intervalles
Method Detail

compute_loc_min

public void compute_loc_min(int window)
Cette fonction calcule les frontires en recherchant les plus petites similaritŽs, puis en vŽrifiant que ces frontires ont une valeur infŽrieurs ˆ leurs voisines. Pour cela, on effectue d'abord un tri des frontires en fonction de leurs valeurs, puis on sŽlectionne dans l'ordre celles qui n'ont pas de "proches voisins" dŽjˆ sŽlectionnŽ.

Parameters:
window - : fentre dans laquelle on souhaite que les valeurs retenues soient minimales. On peut Žgalement considŽrer ce paramtre comme une taille minimale des segments.

compute_min_similarities

public void compute_min_similarities()
Cette fonction dŽduit les frontires thŽmatiques on sŽlectionnant les n plus petites si le nombre de frontires ˆ sŽlectionners est prŽdŽfini, ou en sŽlectionnant toutes celles sous un certain seuil (moyenne - ecart-type) sinon.


compute_max_depth

public void compute_max_depth()
Cette fonction dŽduit les frontires thŽmatiques on sŽlectionnant les n plus grandes valeurs si le nombre de frontires ˆ sŽlectionners est prŽdŽfini, ou en sŽlectionnant toutes celles au dessus un certain seuil (moyenne + ecart-type) sinon.


position_boundaries

public int[] position_boundaries()
retourne les numŽros des phrases aprs lesquelles se trouvent les frontires thŽmatiques

Specified by:
position_boundaries in interface Boundaries
Returns:
un tableau d'entiers qui sont les frontires thŽmatiques

count_boundaries

public int count_boundaries()
Description copied from interface: Boundaries
permet de conna”tre le nombre de frontires thŽmatiques ˆ l'intŽrieur du texte Il se peut que ce nombre soit infŽrieur ˆ un nombre initialisŽ.

Specified by:
count_boundaries in interface Boundaries
Returns:
le nombre de frontires thŽmatiques

count_segments

public int count_segments()
Description copied from interface: Boundaries
renvoie le nombre de segments thŽmatiques dŽduits

Specified by:
count_segments in interface Boundaries
Returns:
un nombre

to_string

public java.lang.String to_string()