Source of background knowledge able to answer the queries.
partitionarray-like, default=None
Existing partition of the data that provides the number of clusters to find.
It has priority over n_clusters, i.e. n_clusters will not be
taken into account if a partition is passed.
n_clustersint, default=None
Number of clusters to find.
If none given, only the Explore phase will be used.
Derives constraints from the neighborhood structure :
ML between all pairs of points in the same neighborhood and
CL between all pairs of points in separate neighborhoods
Source of background knowledge able to answer the queries.
partitionarray-like, default=None
Existing partition of the data that provides the number of clusters to find.
It has priority over n_clusters, i.e. n_clusters will not be
taken into account if a partition is passed.
n_clustersint, default=None
Number of clusters to find.
If none given, only the Explore phase will be used.
Derives constraints from the neighborhood structure :
ML between all pairs of points in the same neighborhood and
CL between all pairs of points in separate neighborhoods
This implementation of NPU works either with a constrained clustering algorithm or
by giving a partition as argument of the fit method. In the former case,
only algorithms from active-semi-supervised-clustering library are supported.
Sequential approach for Active Constraint Selection algorithm [1]_.
Selects a subset of boundary instances with Support Vector
Data Description (SVDD), then computes individual constraint utility
and sequential utility of constraints.
La fonction u_t se charge de la sélection des contraintes en se basant sur les mesures d’utilité calculées par les fonctions u_indA et u_indB.
Voici un résumé du fonctionnement de cette fonction :
Elle commence par identifier la contrainte avec la plus grande utilité dans la matrice d’utilité u_t_ij.
2. Elle vérifie ensuite si cette paire de contraintes n’a pas déjà été sélectionnée. Si ce n’est pas le cas,
elle l’ajoute à l’ensemble des contraintes sélectionnées c_t, ainsi qu’à la liste appropriée de contraintes de lien (ml)
ou de contraintes de non-lien (cl), selon le paramètre link.
3. Après avoir ajouté une nouvelle contrainte, elle met à jour la valeur d’utilité de cette contrainte dans la matrice d’utilité u_t_ij
pour éviter de la sélectionner à nouveau.
4. Enfin, elle met à jour les valeurs d’utilité de toutes les autres contraintes dans u_t_ij en fonction de leur distance à l’ensemble
des contraintes déjà sélectionnées.
Cette mise à jour est réalisée en multipliant l’utilité actuelle de chaque contrainte par la distance minimale entre cette contrainte
et l’ensemble des contraintes déjà sélectionnées ( via la méthode djc_t() ), et en divisant le résultat par la distance maximale parmi toutes les contraintes.
En résumé, cette fonction sélectionne les contraintes une par une en fonction de leur utilité,
en veillant à mettre à jour l’utilité des contraintes restantes à chaque étape pour tenir compte de l’information déjà capturée
par les contraintes sélectionnées.