Siamese Network
Un réseau siamois est une architecture de réseau neuronal composée de deux (ou plusieurs) sous-réseaux identiques partageant les mêmes poids et paramètres. Il est conçu pour comparer deux entrées et déterminer leur similarité.
Contexte
Ce type de réseau a été introduit dans les années 1990 pour des tâches de vérification de signatures manuscrites. Sa particularité est de ne pas classer directement les données, mais de produire une représentation vectorielle de chaque entrée, puis de mesurer leur distance (ex. euclidienne, cosinus) pour estimer leur proximité.
Applications
- Reconnaissance faciale : vérifier si deux photos appartiennent à la même personne.
- Détection de doublons : identifier des documents ou images quasi identiques.
- Recherche d’information : associer une requête à des documents pertinents.
- Biométrie : analyse d’empreintes digitales ou vocales.
Avantages et limites
- ✅ Efficace pour comparer des paires de données même avec peu d’exemples.
- ✅ Généralise bien aux nouveaux cas (ex. nouvelles personnes non vues à l’entraînement).
- ❌ Nécessite un design soigné de la fonction de distance.
- ❌ Peut être coûteux si le nombre de paires à comparer est très élevé.
Les réseaux siamois incarnent une idée élégante : plutôt que d’apprendre à classer, ils apprennent à comparer. Ce paradigme est particulièrement utile lorsqu’il s’agit d’ensembles de données où les classes sont nombreuses, déséquilibrées ou rares. Par exemple, dans la vérification d’identité, il est irréaliste d’entraîner un modèle à reconnaître tous les individus du monde ; en revanche, un modèle capable de juger de la similarité entre deux empreintes digitales devient universellement applicable.
Historiquement, les fonctions de perte comme la loss contrastive ou la triplet loss ont permis de formaliser cet apprentissage de la distance. Ces méthodes ont ensuite été adaptées dans des domaines variés : du plagiat textuel à la détection de produits similaires en e-commerce.
Le défi reste la scalabilité : comparer chaque paire possible est prohibitif à grande échelle. Pour contourner cela, on associe souvent les réseaux siamois à des structures d’indexation efficaces ou à des méthodes de recherche approximative de voisins proches. Ainsi, ils demeurent un pilier dans le domaine de l’apprentissage métrique et une source d’inspiration pour des architectures plus récentes.
📚 Références
- Bromley, J. et al. (1994). Signature Verification using a Siamese Time Delay Neural Network. NeurIPS.
- Koch, G. (2015). Siamese Neural Networks for One-shot Image Recognition.