En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
How-to

Annotation de Bounding Boxes pour les modèles Computer Vision : 10 astuces essentielles

Ecrit par
Aïcha
Publié le
2023-09-08
Temps de lecture
This is some text inside of a div block.
min

L'annotation de boîtes englobantes est une étape essentielle dans la création de jeux de données pour l'apprentissage automatique, en particulier dans des domaines tels que la Computer Vision. Il s'agit de l'annotation la plus simple pour ces modèles. Pour autant, une annotation précise des bounding boxes est essentielle pour former des modèles IA capables de détecter et de localiser des objets dans des images. Dans cet article, nous explorons les dix meilleures pratiques pour garantir des annotations de bounding boxes de haute qualité.

1. Bounding Box : de l'importance de choisir des outils adaptés

La première étape pour réussir l'annotation de bounding boxes est de sélectionner les outils appropriés. Il existe de nombreuses plateformes et logiciels d'annotation disponibles, tels que Labelbox, Supervisely, Encord, V7 Labs ou encore Label Studio, qui offrent des fonctionnalités avancées pour vous aider à obtenir des résultats précis. Pour en savoir plus, n'hésitez pas à consulter notre Top 10 des plateformes d'annotation de données les plus performantes.

2. Élaborer des instructions claires et complètes pour les annotateurs d'images

Avant de commencer le processus d'annotation, établissez des directives claires et détaillées pour vos annotateurs (ou Data Labelers). Ces directives doivent inclure des exemples visuels, des instructions spécifiques sur la manière de dessiner les bounding boxes, et des règles de catégorisation des objets.

La zone d'annotation doit être clairement définie dans un guide pour éviter toute confusion, et il peut être utile de se référer à des exemples spécifiques pour standardiser l'approche d'annotation à travers différents projets. La compréhension de ces éléments peut grandement influencer l'efficacité des modèles de vision par ordinateur en leur fournissant des données bien structurées et précises, pixel par pixel.

3. Former les Data Labelers aux techniques d'annotation (Bounding Box, Keypoints, Segmentation, etc.)

Il est essentiel de former vos annotateurs sur les fondamentaux de l'annotation de bounding boxes, ainsi que sur les spécificités de votre projet. Assurez-vous qu'ils comprennent parfaitement les objectifs de votre tâche et les règles spécifiques à suivre. Si vous travaillez avec un prestataire de services de labellisation, assurez-vous que celui-ci dispose d'un parcours de formation pour ses équipes ainsi que d'un suivi régulier.

Les principes de gestion des annotations doivent être conçus et communiqués de façon uniforme, de manière à faciliter l'identification et la séparation des différents éléments au sein d'une même image. Les Data Labelers doivent avoir les mêmes réflexes lorsqu'ils utilisent des rectangles d'annotation pour isoler et identifier chaque objet de manière distincte, pour éviter une variation trop importante dans le set de données annoté, en veillant à une délimitation précise qui prend en compte chaque pixel.

Ceci est une Bounding Box (source : CVAT.ai)

4. Étiqueter les classes correctement

Si votre tâche d'annotation implique de classifier ou catégoriser des objets, assurez-vous que chaque bounding box est associée à la classe appropriée. Utilisez un système de codage couleur ou d'étiquetage pour distinguer les différentes classes (ce que permettent la plupart des outils d'annotation modernes aujourd'hui - si ce n'est pas le cas, pensez à revoir votre setup).

Pour assurer une délimitation efficace, il est également essentiel de considérer la latitude et la longitude (lors de l'annotation spatiale d'images satellite par exemple), il faut donc préférer un outil qui donne des indications aux Data Labelers pour les aider à être le plus précis possible. La gestion de ces coordonnées doit être intégrée dans la plateforme d'annotation pour une précision maximale. De plus, la largeur et la hauteur des boîtes englobantes doivent être ajustées avec soin pour éviter toute déformation qui pourrait nuire à l'exactitude des données d'entraînement.

5. Ne pas négliger l'interface d'annotation et son contraste

Votre équipe de Data Labelers est appelée à travailler plusieurs centaines ou milliers d'heures sur vos données. Si l'interface est peu intuitive ou peu performante, cela va impacter la qualité de vos données en fin de processus. Et cela n'a (souvent) rien à voir avec le niveau de performance des annotateurs. Pensez également au contraste : si vous annotez des factures sur fond blanc avec 40 labels différents, et que chaque label est de la même couleur (blanc ou couleurs claires), cela va induire les annotateurs en erreur, rendre le travail plus difficile pour ces derniers... et bien sûr générer des erreurs.

Logo


Des spécialistes de la Bounding Box, à la demande
Accélérez vos tâches d'annotation de données et diminuez les erreurs jusqu'à 10 fois. Collaborez avec nos Data Labelers dès maintenant.

6. Gérer les cas ambigus ou non documentés

Définissez des consignes pour gérer les situations où l'objet à annoter est partiellement visible, flou ou caché par un autre objet. Les annotateurs doivent être formés pour identifier et traiter ces cas de manière appropriée... ou simplement les ignorer pour ne pas créer de faux positifs.

7. Éviter la sur-annotation

Faites attention à ne pas annoter des zones vides ou à ne pas recouvrir le même objet avec plusieurs bounding boxes, ce qui peut entraîner des erreurs de modèle.

8. Maintenir les proportions

Les bounding boxes doivent conserver des proportions correctes pour refléter fidèlement la taille de l'objet en pixels. Évitez de les déformer ou de les étirer. Celles-ci doivent être au plus proche de l'objet pour une délimitation précise, s'assurant que chaque pixel à l'intérieur de la boîte englobante est pertinent pour l'objet ciblé.

9. Gestion des objets partiellement cachés ou peu visibles

Marquez clairement les parties des objets qui sont partiellement cachées ou obscurcies par d'autres objets, avec des commentaires ou des indications (méta-données) dans votre plateforme. Cela permettra aux modèles de comprendre la présence d'occultation.

10. Contrôle qualité, documentation et itération

Mettez en place un processus de vérification et de contrôle qualité pour examiner les annotations et identifier les erreurs ou les incohérences. La vérification est critique pour garantir que vos données annotées sont correctes et fiables.

Tenez également un registre détaillé de chaque famille d'annotation pour référence future. Encouragez les annotateurs à fournir des commentaires sur les défis rencontrés lors de l'annotation. Ce processus itératif peut contribuer à améliorer la qualité des données sur le long terme.


L'annotation de boîtes englobantes est une composante critique de la préparation des données pour l'apprentissage automatique. En suivant ces dix meilleures pratiques et en les intégrant dans vos processus d'annotation, vous serez en mesure de produire des annotations de bounding boxes de haute qualité, ce qui se traduira par des modèles d'apprentissage automatique plus performants et plus précis. Rappelons que l'annotation précise de bounding boxes est essentielle pour de nombreuses applications, notamment la détection d'objets, la reconnaissance d'images ou la réalité augmentée.