En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Data Labeling

Annotation de Bounding Boxes pour les modèles Computer Vision : 10 astuces essentielles

écrit par
Aïcha
Temps de lecture
This is some text inside of a div block.
min

L'annotation de bounding boxes est une étape cruciale dans la création de jeux de données pour l'apprentissage automatique, en particulier dans des domaines tels que la computer vision. Il s'agit de l'annotation la plus simple pour ces modèles. Pour autant, une annotation précise des bounding boxes est essentielle pour former des modèles IA capables de détecter et de localiser des objets dans des images. Dans cet article, nous explorons les dix meilleures pratiques pour garantir des annotations de bounding boxes de haute qualité.

1. Choisir des outils adaptés

La première étape pour réussir l'annotation de bounding boxes est de sélectionner les outils appropriés. Il existe de nombreuses plateformes et logiciels d'annotation disponibles, tels que Labelbox, Supervisely, Encord, V7 Labs ou encore Label Studio, qui offrent des fonctionnalités avancées pour vous aider à obtenir des résultats précis.

2. Elaborer des instructions claires et complètes pour les annotateurs d'images

Avant de commencer le processus d'annotation, établissez des directives claires et détaillées pour vos annotateurs (ou Data Labelers). Ces directives doivent inclure des exemples visuels, des instructions spécifiques sur la manière de dessiner les bounding boxes, et des règles de catégorisation des objets.

3. Former les Data Labelers

Il est essentiel de former vos annotateurs sur les fondamentaux de l'annotation de bounding boxes, ainsi que sur les spécificités de votre projet. Assurez-vous qu'ils comprennent parfaitement les objectifs de votre tâche et les règles spécifiques à suivre. Si vous travaillez avec un prestataire de services de labellisation, assurez-vous que celui-ci dispose d'un parcours de formation pour ses équipes ainsi que d'un suivi régulier.

4. Etiqueter les classes correctement

Si votre tâche d'annotation implique de classifier ou catégoriser des objets, assurez-vous que chaque bounding box est associée à la classe appropriée. Utilisez un système de codage couleur ou d'étiquetage pour distinguer les différentes classes (ce que permettent la plupart des outils d'annotation modernes aujourd'hui - si ce n'est pas le cas, pensez à revoir votre setup).

5. Ne pas négliger l'interface d'annotation et son contraste

Votre équipe de Data Labelers est appelée à travailler plusieurs centaines d'heures sur vos données. Si l'interface est peu intuitive ou peu performante, cela va impacter la qualité de vos données en fin de processus. Et cela n'a rien à voir avec le niveau de performance des annotateurs. Pensez également au contraste : si vous annotez des factures sur fond blanc avec 40 labels différents, et que chaque label est de la même couleur (blanc ou couleurs claires), cela va induire les annotateurs en erreur, rendre le travail plus difficile pour ces derniers... et bien sûr générer des erreurs.

6. Gérer les cas ambigus ou non documentés

Définissez des consignes pour gérer les situations où l'objet à annoter est partiellement visible, flou ou caché par un autre objet. Les annotateurs doivent être formés pour identifier et traiter ces cas de manière appropriée... ou simplement les ignorer pour ne pas créer de faux positifs.

7. Éviter la sur-annotation

Faites attention à ne pas annoter des zones vides ou à ne pas recouvrir le même objet avec plusieurs bounding boxes, ce qui peut entraîner des erreurs de modèle.

8. Maintenir les proportions

Les bounding boxes doivent conserver des proportions correctes pour refléter fidèlement la taille de l'objet. Évitez de les déformer ou de les étirer. Celles-ci doivent être au plus proche de l'objet.

9. Gestion des objets partiellement cachés ou peu visibles

Marquez clairement les parties des objets qui sont partiellement cachées ou obscurcies par d'autres objets. Cela permettra aux modèles de comprendre la présence d'occultation.

10. Contrôle qualité, documentation et itération

Mettez en place un processus de vérification et de contrôle qualité pour examiner les annotations et identifier les erreurs ou les incohérences. La vérification est critique pour garantir que vos données annotées sont correctes et fiables.

Tenez également un registre détaillé de chaque famille d'annotation pour référence future. Encouragez les annotateurs à fournir des commentaires sur les défis rencontrés lors de l'annotation. Ce processus itératif peut contribuer à améliorer la qualité des données sur le long terme.

En suivant ces dix meilleures pratiques, vous serez en mesure de produire des annotations de bounding boxes de haute qualité, ce qui se traduira par des modèles d'apprentissage automatique plus performants et plus précis. Rappelons que l'annotation précise de bounding boxes est essentielle pour de nombreuses applications, notamment la détection d'objets, la reconnaissance d'images et la réalité augmentée.