En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Recursos
Casos de estudio
Aprovechar la gran cantidad de datos de audio mediante una anotación multimodal precisa
Caso de estudio

Aprovechar la gran cantidad de datos de audio mediante una anotación multimodal precisa

Ecrit par
Aïcha
+500 horas

archivos de audio anotados y transcritos

+30

etiquetas aplicadas a datos multimodales

100%

Correspondencia entre los segmentos de audio y la transcripción

Resumen

Construye el dataset ideal para alcanzar tus objetivos

Anotación experta y precisa para que entrenes tus modelos de inteligencia artificial con confianza

👉 Pídenos un presupuesto
Partager

En los sectores de la atención al cliente, la salud y el análisis del comportamiento, la explotación de los datos de audio es fundamental para entrenar modelos que puedan detectar intenciones, emociones o entidades en el habla humana.

La misión

Cree un conjunto de datos rico y estructurado a partir de archivos de audio sin procesar, que incluya:

  • La fina segmentación de los audios en Trozos relevante con las marcas de tiempo;
  • Transcripción manual de segmentos, con corrección de errores de reconocimiento de voz;
  • La anotación de más de 30 etiquetas relacionadas con el contenido (temas, intenciones, emociones, entidades, interrupciones... );
  • Construir relaciones multimodal entre la transcripción y las partes de audio correspondientes.

Innovatiana movilizó un equipo dedicado, experto en anotaciones de audio y PNL, y estableció un proceso estructurado que permitía un alto nivel de precisión y una trazabilidad completa de las anotaciones.

Los resultados

  • Un conjunto de datos estructurado para entrenar modelos de conversión de voz a texto, clasificación o detección de intenciones;
  • Una base de verdad multimodal alineada para aprovechar tanto la señal de audio como su interpretación lingüística;
  • Una reducción significativa del tiempo necesario para la validación humana gracias a la calidad inicial de las anotaciones.

Aïcha

Publicado el

12/6/2025

Aïcha

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.