Recursos
Casos de estudio
Aprovechar la gran cantidad de datos de audio mediante una anotación multimodal precisa
Caso de estudio
Aprovechar la gran cantidad de datos de audio mediante una anotación multimodal precisa

+500 horas
archivos de audio anotados y transcritos
+30
etiquetas aplicadas a datos multimodales
100%
Correspondencia entre los segmentos de audio y la transcripción
En los sectores de la atención al cliente, la salud y el análisis del comportamiento, la explotación de los datos de audio es fundamental para entrenar modelos que puedan detectar intenciones, emociones o entidades en el habla humana.
La misión
Cree un conjunto de datos rico y estructurado a partir de archivos de audio sin procesar, que incluya:
- La fina segmentación de los audios en Trozos relevante con las marcas de tiempo;
- Transcripción manual de segmentos, con corrección de errores de reconocimiento de voz;
- La anotación de más de 30 etiquetas relacionadas con el contenido (temas, intenciones, emociones, entidades, interrupciones... );
- Construir relaciones multimodal entre la transcripción y las partes de audio correspondientes.
Innovatiana movilizó un equipo dedicado, experto en anotaciones de audio y PNL, y estableció un proceso estructurado que permitía un alto nivel de precisión y una trazabilidad completa de las anotaciones.
Los resultados
- Un conjunto de datos estructurado para entrenar modelos de conversión de voz a texto, clasificación o detección de intenciones;
- Una base de verdad multimodal alineada para aprovechar tanto la señal de audio como su interpretación lingüística;
- Una reducción significativa del tiempo necesario para la validación humana gracias a la calidad inicial de las anotaciones.
Nuestros otros casos de estudio
Ver más