Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información.  pour plus d'informations.
Open Datasets
WebCode2M
Multimodal

WebCode2M

WebCode2M es un conjunto de datos multimodal que combina capturas de pantalla de diseños de páginas web con su código HTML/CSS y la información de diseño asociada. Su objetivo es mejorar la generación automática de código web.

Obtén el dataset
Tamaño

3.171.024 instancias, imágenes PNG, código HTML/CSS en texto, archivos Parquet (~1,1 TB)

Licencia

CC BY 4.0

Descripción

WebCode2M es un vasto conjunto de datos que contiene más de 3 millones de ejemplos reales que combinan imágenes de diseño web, sus códigos HTML/CSS correspondientes y datos de diseño (cuadros delimitadores, jerarquía). Este conjunto de datos permite crear modelos multimodales capaces de generar código de interfaz a partir de una imagen de diseño.

¿Para qué sirve este conjunto de datos?

  • Entrenamiento de modelos de aprendizaje multimodales para la generación automática de código web
  • Desarrolle herramientas de soporte de diseño de IA frontales
  • Pruebe la solidez de los MLLM en la comprensión visual y textual de las interfaces

¿Se puede enriquecer o mejorar?

Sí, podemos enriquecer este conjunto de datos filtrando más minuciosamente el contenido confidencial, añadiendo variantes lingüísticas o incluso documentando los distintos estilos CSS presentes para guiar mejor el aprendizaje.

🔎 En resumen

Criterio Evaluación
🧩 Facilidad de uso⭐⭐✩✩✩ (Voluminoso y requiere recursos informáticos importantes)
🧼 Necesidad de limpieza⭐⭐⭐✩✩ (Moderado – requiere filtrado de contenido inapropiado posible)
🏷️ Riqueza de anotaciones⭐⭐⭐⭐⭐ (Excelente – imagen, código, layout y metadatos lingüísticos)
📜 Licencia comercial✅ Sí (CC BY 4.0)
👨‍💻 Ideal para principiantes⚠️ No – recomendado para usuarios avanzados
🔁 Reutilizable para fine-tuning✅ Muy adecuado para entrenamiento de MLLMs multimodales
🌍 Diversidad cultural🈳 Bueno – soporte de 20 idiomas principales de la web

🧠 Recomendado para

  • Investigadores de IA de primera línea
  • Desarrolladores de MLLM multimodales
  • Proyectos de generación de interfaces de usuario

🔧 Herramientas compatibles

  • PyTorch
  • TensorFlow
  • Hugging Face Datasets
  • Vision Transformer
  • Diffusers

💡 Consejo

Prefiere el uso de la versión purificada para evitar contenidos inapropiados durante el entrenamiento.

Preguntas frecuentes

¿Este conjunto de datos contiene datos sensibles o inapropiados?

Sí, a pesar del filtrado, es posible que quede una pequeña cantidad de contenido inapropiado. Hay disponible una versión purificada.

¿Cuáles son los idiomas incluidos en este conjunto de datos?

Abarca 20 idiomas principales, incluidos francés, inglés, chino, árabe, español, japonés y más.

¿Cuál es el tamaño total del conjunto de datos?

Aproximadamente 1,1 TB de datos en total, incluidas imágenes, códigos y metadatos en formato Parquet.

Otros datasets

Ver más
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.