Procesamiento y Comprensión de Documentos con Mistral OCR y Multimodal
Workflow que demuestra el uso de Mistral OCR para extraer texto de PDFs e imágenes, tanto de URLs públicas como de archivos subidos a Mistral Cloud, y la capacidad de los modelos de chat de Mistral para la comprensión directa de documentos.
Nodos
Herramientas
Detalles
- ID
- 2738
- Nodos
- 5
- Conex.
- Sí
- Tipos
- 3
Pertenece a:
¿Qué hace este workflow?
Este flujo de trabajo ofrece una manera interactiva y creativa de transformar imágenes. Al recibir un mensaje con una imagen a través de LINE, el workflow procesa esta imagen y genera un prompt específico para DALL-E. Utilizando la capacidad de inteligencia artificial de DALL-E, la imagen original se recrea en un distintivo estilo Lego. Una vez generada, la nueva imagen es enviada de vuelta al usuario a través de LINE, proporcionando una experiencia lúdica y personalizada. Es una excelente demostración de cómo integrar servicios de mensajería con IA generativa para crear contenido visual único y participativo, abriendo posibilidades para aplicaciones de entretenimiento o marketing experiencial.
¿Cómo funciona?
Este workflow usa 5 nodos conectados con 3 tipos diferentes: Webhook, HttpRequest, OpenAi. La estructura está totalmente conectada — listo para importar.
¿Lo quieres en tu empresa?
→Lo implementamos por ti end-to-end: integración, deploy, mantenimiento y soporte. Consultoría B2B con Genai Sapiens.
Hablemos de tu proyecto¿Quieres aprender a hacerlo?
→Sprints de 30 días con companion IA + comunidad. Aprende n8n, automatización y agentes IA desde cero o nivel avanzado.
Ver formación Momentum