Scraper de Sitio Web con Sitemap a Google Drive
Escrapea un sitio web completo usando su sitemap XML, procesa cada página secuencialmente con retrasos, extrae el contenido y lo guarda como archivos Markdown formateados en Google Drive.
Nodos
Herramientas
Detalles
- ID
- 7186
- Nodos
- 13
- Conex.
- Sí
- Tipos
- 11
Pertenece a:
¿Qué hace este workflow?
Este workflow está diseñado para la extracción eficiente y automatizada de contenido de cualquier sitio web, utilizando su sitemap XML como guía para identificar todas las URLs relevantes. Procesa cada página de manera secuencial, incorporando retrasos configurables entre solicitudes para simular el comportamiento humano y evitar bloqueos. El contenido extraído se formatea cuidadosamente como archivos Markdown y se guarda directamente en una carpeta específica de Google Drive, facilitando su posterior organización, análisis o archivo. Ideal para equipos de marketing que monitorizan competidores, investigadores que recopilan datos o creadores de contenido que necesitan un repositorio organizado de información web. Permite automatizar una tarea que consumiría horas de trabajo manual, asegurando una recopilación de datos consistente y sin errores, liberando tiempo valioso para tareas de mayor impacto estratégico.
¿Cómo funciona?
Este workflow usa 13 nodos conectados con 11 tipos diferentes: StickyNote, ManualTrigger, Set, HttpRequest, Xml y 6 más. La estructura está totalmente conectada — listo para importar.
¿Para quién es?
Diseñado para equipos de Marketing & Email, Operaciones & Finanzas. Nivel intermedio — necesitas familiaridad con n8n.
¿Lo quieres en tu empresa?
→Lo implementamos por ti end-to-end: integración, deploy, mantenimiento y soporte. Consultoría B2B con Genai Sapiens.
Hablemos de tu proyecto¿Quieres aprender a hacerlo?
→Sprints de 30 días con companion IA + comunidad. Aprende n8n, automatización y agentes IA desde cero o nivel avanzado.
Ver formación Momentum