Cómo automaticé un medio de jazz con IA: agenda, fichas y SEO casi en piloto automático
Caso real: cómo monté un medio de nicho que se actualiza solo con un pipeline de IA — scraping de agenda, fichas de músicos enriquecidas, SEO técnico y deploy automático. Qué funcionó y qué no.
Tenía un proyecto dormido: una pequeña empresa de eventos culturales de jazz que, sin equipo ni tiempo, no pasaba de uno o dos conciertos al año. La pregunta que me hice fue la misma que se hace cualquier PYME hoy: ¿puede un pipeline de IA mantener vivo un medio de nicho casi sin que yo toque nada cada día?
La respuesta corta es que sí, con matices. Monté un medio especializado en jazz en directo —agenda de conciertos, fichas de músicos, fichas de salas y artículos editoriales— que se actualiza solo. El resultado está publicado en Club Gre2Jazz y lleva meses funcionando con una intervención mínima. Te cuento cómo, qué stack usé y, sobre todo, qué aprendí para que puedas replicarlo en tu propio nicho.
El problema: contenido vivo sin manos que lo mantengan
Un medio de nicho necesita dos cosas que consumen muchísimo tiempo: datos frescos (qué concierto hay esta semana, en qué sala, de qué artista) y contenido de fondo que posicione (biografías, reseñas, guías). Hacerlo a mano es inviable para una persona. Automatizarlo a lo bruto produce basura que Google ignora.
El objetivo no era “publicar mucho”, sino publicar bien y solo: que cada página tuviera valor real, datos correctos y el SEO técnico que un medio profesional necesita para indexar. Esa fue la vara de medir de todo el proyecto.
La arquitectura: cinco etapas encadenadas
El pipeline tiene cinco fases, y cada una alimenta la siguiente:
-
Ingesta (scraping de agendas). Un job diario recoge listados de conciertos de varias fuentes, los normaliza (fechas, artista, sala, ciudad) y deduplica. Esto genera la materia prima: los eventos.
-
Enriquecido con IA + APIs. Aquí está el corazón. Para cada músico que aparece, un modelo de lenguaje redacta una biografía editorial, y un conjunto de APIs públicas (Discogs para discografía, MusicBrainz y Wikidata para enlaces, Spotify para metadatos) completa la ficha con datos verificables. Las fotos se resuelven con un buscador de imágenes libres de derechos. Si quieres profundizar en qué herramientas de IA encajan en una tarea así, lo cubrimos en el directorio.
-
Generación del sitio (SSG). Todo el contenido se materializa en un sitio estático con Astro: páginas de eventos, de músicos, de salas, y vistas de agenda filtradas por ciudad, estilo y mes. Estático significa rápido, barato de servir y robusto.
-
SEO técnico automático. Cada página emite su
schema.orgcorrespondiente (MusicEvent con oferta de entradas, Person/MusicGroup para músicos, MusicVenue para salas, Article y BreadcrumbList en el editorial). Se generan imágenes Open Graph únicas por página, unsitemap.xmldinámico conlastmodhonesto, y la indexación se notifica a Google vía su Indexing API. -
Despliegue. Un deploy incremental por SFTP sube solo lo que cambió. El sitio se reconstruye y se publica sin que yo entre.
El resultado es un medio con varios cientos de páginas —alrededor de 200 fichas de músicos, por ejemplo, cada una enriquecida automáticamente— que crece y se refresca solo.
Lo que SÍ funcionó
El motor editorial. La generación de artículos de fondo (reseñas, perfiles, guías) a ritmo de varias piezas por semana, con un autor consistente y schema de artículo, posiciona como un blog cuidado a mano. La clave fue tratar la IA como redactor con instrucciones precisas, no como una caja negra que escupe texto.
El SEO técnico de serie. Que cada página nazca con su structured data, su OG image y su entrada en el sitemap es lo que separa un experimento de un medio que Google se toma en serio. Automatizar esto una vez te ahorra el trabajo en cada una de las miles de páginas siguientes.
El coste casi nulo de mantenimiento. Una vez calibrado, el sistema vive solo. Eso es lo que convierte un proyecto dormido en un activo.
Lo que NO funcionó a la primera (y cómo lo arreglé)
Sería deshonesto vender esto como magia. Tres cosas me costaron:
-
La calidad de los datos scrapeados. Las fuentes mezclan artistas reales con ruido: nombres de DJs, etiquetas de festivales, “jam sessions” genéricas. Sin un filtro duro, acababas con cientos de fichas basura que diluyen la autoridad del dominio. La solución fue una puerta de calidad: cualquier ficha sin señales mínimas de ser un músico real se marca
noindex, así existe para el usuario pero no contamina el índice. -
La fragilidad del build. Reconstruir cientos de páginas y generar sus imágenes OG en cada deploy era lento y, si se interrumpía, dejaba el build corrupto. Lo resolví con caché por hash (no regenerar lo que no cambió) y límites de tiempo generosos. Una imagen que ya existe y no cambió no se vuelve a renderizar: el build pasó de casi una hora a segundos.
-
La tentación de publicar de todo. Más páginas no es más SEO. Aprendí a poner gates de calidad en origen: mejor 200 fichas sólidas que 500 mediocres.
Los aprendizajes transferibles a cualquier nicho
Si te planteas algo parecido —da igual que tu nicho sea inmobiliario, restauración o formación—, estas son las lecciones que valen para todos:
- Automatiza el SEO técnico una sola vez. Schema, OG images, sitemap con
lastmode indexación son trabajo de plantilla: lo configuras una vez y se aplica a cada página nueva gratis. - La IA es el redactor, tú eres el editor. El valor está en las instrucciones y en los datos que le das, no en el modelo. Aliméntalo con APIs y hechos verificables, no le pidas que invente.
- Pon puertas de calidad en la entrada, no en la salida. Es más barato no generar basura que limpiarla después.
- Cachea todo lo caro. Builds, imágenes, llamadas a APIs: si no cambió, no lo repitas.
- Empieza por un nicho que conozcas. La automatización amplifica tu criterio; no lo sustituye.
Montar esto no requiere un equipo de ingeniería: requiere encadenar bien herramientas que ya existen y tener claro el criterio editorial. Si quieres ver el resultado en producción, está todo vivo en clubgre2jazz.com —desde la agenda hasta las fichas de cada músico—. Y si estás pensando en automatizar contenido en tu propio sector, en el resto del sitio encontrarás el stack y las comparativas para elegir cada pieza.

Sobre el autor
Iván Jiménez MorenoEspecialista en automatización · Fundador de AutomatizayEscala.com
Analiza herramientas de automatización, IA y productividad para emprendedores y PYMEs hispanohablantes. Más de 180 herramientas evaluadas con metodología propia en 5 dimensiones.