¿Está tu web lista para la IA? Mi viaje adaptando davidbuenov.com a los LLMs

Imagen de ¿Está tu web lista para la IA? Mi viaje adaptando davidbuenov.com a los LLMs

El mundo de las búsquedas en Internet está cambiando a una velocidad de vértigo.
Ya no solo buscamos en Google introduciendo palabras clave; ahora le preguntamos a ChatGPT, Claude, Gemini o Copilot para que busquen por nosotros, resuman información y nos den una respuesta directa.

Esto nos lleva a una pregunta inevitable para cualquier profesional, empresa o institución:
¿Está tu sitio web preparado para que una Inteligencia Artificial lo lea, lo entienda y te recomiende?

Hace unos días decidí poner a prueba mi propia web.
Y el resultado fue un auténtico baño de realidad.


El diagnóstico inicial: 21/100

Para medir el nivel de compatibilidad de mi web con la IA, utilicé herramientas de auditoría especializadas en Agent Readiness y GEO (Generative Engine Optimization).

Al pasar el primer escáner, la puntuación fue de 21 sobre 100:

Diagnóstico inicial de Agent Readiness: 21/100

Mi web funcionaba de maravilla para humanos. Tenía un buen SEO tradicional, cargaba rápido y los enlaces funcionaban.
Pero para un agente de IA, era un laberinto.

Los bots se topaban con páginas de error en HTML cuando buscaban APIs, no entendían qué directivas de entrenamiento tenían permitidas y no encontraban una estructura de datos clara a la que consultar directamente. Estaba perdiendo la oportunidad de que los modelos de lenguaje me indexaran y recomendaran adecuadamente.


¿Qué es el “Agent Readiness” y el GEO?

Básicamente, consiste en optimizar tu web para que los agentes autónomos de IA y los crawlers de LLM puedan interactuar con ella de forma eficiente. Si el SEO tradicional posicionaba páginas para humanos, el GEO prepara la infraestructura para que los bots extraigan conocimiento.

Para solucionar esto, tracé una estrategia de adaptación dividida en cinco grandes pilares (sin entrar en el código complejo, pero sí en la lógica estratégica):

1. Facilitar el “mapa del tesoro” (Contenido para LLMs)

Los bots no leen el diseño visual. Necesitan texto limpio.

  • Implementé un archivo de descubrimiento semántico (llms.txt) en la raíz de la web. Es un mapa en Markdown limpio que resume quién soy y dónde está cada sección clave.
  • Configuramos una directiva clara de señales de contenido (Content Signals) en el archivo robots.txt para indicar qué permitimos entrenar y qué no.

2. Infraestructura DNS y Servidor

Los bots de IA buscan metadatos en rutas específicas de red antes de rastrear el sitio.

  • Intentamos configurar el descubrimiento a nivel DNS mediante registros de descubrimiento de agentes (DNS-AID), aunque en mi caso me topé con limitaciones del proveedor (1&1/IONOS no da soporte nativo al tipo de registro HTTPS en DNS, que es el requerido para esto).
  • Ajustamos las cabeceras HTTP de respuesta del servidor (en mi caso, configuradas en Firebase) para que los bots identifiquen nuestras capacidades semánticas en una sola petición ultrarrápida.

3. Protocolos de IA (MCP y WebMCP)

La IA no solo lee, también puede interactuar localmente.

  • Configuramos un “MCP Server Card” compatible con el estándar de Anthropic (Model Context Protocol).
  • Integramos WebMCP a nivel de cliente mediante scripts que exponen herramientas directamente al navegador del agente de IA cuando este visita el sitio.

4. Flujo de Identidad y APIs

Para que los motores semánticos verifiquen los datos sin registrarse o fallar por temas de seguridad:

  • Definimos metadatos claros de acceso y autorización (auth.md) compatibles con especificaciones modernas de flujo de bots.
  • Estructuramos un índice de capacidades y un catálogo de APIs en formatos estandarizados.

5. SEO Semántico y Grafo de Entidades (Schema.org JSON-LD)

Para que los LLMs interconecten la información y puedan verificar hechos de forma inequívoca en su base de conocimiento:

  • Implementamos datos estructurados de tipo Person para consolidar mi identidad y asociarla con mi alias @davidbuenov y perfiles sociales.
  • Añadimos metadatos dinámicos de tipo BlogPosting para los artículos del blog y de tipo Event para la sección de conferencias.
  • Clasificamos de forma híbrida nuestros proyectos para diferenciar las herramientas interactivas (SoftwareApplication) de las consultorías e investigaciones (CreativeWork).

El Éxito Final: Puntuaciones de Matrícula (100/100, 93/100 y 88/100)

Tras aplicar esta arquitectura híbrida y desplegar las mejoras de negociación de contenido, compatibilidad de agentes e inyección de datos estructurados, volvimos a pasar las auditorías con resultados espectaculares:

  • Luminary Lane A2A Checker: Conseguimos una puntuación perfecta de 100/100 (matrícula de honor).
  • IsItAgentReady: Logramos alcanzar un sobresaliente 93/100, quedándonos a las puertas del 100% únicamente porque mi actual proveedor de dominio (1&1/IONOS) no permite añadir registros de tipo HTTPS en su panel DNS (necesario para el autodescubrimiento DNS-AID).
  • AgentReady.md: Escalamos la puntuación hasta un excelente 88/100 tras la última integración de datos estructurados de Schema.org, lo que nos permitió integrar su distintivo oficial en el pie de página de la web.

Puntuación perfecta de 100/100 en Luminary Lane


¿Y ahora qué?

El “Agent Readiness” ya no es una opción de futuro; es una necesidad del presente. Si tu web no está adaptada, los nuevos buscadores basados en chat simplemente no te encontrarán ni te recomendarán en sus respuestas.

Hacer esta transición requiere entender no solo de desarrollo web y servidores, sino de los estándares emergentes que los gigantes de la IA (Google, OpenAI, Anthropic) están definiendo mes a mes.

¿Quieres preparar la web de tu empresa, universidad o marca personal para los agentes de IA?
Si necesitas un experto para auditar, diseñar o implementar esta adaptación en tu sitio web, no dudes en ponerte en contacto conmigo a través de mi formulario de contacto. Estaré encantado de ayudarte a dar el salto a la web del futuro.

Compartir:

Comentarios