Más que cualquier otro tipo de sitio, los e-commerce son conocidos por desarrollar estructuras de URL que crean problemas de rastreo en los motores de búsqueda. Es importante mantener esto bajo control para evitar el contenido duplicado y posibles problemas de indexación. Para ayudarte, te damos cinco consejos que, a nuestro parecer, te van a venir muy bien para mantener estos errores a raya:

  1. ¿Qué hay en el índice de Google?

Es importante verificar con regularidad cuántas de tus páginas Google reportan como indexadas. Para ello, ejecuta una búsqueda «site: example.com» para ver cuántas páginas reconoce Google en la Web. Si bien este número es solo un cálculo aproximado, es la forma más fácil de identificar si estamos teniendo problemas con la indexación.

Los números entre tu gestor de contenido (CMS) y la plataforma de comercio electrónico, el mapa del sitio y los archivos del servidor deben coincidir casi perfectamente o, al menos, que cualquier discrepancia esté justificada.

Si Google devuelve muy pocos resultados:

  • Identifica qué páginas de tu sitemap no registran tráfico orgánico en Google Analytics.
  • Busca una muestra representativa de estas páginas en Google para identificar cuáles faltan realmente en el índice.
  • Identifica los patrones en las páginas que no están indexadas y trátalos sistemáticamente en tu sitio para aumentar las posibilidades de indexación de esas páginas. Los patrones que se deben buscar incluyen problemas de contenido duplicado, falta de enlaces internos entrantes, no inclusión en el mapa del sitio XML, no indexación no intencional o canonicalización, y HTML con serios errores de validación.

Si Google está devolviendo demasiados resultados:

  • Realiza un rastreo del sitio con ScreamingFrog o una herramienta similar, e identifique las páginas con títulos duplicados, ya que normalmente tienen contenido duplicado.
  • Determina qué está causando los duplicados y elimínelos. Hay varias causas y soluciones que constituirán la mayor parte del resto de esta publicación, y que se explican a continuación.
  1. Optimizar sitemaps, robots.txt y enlaces de navegación

Estos tres elementos son fundamentales para la indexación, y sería negligente si no los mencionamos (una vez más) aquí.

El analista de tendencias del Webmaster de Google Gary Illyes afirma que el mapa de un sitio es incluso más importante que los enlaces internos. Ilyes confirmó recientemente que incluso los resultados de búsqueda de palabras clave «principales» pueden incluir páginas sin enlaces entrantes, incluso sin enlaces internos. La única forma en que Google podría haber sabido sobre estas páginas es a través del mapa del sitio.

Es igualmente importante que te asegures de que el robots.txt sea funcional, no bloquee a Google en ninguna parte del sitio que deseas indexar, y que incluya la ubicación del sitemap.

Finalmente, una estructura de enlace de navegación intuitiva y lógica es imprescindible para una buena indexación. Además del hecho de que cada página que espera indexarse ​​debe ser accesible desde, al menos, un enlace en tu sitio. Las buenas prácticas de UX son esenciales.

  1. Controla los parámetros de URL

Los parámetros de URL son una causa muy común de «espacios infinitos» y contenido duplicado, lo que limita mucho el rastreo. Son variables añadidas a la estructura de URL que llevan instrucciones del servidor utilizadas para hacer cosas como ordenar y filtrar elementos, personalizar la apariencia de la página, devolver los resultados de búsqueda, etc.

Examina los diferentes tipos de parámetros de URL en juego. Cualquier parámetro de URL que no tenga un impacto significativo en el contenido, como las etiquetas de campaña publicitaria (utm), la clasificación, el filtrado y la personalización, debe tratarse con una directiva noindex o canonicalización (¡y nunca con ambas!).

  1. Filtros buenos y malos

¿Cuándo se debe poder rastrear un filtro por los motores de búsqueda y cuándo no debe indexarse ​​o canonicalizarse? Según las recomendaciones de Google, los filtros «buenos»:

  • Deben actuar como una extensión significativa de sus categorías de productos, produciendo páginas diferentes pero sólidas.
  • Deberían ayudar a especificar un producto.
  • Deberían ser indexados.

Se consideran filtros «malos” aquellos que:

  • Reorganicen el contenido sin cambiarlo, como ordenar por precio o popularidad.
  • Mantengan las preferencias del usuario que cambian el diseño, pero no afectan al contenido.
  • Estos tipos de filtros no deben indexarse y en su lugar deben abordarse con directivas noindex o canonicalization.
  1. Uso apropiado de noindex y canonicalización

La etiqueta noindex le dice a los motores de búsqueda que no indexe una página, mientras que la canonización les indica que dos o más URL son en realidad la misma página, pero una es la página canónica «oficial».

Para duplicados o casi duplicados, la canonicalización es la opción correcta en la mayoría de los casos, ya que conserva la autoridad SEO. Si lo que deseas es que no se indexe ninguna versión de la página, se debe usar noindex.

No uses noindex y canonicalización al mismo tiempo. John Mueller, también analista de tendencias del Webmaster de Google, advirte contra esto porque podría decirles a los motores de búsqueda que no indexen la página canónica, así como los duplicados.

Para resumir, cosas que deben canonicalizarse:

  • Los duplicados creados mediante parámetros de navegación deben canonicalizarse a la versión estándar de la página.
  • Canonicaliza el contenido paginado en una página consolidada de «ver todo».
  • Canonicaliza cualquier prueba de división A/B o multivariante en la URL oficial.

Cosas que no deben estar indexadas:

  • Cualquier área de cliente o páginas de inicio de sesión del usuario.
  • Cualquier carrito de compra y página de agradecimiento.
  • Páginas de resultados de búsqueda interna.
  • Cualquier página duplicada que no pueda canonicalizarse.