La solución al contenido duplicado en SEO

julio 18, 2018

El contenido duplicado en SEO es uno de los problemas más habituales dentro de las campañas de posicionamiento, pero, tal vez, el menos atendido. La atención se centra mucho en el diseño de la página web, la creación de enlaces internos, etc. No obstante, la creación de contenido online es una de las premisas también valoradas por Google. Estas son las claves para localizar y solucionar los problemas causados por el contenido duplicado en SEO.

¿A qué llamamos contenido duplicado en SEO?

Se considera contenidos duplicado en SEO a todo aquel texto que se repita dentro de una misma URL, ya sea ésta externa o interna. Esto se produce cuando dentro de tu página web existen varias copias de una misma página o cuando una persona plagia directamente un texto de tu blog.

El contenido duplicado en SEO es todo un problema, ya que buscadores como Google se basan de contenidos variados y originales para sus resultados de búsqueda. Por este motivo, existen filtros que eliminan de las listas de respuestas estos contenidos repetidos. Esta eliminación no es transparente. Es decir, tú no te das cuenta de que Google está eliminado tus contenidos duplicados, lo que te puede  hacer seguir pensando que tu estrategia SEO es correcta. ¿A qué se debe este problema?

Causas del contenido duplicado

Los motivos por los que una página web puede contener contenido duplicado son varias. Y pueden ser OnPage u OffPage

Contenido duplicado dentro de la página web

Muchas personas creen que el contenido duplicado en SEO solo se refiere a los artículos copiados y pegados de un blog a otro. Sin embargo, el mayor porcentaje de contenido repetido se encuentra dentro de la propia página web. Por ejemplo:

  • Dominio no canónico: las URLs canónicas se utilizan desde el año 2009 para evitar los contenidos duplicados dentro de las páginas web. Por esta razón, es aconsejable utilizarlas dentro de tu página web. Un dominio canónico sería <link rel=”canonical” href=”http://www.dominio.es/producto” /> . Esta URL canónica no se redirecciona, sino que se añade directamente como una referencia de la fuente original, pudiendo configurarse de manera individual para cada página de tu web.
  • Páginas no seguras: las páginas seguras son aquellas que en su dominio incluyen el protocolo seguro de transferencia https. Esto indica que el sitio web está protegido por el certificado SSL. Si tu página no lo tiene es muy probable que pueda ser susceptible de tener contenido duplicado.
  • Diferentes IDs de sesión: cuando una página web trabaja con diferentes perfiles esto puede crear confusión en los buscadores. Estos parámetros son diferentes para cada usuario, pero puede que Google los interprete como páginas copiadas.
  • La ubicación de los archivos: los blogs o secciones de noticias de las páginas webs trabajan con archivos. Su ubicación puede hacer que archivos iguales aparezcan en páginas distintas.
  • La paginación: este parámetro usado dentro de un sitio web puede hacer que se entienda que existe contenido duplicado. Sobre todo, cuando esta paginación comparte el mismo título y descripción en todas sus páginas.
  • Modo responsive: cuando una página web genera una URL independiente para su versión móvil sin estar configurada correctamente ésta puede ser considerada como una copia y no como una versión paralela de la página original.

Contenido duplicado fuera de la página

Fuera de nuestro sitio online también existen motivos por los cuales se está generando un contenido duplicado en SEO sin que nosotros lo sepamos. Por ejemplo:

  • Lector RSS o sindicación: lo que también se conoce como Really Simply Syndication se utiliza para enviar contenido actualizado a los usuarios que se han suscrito a él. El problema surge cuando en lugar de enviarse fragmentos específicos de información se envían copias exactas del contenido.
  • Localización: si tu página web está diseñada en varios idiomas porque quieres ampliar fronteras esto puede suponer un problema de contenido duplicado en SEO, ya que la información estaría en varios dominios a la vez.
  • La red de entrega de contenidos: esta red permite la distribución de contenido rápidamente en diferentes ubicaciones. Sin embargo, el uso de CDN puede ser interpretado como contenido duplicado.
  • El scraping: consiste en una técnica que consigue extraer información de las páginas web de manera automática. Esto puede ser usado fraudulentamente para copiar información de tu sitio online y publicarlo en otro dominio diferente.
  • El famoso plagio: existen redactores poco profesionales que se nutren de los contenidos de otros blogs para realizar sus artículos. Lo malo es que sus copias son prácticamente literales, lo cual es un perjuicio para tu propia web.

Consecuencias del contenido duplicado en SEO

Google no penaliza o multa directamente a las páginas web con contenidos duplicados. Lo que hace, como decíamos antes, es un filtrado de las mismas para hacerlas desaparecer de los resultados de búsqueda. Si nos paramos a pensar detenidamente esto ya es una buena penalización en toda regla. Porque nuestra web está siendo eliminada del buscador.

Otras consecuencias del contenido duplicado son:

  1. Peor visibilidad y posicionamiento web.
  2. Deficiente indexación de tus páginas más importantes.
  3. Mala reputación, debido a que Google puede darle la originalidad de tus contenidos a otro dominio.

Soluciones y herramientas para el contenido duplicado

Los métodos más efectivos para detectar el contenido duplicado y acabar con él puede actuar tanto desde dentro de la página como desde fuera de ella. Las herramientas para detectar contenido duplicado dentro de la página son:

Las herramientas más recomendadas para localizar contenido duplicado fuera de la página son:

  • CopyScape.
  • Similar Page Checker.
  • Duplichecker. 
  • Plagiarisma.

Queda claro que la experiencia de usuario es muy valorada por los buscadores. Por esta razón, Google huye del contenido duplicado y lo elimina. Esta es la razón principal por la que una buena estrategia SEO debe prestar atención a este problema. No solo fuera de la página web, sino también dentro de ella.