Uno de los mayores problemas que tienen que afrontar las páginas Webs es el duplicado de contenido. Google considera “contenido duplicado” cuando páginas con URL diferentes tienen el mismo contenido.

Podría parecer que tener contenido repetido no tendría por qué ser de gran importancia pero a la hora de la verdad es un serio problema. Google espera que cualquier usuario que navegue en su buscador pueda encontrar contenido diferente allá donde mire, no el mismo contenido una y otra vez. Por esa razón filtra las copias de un mismo contenido para que no aparezcan.

Por supuesto, el proceso de filtrado que hace el buscador es transparente. Tú, cómo propietario de la Web, puede que no sepas que tus páginas han sido marcadas por Google como duplicadas, cuando tú pensabas que tus páginas eran únicas y atrayentes a tus visitas. ¿Qué consecuencias puede traer esto?:

Google te puede penalizar de dos maneras:

  1. De forma directa. Google o cualquier motor de búsqueda considera las webs con mucho contenido duplicado son sitios de baja calidad ya que no hay contenido relevante en ellas. Se tiene que ir con cuidado con este punto, ya que no quisiéramos tener una página que Google la considerara de “baja calidad”.
  1. De forma indirecta. Debido a que tu sitio ofrece contenido duplicado, el motor de búsqueda puede tener problemas a la hora de elegir que página es la adecuada para posicionar.¿Cuál elegirá Google para posicionar?

¿Qué puede causar el contenido duplicado?

Hay varias situaciones que son más propicias a traer esto a nuestra web, ponemos algunos ejemplos:

1# Contenido dinámico. Hay sitios que asignan parámetros a las URLs para controlar el contenido que se muestra al usuario. Igual que ocurre con los IDs de sesión, los buscadores pueden interpretar estas páginas como copias.

2# Dominio no canónico. Tener tu dominio con www y sin www. ¿Te has fijado si tu dominio aparece siempre de la misma forma? Si puedes acceder a tu dominio tanto usando www como sin ellas (sinwww.com y www.conwww.com), vas a ser penalizado. Esto es un error bastante importante ya que estarías dándole a Google todas tus páginas por duplicado.

3# ID de sesión. Muchos sitios manejan las sesiones de usuario introduciendo un código al final de la URL de cada página. Esto se hace para seguir al usuario o bien para almacenar productos en un shopping cart. El problema está en que estos parámetros, diferentes para cada sesión de usuario, pueden hacer que el buscador crea que se trata de páginas separadas, aunque en realidad sean la misma.

4# Páginas que por algún motivo tienen contenido muy parecido o casi idéntico. Si la versión para móvil de tus páginas se genera en una URL independiente (p.e. un subdominio o un subdirectorio) y no se configura correctamente, el buscador puede tener dificultades para saber que se trata de una versión paralela. También puede que tengas contenido muy parecido con otras Webs. Este problema se da muchas veces en los blogs donde el mismo contenido se puede dar en las carpetas “archivos” y “etiquetas”.

5# Paginación. Cualquier web que use paginación puede tener este problema, especialmente si las páginas de la serie comparten el mismo título y la misma descripción.

¿Cómo encontrar el contenido duplicado?

Existen diferentes herramientas que nos pueden ayudar a saber si nuestro contenido está duplicado para poder tomar cartas en el asunto. Vamos a hablaros de algunas de ellas:

Webmaster Tools. Si estas dado de alta en las herramientas para webmasters de Google, esta te será de gran ayuda para saber qué tal está tu contenido. En la parte de Aspectos de búsqueda > Mejoras en HTML. Está atento a las etiquetas de título y metadescripciones duplicadas. El informe te dirá la cantidad de réplicas existentes y en qué páginas se han encontrado para que puedas corregirlas.

Xenu. Herramienta gratuita, que nos permite identificar elementos duplicados de nuestra web.

Screaming Frog. Esta poderosa herramienta te permite encontrar elementos de tus páginas que están duplicados. Las pestañas que te interesan son URIPage TitlesMeta Description y H1, empleando el filtro Duplicate.Tienes un límite de hasta 500 URLs de forma gratuita.

Comando “Site:” en Google. Este comando nos muestra todas las páginas que indexa Google de tu dominio. Si te aparece el mensaje “repetir la búsqueda e incluir los resultados que se han omitido” puede ser que tengas páginas con contenido duplicado y por eso Google no las muestra. Además este comando te sirve para identificar de forma manual títulos y descripciones duplicadas.

Google AnalyticsTambién puedes encontrar páginas duplicadas en Google Analytics mediante el informe Comportamiento > Contenido del sitio > Páginas de destino. La clave está en buscar URL sospechosas y páginas que reciben menos tráfico orgánico del que debieran.

Tu propia Web puede ser la causante de duplicar contenido.

La mayor fuente de contenido duplicado suele crearse en la propia web, al margen de lo bien optimizada que esté. Sin tu saberlo podrías estar haciendo copias de tus páginas. ¿Cómo? Existen varios motivos:

  • Sindicación. A veces usamos las Redes Sociales para atraer tráfico a nuestra Web. El problema está en cuando publicamos una copia completa que también se encuentra en tu página, en lugar de un fragmento.
  • Localización. Para dirigirte a varios países puedes haber usado el mismo contenido en varios dominios a la vez.
  • Scraping. Los scrapers usan un software robot para copiar tus páginas y publicarlas en otro dominio.
  • Plagios. Alguien puede copiar un texto de tu sitio web y ponerlo en el suyo. Es un problema puntual pero que puede perjudicarte en gran manera.

Entonces ¿cómo puedes detectar si tienes contenido duplicado y cómo puedes librarte de él? Lo veremos en una de nuestras próximas entradas.