Contenido duplicado y SEO

Tweet about this on Twitter49Share on Facebook0Share on Google+6Share on LinkedIn28Pin on Pinterest0

No hay duda que el contenido duplicado afecta negativamente a las posiciones de nuestra web en los buscadores. Se trata de un tema complejo que vamos a intentar abordar de una forma instructiva en este post.

Empecemos dividiendo esta problemática en dos partes: contenido duplicado externo y contenido duplicado interno.

Fuente imagen: Seomoz

Contenido duplicado externo

Se produce cuando el contenido de nuestra web se reproduce en otras webs. El problema es evidente, puede suceder que esas webs aparezcan en los buscadores por encima de nosotros, o incluso en casos extremos (si hay múltiples copias) que la URL de nuestro contenido no aparezca.

Maneras de evitarlo

  • Prohibir la utilización de nuestro contenido y no utilizarlo en ningún otro sitio que no sea nuestra web. Resulta evidente que así solucionaríamos de raíz el problema, pero parece bastante claro que eso, muchas veces, escapa totalmente de nuestro control y que por otro lado nos impide beneficiarnos de una difusión que nos puede interesar por diversos motivos.

Ya que esta primera sugerencia es difícilmente viable, mis consejos serían:

  • Publicar siempre en primer lugar el contenido en nuestra web
  • Utilizar el tag rel=author que veíamos en este artículo: seo y Google +
  • Intentar que todas las copias externas tengan un enlace hacia el contenido original

Contenido duplicado interno

Se produce cuando varias URLs de nuestra web sirven el mismo contenido. Google ha declarado reiteradamente que eso es perjudicial. Por lo que debemos evitarlo a toda costa. Hay muchos motivos que pueden provocar esta duplicación, veamos a modo ilustrativo algunos de ellos:

  • URLs que utilizan parámetros (por ejemplo los típicos tags UTM utilizados por Google Analytics para identificar campañas)
  • URLs con sesiones de usuario
  • Versiones para imprimir (printer friendly pages)
  • Utilización simultanea de URLs con www y sin www…

¿Qué podemos hacer al respecto?

No existe una respuesta única, ya que dependerá del motivo causante de la duplicidad. Veamos algunas soluciones típicas:

  • En primer lugar, evidentemente, intentar a nivel de programación evitar las duplicaciones, por ejemplo no utilizando sesiones de usuario.
  • Utilizar las llamadas URLs canónicas. El propio Google nos dice como hacerlo:

“¿Cómo puedo especificar una URL canónica?

Puedes especificar una URL canónica de dos formas diferentes:

  • Puedes añadir un elemento de enlace rel="canonical" a la sección <head> de la versión no canónica de las páginas HTML.Para especificar un enlace canónico a la página http://www.example.com/product.php?item=swedish-fish, crea un elemento <link>tal como se indica a continuación:
    <link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish"/>

    Copia este enlace en la sección <head> de todas las versiones no canónicas de la página como, por ejemplo, http://www.example.com/product.php?item=swedish-fish&sort=price.

    Si publicas contenido tanto en http://www.example.com/product.php?item=swedish-fish como en https://www.example.com/product.php?item=swedish-fish, puedes especificar la versión canónica de la página. Crea el siguiente elemento <link>:

    <link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish"/>

    Añade este enlace a la sección <head> de la página https://www.example.com/product.php?item=swedish-fish.

  • Responde con el encabezado HTTP Link rel="canonical" para indicar la versión canónica de una URL. Si añades rel="canonical" a la sección head de una página, resulta de utilidad para el contenido HTML, pero no se puede usar en los archivos PDF y en otros tipos de archivo indexados por la Búsqueda web de Google. En estos casos, puedes indicar una URL canónica respondiendo con el encabezado HTTPLink rel="canonical", como se muestra a continuación (ten en cuenta que, para utilizar esta opción, deberás poder configurar tu servidor).
    Link: <http://www.example.com/descargas/libro-blanco.pdf>; rel="canonical"

Podéis leer el resto del contenido en esta URL.

  • Si por cualquier motivo no podemos acceder al head de las páginas duplicadas, debemos intentar que los links que apuntan a la página principal utilicen el tag rel="canonical" , ello ayudará a los buscadores a distinguir dicha página. Es decir los links serán del tipo <link rel=”canonical” href=”http://www.example.com/page.html”>
  • Hacer una redirección 301 de una de las versiones www o no www, a la otra.
  • Ya para finalizar, vamos a ver el caso específico de cuando utilicemos los tags utm de Google analytics. En primer lugar, deberemos examinar si los buscadores están indexando este tipo de páginas, para ello efectuaremos la siguiente búsqueda:

site:example.com inurl:utm_source

Si vemos que aparecen resultados, debemos proceder a eliminarlos, para ello utilizaremos lo expuesto anteriormente sobre los enlaces con el tag “canonical” para identificar la página principal (sin parámetro) y además, aunque sólo sea para Google, iremos al WebmasterTools, y aplicaremos lo expuesto en este interesante artículo: Managing URL Parameters

“Log into Google Webmaster Tools.

Managing URL Parameters in Google Webmaster Tools

Configuration > URL Parameters

If you don’t see the campaign tracking URL parameter already on the list, choose Add parameter.

Add the parameter you wish to prevent crawling/indexing. In this example, we’ve used utm=source. Select No from the drop down list because your campaign tracking URLs do not change the content that is seen by the visitor- they are just for tracking.”

 

Tweet about this on Twitter49Share on Facebook0Share on Google+6Share on LinkedIn28Pin on Pinterest0
<< Post Anterior
Post Siguiente >>

Leave A Response

* Denotes Required Field