Contenido duplicado – Herramientas y consejos para detectarlo

Si tienes un Blog, tienes contenido duplicado

¿Qué es el contenido duplicado?

El contenido duplicado normalmente hace referencia a fragmentos de contenidos en varios dominios que coinciden totalmente o que son muy similares. En la mayoría de los casos, este contenido se produce sin que nos percatemos de ello.

El contenido duplicado es uno de los lastres más incómodos que pueden tener cualquier sitio web y que pueden afectar negativamente a tu SEO. Si tienes un blog en Wordpress te diré que hay 1001 formas de que estés acumulando contenido duplicado.

Piensa que en Wordpress es muy fácil que te aparezca más de un contenido con toda la pinta de ser duplicado, o lo que es lo mismo, si tienes un  Blog deberás prestar especial atención a mantener a raya todo el contenido que tengamos duplicado para que no afecten negativamente a tu posicionamiento en buscadores.

Evita siempre el duplicado de contenidos porque es nefasto para el SEO

Con este post lo que pretendo es acabar definitivamente con el contenido duplicado de cualquier Blog o sitio web, y sentar unas buenas bases para tratar de mantenerlo en el futuro siempre a raya.

Empezaremos con algo muy sencillo y que constituyen aspectos básicos de una buena configuración de nuestro blog para evitar la aparición del tan poco deseado contenido duplicado.

13 consejos básicos para eliminar el contenido duplicado

1.- URL Canónica. Elige el dominio que vas a utilizar con o sin www, y comunícaselo a Google a través de Google Webmaster.  Recuerda que debes añadir el sitio con y sin www y validar la propiedad de ambos dominios, para que de este modo te permita elegir entre uno de los dos. Este es la forma más común de generar contenido duplicado, y una de las más nefastas para el SEO.

google webmaster

Podéis hacer una prueba para ver si la URL es canónica haciendo una búsqueda en Google con “site:nombre-de-domino.extension”, tal y como podemos ver en la imagen, pero utilizando el formato que no hemos elegido, en mi caso sin las 3 www.

contenido duplicado

2.- Un único editor. Si eres el único editor de tu blog tienes que saber que estás generando información duplicada, esto se puede corregir fácilmente si marcamos la casilla de autor “noindex, follow”, y de esta forma le decimos al buscador que no indexe esta página. Sólo tienes que hacerlo si el blog está gestionado por un único autor.

3.- Mal uso e indexación de las etiquetas. Tienes que saber que las etiquetas no te van a ayudar en el posicionamiento de tu Blog, así que utilízalas lo menos posible, y siempre y cuando sea estrictamente necesario.

Lo ideal es puedas definir unas 20 o 25 etiquetas, donde el marketing de contenidos que realices estén relacionados con algunas de estas.

Un error muy habitual en el mal uso de las etiquetas es tener de 50 a 100 etiquetas con un o dos artículos por etiqueta, lo cual no tiene ningún sentido.

4.- Una estructura de enlaces internos poco coherente. 

5.- Contenido duplicado en más de una página. También se trata de un error muy habitual, que ocurre al utilizar un contenido parcial o totalmente en varias páginas de nuestro Blog. Esto lo debemos evitar siempre ya que puede perjudicarnos en las SERP (SEO).

6.- Categorías sin Metas. Las categorías son siempre las grandes olvidadas de un Blog, nadie se para a introducir una descripción, ni mucho menos el Meta Title y la Meta Description, y esto nos puede generar contenido duplicado.

7.- Páginas de una misma categoría.  Para solucionarlo puedes utilizar los atributos de HTML rel=”next” y rel=”prev” para señalar la relación existente entre direcciones URL concretas, es lo que se conoce como contenido paginado.

En el siguiente vídeo te explica cómo funciona:

8.- Meta Title Duplicado. Este es uno de los casos más habituales de encontrar este contenido debido a que más de una url utilizan el mismo Meta Title.

9.- Meta Description Duplicado. Al igual que el anterior, es bastante frecuente, y debemos solucionarlo escribiendo una descripción única para cada elemento que indexemos en el buscador.

10.- No indexes lo que consideres poco relevante de tu Blog. Si marques la casilla de nofollow en aquellos elementos que no tienen importancia en nuestro blog, estarás reduciendo en gran parte las posibilidades de generar contenido duplicado.

11.- Contenido duplicado extraído de un tercero. Es aquel contenido que copiamos parcialmente de otras web y lo publicamos en nuestro blog, debemos evitarlo siempre que nos sea posible.

12.- Sindicación. El problema lo tenemos cuando enviamos nuestros contenidos para que se publiquen por RSS en otros sitios y en lugar de publicarse de forma parcial se hace de forma total.

13.- Plagio de nuestro Blog. Para resolver alguien que nos plagia un contenido totalmente lo que podemos hacer es enviarle un email para que elimine el contenido o para que ponga un enlace, esto ayudará al buscador a detectar el contenido original.

Si ha transcurrido un tiempo razonable y no recibes ninguna respuesta, puede solicitar a Google que elimine la página infractora presentando una solicitud basada en la ley estadounidense de protección de los derechos de autor (Digital Millennium Copyright Act, DMCA).
 

¿Cómo detectar el contenido duplicado?

Detectar cuantos contenidos tenemos duplicados en nuestro blog es una tarea difícil y para la cual obligatoriamente necesitaremos apoyarnos en herramientas que nos ayuden a encontrarlo.

En este post me centraré en explicar sólo herramientas gratuitas, aunque mencionaré sólo de pasada algunas de pago que son muy interesantes.

[message type=”normal” background_color=”#38a0ee”]

¿Cuáles son las mejores herramientas para analizar el contenido duplicado de un Blog?

[/message]

Explicaré pocas pero muy efectivas herramientas que permitan analizar nuestro Blog en busca de este dichoso contenido. Sigue y por orden cada una de estas herramientas:

1.- Virante Tools

Esta herramienta online nos permitirá detectar algunos aspectos básicos que debe cumplir nuestro blog para no tener duplicado nuestro contenido.

duplicate content

Lo ideal es que te aparezcan todos los check en verde, en el caso de que te aparezca algún indicador en rojo nos indica que tenemos trabajo por delante para corregir el error.

Si te marca el primer indicador en rojo, eso indica que la URL no es Canónica y no has elegido un formato preferido de URL, para corregirlo vuelve al consejo 1 de este post.

Una URL Canónica sin configurar es el error más grave para generar contenido duplicado

2.- Google Webmaster

La herramienta Webmaster de Google nos puede ayudar a localizar parte de este contenido en nuestro Blog. Para ello dirígete al apartado “Aspectos de la búsquedas > Mejoras de HTML”.

contenido duplicado webmaster

En este ejemplo podemos encontrar 4 metadescripciones duplicadas y 6 etiquetas con el título duplicado.

3.- Screaming Frog

Es una de las herramientas más completas para analizar y detectar errores y contenidos duplicados en nuestro Blog.

Puedes utilizar la versión gratuita que permite analizar hasta 500 URLs, aunque no podrás configurar las variables que quieres analizar.

4.- SiteLiner

siteliner

Esta herramienta online detectará  el contenido duplicado de nuestra web, así como los elementos comunes que utilizamos por ejemplo en las barras laterales, menús  y pie de página.

tool duplicate content

Su aspecto es muy visual y la versión gratuita te permitirá analizar hasta 250 páginas.

En mi caso me dice que tengo un 6% de contenido duplicado.

¿Qué cantidad os da como resultado a vosotros? 

5.- SEMrush

Es una fantástica herramienta SEO que ha incluido recientemente una completa auditoría SEO de nuestro sitio web y nos puede decir también el contenido duplicado del mismo.

[message type=”normal” background_color=”#38a0ee”]

Herramientas para detectar quién plagia nuestros contenidos

[/message]

Copyscape

copyscape

Esta herramienta permitirá encontrar los sitios web que están plagiando nuestros contenidos. Hay que tener en cuenta que un mal uso de la forma que se plagia el contenido puede llegar a ser negativo para nosotros y que el buscador nos penalice, por lo que debemos analizar cada cierto tiempo los blogs o sitios web que no están plagiando para poder detectar si el contenido se ha publicado correctamente o si tenemos que sugerir una modificación u eliminación del contenido.

Otras herramientas para detectar contenido duplicado:

DuplicheckerPlagiarismaPlagium y Similar Page Checker

Recursos adicionales:

Consejos de Google sobre el contenido duplicado

Presentar un informe de spam:

http://www.google.com/webmasters/tools/spamreport

Si no tienes una cuenta de Webmasters, puedes denunciar al blog aquí:

http://www.google.com/contact/spamreport.html

[message type=”normal” background_color=”#38a0ee”]

Conclusiones

  1. Utiliza títulos y descripciones únicos para cada entrada o página de tu Blog.
  2. El texto de cada página tiene que ser un contenido 100% original.
  3. Incluye en tu sitemap únicamente la versión canónica.
  4. Cuando copies contenido de otro cito, siempre debes citar la fuente.
  5. Dedica una hora a la semana para utilizar detectar y eliminar todas las duplicidades de contenido.
  6. Revisa media hora a la semana a detectar y eliminar los enlaces rotos, ya sean internos o externos.
  7. Recuerda no obsesionarte con reducir al 0% el contenido duplicado, la mayoría de sitios en Internet tienen de un 10 a un 20% de contenido duplicado.

[/message]

Infografía: maricarmenmas.com

¿Qué herramienta utilizas para detectar y eliminar el contenido plagiado?

Dime si utilizas otras herramientas para combatir el contenido duplicado.

Si te ha gustado el artículo, puedes compartirlo con un amigo/a

Facebook
Twitter
LinkedIn

Artículos que pueden interesarte...

13 comentarios

  1. Yo la verdad es que en este caso soy de usar copyspace
    Será porque me estoy haciendo viejo y esta es de las primeras que salió.
    Un saludo Miguel

    1. Jajaja, pues yo utilizo copyscape, que como dices es la más clásica, pero una herramienta efectiva para localizar a los spamers de blogs.

      Aunque también utilizo Screaming Frog y SEMrush, dos herramientas espectaculares, la primera para usarla de forma manual y la segunda para programar semanalmente una auditoría de los errores y el contenido duplicado.

      Muchas gracias por tu comentario Fernando, pásate de nuevo cuando quieras.

      Un saludo

  2. Hola Mónica,

    En la siguiente url encontrarás las formas de verificar la propieda de un sitio web, lo puedes hacer de 2 formas, añadiendo un código de seguimiento o subiendo un archivo de verificación a la raíz de tu dominio.

    1. Wow! qué rapidez! jeje.
      Muchas gracias, ya vi que se podía de dos maneras, y es que ya lo tengo subido en el dominio con www, pero luego sin www no me aparece ni la opción. Es como si al hacerlo ya una vez, esa página en Webmasters Tools no me apareciera. No lo entiendo :S
      A ver si puedo solucionarlo. Muchas gracias.
      Un saludo!

      1. Hola Mónica, el proceso de añadir una web con o sin www es el mismo. Tienes que hace clic en añadir sitio e introducir la url que quiere añadir y verificar. Entiendo que pueda resultar algo confuso añadir el sitio dos veces pero es la única forma que Google Webmaster te deja seleccionar tu preferencia en el formato de la URL.

        Un saludo y gracias por volver a preguntar de nuevo

  3. a mí me da un contenido duplicado del 37 %, debo de tener algo mal porque me da 111 resultados de contenido duplicado y sólo tengo 50 posts.
    Muchas gracias por el artículo

    1. Hola Mónica,

      No solo se indexan los post, también lo hace las categorías, tags, y otros elementos como las páginas de autor u otras páginas. Este porcentaje es muy alto y tienes que tratar de reducirlo por debajo del 20%.

      Un saludo

  4. Hola Miguel, excelente artículo. Me permito hacerte una pregunta: en el caso de mi ecommerce, yo cambio un par de palabras, pero la ranita (screaming frog) me dice Hey! Duplicated!, tu que opinas? Gracias de Antemano.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Responsable: Miguel Ángel Florido Robledo
Finalidad: Gestión de los comentarios de las publicaciones
Legitimación: Consentimiento del interesado
Destinatarios: Los datos no se cederán a terceros salvo en los casos en que exista una obligación legal. Los boletines electrónicos o newsletter están gestionados por entidades cuya sede y servidores se encuentran dentro del territorio de la UE
Derechos: Acceder, rectificar y suprimir los datos, así como otros derechos, como se explica en la información adicional.

Hola, soy Miguel Florido, consultor de Marketing Digital y Social Media.

Creador del Blog Marketing and Web, un blog humilde y sencillo que poco a poco se ha abierto un hueco entre los blogs de referencia del marketing digital en España.

ACCEDE GRATIS A 4 CLASES DEL MÁSTER DE MARKETING DIGITAL