Curtido en mil batallas y perseguido por webmasters y propietarios de sitios web, el contenido duplicado proyecta una sombra demasiado alargada.

Ese enemigo incómodo aparece cuando menos se le espera bien por despiste, desconocimiento, sin olvidar a quienes optan por este recurso para adueñarse de lo ajeno con claras intenciones maliciosas.

Por su relevancia y efectos, Isabel López – directora SEO de Webpositer Agency – te explica en el vídeo que encabeza este artículo qué es el contenido duplicado, buenas prácticas para combatirlo y ejemplos para evitar esa duplicidad que afecta de pleno a tu posicionamiento web.

¿Qué es el contenido duplicación? Definición del concepto

El contenido duplicado hace referencia a aquel contenido que se repite de forma íntegra o parcial en varias páginas de un mismo dominio o incluso de dominios externos.

En multitud de ocasiones, consideramos que es en otros dominios donde hallamos esa duplicidad de contenido, pero ya te avanzamos que por experiencia el mayor porcentaje de contenido duplicado de una web se encuentra en el propio sitio web.

De este modo, diferenciamos diversas modalidades de contenido duplicado según su alcance:

  • 100% duplicado. Un calco perfecto, exactamente el mismo contenido pero solo manteniendo una diferencia, la URL.
  • Duplicación parcial. El contenido es idéntico, pero varía la disposición de los elementos o las imágenes, además de la URL. No obstante, como se ha señalado, son diferencias mínimas.
  • Contenido duplicado entre dominios. La duplicidad puede darse tanto dentro de nuestra web como fuera de ella. En este caso, resulta evidente que la dirección de las páginas sea distinta, pero el contenido original de la web creadora se ha copiado y pegado todo o parte en otros dominios.

Cómo afecta la duplicidad de contenido al SEO de una web

tipos-contenido-duplicado

Google conoce si un contenido es original o, por el contrario, está ante un duplicado bien interno o procedente de otra web.

Por norma general, la duplicidad de contenido daña la aparición de una web en los resultados de búsqueda de Google porque considera que está ofreciendo una respuesta de baja calidad al usuario.

Al mismo tiempo, este tipo de prácticas acaba generando la penalización por parte del algoritmo Google Panda, que veremos reflejada en descensos de la visibilidad del proyecto en Sistrix.

Asimismo, debemos añadir una tercera consecuencia: recibir una denuncia manual por plagio a través de Google Search Console.

Para evitar estas tres situaciones, quédate con este consejo: «aquello que es bueno para el usuario, también lo será para el buscador».

Porque un contenido duplicado es innecesario para el usuario – ¿quién quiere ver cientos de veces lo mismo? – y además los buscadores lo engloban dentro de las malas prácticas, como detalla en su Search Quality Evaluator Guidelines.

2 formas sencillas de detectar si tu web cuenta con contenido duplicado

  • Escoge parte de un texto y cópialo y pégalo entrecomillado en el buscador. Si muestra más resultados de búsqueda que coincidan con ese texto, contarás con duplicidad de contenidos.
  • Herramientas de pago como Safecont o Screaming Frog también ayudan en la detección de contenido duplicado.

Sigue leyendo:

Puntos de atención para evaluar la calidad SEO de una web según Google


Tipos de contenido duplicado

Una vez que conocemos más de cerca qué es el contenido duplicado, ahora llegó el momento de identificar sus variedades para tratar de dar con la solución a este problema.

Contenido duplicado EXTERNO

Aquí diferenciamos dos posibilidades:

  • Duplicidad involuntaria. En esta tipología encontraríamos ese contenido que alguien copia de tu web o tú te adjudicas de otro sitio web.
  • Duplicidad voluntaria. Un ejemplo de contenido duplicado habitual en tiendas online es utilizar los textos realizados por el distribuidor de ciertos productos dentro del ecommerce. En este caso, lo recomendable sería indicar al usuario quién es el autor o fuente original de ese contenido (el distribuidor).

De igual modo, si generas contenido y otros usuarios deciden publicarlo en su web, debería incorporarse una cita en ese sitio web que mencione al autor de ese texto.

Contenido duplicado INTERNO

En este punto, la duplicidad de contenido se halla dentro de nuestro sitio web siendo estos 6 los principales problemas:

  1. Falta de definición del dominio con y sin tres uves dobles
  2. Zona de pruebas disponible para el rastreo e indexación por parte de Google.
  3. Parámetros de búsquedas y filtros de ordenación pueden acabar generando contenido duplicado si no optamos por su bloqueo.
  4. Contenido casi idéntico entre la versión mobile m.dominio.com y la de escritorio, cambiando solo la disposición de los elementos para su óptima adecuación a dispositivos móviles.
  5. Creación de varias fichas de un producto, diferenciando solo por talla o color, pero manteniendo igual el resto de contenido.
  6. Duplicidad de contenidos de webs internacionales, es decir, el contenido idéntico en un único idioma se muestra en las diferentes versiones geográficas de un mismo sitio web.

Cómo solucionar el contenido duplicado ante estos 6 problemas frecuentes

solucion-problemas-duplicidad-contenidos

Ahora que conoces los casos más comunes de duplicidad de contenido, pasamos a recoger las recomendaciones que Isabel da en el vídeo para resolverlos.

Solución 1 – Duplicidad con tres uves dobles

En este punto, identifica la cantidad de URL que tu dominio tiene indexadas en Google tanto con tres uves dobles como sin ellas.

Asimismo, debes determinar cuál de esos dos dominios es el que más te interesa establecer como preferido.

Una vez elegido, realiza una redirección 301 del secundario al principal y habrás resuelto este problema de duplicidad de contenido.

Solución 2 – Zona de pruebas

Si no bloqueas el acceso de Google a esa versión de pruebas de tu web sobre la que estás realizando cambios, acabará rastreando e indexando un sitio web que es prácticamente idéntico a la versión principal, generando un importante problema de duplicidad.

Siempre que generes un entorno de pruebas, recuerda bloquearlo en el archivo robots.txt para que Google no lo tenga en consideración.

Solución 3 – Parámetros de búsqueda y filtros de ordenación

A través de Google Search Console, puedes analizar el índice de cobertura de una web y conocer la cantidad de URL que se están indexando y posicionando mediante filtros y parámetros.

A partir de ahí, podrás extraer un listado de URL para saber si esos filtros y parámetros están canibalizando o duplicando ese contenido con la categoría principal.

En este caso, la forma de solucionar esta duplicidad de contenido pasa por establecer un «noindex» a esos parámetros y filtros, además de bloquearlos en robots.txt.

Solución 4 – Versión móvil m.dominio.com

Para evitar duplicidades, siempre debes apuntar la canonical de la versión AMP de tu web a la canonical de la versión de escritorio.

Solución 5 – Fichas de producto

Te recomendamos que no crees diferentes páginas con el mismo contenido solo en función de la diversidad de tallas o colores de un mismo producto.

En este caso, pon solución a este problema de duplicidad en fichas de producto identificando la URL más relevante de todas esas variables por motivos de tráfico web, ventas o incluso porque dispongas de más stock de ese artículo.

Una vez hallada, la canonical del resto de combinaciones debería apuntar a la URL establecida como preferente.

En estos casos la acción correcta pasaría por generar una sola URL por producto, donde en la información facilita integre datos sobre el color y las tallas.

Solución 6 – Webs de diferentes idiomas

Si tu web cuenta con varios idiomas, debes utilizar la etiqueta hreflang para que Google sepa de esa disponibilidad y además identifique dónde están las versiones multidiomas de la web.

Además de la implementación de este etiquetado, es importante definir la canonical en esos idiomas para evitar el contenido duplicado.

Por ejemplo, si el contenido que aparece en la versión italiana de la web es el mismo que el que muestra la de español, al margen del etiquetado hreflang, la canonical del sitio web en italiano debe apuntar a la versión en español que es donde se halla el contenido original.


Este vídeo te interesa:

¿Qué es la etiqueta hreflang y cómo se utiliza en SEO?


Conclusión

Isabel lo cita en el vídeo y con razón. En multitud de ocasiones, oímos «contenidos duplicado» y lo atribuimos en exclusiva a otras webs que han copiado texto de nuestro site.

Sin embargo, tras leer cada una de las líneas de este artículo, habrás comprobado que tu propia web puede disponer de contenido duplicado que está perjudicando el crecimiento SEO de tu proyecto y no le has puesto solución.

Esperamos que ahora te resulte más sencillo identificar esos problemas y, lo más importante, atajar de raíz esas duplicidades que debilitan a tu negocio online.