Curtido en mil batallas y perseguido por webmasters y propietarios de sitios web en todo el mundo, el contenido duplicado proyecta una sombra demasiado alargada. Ese enemigo incómodo aparece cuando menos se le espera bien por despiste, desconocimiento, sin olvidar a quienes optan por este recurso para adueñarse de lo ajeno con claras intenciones maliciosas. No le tengas miedo. Conoce bien a tu adversario y gánale la partida haciendo de las reglas del buen SEO tu aliado más fiel y efectivo.

Tras el capítulo centrado en detallar y aportar soluciones a los problemas de indexación más habituales, en Webpositer nos hemos propuesto identificar todos aquellos “males” que tanto dañan el constante trabajo de optimización realizado sobre un sitio web. Desgraciadamente, por su relevancia y efectos hoy centramos toda la atención en definir qué es el contenido duplicado y mostrar algunas de las fórmulas para combatirlo, completando en dos próximas entregas todo el universo que rodea a la duplicidad de contenidos.

Por mucho que se hable de él, por más advertencias que se ofrezcan, continúa siendo esa suerte de invitado incómodo que siempre se deja ver. ¿Por qué? Desde las Directrices de Calidad para Webmasters de Google se dice muy claro: “No crees páginas, subdominios o dominios que presenten básicamente contenido duplicado”.

Es más, en febrero de 2011 el algoritmo de Google Panda dio sus primeros pasos persiguiendo mejorar al máximo la calidad y relevancia de los resultados ofrecidos a los usuarios en sus búsquedas, siendo el contenido original un elemento básico en esta cruzada.

Pasaron varios meses, entre pruebas y actualizaciones del algoritmo hasta que, en 12 de agosto de 2011 en el blog oficial de Google se anuncia que Panda afectaría a las búsquedas realizadas en cualquier idioma. Sus efectos afectaron a los resultados de aquellas webs que, a ojos de Google, practicaban unas reglas de juego dudosas. ¿Un ejemplo mayúsculo? El contenido duplicado.

En estas líneas vamos a diseccionar a este gran adversario porque, reinterpretando el dicho popular, si quieres vencer a tu enemigo, conócele bien y desármale. No solo descubrirás qué es el contenido duplicado, sino que te proponemos buenas prácticas para combatirlo, ejemplos para verlo todo más claro y herramientas que sacarán de ti ese Sherlock Holmes en busca del SEO dañino. ¡No perdamos más tiempo!

¿QUÉ ES EL CONTENIDO DUPLICADO? Tipología de un gran enemigo

Si dentro de tu web existen bloques de contenido iguales o que coinciden muchísimo entre sí, hablamos de contenido duplicado. Asimismo, cuando hallas contenido original de tu web en su totalidad o parcialmente publicado en otros dominios, hablamos de contenido duplicado.

Cont_dupl_parte1_img1

Clases de Contenidos Duplicados. Encontrando las diferencias.

  • 100% duplicado. Un calco perfecto, exactamente el mismo contenido pero solo manteniendo una diferencia, la URL.
  • Duplicación parcial: El contenido es idéntico pero varía la disposición de los elementos o las imágenes, además de la URL. No obstante, como se ha señalado, son diferencias mínimas.
  • Contenido duplicado entre dominios. La duplicidad puede darse tanto dentro de nuestra web como fuera de ella. En este caso, resulta evidente que la dirección de las páginas sea distinta pero, el contenido original de la web creadora se ha “copiado y pegado” todo o parte en otros dominios.

En la mayoría de los casos, la duplicidad de contenidos no tiene un ingrediente de engaño en su esencia. De hecho, como veremos más adelante, se puede solventar con una óptima canonicalización entre otras prácticas. Pero, seamos sinceros, las malas intenciones aunque nos cueste admitirlo acompañan al género humano y, al igual que en la vida, en el SEO tienen acto de presencia. Cuando Google detecta que el contenido duplicado se emplea de forma malintencionada para manipular el listado de resultados del buscador u obtener más tráfico, entiende que esa praxis está perjudicando la experiencia de navegación del usuario.

Ante un caso de contenido duplicado, Google se decanta por escoger la versión, a su juicio, más adecuada. Pero, en esa revisión, el gran buscador puede llegar incluso a la eliminación de una web del ranking de resultados. ¿Qué hacer en estos casos? Primero revisar que tu web se está portando bien y, si se está seguro, entonces envía una solicitud de reconsideración a Google para que valore de nuevo tu web.

Cont_dupli_parte1_Solicitud_reconsideración

Google ya anunció en 2008 que no penaliza a nadie por tener contenido duplicado dentro de un sitio web. Hasta aquí todo bien, pero la ausencia de castigo para la duplicidad de contenido no quiere decir que dicha práctica no afecte al posicionamiento de la web. Sus efectos llegan y actuar con determinación y eficiencia será crucial.

¿QUÉ ME PASA, DOCTOR SEO? 6 Tratamientos para evitar el contenido duplicado (Primera parte)

Probablemente tengas alguna afición o hobby al que dediques parte de tu tiempo libre. Para conocer más sobre él, compras revistas del sector o bien sigues webs de referencia. ¿Qué pasaría si un día vas al quiosco, compras los últimos números de dos publicaciones y, al abrirlas, descubres que hay artículos iguales o muy parecidos? ¿Y si lo mismo sucede al visitar sus sites? Seguramente te sentirás engañad@, además de los efectos negativos que esa actuación tendría para esa revista entre su audiencia.

En el mundo online sucedería igual. Entonces, te recomendamos que tengas siempre presente este consejo: Algo bueno para el buscador, también lo será para el usuario (y viceversa). Un contenido duplicado es innecesario para el usuario – ¿quién quiere ver cientos de veces lo mismo? – y además los buscadores lo engloban dentro de las malas prácticas. Porque dos razones valen más que una, toma nota de las técnicas que presentamos a continuación para combatir la duplicidad de contenido. Tu web y los usuarios te lo agradecerán y Google sabrá recompensar tu esfuerzo.

1-. Error 404 (Not Found).

Drástica donde las haya, esta medida supone cortar por lo sano. Si quieres que una página de tu web con contenido duplicado ya no sea vista por el usuario, ni indexada y tampoco deseas que los robots sigan sus enlaces, se puede eliminar directamente. Pero hay soluciones menos radicales que te permitirán reorientar esas páginas y darles un uso efectivo acorde a las reglas del SEO.

2-. Redireccionamientos 301.

¿Has hecho recientemente una reestructuración de tu web? Gracias al uso de la redirección 301 en el archivo .htacess le comunicamos tanto a los usuario, a Googlebot como a las arañas que esa página se ha trasladado de forma permanente a otro lugar. Muy recomendable en la esfera SEO, la autoridad del enlace entrante se transfiere de la anterior página a la nueva redirigida. No obstante, un uso excesivo de este tipo de redireccionamientos puede sobrecargar el servidor y aumentar el tiempo de carga de una página.

3-. Etiqueta rel=canonical

Este elemento le indica a Google cuál es la página preferida –canónica – de entre un conjunto de páginas con contenido duplicado o muy similar. Su efectividad es máxima además de contar con el beneplácito de Google y otros buscadores. Para conocer y poner en práctica esta útil herramienta, te instamos a consultar el artículo Los mejores amigos del SEO: La etiqueta rel canonical donde se analiza en profundidad.

4-. Desindexación.

Con la etiqueta Meta Robots, la duplicidad de contenido cuenta con una buena aliada. Ahora te indicamos las diferentes acciones que puedes comunicar a los robots de Google con unos sencillos pasos:

  • Si deseas que una página con contenido duplicado ni se indexe ni se sigan sus enlaces: <meta name=”robots” content=”noindex,nofollow”>
  • Para que una página con contenido idéntico o muy similar a otra no se indexe pero sí deseas que se sigan sus enlaces: <meta name=”robots” content=”noindex,follow”>
  • Si queremos que Google indexe esa página pero sin seguir los enlaces: <meta name=”robots” content=”index,nofollow”>

5-. Archivo robots.txt

Este archivo ayuda a evitar la indexación del contenido por parte de Google. Haciendo un pequeño cambio en el fichero, podemos bloquear desde carpetas enteras a parámetros de las URL – lo veremos más adelante -, aunque es una medida algo extrema que, si se hace rápidamente, puede tener consecuencias importantes. Pongamos un ejemplo. Si deseamos cerrar el paso a que Google indexe una carpeta de mi web – las etiquetas – donde hay duplicidad de contenido, lo indicaríamos en el archivo robots.txt del siguiente modo:

User-agent: *

Disallow: /tags

No obstante, a ojos del todopoderoso Google, impedir el acceso para rastrear el contenido de un sitio web por esta vía no se halla entre sus medidas recomendadas. Google pone a nuestro alcance soluciones como los redireccionamientos 301, la etiqueta rel=canonical o la herramienta de organización de parámetros de URLs que tratamos ahora mismo.

6-. Bloqueo de parámetros de URLs.

En ocasiones, es habitual encontrarnos que un site genera con un mismo contenido URLs con parámetros diferentes. Se identifican 2 tipos de parámetros de URL distintos:

  • Parámetros que no cambian el contenido de una página (sessionid/affiliateid). Estos indicadores ayudan a seguir las visitas y las páginas de referencia, no afectan al contenido de la página pero dirigen continuamente al mismo contenido duplicado. Unos ejemplos:
  1. http://www.estoesunejemplo.com/mujer/pantalon?sessionid=1237
  2. http://www.estoesunejemplo.com/mujer/pantalon?affiliateid=4785
  • Parámetros que modifican o determinan el contenido de una página. Estos parámetros ayudan a que el contenido aparezca:
  1. Ordenado: sort=prize_ascending
  2. Limitado: t-shirt_size=XL
  3. Especificado: store=hombre
  4. Traducido: lang=it
  5. Paginado: page=3

Desde Google, nos recomiendan el uso de la herramienta para organizar los parámetros de las URLs, indicando la finalidad de los mismos y especificando cuáles de esos parámetros se desean que sean ignorados. Para ello, solo hemos de acudir al panel de Herramientas para Webmasters de Google y seguir la ruta Configuración del sitio/Parámetros de Bloqueo.

¿Qué te ha parecido este primer recorrido por el siempre alarmante mundo del contenido duplicado? Pero no pienses que aquí ha acabado todo. La próxima semana completaremos el listado de tácticas para evitar el contenido duplicado con ejemplos prácticos, finalizando esta serie de artículos con una tercera entrega donde hablaremos del robo de contenidos y herramientas imprescindibles para la detección de contenidos plagiados. ¡Éste es solo el comienzo y nos gustaría que nos sigas hasta el final!

Todos sabemos el trabajo que hay detrás de la obtención de estas pequeñas victorias que, sumadas una a una, hacen grande y real nuestro proyecto online. Evita que el contenido duplicado tanto en tu página como el plagio en otros dominios frene el crecimiento de tu web y haz gala de tu olfato sabueso. Actúa, pon en práctica estos puntos y, ante cualquier duda, ya sabes dónde encontrarnos. Elemental, queridos usuarios.

Artículos Relacionados:

Los mejores amigos del SEO: El Título

Los mejores amigos del SEO: La Description

Los mejores amigos del SEO: La etiqueta rel=”canonical”

Los mejores amigos del SEO: Las palabras claves o keywords

Los mejores amigos del SEO: Herramientas para Webmasters de Google

Los mejores amigos del SEO: Google Analytics

Los peores enemigos del SEO: Los problemas de indexación

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (Ninguna valoración todavía)
Cargando…