Curtido en mil batallas y perseguido por webmasters y propietarios de sitios web en todo el mundo, el contenido duplicado proyecta una sombra demasiado alargada. Ese enemigo inc√≥modo aparece cuando menos se le espera bien por despiste, desconocimiento, sin olvidar a quienes optan por este recurso para adue√Īarse de lo ajeno con claras intenciones maliciosas. No le tengas miedo. Conoce bien a tu adversario y g√°nale la partida haciendo de las reglas del buen SEO tu aliado m√°s fiel y efectivo.

Tras el cap√≠tulo centrado en detallar y aportar soluciones a los problemas de indexaci√≥n m√°s habituales, en Webpositer nos hemos propuesto identificar todos aquellos “males” que tanto da√Īan el constante trabajo de optimizaci√≥n realizado sobre un sitio web. Desgraciadamente, por su relevancia y efectos hoy centramos toda la atenci√≥n en definir qu√© es el contenido duplicado y mostrar algunas de las f√≥rmulas para combatirlo, completando en dos pr√≥ximas entregas todo el universo que rodea a la duplicidad de contenidos.

Por mucho que se hable de √©l, por m√°s advertencias que se ofrezcan, contin√ļa siendo esa suerte de invitado inc√≥modo que siempre se deja ver. ¬ŅPor qu√©? Desde las Directrices de Calidad para Webmasters de Google se dice muy claro: “No crees p√°ginas, subdominios o dominios que presenten b√°sicamente contenido duplicado”.

Es m√°s, en febrero de 2011 el algoritmo de Google Panda dio sus primeros pasos persiguiendo mejorar al m√°ximo la calidad y relevancia de los resultados ofrecidos a los usuarios en sus b√ļsquedas, siendo el contenido original un elemento b√°sico en esta cruzada.

Pasaron varios meses, entre pruebas y actualizaciones del algoritmo hasta que, en 12 de agosto de 2011 en el blog oficial de Google se anuncia que Panda afectar√≠a a las b√ļsquedas realizadas en cualquier idioma. Sus efectos afectaron a los resultados de aquellas webs que, a ojos de Google, practicaban unas reglas de juego dudosas. ¬ŅUn ejemplo may√ļsculo? El contenido duplicado.

En estas l√≠neas vamos a diseccionar a este gran adversario porque, reinterpretando el dicho popular, si quieres vencer a tu enemigo, con√≥cele bien y des√°rmale. No solo descubrir√°s qu√© es el contenido duplicado, sino que te proponemos buenas pr√°cticas para combatirlo, ejemplos para verlo todo m√°s claro y herramientas que sacar√°n de ti ese Sherlock Holmes en busca del SEO da√Īino. ¬°No perdamos m√°s tiempo!

¬ŅQU√Č ES EL CONTENIDO DUPLICADO? Tipolog√≠a de un gran enemigo

Si dentro de tu web existen bloques de contenido iguales o que coinciden muchísimo entre sí, hablamos de contenido duplicado. Asimismo, cuando hallas contenido original de tu web en su totalidad o parcialmente publicado en otros dominios, hablamos de contenido duplicado.

Cont_dupl_parte1_img1

Clases de Contenidos Duplicados. Encontrando las diferencias.

  • 100% duplicado. Un calco perfecto, exactamente el mismo contenido pero solo manteniendo una diferencia, la URL.
  • Duplicaci√≥n parcial: El contenido es id√©ntico pero var√≠a la disposici√≥n de los elementos o las im√°genes, adem√°s de la URL. No obstante, como se ha se√Īalado, son diferencias m√≠nimas.
  • Contenido duplicado entre dominios. La duplicidad puede darse tanto dentro de nuestra web como fuera de ella. En este caso, resulta evidente que la direcci√≥n de las p√°ginas sea distinta pero, el contenido original de la web creadora se ha “copiado y pegado” todo o parte en otros dominios.

En la mayor√≠a de los casos, la duplicidad de contenidos no tiene un ingrediente de enga√Īo en su esencia. De hecho, como veremos m√°s adelante, se puede solventar con una √≥ptima canonicalizaci√≥n entre otras pr√°cticas. Pero, seamos sinceros, las malas intenciones aunque nos cueste admitirlo acompa√Īan al g√©nero humano y, al igual que en la vida, en el SEO tienen acto de presencia. Cuando Google detecta que el contenido duplicado se emplea de forma malintencionada para manipular el listado de resultados del buscador u obtener m√°s tr√°fico, entiende que esa praxis est√° perjudicando la experiencia de navegaci√≥n del usuario.

Ante un caso de contenido duplicado, Google se decanta por escoger la versi√≥n, a su juicio, m√°s adecuada. Pero, en esa revisi√≥n, el gran buscador puede llegar incluso a la eliminaci√≥n de una web del ranking de resultados. ¬ŅQu√© hacer en estos casos? Primero revisar que tu web se est√° portando bien y, si se est√° seguro, entonces env√≠a una solicitud de reconsideraci√≥n a Google para que valore de nuevo tu web.

Cont_dupli_parte1_Solicitud_reconsideración

Google ya anunció en 2008 que no penaliza a nadie por tener contenido duplicado dentro de un sitio web. Hasta aquí todo bien, pero la ausencia de castigo para la duplicidad de contenido no quiere decir que dicha práctica no afecte al posicionamiento de la web. Sus efectos llegan y actuar con determinación y eficiencia será crucial.

¬ŅQU√Č ME PASA, DOCTOR SEO? 6 Tratamientos para evitar el contenido duplicado (Primera parte)

Probablemente tengas alguna afici√≥n o hobby al que dediques parte de tu tiempo libre. Para conocer m√°s sobre √©l, compras revistas del sector o bien sigues webs de referencia. ¬ŅQu√© pasar√≠a si un d√≠a vas al quiosco, compras los √ļltimos n√ļmeros de dos publicaciones y, al abrirlas, descubres que hay art√≠culos iguales o muy parecidos? ¬ŅY si lo mismo sucede al visitar sus sites? Seguramente te sentir√°s enga√Īad@, adem√°s de los efectos negativos que esa actuaci√≥n tendr√≠a para esa revista entre su audiencia.

En el mundo online suceder√≠a igual. Entonces, te recomendamos que tengas siempre presente este consejo: Algo bueno para el buscador, tambi√©n lo ser√° para el usuario (y viceversa). Un contenido duplicado es innecesario para el usuario – ¬Ņqui√©n quiere ver cientos de veces lo mismo? ‚Äď y adem√°s los buscadores lo engloban dentro de las malas pr√°cticas. Porque dos razones valen m√°s que una, toma nota de las t√©cnicas que presentamos a continuaci√≥n para combatir la duplicidad de contenido. Tu web y los usuarios te lo agradecer√°n y Google sabr√° recompensar tu esfuerzo.

1-. Error 404 (Not Found).

Dr√°stica donde las haya, esta medida supone cortar por lo sano. Si quieres que una p√°gina de tu web con contenido duplicado ya no sea vista por el usuario, ni indexada y tampoco deseas que los robots sigan sus enlaces, se puede eliminar directamente. Pero hay soluciones menos radicales que te permitir√°n reorientar esas p√°ginas y darles un uso efectivo acorde a las reglas del SEO.

2-. Redireccionamientos 301.

¬ŅHas hecho recientemente una reestructuraci√≥n de tu web? Gracias al uso de la redirecci√≥n 301 en el archivo .htacess le comunicamos tanto a los usuario, a Googlebot como a las ara√Īas que esa p√°gina se ha trasladado de forma permanente a otro lugar. Muy recomendable en la esfera SEO, la autoridad del enlace entrante se transfiere de la anterior p√°gina a la nueva redirigida. No obstante, un uso excesivo de este tipo de redireccionamientos puede sobrecargar el servidor y aumentar el tiempo de carga de una p√°gina.

3-. Etiqueta rel=canonical

Este elemento le indica a Google cu√°l es la p√°gina preferida ‚Äďcan√≥nica ‚Äď de entre un conjunto de p√°ginas con contenido duplicado o muy similar. Su efectividad es m√°xima adem√°s de contar con el benepl√°cito de Google y otros buscadores. Para conocer y poner en pr√°ctica esta √ļtil herramienta, te instamos a consultar el art√≠culo Los mejores amigos del SEO: La etiqueta rel canonical donde se analiza en profundidad.

4-. Desindexación.

Con la etiqueta Meta Robots, la duplicidad de contenido cuenta con una buena aliada. Ahora te indicamos las diferentes acciones que puedes comunicar a los robots de Google con unos sencillos pasos:

  • Si deseas que una p√°gina con contenido duplicado ni se indexe ni se sigan sus enlaces: <meta name=”robots” content=”noindex,nofollow”>
  • Para que una p√°gina con contenido id√©ntico o muy similar a otra no se indexe pero s√≠ deseas que se sigan sus enlaces:¬†<meta name=”robots” content=”noindex,follow”>
  • Si queremos que Google indexe esa p√°gina pero sin seguir los enlaces:¬†<meta name=”robots” content=”index,nofollow”>

5-. Archivo robots.txt

Este archivo ayuda a evitar la indexaci√≥n del contenido por parte de Google. Haciendo un peque√Īo cambio en el fichero, podemos bloquear desde carpetas enteras a par√°metros de las URL ‚Äď lo veremos m√°s adelante -, aunque es una medida algo extrema que, si se hace r√°pidamente, puede tener consecuencias importantes. Pongamos un ejemplo. Si deseamos cerrar el paso a que Google indexe una carpeta de mi web ‚Äď las etiquetas – donde hay duplicidad de contenido, lo indicar√≠amos en el archivo robots.txt del siguiente modo:

User-agent: *

Disallow: /tags

No obstante, a ojos del todopoderoso Google, impedir el acceso para rastrear el contenido de un sitio web por esta vía no se halla entre sus medidas recomendadas. Google pone a nuestro alcance soluciones como los redireccionamientos 301, la etiqueta rel=canonical o la herramienta de organización de parámetros de URLs que tratamos ahora mismo.

6-. Bloqueo de par√°metros de URLs.

En ocasiones, es habitual encontrarnos que un site genera con un mismo contenido URLs con par√°metros diferentes. Se identifican 2 tipos de par√°metros de URL distintos:

  • Par√°metros que no cambian el contenido de una p√°gina (sessionid/affiliateid). Estos indicadores ayudan a seguir las visitas y las p√°ginas de referencia, no afectan al contenido de la p√°gina pero dirigen continuamente al mismo contenido duplicado. Unos ejemplos:
  1. http://www.estoesunejemplo.com/mujer/pantalon?sessionid=1237
  2. http://www.estoesunejemplo.com/mujer/pantalon?affiliateid=4785
  • Par√°metros que modifican o determinan el contenido de una p√°gina. Estos par√°metros ayudan a que el contenido aparezca:
  1. Ordenado: sort=prize_ascending
  2. Limitado: t-shirt_size=XL
  3. Especificado: store=hombre
  4. Traducido: lang=it
  5. Paginado: page=3

Desde Google, nos recomiendan el uso de la herramienta para organizar los parámetros de las URLs, indicando la finalidad de los mismos y especificando cuáles de esos parámetros se desean que sean ignorados. Para ello, solo hemos de acudir al panel de Herramientas para Webmasters de Google y seguir la ruta Configuración del sitio/Parámetros de Bloqueo.

¬ŅQu√© te ha parecido este primer recorrido por el siempre alarmante mundo del contenido duplicado? Pero no pienses que aqu√≠ ha acabado todo. La pr√≥xima semana completaremos el listado de t√°cticas para evitar el contenido duplicado con ejemplos pr√°cticos, finalizando esta serie de art√≠culos con una tercera entrega donde hablaremos del robo de contenidos y herramientas imprescindibles para la detecci√≥n de contenidos plagiados. ¬°√Čste es solo el comienzo y nos gustar√≠a que nos sigas hasta el final!

Todos sabemos el trabajo que hay detr√°s de la obtenci√≥n de estas peque√Īas victorias que, sumadas una a una, hacen grande y real nuestro proyecto online. Evita que el contenido duplicado tanto en tu p√°gina como el plagio en otros dominios frene el crecimiento de tu web y haz gala de tu olfato sabueso. Act√ļa, pon en pr√°ctica estos puntos y, ante cualquier duda, ya sabes d√≥nde encontrarnos. Elemental, queridos usuarios.

Artículos Relacionados:

Los mejores amigos del SEO: El Título

Los mejores amigos del SEO: La Description

Los mejores amigos del SEO: La etiqueta rel=”canonical”

Los mejores amigos del SEO: Las palabras claves o keywords

Los mejores amigos del SEO: Herramientas para Webmasters de Google

Los mejores amigos del SEO: Google Analytics

Los peores enemigos del SEO: Los problemas de indexación

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (Ninguna valoración todavía)
Cargando…