Con este art铆culo, en Webpositer damos comienzo a una nueva serie de consejos SEO donde se analizan aquellos aspectos que dificultan el 贸ptimo posicionamiento de una web en los buscadores. La primera parada tiene como protagonista los problemas de indexaci贸n o, dicho de otro modo, las dificultades con las que se enfrenta una web para que los robots de Google, Yahoo! o Bing lleguen a su sitio, descubran una p谩gina y la incluyan en los resultados de b煤squeda. En ocasiones, ese descubrimiento tarda en producirse o no logra hacerse efectivo nunca. 驴Por qu茅? 驴Qu茅 impide que una p谩gina se indexe? Y, lo m谩s importante, 驴hay soluciones ante semejante problema?

Seamos francos: Las dificultades de indexaci贸n suponen un verdadero obst谩culo para el trabajo de posicionamiento web que d铆a a d铆a realizamos. Por esta raz贸n, es importante detectarlos a tiempo, actuando con firmeza y determinaci贸n cuanto antes. Para que dispongas de toda la informaci贸n necesaria para enfrentarte a este dilema con todas tus armas, a continuaci贸n se identifican las causas y se plantean soluciones para conseguir que la indexaci贸n de las p谩ginas de tu sitio web sea un HECHO y no un quebradero de cabeza. 隆Lanc茅monos ya a la aventura!

驴Qu茅 me ayuda a indexar 贸ptimamente las p谩ginas que componen mi web?

En la indexaci贸n de las p谩ginas de tu web, hay tres grandes aliados que pueden reportarte efectivas respuestas. Con贸celos, cu铆dalos y ded铆cales siempre tu valioso tiempo en cada acci贸n de optimizaci贸n web que desarrolles.

Enlaces, una de las joyas de la corona

Las URLs de cualquier sitio web funcionan empleando links. En la labor de rastreo de los buscadores, Googlebot 鈥 el robot-ara帽a de Google – usa las URLs de estos enlaces para determinar de qu茅 p谩ginas debe seguir tomando datos y cu谩les ha de obviar. Para optimizar al m谩ximo este proceso, de nada sirve que los documentos que componen nuestras p谩ginas est茅n estructurados claramente, sino que han de ofrecer enlaces entre ellos evitando que alg煤n documento quede fuera del alcance de los spiders. Un consejo: Si creas un mapa de contenidos donde se incluyan todos los contenidos que componen tus p谩ginas, te resultar谩 mucho m谩s f谩cil dise帽ar un camino corto y eficiente que mejore al m谩ximo la labor de indexaci贸n.

Sitemaps.xml, dando pistas.

A modo de definici贸n, el Sitemap es un archivo XML que confeccionan los webmasters para informar a los buscadores de las p谩ginas que se pueden rastrear en su sitio web. En esta suerte de listado de URLs tambi茅n tienen cabida otros datos adicionales pero importantes como su 煤ltima actualizaci贸n, frecuencia de modificaci贸n o grado de relevancia. Con toda esta informaci贸n los motores de b煤squeda cuentan con datos valiosos para hacer un rastreo de la web mucho m谩s eficiente. Aunque no es la panacea, sin duda, proporciona sugerencias importantes para mejorar el trabajo de rastreo e indexaci贸n de las p谩ginas.聽

驴Conoces la estructura de un archivo Sitemap.xml? Es muy sencilla y siempre responde al mismo esquema. Toma nota: Una vez creado, ub铆calo en tu servidor y registra el fichero Sitemap.xml en el panel de Herramientas para Webmasters de Google.

Archivo Sitemaps.xml

Robots.txt, marcando la pauta

Hablamos en este caso de un archivo de texto plano donde se especifican algunas indicaciones para que los robots spiders cumplan cuando visiten y rastreen nuestro sitio web. Importante: Es solo una recomendaci贸n, no una obligaci贸n.聽

Directiva de archivo Robots.txt

En la confecci贸n del archivo robots.txt, podemos acumular varios Disallow bajo un mismo User-agent, pero no al contrario. Es m谩s, la presencia de este fichero proporciona multitud de beneficios, entre ellos, impedir el acceso a robots determinados, evitar la sobrecarga del servidor, prohibir zonas o eliminar la duplicidad de contenido. Puedes ver un ejemplo de fichero robots.txt aqu铆.

Ejemplo de fichero robots.txt

Las p谩ginas de mi web no se indexan. 驴D贸nde puede estar el origen del mal? Analizando 20 posibles motivos, aportando 20 soluciones.

Si por m谩s que analizas y piensas, no encuentras explicaci贸n alguna a lo mucho que tarda Google en indexar las p谩ginas de tu sitio web, ahora compartimos contigo algunos de los motivos m谩s habituales.

1-. Error en el archivo robots.txt.

驴Conf铆as al 100% en su correcta configuraci贸n? Te recomendamos que le eches un vistazo con detalle porque puedes haber marcado unas indicaciones a las ara帽as que est茅n prohibiendo la entrada a p谩ginas que s铆 te interesa que sean cacheadas. Un peque帽o despiste puede desencadenar que Google no indexe nuestro sitio, con lo que ello supondr铆a para el posicionamiento en buscadores de nuestra web. Al igual que no existe una directiva Allow que facilite la indexaci贸n, una directiva incompleta como Disallow: / estar铆a bloqueando el acceso de Google a toda la p谩gina, cuando esta acci贸n no es la que buscas.

驴Quieres evitar problemas? Te aconsejamos que hagas uso de esta herramienta de validaci贸n del fichero robots. Una gran ayuda, sin duda. A continuaci贸n, puedes ver el registro del archivo robots.txt en Herramientas para Webmasters en Google.

An谩lisis de Robots.txt en Herramientas para Webmasters de Google

2-.聽Configuraci贸n err贸nea del archivo .htaccess.

Propio de los servidores Linux y encargado de manejar redirecciones y reescrituras de URLs en sitios din谩micos. Es una herramienta 煤til y muy apreciada en posicionamiento en buscadores. Sin embargo, un peque帽o error de sintaxis tambi茅n puede influir de manera catastr贸fica en la indexaci贸n del sitio. Debemos revisarlo y corroborar que no incluye:

  • Redirecciones infinitas
  • Redirecciones con demasiados pasos
  • Redirecciones de p谩ginas que nos interesan indexar y no secciones completas del sitio

3-. Par谩metros de URLs incorrectos en Webmasters Tools de Google.

驴Tienes una tienda online y sus URLs din谩micas cuentan con muchos valores obstruidos? Se pueden ocultar en los resultados de b煤squeda de dicha secci贸n. Sin embargo, si colocamos mal alguna variable, ese error puede derivar en la desaparici贸n de buena parte de las p谩ginas en los resultados de Google, perdiendo las posiciones alcanzadas.

Desde el panel de Herramientas para Webmasters de Google detectar谩s si la cantidad de p谩ginas enviadas es mayor a las indexadas, en cuyo caso algo no funciona como deber铆a. Corrige tu archivo sitemaps.xml y env铆alo a Google Webmasters Tools para que conozca la actualizaci贸n y la tenga presente en sus tareas de rastreo.

Sitemaps herramientas para webmasters de Google

4-.聽Uso de c贸digos de programaci贸n 芦problem谩ticos禄.

Javascript, Flash, Frames y Ajax son los causantes de multitud de problemas de indexaci贸n. Pr谩cticamente invisibles para los motores de b煤squeda, muchas de las secciones de las webs programadas con estos lenguajes son inaccesibles y sus contenidos no logran indexarse correctamente afectando gravemente al posicionamiento de la web, ya que no responden a la f贸rmula una p谩gina/una URL.

5-. Falta de enlaces externos.

Los enlaces procedentes de otros dominios son identificados por Google como votos de confianza hacia tu web. Si el buscador de buscadores detecta que no tienes enlaces externos, tardar谩 m谩s en indexar las p谩ginas de tu sitio web. Como se帽al de relevancia y popularidad, es muy recomendable que desde las redes sociales se enlace a tu web tanto en perfiles personales como en p谩ginas propias creadas en Facebook o Twitter.

6-.聽Evita los contenidos reservados.

Googlebot no consigue llegar a p谩ginas con contenidos provistos de contrase帽as, formularios o acciones que no se acceda a ellas a trav茅s de un enlace directo. 驴La soluci贸n? Dise帽ar p谩ginas est谩ticas que Google logre encontrar e indexar f谩cilmente sin hacer ninguna acci贸n especial.

7-.聽Lo gratuito no siempre es una ventaja.

Los sitios gratuitos son identificados por Google como dominios spammers, impidiendo su indexaci贸n. El ahorro de unos euros puede repercutir en una p茅rdida importante de posiciones y una inversi贸n de esfuerzo tirada por la borda. Nuestro consejo es que construyas tu web sobre un dominio propio en un alojamiento de pago de confianza.

8-. 驴Direcci贸n IP baneada?

Si tu web est谩 alojada en una ubicaci贸n cuya direcci贸n IP ha sido utilizada por sitios spammers, no ser谩 accesible. Lo mejor siempre ser谩 disponer de una IP propia para tu sitio web.

9-. Apuesta por las URLs amigables.

Las p谩ginas din谩micas pueden contener par谩metros con caracteres especiales que se presentan como un freno importante en el trabajo de indexaci贸n de Google. Es m谩s, muchas de estas URLs son generadas autom谩ticamente por el sistema o bien, son tantas las p谩ginas, que Google solo indexa las que estima m谩s relevantes, considerando muchas de ellas como contenido duplicado.

Para evitar problemas de indexaci贸n, una soluci贸n ideal pasa por la construcci贸n de direcciones simples y sencillas como, por ejemplo: http://www.estoesunejemplo.com/como-posicionar-una-web-en-google.html

10-. 驴Tus contenidos no se indexan?

Si los textos de nuestras p谩ginas se encuentran dentro de im谩genes, animaciones en Flash o applets en Javascript, es recomendable proveer de contenido v谩lido en formato texto o bien plasm谩ndolo en documentos que Google s铆 indexa como archivos PDF.

11-.聽Metatags vac铆os.

Si las etiquetas del title o la description no tienen contenido ninguno, Google puede obviar tu p谩gina. Para curarte en salud, lo adecuado ser铆a revisar todas las metatags de tu web para corroborar no solo que est谩n cumplimentadas correctamente, sino que son 煤nicas para cada p谩gina.

12-.聽Warning!! Cuidado con la etiqueta Meta Robots.

Su funcionamiento es el mismo que el archivo robots.txt pero act煤a solo en la p谩gina y no en todo el sitio web. Responde a la siguiente sintaxis:

Sintaxis metarobots

En p谩ginas din谩micas, no es de extra帽ar encontrarnos variables como “noindex,follow” o “noindex,nofollow” en esta etiqueta, lo que provocar铆a que esta p谩gina no logre ser indexada.

13-. P谩ginas demasiado largas, un gran handicap.

Con una conexi贸n lenta y multitud de p谩ginas a indexar, Google puede dar una respuesta negativa y no hacer caso a nuestros contenidos. En este caso, lo 贸ptimo ser谩 escoger las p谩ginas m谩s relevantes, limitando su tama帽o. Adem谩s de conseguir la indexaci贸n, el tiempo de carga de las p谩ginas mejorar谩 y el usuario disfrutar谩 m谩s de la navegaci贸n y experiencia de visita de la web.

14-.聽Respuestas r谩pidas, por favor.

驴Google hace una consulta y tu web no responde al instante por problemas de servidor o comunicaciones? Generalmente, Google vuelve a hacer la consulta, pero no se garantiza. Asimismo, si una p谩gina fue indexada pero tras un tiempo no responde, 茅sta puede ser eliminada de su 铆ndice de resultados.

15-. Deja de hacer spam.

驴Has practicado alguna vez t谩cticas propias del black hat?驴Haces spam en tu p谩gina? Si la respuesta a ambas preguntas es afirmativa, tienes todas las papeletas para no ser indexado por Google. Comp贸rtate debidamente y empieza de cero con un dominio nuevo.

16-. El dilema de las redirecciones.

Los c贸digos de refrescamiento o redirecciones pueden ocasionar problemas de indexaci贸n. De hecho, buscadores como Bing no indexan p谩ginas con redirecciones 302 porque, al ser temporales, entienden que su duraci贸n ser谩 limitada. Es m谩s, en ocasiones interpreta el uso de las redirecciones como intentos de enga帽ar al sistema, ocultando determinados contenidos. Solo ha de utilizarse cuando efectivamente tu web estar谩 offline por un tiempo o deseas redirigir tus visitas hacia otra p谩gina. No juegues con fuego y ten siempre presente que, si tu redireccionamiento es permanente, apuesta por una redirecci贸n 301.

17-. Enlaces rotos y problemas de navegaci贸n.

Como tarea obligada en tu agenda, peri贸dicamente se ha de revisar la web para detectar posibles enlaces rotos 鈥 son un obst谩culo absoluto para Googlebot -, y optimizar la navegaci贸n por la p谩gina. Analiza si faltan enlaces hacia la p谩gina de inicio de tu web en todas las p谩ginas o si los men煤s de navegaci贸n est谩n en Flash… Intenta corregirlo para favorecer la indexaci贸n.

18-. El contenido irrelevante no sirve de nada.

Si el contenido que aparece en alguna secci贸n de tu web no es relevante o incluso es duplicado, Google no le har谩 ni caso y, por supuesto, dir谩 NO a su indexaci贸n. Trabaja en unos contenidos de inter茅s para el usuario. Y no solo esto. Si tu web tiene muchas p谩ginas, seguramente Google solo tendr谩 en cuenta aquellas m谩s importantes. Realiza contenidos novedosos y que aporten valor a p谩ginas que todav铆a no han sido indexadas, puede ser una buena idea para dotar de vida y actividad a p谩ginas que se cre铆an olvidadas.

19-. 驴Sabes si Google llega a tu sitio web?

Desde las Herramientas para Webmasters de Google podemos conocer los errores de rastreo registrados, una ayuda imprescindible para saber por qu茅 Google no llega a nuestro sitio web. Pon en marcha la revisi贸n de esos errores y corr铆gelos. Asimismo, y como se ha comentado anteriormente, recuerda analizar el archivo robots.txt por si contiene directivas inv谩lidas que bloquean el paso de Google.

20-.聽Utiliza las t茅cnicas SEO en tus im谩genes.

Lejos de nombrar a las im谩genes de tu web como IMG2.jpg, emplea palabras claves que describan su contenido como, por ejemplo, muebles-oficina.jpg si tu web es de mobiliario profesional. Aplica la misma norma para la etiqueta ALT de las im谩genes de tu web. Esta sencilla acci贸n mejorar谩 su indexaci贸n al tiempo que potenciar谩 su posicionamiento.

Identificados los problemas de indexaci贸n m谩s comunes, 驴a qu茅 esperas para detectar si en alguno de ellos est谩 la causa que est谩 impidiendo que Google entre en tu web y rastree sus p谩ginas? 脡ste es el momento de ponerte manos a la obra trabajando, sin prisa pero sin pausa, en la optimizaci贸n de tu web.

Si esta ayuda no ha sido suficiente y precisas de asistencia personalizada, no lo olvides. En Webpositer estamos para ayudarte porque nuestro mayor reto hoy es contribuir a tu 茅xito ma帽ana. 驴Cu谩ndo empezamos?

Art铆culos Relacionados:

Los mejores amigos del SEO: El T铆tulo

Los mejores amigos del SEO: La Description

Los mejores amigos del SEO: La etiqueta rel=”canonical”

Los mejores amigos del SEO: Las palabras claves o keywords

Los mejores amigos del SEO: Herramientas para webmasters de Google

Los mejores amigos del SEO: Google Analytics

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (Ninguna valoraci贸n todav铆a)
Cargando鈥