Con este art√≠culo, en Webpositer damos comienzo a una nueva serie de consejos SEO donde se analizan aquellos aspectos que dificultan el √≥ptimo posicionamiento de una web en los buscadores. La primera parada tiene como protagonista los problemas de indexaci√≥n o, dicho de otro modo, las dificultades con las que se enfrenta una web para que los robots de Google, Yahoo! o Bing lleguen a su sitio, descubran una p√°gina y la incluyan en los resultados de b√ļsqueda. En ocasiones, ese descubrimiento tarda en producirse o no logra hacerse efectivo nunca. ¬ŅPor qu√©? ¬ŅQu√© impide que una p√°gina se indexe? Y, lo m√°s importante, ¬Ņhay soluciones ante semejante problema?

Seamos francos: Las dificultades de indexación suponen un verdadero obstáculo para el trabajo de posicionamiento web que día a día realizamos. Por esta razón, es importante detectarlos a tiempo, actuando con firmeza y determinación cuanto antes. Para que dispongas de toda la información necesaria para enfrentarte a este dilema con todas tus armas, a continuación se identifican las causas y se plantean soluciones para conseguir que la indexación de las páginas de tu sitio web sea un HECHO y no un quebradero de cabeza. ¡Lancémonos ya a la aventura!

¬ŅQu√© me ayuda a indexar √≥ptimamente las p√°ginas que componen mi web?

En la indexación de las páginas de tu web, hay tres grandes aliados que pueden reportarte efectivas respuestas. Conócelos, cuídalos y dedícales siempre tu valioso tiempo en cada acción de optimización web que desarrolles.

Enlaces, una de las joyas de la corona

Las URLs de cualquier sitio web funcionan empleando links. En la labor de rastreo de los buscadores, Googlebot ‚Äď el robot-ara√Īa de Google – usa las URLs de estos enlaces para determinar de qu√© p√°ginas debe seguir tomando datos y cu√°les ha de obviar. Para optimizar al m√°ximo este proceso, de nada sirve que los documentos que componen nuestras p√°ginas est√©n estructurados claramente, sino que han de ofrecer enlaces entre ellos evitando que alg√ļn documento quede fuera del alcance de los spiders. Un consejo: Si creas un mapa de contenidos donde se incluyan todos los contenidos que componen tus p√°ginas, te resultar√° mucho m√°s f√°cil dise√Īar un camino corto y eficiente que mejore al m√°ximo la labor de indexaci√≥n.

Sitemaps.xml, dando pistas.

A modo de definici√≥n, el Sitemap es un archivo XML que confeccionan los webmasters para informar a los buscadores de las p√°ginas que se pueden rastrear en su sitio web. En esta suerte de listado de URLs tambi√©n tienen cabida otros datos adicionales pero importantes como su √ļltima actualizaci√≥n, frecuencia de modificaci√≥n o grado de relevancia. Con toda esta informaci√≥n los motores de b√ļsqueda cuentan con datos valiosos para hacer un rastreo de la web mucho m√°s eficiente. Aunque no es la panacea, sin duda, proporciona sugerencias importantes para mejorar el trabajo de rastreo e indexaci√≥n de las p√°ginas.¬†

¬ŅConoces la estructura de un archivo Sitemap.xml? Es muy sencilla y siempre responde al mismo esquema. Toma nota: Una vez creado, ub√≠calo en tu servidor y registra el fichero Sitemap.xml en el panel de Herramientas para Webmasters de Google.

Archivo Sitemaps.xml

Robots.txt, marcando la pauta

Hablamos en este caso de un archivo de texto plano donde se especifican algunas indicaciones para que los robots spiders cumplan cuando visiten y rastreen nuestro sitio web. Importante: Es solo una recomendación, no una obligación. 

Directiva de archivo Robots.txt

En la confección del archivo robots.txt, podemos acumular varios Disallow bajo un mismo User-agent, pero no al contrario. Es más, la presencia de este fichero proporciona multitud de beneficios, entre ellos, impedir el acceso a robots determinados, evitar la sobrecarga del servidor, prohibir zonas o eliminar la duplicidad de contenido. Puedes ver un ejemplo de fichero robots.txt aquí.

Ejemplo de fichero robots.txt

Las p√°ginas de mi web no se indexan. ¬ŅD√≥nde puede estar el origen del mal? Analizando 20 posibles motivos, aportando 20 soluciones.

Si por más que analizas y piensas, no encuentras explicación alguna a lo mucho que tarda Google en indexar las páginas de tu sitio web, ahora compartimos contigo algunos de los motivos más habituales.

1-. Error en el archivo robots.txt.

¬ŅConf√≠as al 100% en su correcta configuraci√≥n? Te recomendamos que le eches un vistazo con detalle porque puedes haber marcado unas indicaciones a las ara√Īas que est√©n prohibiendo la entrada a p√°ginas que s√≠ te interesa que sean cacheadas. Un peque√Īo despiste puede desencadenar que Google no indexe nuestro sitio, con lo que ello supondr√≠a para el posicionamiento en buscadores de nuestra web. Al igual que no existe una directiva Allow que facilite la indexaci√≥n, una directiva incompleta como Disallow: / estar√≠a bloqueando el acceso de Google a toda la p√°gina, cuando esta acci√≥n no es la que buscas.

¬ŅQuieres evitar problemas? Te aconsejamos que hagas uso de esta herramienta de validaci√≥n del fichero robots. Una gran ayuda, sin duda. A continuaci√≥n, puedes ver el registro del archivo robots.txt en Herramientas para Webmasters en Google.

An√°lisis de Robots.txt en Herramientas para Webmasters de Google

2-. Configuración errónea del archivo .htaccess.

Propio de los servidores Linux y encargado de manejar redirecciones y reescrituras de URLs en sitios din√°micos. Es una herramienta √ļtil y muy apreciada en posicionamiento en buscadores. Sin embargo, un peque√Īo error de sintaxis tambi√©n puede influir de manera catastr√≥fica en la indexaci√≥n del sitio. Debemos revisarlo y corroborar que no incluye:

  • Redirecciones infinitas
  • Redirecciones con demasiados pasos
  • Redirecciones de p√°ginas que nos interesan indexar y no secciones completas del sitio

3-. Par√°metros de URLs incorrectos en Webmasters Tools de Google.

¬ŅTienes una tienda online y sus URLs din√°micas cuentan con muchos valores obstruidos? Se pueden ocultar en los resultados de b√ļsqueda de dicha secci√≥n. Sin embargo, si colocamos mal alguna variable, ese error puede derivar en la desaparici√≥n de buena parte de las p√°ginas en los resultados de Google, perdiendo las posiciones alcanzadas.

Desde el panel de Herramientas para Webmasters de Google detectarás si la cantidad de páginas enviadas es mayor a las indexadas, en cuyo caso algo no funciona como debería. Corrige tu archivo sitemaps.xml y envíalo a Google Webmasters Tools para que conozca la actualización y la tenga presente en sus tareas de rastreo.

Sitemaps herramientas para webmasters de Google

4-.¬†Uso de c√≥digos de programaci√≥n ¬ęproblem√°ticos¬Ľ.

Javascript, Flash, Frames y Ajax son los causantes de multitud de problemas de indexaci√≥n. Pr√°cticamente invisibles para los motores de b√ļsqueda, muchas de las secciones de las webs programadas con estos lenguajes son inaccesibles y sus contenidos no logran indexarse correctamente afectando gravemente al posicionamiento de la web, ya que no responden a la f√≥rmula una p√°gina/una URL.

5-. Falta de enlaces externos.

Los enlaces procedentes de otros dominios son identificados por Google como votos de confianza hacia tu web. Si el buscador de buscadores detecta que no tienes enlaces externos, tardar√° m√°s en indexar las p√°ginas de tu sitio web. Como se√Īal de relevancia y popularidad, es muy recomendable que desde las redes sociales se enlace a tu web tanto en perfiles personales como en p√°ginas propias creadas en Facebook o Twitter.

6-. Evita los contenidos reservados.

Googlebot no consigue llegar a p√°ginas con contenidos provistos de contrase√Īas, formularios o acciones que no se acceda a ellas a trav√©s de un enlace directo. ¬ŅLa soluci√≥n? Dise√Īar p√°ginas est√°ticas que Google logre encontrar e indexar f√°cilmente sin hacer ninguna acci√≥n especial.

7-. Lo gratuito no siempre es una ventaja.

Los sitios gratuitos son identificados por Google como dominios spammers, impidiendo su indexación. El ahorro de unos euros puede repercutir en una pérdida importante de posiciones y una inversión de esfuerzo tirada por la borda. Nuestro consejo es que construyas tu web sobre un dominio propio en un alojamiento de pago de confianza.

8-. ¬ŅDirecci√≥n IP baneada?

Si tu web está alojada en una ubicación cuya dirección IP ha sido utilizada por sitios spammers, no será accesible. Lo mejor siempre será disponer de una IP propia para tu sitio web.

9-. Apuesta por las URLs amigables.

Las páginas dinámicas pueden contener parámetros con caracteres especiales que se presentan como un freno importante en el trabajo de indexación de Google. Es más, muchas de estas URLs son generadas automáticamente por el sistema o bien, son tantas las páginas, que Google solo indexa las que estima más relevantes, considerando muchas de ellas como contenido duplicado.

Para evitar problemas de indexación, una solución ideal pasa por la construcción de direcciones simples y sencillas como, por ejemplo: http://www.estoesunejemplo.com/como-posicionar-una-web-en-google.html

10-. ¬ŅTus contenidos no se indexan?

Si los textos de nuestras páginas se encuentran dentro de imágenes, animaciones en Flash o applets en Javascript, es recomendable proveer de contenido válido en formato texto o bien plasmándolo en documentos que Google sí indexa como archivos PDF.

11-. Metatags vacíos.

Si las etiquetas del title o la description no tienen contenido ninguno, Google puede obviar tu p√°gina. Para curarte en salud, lo adecuado ser√≠a revisar todas las metatags de tu web para corroborar no solo que est√°n cumplimentadas correctamente, sino que son √ļnicas para cada p√°gina.

12-. Warning!! Cuidado con la etiqueta Meta Robots.

Su funcionamiento es el mismo que el archivo robots.txt pero act√ļa solo en la p√°gina y no en todo el sitio web. Responde a la siguiente sintaxis:

Sintaxis metarobots

En p√°ginas din√°micas, no es de extra√Īar encontrarnos variables como «noindex,follow» o «noindex,nofollow» en esta etiqueta, lo que provocar√≠a que esta p√°gina no logre ser indexada.

13-. P√°ginas demasiado largas, un gran handicap.

Con una conexi√≥n lenta y multitud de p√°ginas a indexar, Google puede dar una respuesta negativa y no hacer caso a nuestros contenidos. En este caso, lo √≥ptimo ser√° escoger las p√°ginas m√°s relevantes, limitando su tama√Īo. Adem√°s de conseguir la indexaci√≥n, el tiempo de carga de las p√°ginas mejorar√° y el usuario disfrutar√° m√°s de la navegaci√≥n y experiencia de visita de la web.

14-. Respuestas rápidas, por favor.

¬ŅGoogle hace una consulta y tu web no responde al instante por problemas de servidor o comunicaciones? Generalmente, Google vuelve a hacer la consulta, pero no se garantiza. Asimismo, si una p√°gina fue indexada pero tras un tiempo no responde, √©sta puede ser eliminada de su √≠ndice de resultados.

15-. Deja de hacer spam.

¬ŅHas practicado alguna vez t√°cticas propias del black hat?¬ŅHaces spam en tu p√°gina? Si la respuesta a ambas preguntas es afirmativa, tienes todas las papeletas para no ser indexado por Google. Comp√≥rtate debidamente y empieza de cero con un dominio nuevo.

16-. El dilema de las redirecciones.

Los c√≥digos de refrescamiento o redirecciones pueden ocasionar problemas de indexaci√≥n. De hecho, buscadores como Bing no indexan p√°ginas con redirecciones 302 porque, al ser temporales, entienden que su duraci√≥n ser√° limitada. Es m√°s, en ocasiones interpreta el uso de las redirecciones como intentos de enga√Īar al sistema, ocultando determinados contenidos. Solo ha de utilizarse cuando efectivamente tu web estar√° offline por un tiempo o deseas redirigir tus visitas hacia otra p√°gina. No juegues con fuego y ten siempre presente que, si tu redireccionamiento es permanente, apuesta por una redirecci√≥n 301.

17-. Enlaces rotos y problemas de navegación.

Como tarea obligada en tu agenda, peri√≥dicamente se ha de revisar la web para detectar posibles enlaces rotos ‚Äď son un obst√°culo absoluto para Googlebot -, y optimizar la navegaci√≥n por la p√°gina. Analiza si faltan enlaces hacia la p√°gina de inicio de tu web en todas las p√°ginas o si los men√ļs de navegaci√≥n est√°n en Flash… Intenta corregirlo para favorecer la indexaci√≥n.

18-. El contenido irrelevante no sirve de nada.

Si el contenido que aparece en alguna sección de tu web no es relevante o incluso es duplicado, Google no le hará ni caso y, por supuesto, dirá NO a su indexación. Trabaja en unos contenidos de interés para el usuario. Y no solo esto. Si tu web tiene muchas páginas, seguramente Google solo tendrá en cuenta aquellas más importantes. Realiza contenidos novedosos y que aporten valor a páginas que todavía no han sido indexadas, puede ser una buena idea para dotar de vida y actividad a páginas que se creían olvidadas.

19-. ¬ŅSabes si Google llega a tu sitio web?

Desde las Herramientas para Webmasters de Google podemos conocer los errores de rastreo registrados, una ayuda imprescindible para saber por qué Google no llega a nuestro sitio web. Pon en marcha la revisión de esos errores y corrígelos. Asimismo, y como se ha comentado anteriormente, recuerda analizar el archivo robots.txt por si contiene directivas inválidas que bloquean el paso de Google.

20-. Utiliza las técnicas SEO en tus imágenes.

Lejos de nombrar a las imágenes de tu web como IMG2.jpg, emplea palabras claves que describan su contenido como, por ejemplo, muebles-oficina.jpg si tu web es de mobiliario profesional. Aplica la misma norma para la etiqueta ALT de las imágenes de tu web. Esta sencilla acción mejorará su indexación al tiempo que potenciará su posicionamiento.

Identificados los problemas de indexaci√≥n m√°s comunes, ¬Ņa qu√© esperas para detectar si en alguno de ellos est√° la causa que est√° impidiendo que Google entre en tu web y rastree sus p√°ginas? √Čste es el momento de ponerte manos a la obra trabajando, sin prisa pero sin pausa, en la optimizaci√≥n de tu web.

Si esta ayuda no ha sido suficiente y precisas de asistencia personalizada, no lo olvides. En Webpositer estamos para ayudarte porque nuestro mayor reto hoy es contribuir a tu √©xito ma√Īana. ¬ŅCu√°ndo empezamos?

Artículos Relacionados:

Los mejores amigos del SEO: El Título

Los mejores amigos del SEO: La Description

Los mejores amigos del SEO: La etiqueta rel=»canonical»

Los mejores amigos del SEO: Las palabras claves o keywords

Los mejores amigos del SEO: Herramientas para webmasters de Google

Los mejores amigos del SEO: Google Analytics

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (Ninguna valoración todavía)
Cargando…