Y además de descifrar la fórmula TF*IDF, de regalo el complemento perfecto en formato vídeo:

En más de una ocasión has leído frases manidas como «el contenido es una pieza fundamental en una estrategia SEO».

Afirmaciones como esta encierran una realidad incuestionable ya que toda web necesita de contenidos de valor para que Google sepa interpretar qué ofrece ese site al usuario y cómo en él puede encontrar respuestas a sus inquietudes de búsqueda.

Pero, como también habrás oído, no todo el contenido vale porque de nada sirve redactar textos sin orden ni concierto y publicarlos en tu web si no están tocados por la varita de un concepto clave en SEO: la relevancia.

El contenido de una web es relevante porque brinda al usuario una respuesta de calidad, capaz de aclarar dudas y argumentar la información con criterio, utilizando las palabras claves adecuadas y envolviendo el contenido del campo semántico que rodea a esa temática.

Ante este objetivo, conceptos como la densidad de palabra clave tienen poca cabida y cada vez más aparece la fórmula algorítmica TF*IDF aplicada al SEO para calcular la ansiada relevancia del contenido.

Pero, ¿qué es eso de TF*IDF? Miguel Pau (@miguelpau) te saca de dudas en el vídeo que acompaña a este artículo.

Olvídate de aplicar ecuaciones imposibles porque ya te advertimos que aplicar el análisis TF*IDF en tus textos es más sencillo de lo que imaginas.

¿Qué es el TF*IDF?

tfidf-que-es

Estas fórmulas asustan, ¿verdad? Si como yo eres de letras, te habrá dado un sofoco al pensar que el mundo del SEO cada vez lo complican más y has estado a segundos de decir «este post no es para mí». Tranquilo, amigo.

Expresado así el TF*IDF impresiona a primera vista pero, cuando conoces su esencia, la entenderás a la perfección e incluso te gustará aprender de su potencial.

¿Un anticipo? Hay diversas herramientas para calcular el TF*IDF de un contenido de forma automática así que respira y sigue leyendo.

TF*IDF son las siglas en inglés de «Term Frequency – Inverse Document Frequency», cuya traducción sería «frecuencia del término por frecuencia inversa de documento».

Este medida numérica empezó a utilizarse en los años 70 en las bibliotecas y grandes archivos para un fin: hallar el documento más relevante por una palabra concreta dentro de una colección de documentos.

Si lo trasladamos a nuestros días, el algoritmo de Google actúa de forma similar ya que, cuando realizamos un búsqueda, nos responde con los resultados que estima que mejor contestan a la intención del usuario.

Tal vez no aplique al 100% en análisis TF*IDF, pero su tecnología sí sigue en cierta forma las reglas de IR (Information Retrieval) en las que se enmarca la fórmula que hoy desgranamos.

Toma este consejo. Olvídate de esa fórmula tan enrevesada e interioriza este resumen:

El TF*IDF en SEO calcula la frecuencia con la que aparece una palabra o grupo de palabra dentro de una página web y lo compara con el número de páginas de la competencia que también incluyen ese término.

¿Cómo determina el TF*IDF la frecuencia de un término dentro de una página web?

Para desarrollar ese cálculo, este indicador:

  • Mide la frecuencia en función de la extensión de contenido.
  • Adapta la repetición de ese término según unos parámetros logarítmicos de forma que, alcanzando cierta frecuencia, ya no sería necesario incluirlo más veces.
  • No valora mejor los contenidos de mayor extensión que podrían trabajar más la frecuencia de ese término.

Entonces, ¿el cálculo TF*IDF es primo hermano de la densidad de palabra clave? No por una importante razón: la densidad de palabra clave solo mide las repeticiones de una keyword dentro un contenido sin comparaciones con otros documentos (o webs).

Es la segunda parte de la fórmula del TF*IDF la que se encarga de valorar esa relevancia en comparación con la frecuencia del término en otras URLs a analizar.

Herramientas para calcular el TF*IDF en los textos de tu web

Como ya te avanzaba, en un periquete puedes averiguar el valor TF*IDF del contenido de ciertas páginas de tu web y mejorar así la relevancia del texto SEO.

Existen diversas herramientas para su cálculo pero vamos a citar dos de ellas porque son las que más utilizamos en nuestro día a día.

Seobility

Gracias a esta herramienta, puedes realizar 3 análisis gratuitos al día con información muy completa que te servirán de ayuda para darle una vuelta a ese texto de tu web y pulirlo al máximo para potenciar su posicionamiento en Google.

En Seobility solo debes rellenar estos 3 campos con la siguiente información:

  • Palabra clave
  • URL
  • País (en nuestro ejemplo, Google.es)

seobility herramienta TF*IDF

Tras el análisis, Seobility responde con un gráfico que revela la media de apariciones de esa palabra clave en los contenidos analizados, el máximo de repeticiones y la frecuencia de repeticiones del contenido que hemos introducido como referencia.

TFIDF-seobility

De este modo, hallarás términos que tu contenido no incluye y que, dentro de esa temática, deberían aparecer.

Aprovecha esa información aportada por Seobility en su análisis TF*IDF para optimizar el contenido, mejorar su semántica y alcanzar la relevancia deseada.

SEOlyze

Con prueba gratuita válida durante 30 días, SEOlyze presente un completo diagnóstico del contenido de una web desde el punto de vista de la métrica TF*IDF.

Aunque los cálculos resulte excesivamente matemáticos, hay que reconocer que la herramienta ofrece datos de enorme valor para detectar palabras clave que, como en el caso de Seobility, hemos pasado por alto y sí o sí deberían aparecer en el contenido dada la temática tratada.

Vamos a ver un ejemplo real de esta herramienta de SEO copywriting esencial analizando un post del blog de Webpositer.

Pasos para la optimización SEO de un contenido con la fórmula TF*IDF según las indicaciones de SEOlyze

1 – En la sección WDF/IDF Análisis, rellena los siguientes campos y clica sobre «Iniciar el análisis»:
  • Palabra clave
  • Página de referencia
  • Versión de Google
  • Idioma

seolyze herramienta calcular TF*IDF

2 – Revisa los datos de su estudio y toma nota de los puntos a mejorar

Gracias a su estudio, SEOlyze analiza la web de referencia que le has indicado con respecto a los 10 resultados posicionados en la primera página de Google.

Te recomendamos que vayas uno a uno analizando manualmente su contenido porque seguro que darás con detalles importantes que esta sofisticada herramienta no detectará.

competencia-seolyze

Además, SEOlyze hace una valoración general de aspectos de tu contenido con el resto de URLs analizadas a los que debes prestar atención: extensión del contenido, encabezados H1, h2, H3, meta description, meta title o keyword en el title, entre otros.

Como puedes ver en la siguiente captura, SEOlyze nos recomienda que ampliemos la extensión del contenido dado que la media de artículos que responde a esa búsqueda cuentan con más de 4 000 palabras y nuestro post tiene 1710. Aunque hemos alcanzado la segunda posición, ¡hay trabajo de mejora!

optimizacion-seolyze

¿Imaginas que una herramienta te chive los términos que estás trabajando de forma correcta y, lo más importante, aquellos que deben aumentar su frecuencia? Como Seobility, también SEOlyce ejerce de excelente aliado.

Esta ha sido su evaluación:

evaluacion-keywords-seolyze

Según parece, debemos darle unos toques mágicos al texto incluyendo en más ocasiones palabras como «contenidos», «marketing», «estrategia», «crear» o preguntas que integren «cómo», para acercarnos a la relevancia de los contenidos comparados por la herramienta. ¡Tomamos nota!

Ahora vamos un paso más allá: estudia al detalle el gráfico de valores.

valor-seolyze

Con esta gráfica ante tus ojos, ¿en qué debes fijarte? Observa la línea negra, verifica que tu proyecto no sobrepasa los valores EPS-KF máximo y, sobre todo, identifica en qué valores (palabras) está fallando porque no aparecen en tu texto.

Siguiendo este ejemplo, percibimos que a las palabras «tráfico», «ejemplos», «herramientas» o al verbo «mejorar» conviene darles cabida en el post.

3 – Aprovecha la información para mejorar tu contenido

Con todos los datos obtenidos, el cálculo TF*IDF realizado por SEOlyze te permitirá:

  • Identificar oportunidades de contenido que no habías contemplado.
  • Ampliar el contenido del texto para que resuelva mejor las dudas de los usuarios.
  • Actualizar un contenido evergreen
  • Mejorar la semántica del texto

Eso sí, evita tomar a rajatabla todas las indicaciones de estas herramientas. ¿Por qué te damos esta recomendación? En multitud de ocasiones te indicarán como palabras a aumentar sus repeticiones términos como «esto», «más», «tus» u otros conceptos inverosímiles. Aplica la lógica y filtra.


Profundiza más en Seolyze con este tutorial:


BONUS EXTRA → Las entidades en SEO: ¿qué son y cómo ayudan a pulir la semántica de tu contenido?

Ahora te animamos a ir un paso más allá: pasar de la frecuencia de un término a los conceptos que están relacionados con esa keyword objetivo.

Hablamos de las entidades SEO o aquellas personas, lugares, instituciones o cualquier otro elemento que está vinculado con ese espacio, ubicación u objeto al que hagamos referencia en un texto.

¿Por qué es importante conocer las entidades que rodean a un concepto?

Además de facilitar la labor de investigación al creador de ese contenido, permiten estructurar con más acierto la información incluyendo en el texto aquellos elementos semánticamente relacionados con esa palabra clave principal o el objetivo de ese contenido.

Existen diversas herramientas gratuitas para la extracción de entidades SEO como Entity Explorer, Cloud Natural Language de Google o Extractor de Entidades, creada por Fede Gómez.

En el siguiente vídeo lo verás más claro gracias a la aproximación que hace Miguel Pau sobre las entidades y su uso en SEO. ¡Dale al play!

Conclusión

Esperamos que con este post hayas superado tu miedo a la fórmula matemática del TF*IDF y empieces a aplicar sus bondades en SEO con la ayuda de estas herramientas para mejorar la relevancia de los contenidos de tu web.

Además, aprovecha las herramientas para obtener entidades SEO relacionadas con conceptos y palabras clave que desees potenciar en tus contenidos. ¡Multiplicarás sus efectos todopoderosos para escalar en el ranking de Google!

¿Conoces otras herramientas que te van de maravilla? No te cortes; compártelas en los comentarios.

[enlaces_pie_post] [related_post posts_ids=’18436,21032,16606′]