TF.IDF (frecuencia de términos – frecuencia inversa de documentos) es una estadística numérica que indica la importancia de una palabra o frase en un documento dentro de una colección de documentos.
Es una puntuación proporcional al número de veces que una palabra aparece en el documento compensado por la frecuencia de la palabra en la colección de documentos.
Se calcula multiplicando la “frecuencia del término” de la palabra que aparece en el documento y la “frecuencia inversa del documento” de la palabra en todos los documentos.
Está diseñado para medir la relevancia de un término en un documento concreto en comparación con otros documentos del conjunto.
En las búsquedas orientadas a las personas, como las ofertas de empleo, TF.IDF puede ayudar a identificar palabras relacionadas con determinados puestos o funciones, de modo que los empleadores puedan comparar con precisión los currículos con las cualificaciones laborales.
(Véase también BM25)