TF.IDF (frecuencia de términos – frecuencia inversa de documentos) es una estadística numérica que indica la importancia de una palabra o frase en un documento dentro de una colección de documentos.
Es una puntuación proporcional al número de veces que una palabra aparece en el documento compensado por la frecuencia de la palabra en la colección de documentos.
Se calcula multiplicando la “frecuencia del término” de la palabra que aparece en el documento y la “frecuencia inversa del documento” de la palabra en todos los documentos.
Está diseñado para medir la relevancia de un término en un documento concreto en comparación con otros documentos del conjunto.
En las búsquedas orientadas a las personas, como las ofertas de empleo, TF.IDF puede ayudar a identificar palabras relacionadas con determinados puestos o funciones, de modo que los empleadores puedan comparar con precisión los currículos con las cualificaciones laborales.
(Véase también BM25)
Páginas y artículos relacionados
Si buscas contenidos similares, prueba estas sugerencias y descubre más sobre el mundo del e-commerce y Luigi’s Box.
Frecuencia de Términos
La frecuencia de términos es una cantidad que representa la frecuencia con la que aparece un término en un documento.
Resultados de Búsqueda
Los resultados de una búsqueda son los documentos o datos obtenidos.
Cola Larga
Taxonomía
La taxonomía en búsqueda organiza objetos en jerarquías, facilitando su recuperación y mejorando la clasificación de resultados.
Glosario de Búsqueda
Indexación lingüística
Diccionario
Un tesauro enlaza palabras a taxonomías cruzadas, facilitando la recuperación de documentos con una metaclasificación eficiente.