我正在开发一个简单的搜索引擎,我使用 TF-IDF 公式来评估搜索词的重要性。我看到人们使用不同的公式基础,但我没有看到什么时候使用哪个的解释。这很重要吗?您有什么建议吗?
我当前的实现使用 math.h 库的常规 log() 函数
c tf-idf
c ×1
tf-idf ×1