我计算了两个文件的tf/idf值.以下是tf/idf值:
1.txt
0.0
0.5
2.txt
0.0
0.5
Run Code Online (Sandbox Code Playgroud)
文件如下:
1.txt = > dog cat
2.txt = > cat elephant
Run Code Online (Sandbox Code Playgroud)
如何使用这些值来计算余弦相似度?
我知道我应该计算点积,然后通过它找到距离并除以点积.如何使用我的值来计算?
还有一个问题:两个文件应该有相同数量的单词是否重要?