是否有一种算法可以提取有意义的英文文本标签

sac*_*haa 8 tags algorithm semantics

我想从任何大小的英文文本中提取减少的"有意义"标签集合(最多10个).

http://tagcrowd.com/非常有趣,但算法看起来很基本(只是字数统计)

还有其他现有的算法吗?

cee*_*yoz 6

现有的Web服务.两个三个例子:


小智 2

当你减去人为因素(标签)时,剩下的就是频率。“忽略常见英语单词”是下一个最佳过滤器,因为它处理排除而不是包含。我测试了几个网站,非常准确。确实没有其他方法可以获取“意义”,这就是语义网如今受到如此多关注的原因。这是一种用 HTML 来暗示意义的方法……当然,这也有人类的因素。