构建用于索引内容的主题层次结构

Pau*_*ams 5 topic-maps

我希望建立一个主题图来catagorize内容.

例如,主题'艺术'可能有'艺术史','绘画','雕塑'等子类别.

我已经抓取了一些在线资源,但是我遇到了与我希望如何使用层次结构有关的问题.

我有很多内容,我希望按主题索引.因此,举一个上面的例子,如果用户搜索"艺术",那么他们不仅会得到任何提及"艺术"的东西,而且还会提到任何提到"绘画"的东西,即使它没有提到"艺术".很公平.

但是,如果在我的heirarchy的另一部分中,我有"House Maintenance",那么那也可能有一个"绘画"的副标题.

但是如果用户搜索"艺术",我的引擎会说'好吧,绘画是'艺术'的子类别,所以我将包含这些内容,这些内容都是最好的颜色来画你的浴室墙壁. ..

有没有人遇到过这个问题?我试过谷歌搜索,但不知道确切的术语,很难取得进展....

编辑:更简洁,"绘画"是"艺术"的副主题,但如果有关于"绘画"的内容,那么它并不一定会追随它的"艺术",因为"艺术"不是"绘画"的唯一父母.

Chr*_*son 0

由于您想以不同的方式处理房屋/绘画和艺术/绘画,那么您似乎需要两个不同的绘画条目(每个含义一个)。如果您的文本处理器足够强大,您可以根据文本本身的上下文线索将给定的“文本块”与哪一个相关联。

例如,每当您遇到这样的冲突时,请查看文本 - 您是否看到其他单词?比如“水槽”、“墙壁”、“硬木”或“窗户”?或者您还看到过“莫奈”、“印象派”、“画布”和“画廊”等其他术语吗?这将使您能够自动做出决策,并且应该相当准确。唯一的障碍是,这假设您在某个地方有一本相当健康的“相关术语”词典。

在用户端,当选择“绘画”时,您只需将所有结果合并在一起,或者向用户提供一个选项来选择他们想要查看结果的父主题。