raj*_*pit 1 semantic-web ontology semantics
我有这个问题.我可以理解,网页只能由人而不是机器来解释.因此,我们创建词汇表和语义,并以有向图形格式表示rdf中的信息,以便机器甚至可以解释它.我们有主语谓词和宾语,其中主语,谓语和宾语可以是uris.但我很困惑,我们应该有一个rdf对应一个网站的每个页面,以便人类可以看到网页但机器的解释,他们可以使用rdf版本.我对么?
我也看到使用本体工程,我们使用关联规则分析生成规则.我也有一些困惑.让我们说我想为一个领域创建一个本体论让我们说医疗.然后我使用关联规则挖掘我挖掘网站或其他数据来获得一些关联.但这样做我只能定义概念之间的关系.如何使用此挖掘获得新概念?
我们如何使用这个新创建的本体.我们应该将它们添加到网站上吗?我不清楚.需要一些建议吗?
但我很困惑,我们应该有一个rdf对应一个网站的每个页面,以便人类可以看到网页但机器的解释,他们可以使用rdf版本.我对么?
RDF是一种数据模型,与关系模型一样,可用于存储各种信息.它不需要附加到网页.实际上,它甚至可以独立于Web存在.网页可以将RDF数据直接嵌入到HTML代码中(使用RDFa),因此您不一定需要对人和机器进行不同的表示.HTML页面可以完全与RDF数据分开,但是机器可以以不同的方式被引导到正确的位置,例如,通过网页标题中的链接,或者使用语义站点地图.
在关联数据圈中,必须使用HTTP URI来描述事物以识别它们.当您查找URI时,您应该获得对该事物的描述,在这种情况下,为需要它的软件应用程序提供RDF以及向与人交互的用户代理提供HTML(例如Web浏览器)被认为是一种好的做法. .例如,如果您使用Web浏览器访问http://dbpedia.org/resource/Lyon,则可以获得此信息.如果你去到相同的URI与Web爬虫,你可能会说不是.
如何使用此挖掘获得新概念?
本体工程和规则挖掘是不同的东西.通常,本体是在没有规则挖掘的情况下设计的.概念通常是由希望为某种目的设计本体的人之间达成协议而产生的.但是,可以从挖掘过程中猜出新概念,可能是文本挖掘或关联规则挖掘.但这与如何使用本体无关.
我们如何使用这个新创建的本体.
大多数情况下,只使用本体的术语就可以使用本体.例如,假设你想描述吉姆,一个全名为詹姆斯·D·古奥的人.在RDF中,您知道使用URI识别内容,因此您需要一个Jim的URI,比如http://yourdomain.com/jim缩写yd:jim为简洁(您必须为此决定自己的URI方案).现在你想说吉姆是一个人.为此,您有特殊的预定义谓词rdf:type:
yd:jim rdf:type <aClassThatRepresentsPeople> .
Run Code Online (Sandbox Code Playgroud)
现在,您可以创建自己的新URI,<aClassThatRepresentsPeople>但这就是本体发挥作用的地方.这类人将会被一遍又一遍地重复使用,所以你希望它成为许多人共有的术语.要使用本体术语,您只需编写其URI即可.你不需要任何特殊的东西来解释这个术语来自何处,也不需要进口陈述.由于URI应该是通用的,很明显,您使用的术语与本体中定义的术语完全相同.此外,如果本体遵循关联数据最佳实践,则类的URI应该是可解除引用的,这样当您使用HTTP GET查找URI时,您将获得该术语的定义.吉姆的名字也一样.你想在RDF中说出这样的话:
yd:jim <theNameAttribute> "James D. Goo" .
Run Code Online (Sandbox Code Playgroud)
在这里,您不需要名称本身的URI,它只是一个字符串(尽管可以给它一个标识符,以便您可以将其分解为名字,中间名,姓氏等).同样,<theNameAttribute>您只需重用本体中定义的属性即可.所以最后,你可能会看到这样的东西:
yd:jim rdf:type foaf:Person .
yd:jim foaf:name "James D. Goo" .
Run Code Online (Sandbox Code Playgroud)
其中foaf:是FOAF Ontology的前缀,这是一个用于在线描述人的流行的前缀.
我们应该将它们添加到网站上吗?
不是真的,但在某种程度上是的.您可以重复使用在完全不同的网站上找到的现有本体(如FOAF).这就是Web和关联数据的美妙之处:它是分布式和模块化的.但是如果你使用你自己的本体(比方说http://yourdomain.com/ontology),你应该通过解除引用来访问这个本体,也就是说,如果你查找本体的术语(例如http://yourdomain.com/ontology#person),你的服务器应该回应本体的描述或者至少是要求的期限.您只需按照向网站添加任何文件的方式添加本体.