cbo*_*tig 9 xml html5 metadata schema.org
许多博客使用"标签"和"类别"的概念来向帖子添加元数据.这种信息的语义标记的最佳实践是什么,这样阅读博客文章的机器可以轻松识别标签?
目前我添加"tag"到rel属性的链接,例如在
<a rel="tag" class="tag" href="/tags.html#site-configuration">#site-configuration</a>
Run Code Online (Sandbox Code Playgroud)
我想可以使用Dublin Core的html格式作为关键字:
<meta name = "DC.Subject"
content = "site-configuration">
Run Code Online (Sandbox Code Playgroud)
并将其添加到页眉,还是元标签可以进入正文?是一个或另一个更好,或一些完全不同的选择?
在为内容提供精确和标准化的定义方面是否有更好的策略?
如果我想对元数据如此挑剔,或者我应该使用XML文档类型,HTML5是一个合理的选择吗?
不同方法的优缺点是什么?
uno*_*nor 15
该第一步是获取/使用纯HTML语义正确的.在的情况下(X)HTML5应使用切片内容元素构建一个适当的轮廓section,article,aside和nav,并用header和footer从主内容的元数据的内容中分离; 也考虑内联级语义,如time(发布日期),dfn(定义),abbr(缩写/首字母缩略词)等.并使用meta- name和rel规范中定义的值.
的第二步骤是使使用元数据属性未在说明书中所定义的值,但在指定的地方被登记(所以它们是有效的使用),如name为关键字meta的元素和rel值a/ area/ link元素.
的第三步骤是,以增强标记具有语义的,机器可读的注解.有三种常见的方法可以做到这一点:
class和rel值)RDFa和Microdata是相似的(可扩展且相当复杂),而微格式更简单(但不那么具有表现力/可扩展性).我在程序员那里写了一篇关于差异的简短回答,以及关于Microdata和RDFa之间差异的更详细的答案.
对于RDFa或Microdata,您的主要工作是找到能够描述/分类您的内容的词汇表/本体.这些词汇表可以由每个人创建(您甚至可以自己创建),但通常建议使用众所周知/流行的词汇表,例如,以便搜索引擎可以使用您的注释(流行示例:Schema.org).
在Microformats的情况下,您必须找到适合您需求的Microformat(在microformats.org的维基上).如果您的案例没有,您可以提出一个新的Microformat(但这需要一些时间,直到它被"接受",如果有的话).
如果我想对元数据如此挑剔,或者我应该使用XML文档类型,HTML5是一个合理的选择吗?
如果需要/想要XML支持,您也可以使用XHTML5.如果您"仅"使用规范中定义的(X)HTML而没有其他XML模式/词汇表,那么如果您使用HTML(5)或XHTML(5),则从语义角度来看无关紧要.