用于索引PDF文件的语义标记

Ale*_*art 5 pdf indexing semantic-web schema.org

索引PDF文件的正确方法是什么?我想在其中添加语义信息,并帮助搜索引擎更准确,更准确地呈现文件(特定图像,PDF文件中的文本).我正在考虑使用引擎已经理解的本体,如Schema.org.

Sha*_*ter 3

如何使用 schema.org 从网页链接到 PDF 文件,如下所示:

<div itemscope itemtype="http://schema.org/Article">
  <img itemprop="thumbnailUrl" src="http://www.example.com/how_to_build_a_web_app.jpg"/>
  <a itemprop="url" href="http://www.example.com/how_to_build_a_web_app.pdf">
    <span itemprop="name">How to Build a Web App</span></a>
  by <span itemprop="author">John Smith</span>
  <div itemprop="description">This short e-book explains what a web application 
  is and how to build one.</div>
</div>
Run Code Online (Sandbox Code Playgroud)

这使您可以将标题、图像和文本描述与 PDF 中的文章相关联。