我如何获取维基百科文章的解析信息框?

Ali*_*Ali 9 php wikipedia wikipedia-api

我仍然坚持试图从维基百科解析文章的问题.实际上我希望从维基百科解析文章的信息框部分,即我的应用程序引用了国家和每个国家页面,我希望能够显示该国家相应的维基百科文章中的信息框.我在这里使用PHP - 如果有人有任何代码片段或建议我应该在这里做什么,我将不胜感激.

再次感谢.


编辑

好吧,我有一个包含国家名称的数据库表.我有一个脚本,需要一个国家,并显示其详细信息.我想抓住信息框 - 带有所有国家详细信息图片等的蓝色框,因为它来自维基百科并在我的页面上显示.我想知道一个非常简单易行的方法 - 或者有一个脚本只是将信息框的信息下载到本地远程系统,以后我可以自己访问.我的意思是我对这里的想法持开放态度 - 除了我想要的最终结果是在我的页面上看到信息框 - 当然在底部有一些基于维基百科的内容链接:)


编辑

我想我在http://infochimps.org找到了我想要的东西- 他们在我认为的YAML语言中有很多数据集.我可以直接使用这些信息,但我需要一种方法来不断更新维基百科中的这些信息,尽管我认为信息框很少会改变特别是o国家,除非一些国家决定改变他们的首都城市左右.

小智 14

我会使用维基百科(维基媒体)API.您可以使用JSON,XML,php本机格式和其他格式获取数据.然后,您仍然需要解析返回的信息以提取和格式化您想要的信息,但信息框的开始,停止和信息类型是明确的.

运行您的查询只是rvsection = 0,因为第一部分会在第一个分节符之前获取材料,包括信息框.然后你需要解析信息框内容,这不应该太难.有关正式的维基百科api文档,请参阅en.wikipedia.org/w/api.php;有关本手册,请参阅www.mediawiki.org/wiki/API.

例如,运行查询:http://en.wikipedia.org/w/api.php?action = query&prop = revisions&rvprop = content&format = xmlfm&titles = fortran&rvsection = 0


daj*_*obe 10

我建议您使用DBPedia,它已经完成了将维基百科中的数据转换为可用,可链接,开放形式的工作.


And*_*mer -6

我建议针对维基百科执行 WebRequest。从那里您将拥有该页面,您可以使用正则表达式、字符爬行或您熟悉的其他某种形式简单地解析或查询所需的数据。本质上是屏幕刮擦!

编辑 - 我想在这个答案中添加一点,您可以对 C# 领域的用户使用 HtmlAgilityPack。对于 PHP,它看起来像 SimpleHtmlDom。话虽如此,看起来 Wikipedia 的 API 已经绰绰有余了。这个问题可能最能满足您的需求:

有维基百科 API 吗?

  • 有一个API。刮痧是不合适的。 (6认同)