我正在尝试为我的 Wikipedia api 调用添加不区分大小写的功能。维基百科在页面命名方式上区分大小写。因此,http://en.wikipedia.org/wiki/Cat将产生一个关于动物的页面,http://en.wikipedia.org/wiki/CAT将产生一个消歧页面,并将http://en.wikipedia.org/wiki/CAt产生一个该页面不存在的通知。
我当前的问题是我想使用 API 返回页面,就像维基百科那样。我目前在 Python 中使用以下 API 调用:
"http://en.wikipedia.org/w/index.php?title=" + topic + "&action=render"
Run Code Online (Sandbox Code Playgroud)
当使用 GUI 的搜索框在维基百科上搜索时,“cat”和“CAt”将返回有关动物的页面,而“cAT”和“CAT”将返回消歧页面。
如何通过 API 复制此行为?
search wikipedia case-insensitive wikipedia-api mediawiki-api
我试图使用Rails根据搜索词从维基百科中提取数据.
例如,
1)如果我有字符串"美国偶像",我想将其传递给维基百科,并获得与之相关的文章列表.我的目标是获取前3个超链接并在网站上显示.
2)进一步将涉及我从维基百科中提取小块数据 - 比如信息框,或维基百科文章的前几个单词.
有小费吗?
谢谢!
我阅读了MediaWiki API文档 但我找不到如何获取当天图片的当前URL .
在RTFM之后,我将Commons:Potd中的查询调用 到其页面URL.
它返回pageid=2518149,它是当前的POTD页面.
然后我尝试打电话prop=imageinfo,但我找不到获取图片网址的方法.
唯一成功的电话是这样的:
http://commons.wikimedia.org/w/api.php?titles=File:POTD&action=query&prop=images
"成功"意味着它返回一个图像URL ...但是不同pageid(不是当前的POTD)!
您好我正在使用Curl从维基百科获取信息,我想只收到有关主要图像的信息,我不想收到文章的所有图像..例如..如果我想获得有关所有信息的信息英语图像(http://en.wikipedia.org/wiki/English_language)我应该访问以下URL:http: //en.wikipedia.org/w/api.php?action = query&title = English_Language&prop = images 但我收到人们用XML说英语的国家的旗帜:
<?xml version="1.0"?> <api> <query>
<normalized>
<n from="English_language" to="English language" />
</normalized>
<pages>
<page pageid="8569916" ns="0" title="English language">
<images>
<im ns="6" title="File:Anglospeak(800px)Countries.png" />
<im ns="6" title="File:Anglospeak.svg" />
<im ns="6" title="File:Circle frame.svg" />
<im ns="6" title="File:Commons-logo.svg" />
<im ns="6" title="File:Flag of Argentina.svg" />
<im ns="6" title="File:Flag of Aruba.svg" />
<im ns="6" title="File:Flag of Australia.svg" />
<im ns="6" title="File:Flag of Bolivia.svg" />
<im ns="6" title="File:Flag of Brazil.svg" />
<im ns="6" …Run Code Online (Sandbox Code Playgroud) 是否可以使用MediaWiki API从维基百科下载图像?
我正在查询 MediaWiki API 以将 Wikipedia 数据输入到我的 Filemaker 数据库中。当我将数据加载到浏览器中时,字符会正确显示,但是当它进入 Filemaker 时,带有变音符号的字符会转换为这些奇数字符:á 转换为 ?°(平方根符号 + 度数符号),é 转换为?©(平方根符号+版权符号),í转换为?? (平方根符号+不等于符号)等等。那是什么字符编码?谢谢!!
我需要特定类别下的页面列表及其子类别。我知道如何从维基百科获取查询。
获取此处提到的类别页面的简单查询是将查询的参数定义为:
action = query
list = categorymembers
cmtitle = Category:Physics
Run Code Online (Sandbox Code Playgroud)
这给出了包含物理类别下的子类别和页面的正常输出。我知道我可以一步一步地逐个分类,以获取 Mother 类别下的所有页面。但这是一种通过一个查询请求获取所有页面的方法吗?
如果我尝试通过他们的API获取维基百科上的页面的语言链接,如下所示:
我得到了一份结果清单.
但是,如果我像拉尔夫一样贬低拉尔夫的R:
我没有结果.
看看返回的信息,看起来维基百科在第一个例子中将"wreck-it Ralph"标准化为"Wreck-it Ralph",重定向到"Wreck-It Ralph".
在第二个例子中,"wreck-it ralph"被标准化为"Wreck-it ralph",它显然没有重定向到任何地方.
在http://wikipedia.org上搜索"wreck-it ralph" 当然有效:
http://www.wikipedia.org/search-redirect.php?family=wikipedia&search=wreck-it+ralph&language=en
我能否以相同的方式使langlinks查询工作,当我不知道搜索词的所有字符的确切情况时帮助我?
更新 从Sorawee的回答中我设法找到了如何进行不区分大小写的搜索:https://en.wikipedia.org/w/api.php?action = query&generator = search&format = json&thegsrsearch = wreck-it%20ralph>rlimit = 1托=信息
redirect mediawiki normalization wikipedia-api mediawiki-api
我正在使用以下 wikimedia API 列出具有特定类别的所有页面:https : //www.mediawiki.org/wiki/API :Categorymembers
例如https://en.wikipedia.org/w/api.php?action=query&list=categorymembers&cmtitle=Category:Physics
这给了我一个带有标题和 ID 的页面列表,但我还想查看每个页面的所有类别。然而,似乎没有 cmprop 。
cmprop: Which properties to get. (Default: ids|title)
ids: Page ID
title: Page title
sortkey: The sortkey used for sorting in the category (hexadecimal string)
sortkeyprefix: The sortkey prefix used for sorting in the category (human-readable part of the sortkey) 1.17+
type: Type that the page has been categorised as (page, subcat or file) 1.17+
timestamp: Time and date the article was added to the category …Run Code Online (Sandbox Code Playgroud) 我正在尝试提取与阿拉伯语文章列表相关的英语维基百科文章,假设我有这篇文章
https://ar.wikipedia.org/wiki/%D8%A7%D9%84%D9%82%D8%AF%D8%B3
我需要提取它的英文版本
https://en.wikipedia.org/wiki/耶路撒冷
问题是我没有与阿拉伯语姓名列表对应的英文姓名列表来与 API 一起使用,我考虑提取语言链接并对结果进行一些处理以提取英文姓名,但没有知道是否有更简单的方法可以建议您使用 Mediawiki API?