标签: mediawiki

解析维基百科转储

例如,使用此Wikipedia转储:

http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=lebron%20james&rvprop=content&redirects=true&format=xmlfm

是否有一个现有的Python库,我可以用它来创建一个带有主题和值映射的数组?

例如:

{height_ft,6},{nationality, American}
Run Code Online (Sandbox Code Playgroud)

python mediawiki wikipedia-api mediawiki-api wikimedia-dumps

15
推荐指数
3
解决办法
2万
查看次数

将Excel文档转换为wiki标记

是否可以将Excel电子表格转换为MediaWiki标记?我想到了导出到HTML并将其转换为标记的奇怪建议.有没有解决方案,可能首先导出到XML或直接转换它?

excel markup wiki mediawiki

14
推荐指数
3
解决办法
2万
查看次数

有没有办法在python中将Wikitext转换为Markdown?

是否有一个python库,它采用wikitext(在mediawiki中使用)输入并将其转换为markdown?

python markdown mediawiki text-processing

14
推荐指数
2
解决办法
6803
查看次数

维基百科的"这里有什么链接"如何运作?

我最近使用了维基百科的功能"这里有什么链接"(在任何条目的左侧菜单中的"工具箱"元素下找到),它让我开始想知道这个功能是如何工作的.
我猜测在链接之后搜索所有文章条目不是很有效,那么所有链接都存储在一个单独的数据库中吗?如果是这样,在编辑文章或其他时间更新?

谢谢.

mediawiki wikipedia

13
推荐指数
1
解决办法
1196
查看次数

维基百科的解析器

我下载了一个维基百科转储,我想将维基格式转换为我的对象格式.是否有可用的wiki解析器将对象转换为XML?

java mediawiki nlp wikipedia nsxmlparser

13
推荐指数
1
解决办法
8465
查看次数

如何从MediaWiki的所有页面导出文本?

我有一个MediaWiki运行,它代表德语术语的字典及其对当地方言的翻译.每个页面包含一个术语,其翻译和一些额外的信息.

现在,对于字典的可打印版本,我需要完整导出所有术语及其翻译.由于这是页面内容的摘录,我想我需要以可解析的格式完整导出其最新版本中的所有页面,例如xml或csv.

有没有人这样做或可以指向我的工具?我应该提一下,我没有完全访问服务器,例如没有命令行,但我能够添加MediaWiki扩展或访问MySQL数据库.

mediawiki export

13
推荐指数
2
解决办法
2万
查看次数

如何从MediaWiki wiki中永久删除页面?

我管理的MediaWiki wiki受到大量垃圾邮件的攻击.我已经设法通过使用扩展来摆脱已经添加到wiki的垃圾邮件页面,但页面的数据仍然存在于wiki的MySQL数据库中.这使数据库膨胀超过3GB.

有没有办法从wiki中永久删除垃圾邮件页面,以便将它们从数据库中完全删除?

mediawiki mediawiki-api

13
推荐指数
1
解决办法
6111
查看次数

MWException类型的致命异常

我最近在Debian 7 System上的localhost中安装了MediaWiki.但是在安装之后,我得到了例外Fatal exception of type MWException.我查看了所有报告的错误,但它们不适用于我.

PHP 5.4.4 phpmyaddmin ....

mediawiki mediawiki-extensions

13
推荐指数
1
解决办法
2万
查看次数

清除mediawiki中的所有页面

是否可以清除mediawiki中的所有页面?我试过清空obejctcache表无济于事.我并不特别想要?action=purge追加每一页.版本1.23.3

mediawiki caching purge

12
推荐指数
2
解决办法
3513
查看次数

取消Mediawiki登录以防止会话劫持

我刚刚在AS400 IBM i机器上设置了MediaWiki 1.29.0页面.我使用MariaDB作为数据库.我使用的是PHP 5.5.37

每次我尝试登录帐户时,都会收到错误消息:

您的登录会话似乎有问题; 此操作已被取消,作为防止会话劫持的预防措施.返回上一页,重新加载该页面,然后重试.

显然,我正在寻找的行为是登录.

我试过了:

  • 改变$wgMainCacheType$wgSessionCacheType对各种排列CACHE_NONE,CACHE_ACCEL,CACHE_DB,和CACHE_ANYTHING.
  • 创建tmp目录并设置其权限.
  • 重建我的LocalSettings.php文件.
  • session.referer_check=off在php.ini中设置

我已经检查过,我知道我的cookie已启用(我可以调用document.cookie;并获取数据).

这个问题在之前已经被问到,并且内部存在相关问题,但没有解决方案解决了我的问题.他们还处理旧版本的WikiMedia,但我不知道这在这个例子中是否有所作为.

编辑:当我尝试创建一个新帐户时,我也会遇到相同的行为.但是,我能够导航wiki,创建页面和编辑页面而不会出现任何错误.

这是我的请求标题:

Cache-Control: private, must-revalidate, max-age=0
Connection: close
Content-language: en
Content-Type: text/html; charset=UTF-8
Date: Thu, 10 Aug 2017 13:48:36 GMT
Expires: Thu, 01 Jan 1970 00:00:00 GMT
Link: </<path>/resources/assets/logo.png?88d75>;rel=preload;as=image
Server: Apache
Set-Cookie: ZDEDebuggerPresent=php,phtml,php3; path=/
Set-Cookie: <wikiname>_session=n7gs0ct99ck5i2juq0togto9q7bfou6u; path=/; secure; httponly
Transfer-Encoding: chunked
Vary: Accept-Encoding,Cookie
X-Content-Type-Options: …
Run Code Online (Sandbox Code Playgroud)

php session mediawiki

12
推荐指数
1
解决办法
960
查看次数