相关疑难解决方法(0)

如何提取csv文件的一列

如果我有一个csv文件,是否有快速bash方式打印出任何单个列的内容?可以安全地假设每行具有相同的列数,但每列的内容将具有不同的长度.

csv bash extract

95
推荐指数
12
解决办法
12万
查看次数

CSV格式的mysqldump

我需要以CSV格式转储MySQL中的所有表.

是否有使用命令mysqldump输出每一行的CSV格式的每个表?

mysql csv

65
推荐指数
6
解决办法
12万
查看次数

如何获取所有维基百科文章的标题列表

我想获得所有维基百科文章的所有标题列表.我知道有两种方法可以从维基媒体的wiki中获取内容.一个是API,另一个是数据库转储.

我不想下载wiki转储.首先,它是巨大的,其次,我对查询数据库并不是很有经验.另一方面,API的问题在于我无法找到一种只检索文章标题列表的方法,即使它需要> 4 mio请求,这可能会让我阻止任何进一步的请求.

所以我的问题是

  1. 有没有办法通过API获取维基百科文章的标题?
  2. 有没有办法将多个请求/查询合并为一个?或者我实际上是否必须下载Wikipedia转储?

mediawiki wikipedia wikipedia-api mediawiki-api

22
推荐指数
1
解决办法
7051
查看次数

来自转储的Wikipedia类别层次结构

使用Wikipedia的转储我想为其类别构建层次结构.我已经下载了主转储(enwiki-latest-pages-articles)和类别SQL转储(enwiki-latest-category).但我找不到层次结构信息.

例如,SQL类别的转储包含每个类别的条目,但我找不到任何关于它们如何相互关联的信息.

另一个转储(latest-pages-articles)表示每个页面的父类别,但是以无序方式.它只是陈述了所有的父母.

我见过wikiprep的类别层次结构(http://www.cs.technion.ac.il/~gabr/resources/code/wikiprep/)......这个是如何构建的?Wikiprep列出了类别ID,而不是其名称.有没有办法获得每个ID的名称?

mediawiki wikipedia dump categories wikipedia-api

11
推荐指数
1
解决办法
6474
查看次数

将 enwiki-latest-categorylinks.sql 加载到 mysql 中

我想将维基百科类别链接表加载到 MySql 数据库中。我在终端中使用了以下命令:

mysql -u root -proot categorylinks < enwiki-latest-categorylinks.sql
Run Code Online (Sandbox Code Playgroud)

该文件大小为 11.6 GB,已运行 3 天。有没有更好的方法来更快地加载它或者我需要设置一些设置以使其运行得更快???

mysql

4
推荐指数
1
解决办法
1600
查看次数