7 plaintext dataset
我正在开发ruby中的解析器,它解析一些非均匀的文本数据.任何人都能告诉我,我可以在哪里获得大量明文数据吗?
int*_*iot 6
在这里你会得到一个列表:
http://www.quora.com/Data/Where-can-I-get-large-datasets-open-to-the-public
我最喜欢的是:
http://ftp.sunet.se/mirror/archive/ftp.sunet.se/pub/tv+movies/imdb/
mu *_*ort 5
你可以抓维基百科(或者只是运行一堆lynx -dump).这也会给你很多非英语文本的来源.古腾堡计划将成为大量纯文本的另一个好来源.
lynx -dump
归档时间:
14 年,7 月 前
查看次数:
6851 次
最近记录:
8 年,6 月 前