我正在寻找一个文本语料库来运行一些试验全文风格的数据搜索.我可以下载的东西,或者生成它的系统.更随机的东西会更好,例如1,000,000维基百科文章,格式易于插入2列数据库(id,text).
任何想法或建议?
mysql database core-data corpus dataset
core-data ×1
corpus ×1
database ×1
dataset ×1
mysql ×1