推荐用于处理大量数据的语言或工具

Ste*_*eve 2 programming-languages dataset

我有一个大型数据集(1GB的纯压缩文本).

现在我正在根据数据中的信息重写数据集,例如:

  • 将2009-10-16变为周五
  • 计算事情发生的次数和持续时间

现在我用Java做这一切.我想知道是否有人知道实际设计用于此类工作的工具或语言.它可以用Java编写,但我写了很多样板代码.

jit*_*ter 5

Perl就是答案.它是为处理文本数据而创建的.