如何使用Python更改文件的字段分隔符?

Pie*_*rre 2 python separator lidar

我是来自R世界的Python新手,我正在研究大文本文件,结构化数据列(这是LiDaR数据,因此通常有6000万条+记录).

是否可以更改这样一个大文件的字段分隔符(例如从制表符分隔到逗号分隔),而无需读取文件并for在行上循环?

Eli*_*sky 6

没有.

  • 阅读文件
  • 更改每行的分隔符
  • 写回每一行

只需几行Python就可以轻松完成这项工作(未经测试,但一般方法可行):

# Python - it's so readable, the code basically just writes itself ;-)
#
with open('infile') as infile:
  with open('outfile', 'w') as outfile:
    for line in infile:
      fields = line.split('\t')
      outfile.write(','.join(fields))
Run Code Online (Sandbox Code Playgroud)

我不熟悉R,但是如果它有一个库函数,它可能完全一样.

请注意,此代码一次只能从文件中读取一行,因此文件可能比物理RAM大 - 它永远不会完全加载.