熊猫 read_csv。如何在换行前忽略分隔符

her*_*cho 2 python file pandas

我正在读取一个带有数值的文件。

data = pd.read_csv('data.dat', sep=' ', header=None)

在文本文件中,每一行都以一个空格结束,所以 Pandas 等待一个不存在的值并在每行的末尾添加一个“nan”。例如:

2.343 4.234

读作:[2.343, 4.234, nan]

我可以避免使用它,, usecols = [0 1]但我更喜欢更通用的解决方案

小智 5

您可以在sep参数中使用正则表达式。

您可以要求它使用任意数量的空格作为分隔符,而不是将分隔符指定为一个空格,直到它找到下一个值。您可以使用正则表达式来做到这一点\s+

data = pd.read_csv('data.dat', sep='\s+', header=None)
Run Code Online (Sandbox Code Playgroud)