如何在pandas中读取空格分隔值的文件

yem*_*emu 57 python pandas delimiter-separated-values

我尝试将文件读入熊猫.该文件的值由空格分隔,但我尝试的空格数不同:

pd.read_csv('file.csv', delimiter=' ')
Run Code Online (Sandbox Code Playgroud)

但它不起作用

HYR*_*YRY 98

添加delim_whitespace=True参数,它比正则表达式更快.

  • 应该添加这一点,并删除 `delimiter=' '` 因为它们在最近的版本中是互斥的。 (5认同)
  • @matanster: `delimiter=' '` 非常脆弱,它表示需要一个且只有一个空格。没有制表符、新闻行、多个空格、不间断空格、这些的组合等。 `delimiter='\s+'` 是 pandas 推荐的,并且更强大。 (4认同)

小智 23

你可以使用正则表达式作为分隔符:

pd.read_csv("whitespace.csv", header=None, delimiter=r"\s+")
Run Code Online (Sandbox Code Playgroud)

  • 当您不仅仅有一个空格作为分隔符时,这会有所帮助。在当前版本中,应该添加`engine = "python"` 以避免警告。 (4认同)
  • 抱歉在这里评论旧回复,`"\s+"` 之前的 `r` 是什么意思? (2认同)