使用 Pandas 读取 .data 文件

Sur*_*rya 4 pandas

我正在开展一个深度学习项目,数据是在扩展名为“.data”的文件中提供给我的。能够使用 Pandas“read_csv”函数从文件中读取数据。我试图在网上搜索文件属性,但我不清楚文件属性、用法等。以下是我的几个问题,

  1. 什么是“.data”文件?
  2. 它们是如何创建的?(指从任何应用程序或数据库导出)
  3. 这是使用 pd.read_csv 方法读取“.data”文件的正确方法吗?(也尝试过 read_table )
  4. 还有其他方法可以读取“.data”文件吗?

shi*_*iva 9

.data最近我找到了使用文件的解决方案pandas

import pandas as pd
data = pd.read_fwf("example.data")
Run Code Online (Sandbox Code Playgroud)

欲了解更多详情,请查看此处


小智 6

我自己刚刚在野外遇到了一个 .data 文件。我已经能够在任何文本编辑器(记事本、Visual Studio Code、jupyter lab 等)中查看它。这有助于确定分隔符应该是什么。我的文件不是像 mrinali 提到的那样以制表符分隔,但这并不是说没有任何制表符分隔的 .data 文件。我的是空格分隔的,所以我只是在 panda 的.read_csv()方法中将其指定为“sep”:

pd.read_csv('<your_path>', sep=' ')
Run Code Online (Sandbox Code Playgroud)