小编Fon*_*nti的帖子

对于坏数据,Pandas dataframe read_csv

我想读一个非常大的csv(不能在excel中打开并且很容易编辑)但是在第100,000行的某个地方,有一行有一个额外的列导致程序崩溃.这行是错误的,所以我需要一种方法来忽略它是一个额外的列的事实.有大约50列,所以硬编码标题和使用名称或usecols是不可取的.我也可能在其他csv中遇到这个问题,并且想要一个通用的解决方案.遗憾的是,我在read_csv中找不到任何内容.代码就像这样简单:

def loadCSV(filePath):
    dataframe = pd.read_csv(filePath, index_col=False, encoding='iso-8859-1', nrows=1000)
    datakeys = dataframe.keys();
    return dataframe, datakeys
Run Code Online (Sandbox Code Playgroud)

python csv pandas

49
推荐指数
4
解决办法
4万
查看次数

Pandas.read_csv 将所有文件读入一列

我有一个 csv 文件,格式为 "...","...","..."... 超过 40 列。当我使用这个简单的代码时,它只给了我一个巨大的密钥。我已经弄了一个多小时了,我不知道如何使用熊猫来解决这个问题。

dataframe = pd.read_csv(filePath, header=0, encoding='iso-8859-1')
datakeys = dataframe.keys();
print(datakeys)
Run Code Online (Sandbox Code Playgroud)

python csv excel pandas anaconda

5
推荐指数
2
解决办法
9837
查看次数

标签 统计

csv ×2

pandas ×2

python ×2

anaconda ×1

excel ×1