小编Tat*_*ots的帖子

使用 Pandas 迭代地将列添加到数据框

我有一些相对简单的代码,我正在努力将它们组合在一起。我有一个 CSV 文件,已将其读入数据框。CSV 是面板数据(即每行的唯一公司和年份观察值)。我想对两列执行函数,然后我想根据函数的输出创建新变量。

这是我到目前为止的代码:

#Loop through rows in a CSV file
for index, rows in df.iterrows():
    #Start at column 6 and go to the end of the file
    for row in rows[6:]:
        data = perform_function1( row )
        output =  perform_function2(data)    
        df.ix[index, 'new_variable'] = output
        print output
Run Code Online (Sandbox Code Playgroud)

我希望这段代码从第 6 列开始迭代,然后转到文件末尾(例如,我有两列,我想在 Column6 和 Column7 上执行该函数),然后根据执行的函数创建新列(例如,输出 6 和输出 7)。上面的代码返回 Column7 的输出,但我不知道如何创建一个变量,该变量允许我捕获两列的输出(即,一个不会被循环覆盖的新变量)。我搜索了 Stackoverflow,但没有看到任何与我的问题直接相关的内容(也许是因为我太菜鸟了?)。我将衷心感谢您的帮助。

谢谢,

TT

PS我不确定我是否提供了足够的细节。如果我需要提供更多信息,请告诉我。

python loops dataframe pandas

5
推荐指数
1
解决办法
2万
查看次数

标签 统计

dataframe ×1

loops ×1

pandas ×1

python ×1