我想从通过'append'生成的类列表的属性填充pandas数据帧.(不确定这是描述下面'allFoo'的正确术语这是一个精简的示例代码:
class foo(object):
def __init__(self,input):
self.val=input
#in real life, there will be many more attributes in this class
allFoo=[];
for i in range(10):
allFoo.append(foo(i))
Run Code Online (Sandbox Code Playgroud)
现在我想定义一个新的pandas数据框'df',它从allFoo.val(而不是任何其他属性)填充
这样的事情:
df[0]=foo[0].val
df[1]=foo[1].val
Run Code Online (Sandbox Code Playgroud)
等等
我来自matlab,我会尝试这样的事情:dataFrame = allFoo [:].val
我怎么能在python/pandas中实现这一点?
KT.*_*KT. 18
对于您的"精简"示例,以下代码可以完成这项工作:
pd.DataFrame([f.val for f in allFoo], columns=['val'])
Run Code Online (Sandbox Code Playgroud)
在稍微更一般的情况下,如果您确定可以从对象中获取所有字段值,则以下内容也应该起作用:
pd.DataFrame([vars(f) for f in allFoo])
Run Code Online (Sandbox Code Playgroud)
在更一般的情况下,当您的对象可能包含数据框中需要的某些字段以及您不需要的其他字段时,无法指定此字段列表.以下代码可能有助于:
fields = ['val', 'other_field']
pd.DataFrame([{fn: getattr(f, fn) for fn in fields} for f in allFoo])
Run Code Online (Sandbox Code Playgroud)
道德:每当你不知道某种东西的"内置方法"时,列表理解就是你的第一选择.
| 归档时间: |
|
| 查看次数: |
9901 次 |
| 最近记录: |