如何将 defaultdict(list) 转换为 Pandas DataFrame

got*_*sth 4 python dataframe pandas defaultdict

我有一个具有以下结构的 defaultdict(list) 对象:

{id: [list[list]]}
Run Code Online (Sandbox Code Playgroud)

例如,

'a1': [[0.01, 'cat']],

'a2': [[0.09, 'cat']],

'a3': [[0.5, 'dog']],
Run Code Online (Sandbox Code Playgroud)

...

我想把它转换defaultdict(list)成一个Pandas DataFrame对象。

我尝试了以下方法:

df = pd.DataFrame(list(my_dict.items()), columns=['id', 'category'])

但是,我的“类别”列遇到了问题。这是一列列表的列表。我试图将“类别”中的 2 个值拆分为 2 个单独的列。所以我的最终 DataFrame 列将是 ['id', 'score', 'category']。

当我尝试使用以下应用功能时:

db['category'].apply(lambda x: x[0][0])

我收到“列表索引超出范围”的错误。

我的代码可能有什么问题?我该如何从列表列表中创建 2 个新列?

谢谢。

jez*_*ael 5

我相信你需要:

df = pd.DataFrame([[k] + v[0] for k, v in my_dict.items()], 
                   columns=['id', 'score', 'category'])
Run Code Online (Sandbox Code Playgroud)

或者:

df = pd.DataFrame([(k, v[0][0], v[0][1]) for k, v in my_dict.items()], 
                   columns=['id', 'score', 'category'])
Run Code Online (Sandbox Code Playgroud)