熊猫数据框的元组列表

bla*_*bla 5 python numpy dataframe python-3.x pandas

我有这个数组(它是相似度计算的结果)它是一个像这样的元组列表:

example = [[(a,b), (c,d)], [(a1,b1), (c1,d2)] …]
Run Code Online (Sandbox Code Playgroud)

在示例中有 121044 个列表,每个列表包含 30 个元组。

我想要一个像元组的第二个值(即:b、d、b1、d2)那样的 Pandas Dataframe,而不需要花太多时间来计算它

你有什么想法 ?

jez*_*ael 3

使用嵌套列表理解:

df = pd.DataFrame([[y[1] for y in  x] for x in example])
print (df)
    0   1
0   b   d
1  b1  d2
Run Code Online (Sandbox Code Playgroud)
df = pd.DataFrame([[y[1] for y in  x] for x in example], columns=['col1','col2'])
print (df)
  col1 col2
0    b    d
1   b1   d2
Run Code Online (Sandbox Code Playgroud)