熊猫数据框的元组列表

Question

我有这个数组（它是相似度计算的结果）它是一个像这样的元组列表：

example = [[(a,b), (c,d)], [(a1,b1), (c1,d2)] …]

在示例中有 121044 个列表，每个列表包含 30 个元组。

我想要一个像元组的第二个值（即：b、d、b1、d2）那样的 Pandas Dataframe，而不需要花太多时间来计算它

你有什么想法？

Answer 1

使用嵌套列表理解：

df = pd.DataFrame([[y[1] for y in  x] for x in example])
print (df)
    0   1
0   b   d
1  b1  d2

df = pd.DataFrame([[y[1] for y in  x] for x in example], columns=['col1','col2'])
print (df)
  col1 col2
0    b    d
1   b1   d2