将 3 列数据框转换为矩阵

Question

将 3 列数据框转换为矩阵

use*_*ser 5 python matrix dataframe pandas

我有一个数据框 df，例如：

A = [["John", "Sunday", 6], ["John", "Monday", 3], ["John", "Tuesday", 2], ["Mary", "Sunday", 6], ["Mary", "Monday", 4], ["Mary", "Tuesday", 7]] 
df = pandas.DataFrame(A, columns=["names", "dates", "times"])

Run Code Online (Sandbox Code Playgroud)

我想重塑它，这样，而不是三列，我可以创建一个矩阵，其中第一列索引行，第二列索引列，第三列成为矩阵值，例如：

B = [["John", 6, 3, 2], ["Mary", 6, 4, 7]]
df2 = pandas.DataFrame(B, columns=["names", "Sunday", "Monday", "Tuesday"])

Run Code Online (Sandbox Code Playgroud)

甚至更好：

B = numpy.asarray(B)
B = pandas.DataFrame(B)

Run Code Online (Sandbox Code Playgroud)

怎么把A变成B？

我创建了一个双 for 循环，但在我的情况下 df 非常大并且需要很长时间。有没有更好的方法来做到这一点？

这不仅仅是重塑，因为 A 有 18 个值，B 有 8 个

Answer 1

ACh*_*ion 7

您可以使用pivot_table()，例如：

In []:
df.pivot_table(columns='dates', index='names', values='times').reset_index()

Out[]:
dates names  Monday  Sunday  Tuesday
0      John       3       6        2
1      Mary       4       6        7

Run Code Online (Sandbox Code Playgroud)

Answer 2

Sco*_*ton 5

尝试：

df.set_index(['names','dates'])['times'].unstack().reset_index()

Run Code Online (Sandbox Code Playgroud)

输出：

dates names  Monday  Sunday  Tuesday
0      John       3       6        2
1      Mary       4       6        7

Run Code Online (Sandbox Code Playgroud)

或者：

pd.crosstab(df.names, df.dates, df.times, aggfunc='sum').reset_index()

Run Code Online (Sandbox Code Playgroud)

或者：

df.groupby(['names','dates']).sum()['times'].unstack().reset_index()

Run Code Online (Sandbox Code Playgroud)

或者：

df.pivot('names','dates','times').reset_index()

Run Code Online (Sandbox Code Playgroud)

归档时间：	6 年，11 月前
查看次数：	1619 次
最近记录：	6 年，11 月前