小编raz*_*raz的帖子

如何使用 pd.melt 取消透视列共享前缀的数据框?

我正在尝试使用逆透视数据pd.melt,但到目前为止尚未成功。每一行都是一个商家,数据包含该商家的信息和多个评论。我希望我的数据将每个评论作为一行。

我的前 150 列以 15 为一组,每个组的列名称都具有相同的reviews/n/模式0 < n < 9。( reviews/0/text,, reviews/0/date..., reviews/9/date)。数据框中接下来的 65 列包含更多有关业务的数据(例如business_idaddress),这些数据应保留为 id_variables。

我当前的数据如下所示:

业务_id 地址 评论/0/日期 评论/0/文本 评论/1/日期 评论/1/文本
12345 01街 1990年1月1日 “abc” 1995年2月2日 “定义”

我的新数据框应该将每个评论作为一行而不是每个业务,并且看起来像这样:

业务_id 地址 评论号 审核日期 评论文本
12345 01街 0 1990年1月1日 “abc”
12345 01街 1 1995年2月2日 “定义”

我尝试使用pd.melt但无法成功编写对我有价值的代码。

python regex unpivot melt pandas

4
推荐指数
1
解决办法
324
查看次数

标签 统计

melt ×1

pandas ×1

python ×1

regex ×1

unpivot ×1