我正在尝试使用逆透视数据pd.melt,但到目前为止尚未成功。每一行都是一个商家,数据包含该商家的信息和多个评论。我希望我的数据将每个评论作为一行。
我的前 150 列以 15 为一组,每个组的列名称都具有相同的reviews/n/模式0 < n < 9。( reviews/0/text,, reviews/0/date..., reviews/9/date)。数据框中接下来的 65 列包含更多有关业务的数据(例如business_id,address),这些数据应保留为 id_variables。
我当前的数据如下所示:
| 业务_id | 地址 | 评论/0/日期 | 评论/0/文本 | 评论/1/日期 | 评论/1/文本 |
|---|---|---|---|---|---|
| 12345 | 01街 | 1990年1月1日 | “abc” | 1995年2月2日 | “定义” |
我的新数据框应该将每个评论作为一行而不是每个业务,并且看起来像这样:
| 业务_id | 地址 | 评论号 | 审核日期 | 评论文本 |
|---|---|---|---|---|
| 12345 | 01街 | 0 | 1990年1月1日 | “abc” |
| 12345 | 01街 | 1 | 1995年2月2日 | “定义” |
我尝试使用pd.melt但无法成功编写对我有价值的代码。