相关疑难解决方法(0)

从熊猫系列列表中获取唯一值

我在DataFrame中有一列,其中包含类别列表。例如:

0                                                    [Pizza]
1                                 [Mexican, Bars, Nightlife]
2                                  [American, New, Barbeque]
3                                                     [Thai]
4          [Desserts, Asian, Fusion, Mexican, Hawaiian, F...
6                                           [Thai, Barbeque]
7                           [Asian, Fusion, Korean, Mexican]
8          [Barbeque, Bars, Pubs, American, Traditional, ...
9                       [Diners, Burgers, Breakfast, Brunch]
11                                [Pakistani, Halal, Indian]
Run Code Online (Sandbox Code Playgroud)

我正在尝试做两件事:

1)获得唯一的类别-我的方法是有一个空集,遍历系列并附加每个列表。

我的代码:

unique_categories = {'Pizza'}
for lst in restaurant_review_df['categories_arr']:
    unique_categories = unique_categories | set(lst)
Run Code Online (Sandbox Code Playgroud)

这给了我列中所有列表中包含的一组唯一类别。

2)生成类别计数的饼图,每个餐厅可以属于多个类别。例如:餐厅11属于巴基斯坦,印度和清真食品类别。我的方法再次遍历类别,再遍历一系列迭代以获得计数。

有更简单或更优雅的方法吗?

提前致谢。

python unique set pandas pie-chart

5
推荐指数
1
解决办法
3811
查看次数

标签 统计

pandas ×1

pie-chart ×1

python ×1

set ×1

unique ×1