如何将列表转换为pandas中的set?

ALH*_*ALH 6 python pandas

我有一个数据框如下:

           date                     uids
0  2018-11-23  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
1  2018-11-24  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]
Run Code Online (Sandbox Code Playgroud)

当我用set它来转换它来设置它失败:

df['uids'] = set(df['uids'])  # IT FAILS!
Run Code Online (Sandbox Code Playgroud)

我应该如何转换listset到位?

Gre*_*egg 5

您应该使用DataFrame API的apply方法:

df['uids'] = df.apply(lambda row: set(row['uids']), axis=1)
Run Code Online (Sandbox Code Playgroud)

要么

df = df['uids'].apply(set) # great thanks to EdChum
Run Code Online (Sandbox Code Playgroud)

您可以在此处找到有关apply方法的更多信息。

使用例

df = pd.DataFrame({'A': [[1,2,3,4,5,1,1,1], [2,3,4,2,2,2,3,3]]})
df = df['A'].apply(set)
Run Code Online (Sandbox Code Playgroud)

输出:

>>> df
0    set([1, 2, 3, 4, 5])
1          set([2, 3, 4])
Name: A, dtype: object
Run Code Online (Sandbox Code Playgroud)

要么:

>>> df = pd.DataFrame({'A': [[1,2,3,4,5,1,1,1], [2,3,4,2,2,2,3,3]]})
>>> df['A'] = df.apply(lambda row: set(row['A']), axis=1)
>>> df
                      A
0  set([1, 2, 3, 4, 5])
1        set([2, 3, 4])
Run Code Online (Sandbox Code Playgroud)

  • df ['uids']。apply(set)在这里工作正常 (3认同)
  • `apply` 只是一个 `for` 循环,所以不幸的是,这会很慢,没有 `toset` 方法 (2认同)