小编Roh*_*mal的帖子

有没有更好的方法来迭代行（30000）的嵌套循环？

我想在下表中找到包含重复电子邮件地址的行。当电子邮件地址重复时，我在以下代码的数据框中创建一个额外的列，其值为“ja”。这对于少量行 (150) 来说是很好的。对于大量行 (30000)，脚本会挂起。有更好的方法来循环行吗？

import pandas as pd
data={'Name':['Danny','Damny','Monny','Quony','Dimny','Danny'],
      'Email':['danny@gmail.com','danny@gmail.com','monny@gmail.com','quony@gmail.com','danny@gmail.com','danny@gmail.com']}
df=pd.DataFrame(data)
df['email_repeated']=None
col_email=df.columns.get_loc("Email")
row_count=len(df.index)
for i in range(0,row_count):
    for k in range(0,row_count):
        emailadres=df.iloc[i,col_email] 
        if k!=i:
            if emailadres==df.iloc[k,col_email]:
                df['email_repeated'][k] = 'ja'

Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

Roh*_*mal

2022 10-25

2
推荐指数

1
解决办法

420
查看次数

标签统计

dataframe ×1

pandas ×1

python ×1

有没有更好的方法来迭代行（30000）的嵌套循环？

标签 统计

小编Roh_mal的帖子

标签统计