我有一个大型数据文件,我需要删除以某些字母结尾的行.
这是我正在使用的文件的示例:
User Name DN
MB212DA CN=MB212DA,CN=Users,DC=prod,DC=trovp,DC=net
MB423DA CN=MB423DA,OU=Generic Mailbox,DC=prod,DC=trovp,DC=net
MB424PL CN=MB424PL,CN=Users,DC=prod,DC=trovp,DC=net
MBDA423 CN=MBDA423,OU=DNA,DC=prod,DC=trovp,DC=net
MB2ADA4 CN=MB2ADA4,OU=DNA,DC=prod,DC=trovp,DC=netenter code here
Run Code Online (Sandbox Code Playgroud)
我正在使用的代码:
from pandas import DataFrame, read_csv
import pandas as pd
f = pd.read_csv('test1.csv', sep=',',encoding='latin1')
df = f.loc[~(~pd.isnull(f['User Name']) & f['UserName'].str.contains("DA|PL",))]
Run Code Online (Sandbox Code Playgroud)
如何使用正则表达式语法删除以"DA"和"PL"结尾的单词,但请确保我不删除其他行,因为它们中包含"DA"或"PL"?
它应该删除行,我最终得到一个这样的文件:
User Name DN
MBDA423 CN=MBDA423,OU=DNA,DC=prod,DC=trovp,DC=net
MB2ADA4 CN=MB2ADA4,OU=DNA,DC=prod,DC=trovp,DC=net
Run Code Online (Sandbox Code Playgroud)
删除前3行因为它们以DA和PL结束.
如何将代码的输出导出到自己的文本文件中?当我运行我的代码时,我从中获取了大量数据.如何导出它以便我可以读取其自己的文本文件中的所有数据行.