我需要一些帮助.所以我有这样的事情
import pandas as pd
path = '/Users/arronteb/Desktop/excel/ejemplo.xlsx'
xlsx = pd.ExcelFile(path)
df = pd.read_excel(xlsx,'Sheet1')
df['is_duplicated'] = df.duplicated('#CSR')
df_nodup = df.loc[df['is_duplicated'] == False]
df_nodup.to_excel('ejemplo.xlsx', encoding='utf-8')
Run Code Online (Sandbox Code Playgroud)
所以基本上这个程序将ejemplo.xlsx
(ejemplo是西班牙语的例子,只是文件的名称)加载到df
(a DataFrame
)中,然后检查特定列中的重复值.它会删除重复项并再次保存文件.那部分工作正常.问题是,我需要使用不同的颜色(如黄色)突出显示包含它们的单元格,而不是删除重复项.
我正在使用 Pandas 和 python 在 excel 中工作。我有这样的事情。
df = pd.read_csv("abx.csv")
df1 = df.loc[df["Application Name"].str.contains(r"(\N\/\A)")]
df1.set_index("User ID", inplace = True)
df1.to_csv("abx1.csv")
Run Code Online (Sandbox Code Playgroud)
在这种情况下,我试图过滤包含字符串 N/A 的列“应用程序名称”。但是当我运行此代码时,我收到此错误
raise ValueError('cannot index with vector containing '
ValueError: cannot index with vector containing NA / NaN values
Run Code Online (Sandbox Code Playgroud)
我认为问题在于编译器将 N/A 作为非数字值,而不是 N/A 字符串。
任何的想法。我会感谢您的帮助。感谢和抱歉英语不好