小编Car*_*llo的帖子

用大熊猫在excel中着色细胞

我需要一些帮助.所以我有这样的事情

import pandas as pd
path = '/Users/arronteb/Desktop/excel/ejemplo.xlsx'
xlsx = pd.ExcelFile(path)
df = pd.read_excel(xlsx,'Sheet1')
df['is_duplicated'] = df.duplicated('#CSR')
df_nodup = df.loc[df['is_duplicated'] == False]
df_nodup.to_excel('ejemplo.xlsx', encoding='utf-8')

Run Code Online (Sandbox Code Playgroud)

所以基本上这个程序将ejemplo.xlsx(ejemplo是西班牙语的例子,只是文件的名称)加载到df(a DataFrame)中,然后检查特定列中的重复值.它会删除重复项并再次保存文件.那部分工作正常.问题是,我需要使用不同的颜色(如黄色)突出显示包含它们的单元格,而不是删除重复项.

python excel highlight duplicates pandas

Car*_*llo

2016 09-03

6
推荐指数

2
解决办法

1万
查看次数

N/A 作为 N/A 而不是 Pandas 和 python 中的数字

我正在使用 Pandas 和 python 在 excel 中工作。我有这样的事情。

df = pd.read_csv("abx.csv")
df1 = df.loc[df["Application Name"].str.contains(r"(\N\/\A)")]
df1.set_index("User ID", inplace = True)
df1.to_csv("abx1.csv")

Run Code Online (Sandbox Code Playgroud)

在这种情况下，我试图过滤包含字符串 N/A 的列“应用程序名称”。但是当我运行此代码时，我收到此错误

raise ValueError('cannot index with vector containing '
ValueError: cannot index with vector containing NA / NaN values

Run Code Online (Sandbox Code Playgroud)

我认为问题在于编译器将 N/A 作为非数字值，而不是 N/A 字符串。

任何的想法。我会感谢您的帮助。感谢和抱歉英语不好

python regex nan pandas na

Car*_*llo

lucky-day

2
推荐指数

1
解决办法

5823
查看次数

标签统计

pandas ×2

python ×2

duplicates ×1

excel ×1

highlight ×1

na ×1

nan ×1

regex ×1

用大熊猫在excel中着色细胞

N/A 作为 N/A 而不是 Pandas 和 python 中的数字

标签 统计

小编Car_llo的帖子

标签统计