我在数据框中有一个列应该是所有数字字符,但在某些情况下,有一些字母字符混合在一起.我试图使用列表解析来摆脱非数字字符,以便我有一个列表,然后我可以转换为系列并写入旧值.
我的具体问题是结果列表只是理解中使用的原始数据帧列长度的一半左右.为什么会这样?
if df.CEEB.dtype=='object':
CEEBcomp = {re.sub("[^0-9]","",str(x)) for x in list(df.CEEB)}
Run Code Online (Sandbox Code Playgroud)