emi*_*ina 3 python unicode-string python-2.7 pandas python-unicode
我从读取xls文件获得的数据帧遇到一些麻烦。这样的数据帧上的每个数据都具有“ unicode”类型,对此我无能为力。我想将其更改为str值。另外,如果可能的话,我想知道这个事实的原因。我听到了一些有关“外部数据”的信息,并且我知道列和索引在它们的名称之前也都显示了unicode的“ u”。我对编码几乎一无所知,如果有人另外解释一下,我将不胜感激。
我正在使用Python 2,并尝试使用功能如下逐列解决它
.astype(str)
.astype(basestring)
.apply(str)
Run Code Online (Sandbox Code Playgroud)
和
.str.decode('iso-8859-1').str.encode('utf-8')
Run Code Online (Sandbox Code Playgroud)
(我在这里读到了最后一个,我只是在我的代码中编写了它以尝试另一件事)。我也试过
unicodedata.normalize('NFKD', df_bolsa[l]).encode('ascii','ignore')
Run Code Online (Sandbox Code Playgroud)
但是最后一个不能用于系列。我希望有人能够帮助我澄清这个问题。提前非常感谢您!!
for column in df:
df[column] = df_peru[column].str.encode('utf-8')
Run Code Online (Sandbox Code Playgroud)