Cul*_*ant 3 python unicode pandas
我编写了一个程序来生成要上传到网站的 unicode 文本文件。我已经使用 Microsoft Access 成功地制作了这个特定文件的原型,并注意到如果该文件被编码为 utf-8 文件,则该网站拒绝该文件为非 unicode 文本文件。从文本编辑器(使用 Windows 记事本),如果我只使用下拉框中的 unicode 编码保存文件,我上传的网站就可以接受该文件。
因此,考虑到这种情况,我编写了一个程序来使用 Pandas 和 DataFrames 自动生成文件。我程序的最后一行将 DataFrame 导出到文本文件:
coa1.to_csv('0000-2951-test.txt',index=False, sep='\t', encoding = 'utf-8')
Run Code Online (Sandbox Code Playgroud)
这会生成正确的文件,但是当我在记事本中打开它时,列出的编码是 ANSI 而不是 unicode。如何将我的 DataFrame 写入 unicode 文件?记事本对 Unicode 意味着什么类型的 unicode(当它没有任何额外的限定符时)?
“unicode”不是一个特定的编码,而是一组编码。它可以是 utf-8、utf-16、utf-32。更详细的解释
在 Windows 中,unicode 常表示 utf-16,有可能本网站需要 utf-16。尝试用 utf-16 编码你的 csv,看看它在记事本中是否是“unicode”并且这个网站接受它。
coa1.to_csv('0000-2951-test.txt',index=False, sep='\t', encoding = 'utf-16')
Run Code Online (Sandbox Code Playgroud)
编辑我建议不要使用 Windows 记事本,而是为您的原型设计使用更合适的文本编辑器,它可以精确设置编码。我会使用Sublime或 Notepad++
归档时间: |
|
查看次数: |
1874 次 |
最近记录: |