我正在使用python工具检索Twitter数据并将它们以JSon格式转储到我的磁盘.我注意到用双引号括起来的推文的整个数据字符串的意外转义.此外,实际Json格式的所有双引号都使用反斜杠进行转义.
它们看起来像这样:
"{\"created_at \":\"Fri Aug 08 11:04:40 +0000 2014 \",\"id \":497699913925292032,
我该如何避免?它应该是:
{"created_at":"Fri Aug 08 11:04:40 +0000 2014".....
我的文件输出代码如下所示:
with io.open('data'+self.timestamp+'.txt', 'a', encoding='utf-8') as f:
f.write(unicode(json.dumps(data, ensure_ascii=False)))
f.write(unicode('\n'))
Run Code Online (Sandbox Code Playgroud)
意外的转义会导致在稍后的处理步骤中读取json文件中的问题.
这是我如何转储文件
with open('es_hosts.json', 'w') as fp:
json.dump(','.join(host_list.keys()), fp)
Run Code Online (Sandbox Code Playgroud)
结果是
"a,b,c"
Run Code Online (Sandbox Code Playgroud)
我想要:
a,b,c
Run Code Online (Sandbox Code Playgroud)
谢谢