我使用tweepy提取了一些Twitter数据,并且从那里得到的格式不是最格式正确的json,但是我不太想办法做到这一点,而这不会花费我几个小时的时间。(我在大约100个文件中拥有大约一百万行的Twitter数据)。
下面附上的是我的json文件的一(1)行的示例。
从字面上看,任何方式做到这一点将不胜感激。
谢谢!
user_mentions“:[{” screen_name“:” nparama1951“,” name“:” N.Paramasivam“,” id“:2783847553,” id_str“:” 2783847553“,” indices“:[0,12]},{” screen_name“:” RBhamaria“,” name“:” Capt。Ritesh Bhamaria \ ud83c \ uddee \ ud83c \ uddf3 \ ud83c \ udde6 \ ud83c \ uddfa“,” id“:326234086,” id_str“:” 326234086“,” indices“:[13,23]},{” screen_name“: “ jyotsnavarma9”,“名称”:“ Jyotsna Varma \ ud83c \ uddee \ ud83c \ uddf3”,“ id”:3166184569,“ id_str”:“ 3166184569”,“索引”:[24,38]},{“ screen_name” :“ JaganNKaushik”,“名称”:“ JN Kaushik”,“ id”:878303278420840448,“ id_str”:“ 878303278420840448”,“