我在pandas中有一个数据帧,我想写一个CSV文件.我这样做使用:
df.to_csv('out.csv')
Run Code Online (Sandbox Code Playgroud)
并得到错误:
UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)
有没有办法轻松解决这个问题(即我的数据框中有unicode字符)?有没有办法使用例如'to-tab'方法(我认为不存在)写入制表符分隔文件而不是CSV?
我正在尝试在Python pandas中做一些数据工作,并且无法写出我的结果.我将我的数据作为CSV文件读取并导出每个脚本,因为它自己的CSV文件工作正常.最近虽然我已经尝试将所有内容导出到带有工作表的1个Excel文件中,但是一些工作表给我一个错误
"'utf8'编解码器无法解码位置1中的字节0xe9:无效的连续字节"
我不知道如何开始找到任何可能导致导出到Excel的问题的字符.不知道为什么它出口到CSV就好了虽然:(
相关的路线
from pandas import ExcelWriter
data = pd.read_csv(input)
writer = ExcelWriter(output) #output is just the filename
fundraisers.to_excel(writer, "fundraisers")
locations.to_excel(writer, "locations") #error
locations.to_csv(outputcsv) #works
writer.save()
Run Code Online (Sandbox Code Playgroud)
打印数据帧的负责人
Event ID Constituent ID Email Address First Name \ Last Name
f 1 A A 1
F 4 L R C
M 1 1 A D
F 4 A A G
M 2 0 R G
M 3 O O H
M 2 T E H
M 2 A A H …Run Code Online (Sandbox Code Playgroud) 我试图将信息从Twits(screen_name,created_at和text)保存到pandas DataFrame中,然后将DataFrame保存为csv文件.
我收到编码错误
import tweepy
from tweepy import OAuthHandler
consumer_key = 'bla'
consumer_secret = 'bla'
access_token = 'bla'
access_secret = 'bla'
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_secret)
api = tweepy.API(auth)
import pandas as pd
import numpy as np
import datetime
import sys
encoding = sys.stdout.encoding or 'utf-8'
columns = ['Screen_Name', 'Time_Stamp', 'Tweet']
todays_date = datetime.datetime.now().date()
tweetDF = pd.DataFrame(columns=columns)
for tweet in tweepy.Cursor(api.search, q="manhattan", lang="en").items(10):
lenDF = len(tweetDF)
tweetDF.loc[lenDF] = [tweet.user.screen_name, tweet.created_at, tweet.text]
tweetDF.to_csv("C:/tweetDF")
Run Code Online (Sandbox Code Playgroud)
这里的错误:
UnicodeEncodeError Traceback (most recent call last) …Run Code Online (Sandbox Code Playgroud)