如何为此Seaborne图添加标题?让我们给它一个标题'我是一个标题'.
tips = sns.load_dataset("tips")
g = sns.FacetGrid(tips, col="sex", row="smoker", margin_titles=True)
g.map(sns.plt.scatter, "total_bill", "tip")
Run Code Online (Sandbox Code Playgroud)
我想从我的专栏"tweets"中删除停用词.如何迭代每一行和每个项目?
pos_tweets = [('I love this car', 'positive'),
('This view is amazing', 'positive'),
('I feel great this morning', 'positive'),
('I am so excited about the concert', 'positive'),
('He is my best friend', 'positive')]
test = pd.DataFrame(pos_tweets)
test.columns = ["tweet","class"]
test["tweet"] = test["tweet"].str.lower().str.split()
from nltk.corpus import stopwords
stop = stopwords.words('english')
Run Code Online (Sandbox Code Playgroud) 我清理了400个excel文件并使用pandas将它们读入python并将所有原始数据附加到一个大df中.
然后,当我尝试将其导出到csv时:
df.to_csv("path",header=True,index=False)
Run Code Online (Sandbox Code Playgroud)
我收到此错误:
UnicodeEncodeError: 'ascii' codec can't encode character u'\xc7' in position 20: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)
有人可以建议一种方法来解决这个问题及其意义吗?
谢谢
鉴于以下计数图,我如何将百分比放在栏杆上?
import seaborn as sns
sns.set(style="darkgrid")
titanic = sns.load_dataset("titanic")
ax = sns.countplot(x="class", hue="who", data=titanic)
Run Code Online (Sandbox Code Playgroud)
例如,对于"第一",我想要总的第一人/总第一,总第一女人/总第一,总第一个孩子/总第一个在他们各自的酒吧之上.
如果我的解释不清楚,请告诉我.
谢谢!
我有货币的df:
df = pd.DataFrame({'Currency':['$1.00','$2,000.00','(3,000.00)']})
Currency
0 $1.00
1 $2,000.00
2 (3,000.00)
Run Code Online (Sandbox Code Playgroud)
我想将'Currency'dtype转换为float,但我遇到括号字符串(表示负数)的问题.这是我目前的代码:
df[['Currency']] = df[['Currency']].replace('[\$,]','',regex=True).astype(float)
Run Code Online (Sandbox Code Playgroud)
这会产生错误:
ValueError: could not convert string to float: (3000.00)
Run Code Online (Sandbox Code Playgroud)
我想要的dtype float是:
Currency
0 1.00
1 2000.00
2 -3000.00
Run Code Online (Sandbox Code Playgroud) 我在一个ipython笔记本电池中并排绘制了两个图.但是,我无法改变标题的大小.我可以通过添加参数来更改标签的大小fontsize = 20
.如何更改标题df
和df2
.
fig, axes = plt.subplots(ncols=2, figsize = (20,10))
df.plot('barh', title = 'Legal Collectible Answer Distribution', fontsize = 20, ax = axes[0])
df2.plot(kind = 'pie', autopct = '%1.0f%%', legend = False, title = 'Legal Collectible Answer Distribution', fontsize = 20, ax =axes[1])
Run Code Online (Sandbox Code Playgroud) 我试图在我的课程中运行所有的功能,而不是单独输入它们.
class Foo(object):
def __init__(self,a,b):
self.a = a
self.b=b
def bar(self):
print self.a
def foobar(self):
print self.b
Run Code Online (Sandbox Code Playgroud)
我想这样做但是有一个循环,因为我的实际类有大约8-10个函数.
x = Foo('hi','bye')
x.bar()
x.foobar()
Run Code Online (Sandbox Code Playgroud) 这就是我现在所拥有的:
np.random.seed(1234)
test = pd.DataFrame({'week': [1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2],
'score': np.random.uniform(0, 1, 12),
'type': [0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1],
'type2': [3, 3, 4, 4, 5, 5, 3, 3, 4, 4, 5, 5]})
test.groupby(['week', 'type', 'type2']).agg('sum').unstack().plot(kind='bar')
Run Code Online (Sandbox Code Playgroud)
如何基于'类型'绘制构面?我想要两个不同的图,一个用于type = 1,另一个用于= 2.
我从USATODAY获得了最大量的推文,这是3000.
现在我想创建一个脚本,以便在每天晚上11:59自动提取USATODAY的推文.
我打算使用流api然后我将不得不让它保持运行一整天.
我是否可以了解如何创建一个脚本,每天晚上11:59运行REST API以获取当天的推文?如果没有,是否有人知道如何根据日期提取推文?
我正在考虑在我的for循环中放置一个ifelse语句,但这似乎效率低下,因为它必须每晚搜索3000条推文.
这就是我现在拥有的:
client = MongoClient('localhost', 27017)
db = client['twitter_db']
collection = db['usa_collection']
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token_key, access_token_secret)
api = tweepy.API(auth)
for tweet in tweepy.Cursor(api.user_timeline,id='USATODAY').items():
collection.insert(tweet._json)
Run Code Online (Sandbox Code Playgroud) 我试图将以下时间序列中的日期索引更改为月份名称.
website = dfFinal.groupby(['Date','Website'])
websiteGroup = website['Visits'].aggregate(np.sum).unstack()
Website A B C
Date
2015-01-01 18185 805769 NaN
2015-02-01 73236 944458 NaN
2015-03-01 101737 1003966 NaN
2015-04-01 101018 861229 NaN
2015-05-01 77724 845223 NaN
2015-06-01 111503 966043 NaN
2015-07-01 115413 937184 NaN
2015-08-01 115215 890457 1649
Run Code Online (Sandbox Code Playgroud)
例如,我希望它看起来像这样:
Website A B C
Date
January 18185 805769 NaN
February 73236 944458 NaN
March 101737 1003966 NaN
April 101018 861229 NaN
May 77724 845223 NaN
June 111503 966043 NaN
July 115413 937184 NaN
August 115215 …
Run Code Online (Sandbox Code Playgroud)