小编I a*_*rge的帖子

如何为Seaborn Facet Plot添加标题

如何为此Seaborne图添加标题?让我们给它一个标题'我是一个标题'.

tips = sns.load_dataset("tips")
g = sns.FacetGrid(tips, col="sex", row="smoker", margin_titles=True)
g.map(sns.plt.scatter, "total_bill", "tip")
Run Code Online (Sandbox Code Playgroud)

情节

python visualization seaborn

78
推荐指数
3
解决办法
6万
查看次数

Python从pandas数据帧中删除停用词

我想从我的专栏"tweets"中删除停用词.如何迭代每一行和每个项目?

pos_tweets = [('I love this car', 'positive'),
    ('This view is amazing', 'positive'),
    ('I feel great this morning', 'positive'),
    ('I am so excited about the concert', 'positive'),
    ('He is my best friend', 'positive')]

test = pd.DataFrame(pos_tweets)
test.columns = ["tweet","class"]
test["tweet"] = test["tweet"].str.lower().str.split()

from nltk.corpus import stopwords
stop = stopwords.words('english')
Run Code Online (Sandbox Code Playgroud)

python pandas

28
推荐指数
4
解决办法
4万
查看次数

将pandas df写入csv时出现Unicode编码错误

我清理了400个excel文件并使用pandas将它们读入python并将所有原始数据附加到一个大df中.

然后,当我尝试将其导出到csv时:

df.to_csv("path",header=True,index=False)
Run Code Online (Sandbox Code Playgroud)

我收到此错误:

UnicodeEncodeError: 'ascii' codec can't encode character u'\xc7' in position 20: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)

有人可以建议一种方法来解决这个问题及其意义吗?

谢谢

python export-to-csv pandas python-unicode

28
推荐指数
2
解决办法
4万
查看次数

如何在seaborn的酒吧顶部添加百分比?

鉴于以下计数图,我如何将百分比放在栏杆上?

import seaborn as sns
sns.set(style="darkgrid")
titanic = sns.load_dataset("titanic")
ax = sns.countplot(x="class", hue="who", data=titanic)
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

例如,对于"第一",我想要总的第一人/总第一,总第一女人/总第一,总第一个孩子/总第一个在他们各自的酒吧之上.

如果我的解释不清楚,请告诉我.

谢谢!

python matplotlib seaborn

25
推荐指数
5
解决办法
3万
查看次数

将货币转换为浮动(括号表示负数)

我有货币的df:

df = pd.DataFrame({'Currency':['$1.00','$2,000.00','(3,000.00)']})

     Currency
0       $1.00
1   $2,000.00
2  (3,000.00)
Run Code Online (Sandbox Code Playgroud)

我想将'Currency'dtype转换为float,但我遇到括号字符串(表示负数)的问题.这是我目前的代码:

df[['Currency']] = df[['Currency']].replace('[\$,]','',regex=True).astype(float)
Run Code Online (Sandbox Code Playgroud)

这会产生错误:

ValueError: could not convert string to float: (3000.00)
Run Code Online (Sandbox Code Playgroud)

我想要的dtype float是:

     Currency
0       1.00
1   2000.00
2  -3000.00
Run Code Online (Sandbox Code Playgroud)

python currency pandas

18
推荐指数
1
解决办法
1万
查看次数

ipython笔记本中的pandas subplot标题大小

我在一个ipython笔记本电池中并排绘制了两个图.但是,我无法改变标题的大小.我可以通过添加参数来更改标签的大小fontsize = 20.如何更改标题dfdf2.

fig, axes = plt.subplots(ncols=2, figsize = (20,10))
df.plot('barh', title = 'Legal Collectible Answer Distribution', fontsize = 20, ax = axes[0])
df2.plot(kind = 'pie', autopct = '%1.0f%%', legend = False, title = 'Legal Collectible Answer Distribution', fontsize = 20, ax =axes[1])
Run Code Online (Sandbox Code Playgroud)

python matplotlib pandas

9
推荐指数
1
解决办法
8191
查看次数

在课堂上运行所有功能

我试图在我的课程中运行所有的功能,而不是单独输入它们.

class Foo(object):
    def __init__(self,a,b):
        self.a = a
        self.b=b

    def bar(self):
        print self.a

    def foobar(self):
        print self.b
Run Code Online (Sandbox Code Playgroud)

我想这样做但是有一个循环,因为我的实际类有大约8-10个函数.

x = Foo('hi','bye')
x.bar()
x.foobar()
Run Code Online (Sandbox Code Playgroud)

python class

9
推荐指数
3
解决办法
9696
查看次数

我如何在熊猫中绘制小平面图

这就是我现在所拥有的:

np.random.seed(1234)
test = pd.DataFrame({'week': [1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2],
                     'score': np.random.uniform(0, 1, 12),
                     'type': [0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1],
                     'type2': [3, 3, 4, 4, 5, 5, 3, 3, 4, 4, 5, 5]})

test.groupby(['week', 'type', 'type2']).agg('sum').unstack().plot(kind='bar')
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

如何基于'类型'绘制构面?我想要两个不同的图,一个用于type = 1,另一个用于= 2.

python plot visualization facet pandas

6
推荐指数
1
解决办法
4798
查看次数

通过tweepy获取推文

我从USATODAY获得了最大量的推文,这是3000.

现在我想创建一个脚本,以便在每天晚上11:59自动提取USATODAY的推文.

我打算使用流api然后我将不得不让它保持运行一整天.

我是否可以了解如何创建一个脚本,每天晚上11:59运行REST API以获取当天的推文?如果没有,是否有人知道如何根据日期提取推​​文?

我正在考虑在我的for循环中放置一个ifelse语句,但这似乎效率低下,因为它必须每晚搜索3000条推文.

这就是我现在拥有的:

client = MongoClient('localhost', 27017)
db = client['twitter_db']
collection = db['usa_collection']
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token_key, access_token_secret)

api = tweepy.API(auth)

for tweet in tweepy.Cursor(api.user_timeline,id='USATODAY').items():
    collection.insert(tweet._json)
Run Code Online (Sandbox Code Playgroud)

python twitter tweepy

6
推荐指数
1
解决办法
9928
查看次数

如何将Pandas Index转换为月份名称

我试图将以下时间序列中的日期索引更改为月份名称.

website = dfFinal.groupby(['Date','Website'])

websiteGroup = website['Visits'].aggregate(np.sum).unstack()

Website              A        B          C
Date                                      
2015-01-01       18185   805769        NaN
2015-02-01       73236   944458        NaN
2015-03-01      101737  1003966        NaN
2015-04-01      101018   861229        NaN
2015-05-01       77724   845223        NaN
2015-06-01      111503   966043        NaN
2015-07-01      115413   937184        NaN
2015-08-01      115215   890457       1649
Run Code Online (Sandbox Code Playgroud)

例如,我希望它看起来像这样:

    Website           A        B          C
    Date                                      
    January       18185   805769        NaN
    February      73236   944458        NaN
    March        101737  1003966        NaN
    April        101018   861229        NaN
    May           77724   845223        NaN
    June         111503   966043        NaN
    July         115413   937184        NaN
    August       115215 …
Run Code Online (Sandbox Code Playgroud)

python pandas

5
推荐指数
1
解决办法
5884
查看次数