小编And*_*ith的帖子

有箱线图,想用值标记中值和须线

我有一个 Pandas 数据框,其中包含按“帖子类型”细分的 Facebook 帖子数据。数据框称为“Posts_by_type”,它包含喜欢的数量、分享的数量和帖子的类型。有 3 种类型的帖子:赛车、娱乐和促销。

我想在 matplotlib 中创建一个箱线图,显示每种类型帖子的点赞数。

我的代码有效:

Posts_by_type.boxplot(column='Likes', by='Type', grid=True)
Run Code Online (Sandbox Code Playgroud)

这会产生以下箱线图:

在此处输入图片说明

但是,我还想用相应的数值标记箱线图上的中位数和胡须。

这在 matplotlib 中可能吗?如果是这样,任何人都可以给我一些关于如何做的指示吗?

python matplotlib boxplot dataframe pandas

5
推荐指数
1
解决办法
6565
查看次数

使用Jupyter Notebook安装wordcloud

我需要为家庭作业解决一个wordcloud问题.

不幸的是,我很难将wordcloud安装到我的环境中.

这是我正在运行的代码:

import os
import matplotlib.pyplot as plt
from wordcloud import WordCloud
Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

ImportError:没有名为'wordcloud'的模块

现在,我知道我需要在命令提示符中使用pip install方法将wordcloud引入我的环境.即使这样做(并尝试了几个不同的目的地,包括我的主目录和Anaconda3环境),我仍然会得到同样的错误.

我究竟做错了什么?

python import pip

5
推荐指数
3
解决办法
2万
查看次数

如何从泡菜文件中获取数据到熊猫数据框

我正在为一个班级进行社交媒体情绪分析。我已经将有关肯塔基德比的所有2条推文保存到pkl文件中,为期2个月。

我的问题是:如何将所有这些腌制转储文件加载到数据框中?

这是我的代码:

import sklearn as sk
import pandas as pd
import  got3

def daterange(start_date, end_date):
for n in range(int ((end_date - start_date).days)):
    yield start_date + timedelta(n)

start_date = date(2016, 3, 31)
end_date = date(2016, 6, 1)

dates = []

for single_date in daterange(start_date, end_date):
    dates.append(single_date.strftime("%Y-%m-%d"))

for i in range(len(dates)-1): 
    this_date = dates[i]
    tomorrow_date = dates[i+1]
    print("Getting tweets for " + tomorrow_date)
    tweetCriteria = got3.manager.TweetCriteria()
    tweetCriteria.setQuerySearch("Kentucky Derby")
    tweetCriteria.setQuerySearch("KYDerby")
    tweetCriteria.setSince(this_date)
    tweetCriteria.setUntil(tomorrow_date)
    Kentucky_Derby_tweets = got3.manager.TweetManager.getTweets(tweetCriteria)
    pkl.dump(Kentucky_Derby_tweets, open(tomorrow_date + ".pkl", "wb"))
Run Code Online (Sandbox Code Playgroud)

python twitter pickle pandas

4
推荐指数
1
解决办法
7538
查看次数

从熊猫数据框中制作多个饼图(每行一个)

我有一个数据框 (df),显示与各种业务类别相关的情绪:

在此处输入图片说明

我的任务是创建饼图,显示每种业务的情绪百分比。所以我需要在 matplotlib 中创建一个函数来读取“业务”列,然后使用数据框中每一行的每个情感类别构建一个饼图。

我已经建立了一个条形图,但我对饼图没有运气。编辑:这是我的条形图代码:

import pandas as pd
import csv
import matplotlib.pyplot as plt
GraphData = open("barGraph.csv")
df = pd.read_csv('barGraph.csv')
ax = df.plot(kind='bar', title ="Emotions at Various Businesses", figsize=(15, 10), legend=True, fontsize=12)
ax.set_xlabel("Business Type",fontsize=12)
ax.set_ylabel("Strength of Emotion",fontsize=12)
ax.set_xticklabels(['Beauty & Spas', 'Burgers-Restaurants', 'Pizza', 'Mexican Restaurants', 'Modern European-Restaurants', 'Chinese'])
plt.show()
Run Code Online (Sandbox Code Playgroud)

我已经阅读了有关饼图的文档,但它对我来说没有意义,至少因为它与从数据框而不是系列中绘制数据有关。

有什么建议?

python matplotlib dataframe pandas pie-chart

2
推荐指数
1
解决办法
8830
查看次数

标签 统计

python ×4

pandas ×3

dataframe ×2

matplotlib ×2

boxplot ×1

import ×1

pickle ×1

pie-chart ×1

pip ×1

twitter ×1