小编use*_*696的帖子

如何更改pandas数据帧中的单个索引值?

energy.loc['Republic of Korea']
Run Code Online (Sandbox Code Playgroud)

我想将"韩国"指数的价值改为"韩国".但是数据框太大,无法更改每个索引值.我如何仅更改此单个值?

python data-analysis pandas

28
推荐指数
6
解决办法
4万
查看次数

如何在seaborn中并排绘制两个计数图?

我试图绘制两个显示击球和保龄球计数的计票图.我尝试了以下代码:

l=['batting_team','bowling_team']
for i in l:
    sns.countplot(high_scores[i])
    mlt.show()
Run Code Online (Sandbox Code Playgroud)

但通过使用这个,我得到两个一个在另一个下面的情节.我如何让他们并排订购?

python matplotlib pandas seaborn

16
推荐指数
2
解决办法
2万
查看次数

如何在计数图中显示条形顶部的计数值?

我已经为在板球锦标赛中获胜最多比赛的裁判制定了一个计票图.使用的代码是:

  ax=matches['umpires'].value_counts().head(10).plot.bar(width=.8) 
Run Code Online (Sandbox Code Playgroud)

这会正确绘制条形图,但计数的确切值不会显示在每个条形图的顶部.

如何在每个栏上显示确切的数字?

python matplotlib pandas seaborn

7
推荐指数
1
解决办法
5721
查看次数

Plotly:如何从数据框中绘制桑基图?

我有一个数据框:

Vendor Name                 Category                    Count
AKJ Education               Books                       846888
AKJ Education               Computers & Tablets         1045
Amazon                      Books                       1294423
Amazon                      Computers & Tablets         42165
Amazon                      Other                       415
Flipkart                    Books                       1023
Run Code Online (Sandbox Code Playgroud)

我正在尝试使用上述数据框绘制桑基图,源为Vendor Name,目标为Category,流或宽度为Count。我尝试使用 Plotly,但没有成功。有没有人有使用 Plotly 制作桑基图的解决方案?

谢谢

python pandas plotly sankey-diagram

5
推荐指数
1
解决办法
9389
查看次数

如何比较同一数据帧的两列?

我有这样的数据帧:

 match_id inn1  bat  bowl  runs1 inn2   runs2   is_score_chased
    1     1     KKR  RCB    222  2      82          1
    2     1     CSK  KXIP   240  2      207         1
    8     1     CSK  MI     208  2      202         1
    9     1     DC   RR     214  2      217         1
   33     1     KKR  DC     204  2      181         1
Run Code Online (Sandbox Code Playgroud)

现在我想通过比较runs1runs2中的值来更改is_score_chased列中的值.如果runs1> runs2,则行中的相应值应为"yes",否则应为no.我尝试了以下代码:

for i in (high_scores1):
  if(high_scores1['runs1']>=high_scores1['runs2']):
      high_scores1['is_score_chased']='yes'
  else:
      high_scores1['is_score_chased']='no' 
Run Code Online (Sandbox Code Playgroud)

但它没有用.如何更改列中的值?

python dataframe pandas

3
推荐指数
2
解决办法
1万
查看次数

如何替换数据框中某个字符的所有实例?

我有一个数据框,其中有很多'?'的实例 在不同的行.列的数据类型是"对象".现在我要替换所有'?' 用0.我该怎么做?

python dataframe pandas

3
推荐指数
1
解决办法
3028
查看次数

如何计算 pandas 列中逗号分隔的重复值?

我有一个像这样的数据框列:

1    Applied Learning, Literacy & Language
2             Literacy & Language, Special Needs
3            Math & Science, Literacy & Language
4            Literacy & Language, Math & Science
6               Math & Science, Applied Learning
7                               Applied Learning
8                            Literacy & Language
10                                Math & Science...
Run Code Online (Sandbox Code Playgroud)

每行都有逗号分隔的值。我想要的是计算所有唯一值的出现次数。例如:数学与科学出现 4 次。所以数学和科学的计数应该是 4。我尝试了以下代码:

cato=response['Category'].str.split(',')
cat_set=[]
for i in cato.dropna():
    cat_set.extend(i)
plt1=pd.Series(cat_set).value_counts().sort_values(ascending=False).to_frame()
Run Code Online (Sandbox Code Playgroud)

但问题是,这段代码适用于小型数据集,但对于大型数据集则需要花费大量时间。有什么解决办法吗?

谢谢

python string dataframe pandas

3
推荐指数
1
解决办法
2155
查看次数

如何更改数据框中的日期格式?

我在数据框中有一个日期列,格式yyyy/mm/dd如下:

Date
2016/08/22
2016/08/10
2016/08/08
...
Run Code Online (Sandbox Code Playgroud)

如何将其转换为dd/mm/yyyy格式?

python pandas

2
推荐指数
1
解决办法
1万
查看次数

如何在条形图的条形图内显示值?

我有这样的数据帧:

                 platform     count
release_year        
         1996    PlayStation   138
         1997    PlayStation   170
         1998    PlayStation   155
         1999    PC            243...
Run Code Online (Sandbox Code Playgroud)

现在我想在相应的条形图中使用平台名称绘制水平条形图,使其看起来像这样:

在此输入图像描述

我怎么做?

python matplotlib pandas

2
推荐指数
1
解决办法
4166
查看次数

如何对pandas中的数据框中的值进行排序?

我有这样的数据帧:

 innings    batsman     batsman_runs
    1          AA Noffke     9
    1          B Akhil       0
    1          BB McCullum  158
    1          CL White      6
    1          DJ Hussey     12....
Run Code Online (Sandbox Code Playgroud)

我需要按降序对batsman_runs进行排序并显示相应的击球手,即如果158位于顶部,那么BB McCullum应该在相邻的单元格中.我尝试了以下代码:

df['batsman_runs'].sort_values(ascending=False)
Run Code Online (Sandbox Code Playgroud)

但是这段代码并没有显示击球手的名字.我如何用相应的击球手展示跑步?

python pandas

0
推荐指数
1
解决办法
67
查看次数