小编ls1*_*101的帖子

Python Pandas 按列对数据框进行分组/按字符串列对整数列求和

我一整天都被困住了,已经阅读了许多 SO 文章,但仍然坚持我的最后一篇文章。我将一个 CSV 导入到一个庞大的数据帧中,然后最终得到了下面的较小的数据帧:(注意:我的 df 现在索引在“名称”上,这是我需要建立组或求和的基础)

  Name          Classification       Value 1     Value 2
Company 1   Classification Code 1      5000       8000      
Company 1   Classification Code 1      6000       2000
Company 2   Classification Code 1      2000       3000    
Company 2   Classification Code 1      1000       4500     
Company 3   Classification Code 2      15000      10000      
Company 3   Classification Code 2      20000      32000     
Company 4   Classification Code 3      7500       10000    
Company 4   Classification Code 3      7000       1500     
Run Code Online (Sandbox Code Playgroud)

我现在正在努力的是如何根据公司对这两个值求和(我主要使用 groupby 和 sum() 但已经卡住了几个小时。我知道有很多 SO 文章都在讨论在 Pandas 中求和但我已经好几个小时没有运气了。任何帮助将不胜感激。非常感谢。

编辑:我正在寻找的输出如下

Company …
Run Code Online (Sandbox Code Playgroud)

python group-by pandas xlsxwriter

2
推荐指数
1
解决办法
4621
查看次数

使用 Python Selenium 从元素的 <br> 中获取文本

我正在从网站提取联系信息(文本),目前我可以使用以下xpath语法提取所有类数据:

//*[@id="nomapdata"]/div/div/div/div[2]/div[1]
Run Code Online (Sandbox Code Playgroud)

将此xpath用于元素,我得到以下文本结果:

Name
Title
Company Website
Phone Number
Run Code Online (Sandbox Code Playgroud)

我想要做的是单独拉出这些元素中的每一个,但问题是,数据由 分隔<br> </br>,并且我没有成功隔离每个元素。

下面是一个 HTML 结构的例子:

<div class="col-sm-d">
"
                  Name"
<br>
"
                              Title"
<br>
a href="www.website.com" target="_blank">http://www.website.com</a>
<br>
"

Phone: (555) 555-5555"
<br>
Run Code Online (Sandbox Code Playgroud)

我能够隔离的唯一元素是网站。

我如何隔离这种情况下的每个数据?

html python selenium xpath line-breaks

1
推荐指数
1
解决办法
3199
查看次数

标签 统计

python ×2

group-by ×1

html ×1

line-breaks ×1

pandas ×1

selenium ×1

xlsxwriter ×1

xpath ×1