我一整天都被困住了,已经阅读了许多 SO 文章,但仍然坚持我的最后一篇文章。我将一个 CSV 导入到一个庞大的数据帧中,然后最终得到了下面的较小的数据帧:(注意:我的 df 现在索引在“名称”上,这是我需要建立组或求和的基础)
Name Classification Value 1 Value 2
Company 1 Classification Code 1 5000 8000
Company 1 Classification Code 1 6000 2000
Company 2 Classification Code 1 2000 3000
Company 2 Classification Code 1 1000 4500
Company 3 Classification Code 2 15000 10000
Company 3 Classification Code 2 20000 32000
Company 4 Classification Code 3 7500 10000
Company 4 Classification Code 3 7000 1500
Run Code Online (Sandbox Code Playgroud)
我现在正在努力的是如何根据公司对这两个值求和(我主要使用 groupby 和 sum() 但已经卡住了几个小时。我知道有很多 SO 文章都在讨论在 Pandas 中求和但我已经好几个小时没有运气了。任何帮助将不胜感激。非常感谢。
编辑:我正在寻找的输出如下
Company …Run Code Online (Sandbox Code Playgroud) 我正在从网站提取联系信息(文本),目前我可以使用以下xpath语法提取所有类数据:
//*[@id="nomapdata"]/div/div/div/div[2]/div[1]
Run Code Online (Sandbox Code Playgroud)
将此xpath用于元素,我得到以下文本结果:
Name
Title
Company Website
Phone Number
Run Code Online (Sandbox Code Playgroud)
我想要做的是单独拉出这些元素中的每一个,但问题是,数据由 分隔<br> </br>,并且我没有成功隔离每个元素。
下面是一个 HTML 结构的例子:
<div class="col-sm-d">
"
Name"
<br>
"
Title"
<br>
a href="www.website.com" target="_blank">http://www.website.com</a>
<br>
"
Phone: (555) 555-5555"
<br>
Run Code Online (Sandbox Code Playgroud)
我能够隔离的唯一元素是网站。
我如何隔离这种情况下的每个数据?