小编Com*_*ata的帖子

显示特定列中任何值出现多次的行

我想显示列中任何值的所有行 - "网站"不止一次出现.例如 - 如果某个网站"xyz.com"出现不止一次,那么我想显示所有这些行.我使用以下代码 -

df[df.website.isin(df.groupby('website').website.count() > 1)]
Run Code Online (Sandbox Code Playgroud)

上面的代码返回零行.但我实际上可以看到有这么多网站通过运行以下代码不止一次出现 -

df.website.value_counts()
Run Code Online (Sandbox Code Playgroud)

我应该如何修改我的第一行代码以显示所有这些行?

python pandas

4
推荐指数
1
解决办法
809
查看次数

使用Pandas替换数据框列中的特定值

我有一个数据框df,其中一列名为"Num_of_employees",其值为50-100,200-500等.我发现数据中的值很少.无论员工人数为1-10,数据均为10月1日.此外,无论价值应该是11-50,数据都是11月50日.我如何使用熊猫纠正这个问题?

python pandas

4
推荐指数
1
解决办法
2万
查看次数

导入pytesseract

我试图将pytesseract用于OCR(从图像中提取文本)。我已经使用以下命令成功安装了pytessearct-

pip install pytessearct
Run Code Online (Sandbox Code Playgroud)

当我尝试再次安装它时,它会清楚地说-

Requirement already satisfied (use --upgrade to upgrade): 
pytesseract in ./site-packages
Run Code Online (Sandbox Code Playgroud)

这意味着pytessearct已成功安装。当我尝试使用-在我的iPython笔记本中导入此软件包时-

import pytessearct
Run Code Online (Sandbox Code Playgroud)

引发错误-

ImportError: No module named pytesseract
Run Code Online (Sandbox Code Playgroud)

为什么会这样呢?

python pip ipython pytesser jupyter-notebook

3
推荐指数
1
解决办法
8569
查看次数

将一列的值分为两列

我有一个数据框,其列为"last_updated",类型为datetime64 [ns]:

df = pd.DataFrame({'last_updated': ['11/12/14 2:44 PM','5/18/15 11:36 AM','11/12/14 
3:09 PM']})
Run Code Online (Sandbox Code Playgroud)

我想在这一列中创建两列 - "last_updated_date"和"last_updated_time".此外,时间应为24小时格式.

如何使用pandas完成此任务?

python dataframe pandas

3
推荐指数
1
解决办法
256
查看次数

列表中每个唯一元素的计数

说我有一个国家名单

l = ['India', 'China', 'China', 'Japan', 'USA', 'India', 'USA']  
Run Code Online (Sandbox Code Playgroud)

然后我有一个独特的国家清单

ul = ['India', 'China', 'Japan', 'USA']
Run Code Online (Sandbox Code Playgroud)

我想按升序对列表中的每个独特国家/地区进行计数。因此输出应如下所示:

Japan 1
China 2
India 2
USA   2
Run Code Online (Sandbox Code Playgroud)

python count

3
推荐指数
2
解决办法
3439
查看次数

Groovy 中的日期格式

package com.javacodegeeks.groovy.date
class GroovyDateArithmetic {
static main(args) {
def date = new Date().parse("dd.MM.yyy", '18.05.1988')
def datePlus = date.clone()
def dateMinus = date.clone()
datePlus = datePlus + 5
println datePlus 
Run Code Online (Sandbox Code Playgroud)

上面的代码将打印 Mon May 23 00:00:00 EST 1988。如何格式化最终结果以生成 Mon May 23 1988。

java groovy date simpledateformat

0
推荐指数
1
解决办法
7769
查看次数