小编Com*_*ata的帖子

显示特定列中任何值出现多次的行

我想显示列中任何值的所有行 - "网站"不止一次出现.例如 - 如果某个网站"xyz.com"出现不止一次,那么我想显示所有这些行.我使用以下代码 -

df[df.website.isin(df.groupby('website').website.count() > 1)]

Run Code Online (Sandbox Code Playgroud)

上面的代码返回零行.但我实际上可以看到有这么多网站通过运行以下代码不止一次出现 -

df.website.value_counts()

Run Code Online (Sandbox Code Playgroud)

我应该如何修改我的第一行代码以显示所有这些行？

python pandas

Com*_*ata

lucky-day

4
推荐指数

1
解决办法

809
查看次数

使用Pandas替换数据框列中的特定值

我有一个数据框df,其中一列名为"Num_of_employees",其值为50-100,200-500等.我发现数据中的值很少.无论员工人数为1-10,数据均为10月1日.此外,无论价值应该是11-50,数据都是11月50日.我如何使用熊猫纠正这个问题？

python pandas

Com*_*ata

2016 10-27

4
推荐指数

1
解决办法

2万
查看次数

导入pytesseract

我试图将pytesseract用于OCR（从图像中提取文本）。我已经使用以下命令成功安装了pytessearct-

pip install pytessearct

Run Code Online (Sandbox Code Playgroud)

当我尝试再次安装它时，它会清楚地说-

Requirement already satisfied (use --upgrade to upgrade): 
pytesseract in ./site-packages

Run Code Online (Sandbox Code Playgroud)

这意味着pytessearct已成功安装。当我尝试使用-在我的iPython笔记本中导入此软件包时-

import pytessearct

Run Code Online (Sandbox Code Playgroud)

引发错误-

ImportError: No module named pytesseract

Run Code Online (Sandbox Code Playgroud)

为什么会这样呢？

python pip ipython pytesser jupyter-notebook

Com*_*ata

2016 08-15

3
推荐指数

1
解决办法

8569
查看次数

将一列的值分为两列

我有一个数据框,其列为"last_updated",类型为datetime64 [ns]:

df = pd.DataFrame({'last_updated': ['11/12/14 2:44 PM','5/18/15 11:36 AM','11/12/14 
3:09 PM']})

Run Code Online (Sandbox Code Playgroud)

我想在这一列中创建两列 - "last_updated_date"和"last_updated_time".此外,时间应为24小时格式.

如何使用pandas完成此任务？

python dataframe pandas

Com*_*ata

2016 10-29

3
推荐指数

1
解决办法

256
查看次数

列表中每个唯一元素的计数

说我有一个国家名单

l = ['India', 'China', 'China', 'Japan', 'USA', 'India', 'USA']

Run Code Online (Sandbox Code Playgroud)

然后我有一个独特的国家清单

ul = ['India', 'China', 'Japan', 'USA']

Run Code Online (Sandbox Code Playgroud)

我想按升序对列表中的每个独特国家/地区进行计数。因此输出应如下所示：

Japan 1
China 2
India 2
USA   2

Run Code Online (Sandbox Code Playgroud)

python count

Com*_*ata

2017 06-08

3
推荐指数

2
解决办法

3439
查看次数

Groovy 中的日期格式

package com.javacodegeeks.groovy.date
class GroovyDateArithmetic {
static main(args) {
def date = new Date().parse("dd.MM.yyy", '18.05.1988')
def datePlus = date.clone()
def dateMinus = date.clone()
datePlus = datePlus + 5
println datePlus

Run Code Online (Sandbox Code Playgroud)

上面的代码将打印 Mon May 23 00:00:00 EST 1988。如何格式化最终结果以生成 Mon May 23 1988。

java groovy date simpledateformat

Com*_*ata

2019 01-25

0
推荐指数

1
解决办法

7769
查看次数

标签统计

python ×5

pandas ×3

count ×1

dataframe ×1

date ×1

groovy ×1

ipython ×1

java ×1

jupyter-notebook ×1

pip ×1

pytesser ×1

simpledateformat ×1

显示特定列中任何值出现多次的行

使用Pandas替换数据框列中的特定值

导入pytesseract

将一列的值分为两列

列表中每个唯一元素的计数

Groovy 中的日期格式

标签 统计

小编Com_ata的帖子

标签统计