小编hel*_*err的帖子

在 jupyter notebook 中显示 scikit 决策树图

我目前正在创建一个机器学习 jupyter 笔记本作为一个小项目，并希望显示我的决策树。但是，我能找到的所有选项都是导出图形然后加载图片，这是相当复杂的。

所以想问问有没有办法不导出加载图形直接显示我的决策树。

python decision-tree scikit-learn jupyter-notebook

Jür*_*rdt

2019 01-26

12
推荐指数

3
解决办法

1万
查看次数

Pandas / Numpy NaN无比较

在Python Pandas和Numpy中，比较结果为何不同？

from pandas import Series
from numpy import NaN

Run Code Online (Sandbox Code Playgroud)

NaN 不等于 NaN

>>> NaN == NaN
False

Run Code Online (Sandbox Code Playgroud)

但NaN在列表或元组中是

>>> [NaN] == [NaN], (NaN,) == (NaN,)
(True, True)

Run Code Online (Sandbox Code Playgroud)

而Series与NaN又不相等：

>>> Series([NaN]) == Series([NaN])
0    False
dtype: bool

Run Code Online (Sandbox Code Playgroud)

和None：

>>> None == None, [None] == [None]
(True, True)

Run Code Online (Sandbox Code Playgroud)

而

>>> Series([None]) == Series([None])
0    False
dtype: bool

Run Code Online (Sandbox Code Playgroud)

这个答案解释了原因NaN == NaN是False一般，但并没有解释其在python /大熊猫收藏行为。

python nan python-3.x pandas nonetype

Cha*_*has

2018 09-22

6
推荐指数

1
解决办法

730
查看次数

熊猫:Bin的日期间隔为30分钟并计算平均值

我有一个Pandas数据框,有两列是speed和time.

speed   date
54.72   1:33:56
49.37   1:33:59
37.03   1:34:03
24.02   7:39:58
28.02   7:40:01
24.04   7:40:04
24.02   7:40:07
25.35   7:40:10
26.69   7:40:13
32.04   7:40:16
28.02   11:05:43
30.71   11:05:46
29.36   11:05:49
18.68   11:05:52
54.72   11:05:55
34.69   10:31:34
25.03   10:31:38
56.04   10:31:40
44.03   10:31:43

Run Code Online (Sandbox Code Playgroud)

我想计算每箱30分钟的平均速度.例如,第4个箱(1:31-2:00)的平均速度为(54.72 + 49.37 + 37.03)/ 3.我想过将小时,分钟和秒从00:00转换为秒,然后有1800秒的箱子.我曾尝试使用scipy.stats中的binned_statistic,但我的主要问题是我找不到根据日期分隔垃圾箱并获得平均速度的方法.

有任何想法吗？

python average bins python-3.x pandas

man*_*bar

2018 09-20

5
推荐指数

2
解决办法

2121
查看次数

获取 Github 总克隆统计数据

有没有办法获取任意给定月份的 github 存储库的克隆统计信息？

我们有一个克隆选项卡，其中包含过去 14 天的统计信息https://help.github.com/articles/about-repository-graphs/#traffic但查看历史数据会很有趣。

github github-api

hel*_*err

lucky-day

4
推荐指数

1
解决办法

2724
查看次数

检查Pandas列值是否包含在列表中并分配值

我有一个pandas数据帧和一个包含特定值的列表.
我想检查列标题下的每个列值是否包含在列表中,如果找到其他
值,则要分配1.在下面的示例中,列标题v下的列值将根据列表中的值进行测试l .

l=['a','e']  
df = pd.DataFrame({'id':[1,2,3,4,5],'v' : ['a','b','c','d','e']})  
df  

id  v
 1  a
 2  b
 3  c
 4  d
 5  e

Run Code Online (Sandbox Code Playgroud)

结果,我期待的是,

Run Code Online (Sandbox Code Playgroud)

我试过用

df['v'] = df['v'].apply(lambda x: x.isin(l))

Run Code Online (Sandbox Code Playgroud)

但无法继续如何分配值1和0

python pandas

Ash*_*ama

2015 11-23

2
推荐指数

1
解决办法

1346
查看次数

标签统计

python ×4

pandas ×3

python-3.x ×2

average ×1

bins ×1

decision-tree ×1

github ×1

github-api ×1

jupyter-notebook ×1

nan ×1

nonetype ×1

scikit-learn ×1

在 jupyter notebook 中显示 scikit 决策树图

Pandas / Numpy NaN无比较

熊猫:Bin的日期间隔为30分钟并计算平均值

获取 Github 总克隆统计数据

检查Pandas列值是否包含在列表中并分配值

标签 统计

小编hel_err的帖子

标签统计