小编hel*_*err的帖子

在 jupyter notebook 中显示 scikit 决策树图

我目前正在创建一个机器学习 jupyter 笔记本作为一个小项目,并希望显示我的决策树。但是,我能找到的所有选项都是导出图形然后加载图片,这是相当复杂的。

所以想问问有没有办法不导出加载图形直接显示我的决策树。

python decision-tree scikit-learn jupyter-notebook

12
推荐指数
3
解决办法
1万
查看次数

Pandas / Numpy NaN无比较

在Python Pandas和Numpy中,比较结果为何不同?

from pandas import Series
from numpy import NaN
Run Code Online (Sandbox Code Playgroud)

NaN 不等于 NaN

>>> NaN == NaN
False
Run Code Online (Sandbox Code Playgroud)

NaN在列表或元组中是

>>> [NaN] == [NaN], (NaN,) == (NaN,)
(True, True)
Run Code Online (Sandbox Code Playgroud)

SeriesNaN又不相等:

>>> Series([NaN]) == Series([NaN])
0    False
dtype: bool
Run Code Online (Sandbox Code Playgroud)

None

>>> None == None, [None] == [None]
(True, True)
Run Code Online (Sandbox Code Playgroud)

>>> Series([None]) == Series([None])
0    False
dtype: bool 
Run Code Online (Sandbox Code Playgroud)

这个答案解释了原因NaN == NaNFalse一般,但并没有解释其在python /大熊猫收藏行为。

python nan python-3.x pandas nonetype

6
推荐指数
1
解决办法
730
查看次数

熊猫:Bin的日期间隔为30分钟并计算平均值

我有一个Pandas数据框,有两列是speedtime.

speed   date
54.72   1:33:56
49.37   1:33:59
37.03   1:34:03
24.02   7:39:58
28.02   7:40:01
24.04   7:40:04
24.02   7:40:07
25.35   7:40:10
26.69   7:40:13
32.04   7:40:16
28.02   11:05:43
30.71   11:05:46
29.36   11:05:49
18.68   11:05:52
54.72   11:05:55
34.69   10:31:34
25.03   10:31:38
56.04   10:31:40
44.03   10:31:43
Run Code Online (Sandbox Code Playgroud)

我想计算每箱30分钟的平均速度.例如,第4个箱(1:31-2:00)的平均速度为(54.72 + 49.37 + 37.03)/ 3.我想过将小时,分钟和秒从00:00转换为秒,然后有1800秒的箱子.我曾尝试使用scipy.stats中的binned_statistic,但我的主要问题是我找不到根据日期分隔垃圾箱并获得平均速度的方法.

有任何想法吗?

python average bins python-3.x pandas

5
推荐指数
2
解决办法
2121
查看次数

获取 Github 总克隆统计数据

有没有办法获取任意给定月份的 github 存储库的克隆统计信息?

我们有一个克隆选项卡,其中包含过去 14 天的统计信息https://help.github.com/articles/about-repository-graphs/#traffic但查看历史数据会很有趣。

github github-api

4
推荐指数
1
解决办法
2724
查看次数

检查Pandas列值是否包含在列表中并分配值

我有一个pandas数据帧和一个包含特定值的列表.
我想检查列标题下的每个列值是否包含在列表中,如果找到其他
值,则要分配1.在下面的示例中,列标题v下的列值将根据列表中的值进行测试l .

l=['a','e']  
df = pd.DataFrame({'id':[1,2,3,4,5],'v' : ['a','b','c','d','e']})  
df  

id  v
 1  a
 2  b
 3  c
 4  d
 5  e  
Run Code Online (Sandbox Code Playgroud)

结果,我期待的是,

id  v  
 1  1  
 2  0  
 3  0  
 4  0  
 5  1  
Run Code Online (Sandbox Code Playgroud)

我试过用

df['v'] = df['v'].apply(lambda x: x.isin(l))  
Run Code Online (Sandbox Code Playgroud)

但无法继续如何分配值1和0

python pandas

2
推荐指数
1
解决办法
1346
查看次数