我希望能够在Python中创建图形决策树,我目前正在尝试安装两者pydot
和graphviz
.
我使用Anaconda作为我的环境(以及Spyder),并尝试运行以下代码行
conda install -c https://conda.binstar.org/t/TOKEN/j14r pydot
Run Code Online (Sandbox Code Playgroud)
结果
Error: unknown host: http://repo.continuum.io/pkgs/pro/win-32/
Error: unknown host: http://repo.continuum.io/pkgs/free/win-32/
Error: unknown host: https://conda.binstar.org/t/TOKEN/j14r/win-32/
Error: No packages found matching: pydot
Run Code Online (Sandbox Code Playgroud)
我也试过使用pip install pydot
并pip install graphviz
得到类似的结果:
Downloading/unpacking pydot
Cannot fetch index base URL https://pypi.python.org/simple/
Could not find any downloads that satisfy the requirement pydot
Cleaning up...
No distributions at all found for pydot
Storing complete log in [...]
Run Code Online (Sandbox Code Playgroud)
我在试图弄清楚如何解决这个问题时感到非常无聊,所以我希望那里的任何人都可以给我一些提示.
谢谢
我有以下数据框架C
.
>>> C
a b c
2011-01-01 0 0 NaN
2011-01-02 41 12 NaN
2011-01-03 82 24 NaN
2011-01-04 123 36 NaN
2011-01-05 164 48 NaN
2011-01-06 205 60 2
2011-01-07 246 72 4
2011-01-08 287 84 6
2011-01-09 328 96 8
2011-01-10 369 108 10
Run Code Online (Sandbox Code Playgroud)
我想d
在一个固定的窗口(这里是6)上添加一个新列,我在其中应用滚动函数,我在某种程度上,对于每一行(或日期),修复该值c
.这个滚动函数中的一个循环应该是(伪):
a b c d
2011-01-01 0 0 NaN a + b*2 (a,b from this row, '2' is from 'c' on 2011-01-06)
2011-01-02 41 12 NaN …
Run Code Online (Sandbox Code Playgroud) 我知道可以使用例如掩盖数据帧中的某些行
(1) mask = df['A']=='a'
Run Code Online (Sandbox Code Playgroud)
其中df是手头有一个名为"A"的列的数据框.调用df [mask]会产生我新的"蒙面"DataFrame.
当然也可以使用多个标准
(2) mask = (df['A']=='a') | (df['A']=='b')
Run Code Online (Sandbox Code Playgroud)
然而,当需要满足几个标准时,最后一步可能会变得有点乏味
(3) mask = (df['A']=='a') | (df['A']=='b') | (df['A']=='c') | (df['A']=='d') | ...
Run Code Online (Sandbox Code Playgroud)
现在,假设我在数组中有我的过滤条件
(4) filter = ['a', 'b', 'c', 'd', ...]
# ... here means a lot of other criteria
Run Code Online (Sandbox Code Playgroud)
有没有办法使用单线程获得与上面(3)中相同的结果?
就像是:
(5) mask = df.where(df['A']==filter)
df_new = df[mask]
Run Code Online (Sandbox Code Playgroud)
在这种情况下(5)显然会返回错误.
我正在尝试在 Bokeh 中的多类别图中旋转长轴和短轴(类似于此处对主要刻度标签所做的操作以及此处在 matplotlib 中所做的操作。当有多个类别时,它们的标签/文本经常会被涂抹在一起。
从Bokeh 分类数据文档中汲取一些灵感,使用 Bokehsvbar
功能,结果将类似于
主轴可以使用设置
p.xaxis.major_label_orientation = pi/4
Run Code Online (Sandbox Code Playgroud)
但我找不到任何方法可以为未成年人做同样的事情......
? p.xaxis.minor[0]_label_orientation = pi/4 ?
? p.xaxis.minor[1]_label_orientation = pi/3 ?
...
Run Code Online (Sandbox Code Playgroud)
任何想法都将非常感激!
我正在尝试使用 -package 组合散点图和线图seaborn
(因为这似乎是跨类别使用颜色图的一种巧妙方法)。
目前,我有两个数据集存储为 pandas DataFrame:linear_data
用于线性情况和scatter_data
散点数据。我可以这样创建两个单独的图:
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt
# creating a nice color palette with 10 different colors
color_palette=sns.diverging_palette(10, 130, sep=100, n=10)
N=300
scatter_data = pd.DataFrame({'x' : np.random.random(N)*10, 'y' :
np.random.random(N)*100, 'score' : np.random.randint(1,10,N)})
# create linear plot for linear_data
lin_dict = {0.1: 51.98384470434041,
0.25: 69.9192341826548,
0.5: 83.48683256238559,
1.0: 97.05443094211638,
2.0: 110.62202932184718,
3.0: 118.5585655988348,
4.0: 124.18962770157796,
5.0: 128.55741880016157,
6.0: 132.1261639785656,
7.0: 135.1434950339544,
8.0: 137.75722608130874, …
Run Code Online (Sandbox Code Playgroud) 我想知道是否有办法根据特定工作表中的值,按下按钮在Excel中创建弹出图表?
最好的方法是能够在VBA中完成.
我一直在研究,但找不到任何真正的解决方案.
有什么建议?