我可以从决策树中的受过训练的树中提取基础决策规则(或"决策路径")作为文本列表吗?
就像是:
if A>0.4 then if B<0.2 then if C>0.8 then class='X'
谢谢你的帮助.
python machine-learning decision-tree random-forest scikit-learn
使用tqdm进度条时:我可以在循环中将进度条添加到与进度条相同的行吗?
我尝试使用"tqdm.write"选项,但它在每次写入时都添加了一个新行.我希望每次迭代都在条形图旁边显示一条短消息,它将在下一次迭代中消失.这可能吗?
我想并行运行一个函数,并等待所有并行节点完成,使用joblib.就像在例子中:
from math import sqrt
from joblib import Parallel, delayed
Parallel(n_jobs=2)(delayed(sqrt)(i ** 2) for i in range(10))
Run Code Online (Sandbox Code Playgroud)
但是,我希望执行将在一个进度条中看到,就像使用tqdm一样,显示已完成的作业数量.
你会怎么做?
我有一个带kerasRegressor的scikit-learn pipline:
estimators = [
('standardize', StandardScaler()),
('mlp', KerasRegressor(build_fn=baseline_model, nb_epoch=5, batch_size=1000, verbose=1))
]
pipeline = Pipeline(estimators)
Run Code Online (Sandbox Code Playgroud)
之后,训练pipline,我试图使用joblib保存到磁盘...
joblib.dump(pipeline, filename , compress=9)
Run Code Online (Sandbox Code Playgroud)
但我收到一个错误:
RuntimeError:超出最大递归深度
你如何将管道保存到磁盘?
我试图用anaconda python 3.5从url中获取数据
import requests
url ='http://eutils.ncbi.nlm.nih.gov/entrez/eutils/einfo.fcgi'
r = requests.get(url)
r.content
Run Code Online (Sandbox Code Playgroud)
可以在浏览器中打开网址而不会出现问题...
但我收到一个错误(对于这个网址和我尝试的任何其他网址):
-------------------------------------------------- ------------------------ TypeError Traceback(最近一次调用最后一次)C:\ Anaconda3\lib\site-packages\requests\packages\urllib3\connectionpool _make_request中的.py(self,conn,method,url,timeout,**httplib_request_kw)375尝试:#Python 2.7,使用HTTP响应的缓冲 - > 376 httplib_response = conn.getresponse(buffering = True)377除TypeError外:## Python 2.6及更早版本
TypeError:getresponse()得到一个意外的关键字参数'buffering'
在处理上述异常期间,发生了另一个异常:
RemoteDisconnected Traceback(最近一次调用最后一次)在urlopen中的C:\ Anaconda3\lib\site-packages\requests\packages\urllib3\connectionpool.py(self,method,url,body,headers,retries,redirect,assert_same_host,timeout,pool_timeout ,release_conn,**response_kw)558 timeout = timeout_obj, - > 559 body = body,headers = headers)560
在_make_request(self,conn,method,url,timeout,**httplib_request_kw)中的C:\ Anaconda3\lib\site-packages\requests\packages\urllib3\connectionpool.py 377除TypeError外:#Python 2.6及更早版本 - > 378 httplib_response = conn.getresponse()379除了(SocketTimeout,BaseSSLError,SocketError)为e:
C:\ Anaconda3\lib\http\client.py在getresponse(self)1173
尝试: - > 1174 response.begin()1175除了ConnectionError:C:\ Anaconda3\lib\http\client.py in begin(self)281,True: - > 282 version,status,reason = self._read_status()283 if status!= CONTINUE:
C:\ Anaconda3\lib\http\client.py在_read_status(self)250#中发送有效回复. - …
我需要降低用matplotlib制成的条形舱口的密度.我添加阴影的方式:
kwargs = {'hatch':'|'}
rects2 = ax.bar(theta, day7, width,fill=False, align='edge', alpha=1, **kwargs)
kwargs = {'hatch':'-'}
rects1 = ax.bar(theta, day1, width,fill=False, align='edge', alpha=1, **kwargs)
Run Code Online (Sandbox Code Playgroud)
我知道你可以通过在图案中添加更多字符来增加密度,但是如何降低密度?!
我想在一个jupyter笔记本中创建一个Image实例来响应点击事件 - 我们怎么能这样做?我还希望能够识别被点击的图像.使用按钮但不使用图像很简单.
我在python中运行一个多处理池,在那里我有~2000个任务,被映射到池中的24个工作者.每个任务都基于一些数据分析和Web服务创建一个文件.
当池中的所有任务都完成时,我想运行一个新任务.如何判断池中的所有进程何时完成?
我有一个包含 3 列的 pandas 表:parent_male、parent_female、offsprings - 所有字符串。我想创建一个简单的稀疏交叉表,将男性与女性以及后代作为值 - 我如何编写一个 aggfunc 来执行此操作。(不需要真正的聚合) - 只需在空格中放置一个空字符串。
聚类数据集,然后将数据转换为使用sklearn.cluster.KMeans从质心的距离后,才可能扭转改造,给出的质心,找回原来的特点是什么?
python machine-learning k-means dimensionality-reduction scikit-learn
python ×9
scikit-learn ×3
joblib ×2
tqdm ×2
anaconda ×1
crosstab ×1
ipywidgets ×1
jupyter ×1
k-means ×1
keras ×1
matplotlib ×1
pandas ×1
pool ×1
python-3.x ×1