我为随机森林回归器设置我的n_jobs参数> 1时出现以下错误.如果我设置n_jobs = 1,一切正常.
AttributeError:'Thread'对象没有属性'_children'
我正在烧瓶服务中运行此代码.有趣的是,在烧瓶服务之外运行时不会发生这种情况.我只在新安装的Ubuntu盒子上重新编写了这个.在我的Mac上,它工作得很好.
这是一个谈论这个问题的线程,但似乎没有超越解决方法 'Thread'对象没有属性'_children' - django + scikit-learn
有什么想法吗?
感谢大家!
这是我的测试代码:
@test.route('/testfun')
def testfun():
from sklearn.ensemble import RandomForestRegressor
import numpy as np
train_data = np.array([[1,2,3], [2,1,3]])
target_data = np.array([1,1])
model = RandomForestRegressor(n_jobs=2)
model.fit(train_data, target_data)
return "yey"
堆栈跟踪:
Traceback (most recent call last):
File "/usr/local/lib/python2.7/dist-packages/flask/app.py", line 1836, in __call__
return self.wsgi_app(environ, start_response)
File "/usr/local/lib/python2.7/dist-packages/flask/app.py", line 1820, in wsgi_app
response = self.make_response(self.handle_exception(e))
File "/usr/local/lib/python2.7/dist-packages/flask/app.py", line 1403, in handle_exception
reraise(exc_type, exc_value, tb)
File "/usr/local/lib/python2.7/dist-packages/flask/app.py", line 1817, in wsgi_app
response … 我有一个关于如何处理一些有趣数据的问题。
\n\n我目前有一些数据(计数是真实的,但情况是假的),我们可以预测人们今天会在网上购买的 T 恤数量。我们对每个人的特征属性都了解很多,而且这些属性每天都在变化。我们还知道每个人前几天购买了多少件 T 恤。
\n\n我想要的是有一个算法,能够产生一个连续变量,即该人今天要购买的 T 恤数量的排名或 \xe2\x80\x9cscore\xe2\x80\x9d 。我的最终目标是,如果我可以将这个分数附加到每个人身上,我可以根据分数对他们进行排序并在特定的 UI 中使用它们。目前,我\xe2\x80\x99一直在使用 sci-kit 的随机森林回归,其中我的目标类别是昨天\xe2\x80\x99s 每个人购买 T 恤的计数。效果非常好,只是我的数据有点困难,因为有很多人购买了 0 件 T 恤。这是一个问题,因为我的随机森林给了我很多预测的 0 类,但我无法有效地对它们进行排序。我明白为什么会发生这种情况,但我\xe2\x80\x99m 不确定解决它的最佳方法。
\n\n我想要的是一个非零分数(即使它\xe2\x80\x99是一个接近0的非常小的数字),它告诉我更多关于特征和预测类别的信息。我觉得我的一些特征一定能够告诉我一些东西,并给我一个比 0 更好的预测。
\n\n我认为固有的问题是使用随机森林回归器作为算法。每棵树都获得投票;然而,有太多的零,以至于有很多森林,所有的树都投票给 0。我想尝试另一种算法,但我不\xe2\x80\x99 不知道哪一个最有效。目前 I\xe2\x80\x99m 对整个数据集进行训练并使用 scikit 提供的袋外估计。
\n\n以下是数据类的计数(使用 python\xe2\x80\x99s Counter([目标类])。设置如下:{predicted_class_value: counts_of_that_value_in_the_target_class_list}\n{0: 3560426, 1: 121256, 2: 10582 , 3: 1029, 4: 412, 5: 88, 6: 66, 7: 35, 8: 21, 9: 17, 10: 17, 11: 10, 12: 2, 13: 2, 15: 2, 21 : 2, 17: 1, 18: …
statistics classification machine-learning prediction scikit-learn