小编Hap*_*per的帖子

scikit - 随机森林回归 - AttributeError:'Thread'对象没有属性'_children'

我为随机森林回归器设置我的n_jobs参数> 1时出现以下错误.如果我设置n_jobs = 1,一切正常.

AttributeError:'Thread'对象没有属性'_children'

我正在烧瓶服务中运行此代码.有趣的是,在烧瓶服务之外运行时不会发生这种情况.我只在新安装的Ubuntu盒子上重新编写了这个.在我的Mac上,它工作得很好.

这是一个谈论这个问题的线程,但似乎没有超越解决方法 'Thread'对象没有属性'_children' - django + scikit-learn

有什么想法吗？

感谢大家!

这是我的测试代码:

@test.route('/testfun')

    def testfun():
        from sklearn.ensemble import RandomForestRegressor
        import numpy as np

        train_data = np.array([[1,2,3], [2,1,3]])
        target_data = np.array([1,1])

        model = RandomForestRegressor(n_jobs=2)
        model.fit(train_data, target_data)
        return "yey"

堆栈跟踪:


    Traceback (most recent call last):
      File "/usr/local/lib/python2.7/dist-packages/flask/app.py", line 1836, in __call__
        return self.wsgi_app(environ, start_response)
      File "/usr/local/lib/python2.7/dist-packages/flask/app.py", line 1820, in wsgi_app
        response = self.make_response(self.handle_exception(e))
      File "/usr/local/lib/python2.7/dist-packages/flask/app.py", line 1403, in handle_exception
        reraise(exc_type, exc_value, tb)
      File "/usr/local/lib/python2.7/dist-packages/flask/app.py", line 1817, in wsgi_app
        response …

python flask scikit-learn

Hap*_*per

2017 05-23

7
推荐指数

1
解决办法

1565
查看次数

使用大量数据偏向某一类别来预测类别

我有一个关于如何处理一些有趣数据的问题。

\n\n

我目前有一些数据（计数是真实的，但情况是假的），我们可以预测人们今天会在网上购买的 T 恤数量。我们对每个人的特征属性都了解很多，而且这些属性每天都在变化。我们还知道每个人前几天购买了多少件 T 恤。

\n\n

我想要的是有一个算法，能够产生一个连续变量，即该人今天要购买的 T 恤数量的排名或 \xe2\x80\x9cscore\xe2\x80\x9d 。我的最终目标是，如果我可以将这个分数附加到每个人身上，我可以根据分数对他们进行排序并在特定的 UI 中使用它们。目前，我\xe2\x80\x99一直在使用 sci-kit 的随机森林回归，其中我的目标类别是昨天\xe2\x80\x99s 每个人购买 T 恤的计数。效果非常好，只是我的数据有点困难，因为有很多人购买了 0 件 T 恤。这是一个问题，因为我的随机森林给了我很多预测的 0 类，但我无法有效地对它们进行排序。我明白为什么会发生这种情况，但我\xe2\x80\x99m 不确定解决它的最佳方法。

\n\n

我想要的是一个非零分数（即使它\xe2\x80\x99是一个接近0的非常小的数字），它告诉我更多关于特征和预测类别的信息。我觉得我的一些特征一定能够告诉我一些东西，并给我一个比 0 更好的预测。

\n\n

我认为固有的问题是使用随机森林回归器作为算法。每棵树都获得投票；然而，有太多的零，以至于有很多森林，所有的树都投票给 0。我想尝试另一种算法，但我不\xe2\x80\x99 不知道哪一个最有效。目前 I\xe2\x80\x99m 对整个数据集进行训练并使用 scikit 提供的袋外估计。

\n\n

以下是数据类的计数（使用 python\xe2\x80\x99s Counter([目标类])。设置如下：{predicted_class_value: counts_of_that_value_in_the_target_class_list}\n{0: 3560426, 1: 121256, 2: 10582 , 3: 1029, 4: 412, 5: 88, 6: 66, 7: 35, 8: 21, 9: 17, 10: 17, 11: 10, 12: 2, 13: 2, 15: 2, 21 : 2, 17: 1, 18: …

statistics classification machine-learning prediction scikit-learn

Hap*_*per

2015 08-25

1
推荐指数

1
解决办法

926
查看次数