小编use*_*144的帖子

使用scikit-learn在Naive Bayes分类器中混合分类和连续数据

我正在使用Python中的scikit-learn开发一种分类算法来预测某些客户的性别.除此之外,我想使用朴素贝叶斯分类器,但我的问题是我有混合的分类数据(例如:"在线注册","接受电子邮件通知"等)和连续数据(例如:"年龄","长度")会员资格"等).我之前没有使用scikit,但我认为高斯朴素贝叶斯适用于连续数据,而伯努利朴素贝叶斯可用于分类数据.但是,由于我想在我的模型中同时拥有分类和连续数据,我真的不知道如何处理这个问题.任何想法将不胜感激!

python classification machine-learning data-mining scikit-learn

use*_*144

2017 01-25

43
推荐指数

3
解决办法

1万
查看次数

在Python 3.2中并行执行for循环

可能重复:
如何并行化一个简单的python循环？

我是Python的新手(使用Python 3.2),我有一个关于并行化的问题.我有一个for循环,我希望在Python 3.2中使用"多处理"并行执行:

def computation:    
    global output

    for x in range(i,j):
        localResult = ... #perform some computation as a function of i and j
        output.append(localResult)

Run Code Online (Sandbox Code Playgroud)

总的来说,我想在i = 0到j = 100的范围内执行此计算.因此,我想创建一些进程,每个进程使用总范围的子域调用函数"calculate".有关于如何做到这一点的任何想法？有没有比使用多处理更好的方法？

更具体地说,我想执行域分解,我有以下代码:

from multiprocessing import Pool

class testModule:

    def __init__(self):
        self

    def computation(self, args):
        start, end = args
        print('start: ', start, ' end: ', end)

testMod = testModule()
length = 100
np=4
p = Pool(processes=np)
p.map(yes tMod.computation, [(length, startPosition, length//np) for startPosition in    range(0, length, length//np)])

Run Code Online (Sandbox Code Playgroud)

我收到一条提到PicklingError的错误消息.任何想法可能是这里的问题？

python parallel-processing pickle multiprocessing python-3.x

use*_*144

2017 05-23

14
推荐指数

2
解决办法

2万
查看次数