小编ash*_*shu的帖子

CountVectorizer:AttributeError:'numpy.ndarray'对象没有属性'lower'

我有一个一维数组,每个元素都有大字符串.我试图使用a CountVectorizer将文本数据转换为数字向量.但是,我收到一个错误说:

AttributeError: 'numpy.ndarray' object has no attribute 'lower'

Run Code Online (Sandbox Code Playgroud)

mealarray每个元素中包含大字符串.有5000个这样的样本.我正在尝试对此进行矢量化,如下所示:

vectorizer = CountVectorizer(
    stop_words='english',
    ngram_range=(1, 1),  #ngram_range=(1, 1) is the default
    dtype='double',
)
data = vectorizer.fit_transform(mealarray)

Run Code Online (Sandbox Code Playgroud)

完整的堆栈跟踪:

File "/Library/Python/2.7/site-packages/sklearn/feature_extraction/text.py", line 817, in fit_transform
    self.fixed_vocabulary_)
  File "/Library/Python/2.7/site-packages/sklearn/feature_extraction/text.py", line 748, in _count_vocab
    for feature in analyze(doc):
  File "/Library/Python/2.7/site-packages/sklearn/feature_extraction/text.py", line 234, in <lambda>
    tokenize(preprocess(self.decode(doc))), stop_words)
  File "/Library/Python/2.7/site-packages/sklearn/feature_extraction/text.py", line 200, in <lambda>
    return lambda x: strip_accents(x.lower())
AttributeError: 'numpy.ndarray' object has no attribute 'lower'

Run Code Online (Sandbox Code Playgroud)

python numpy scikit-learn text-classification

ash*_*shu

2018 01-23

11
推荐指数

2
解决办法

3万
查看次数

SQL Alchemy：如何从字典列表中批量更新值

我想更新具有字段的表“ Salary”：

employeeId,
Salary

Run Code Online (Sandbox Code Playgroud)

现在，我在python词典中更新了每个员工的值，例如：

[
{employeeId:1,Salary:10000},
{employeeId:2,Salary:15000}
]

Run Code Online (Sandbox Code Playgroud)

我想知道是否有一种方法可以在单个SQL Alchemy更新查询中执行此更新，而不是一个接一个地执行许多更新语句

python sqlalchemy

ash*_*shu

2016 04-15

3
推荐指数

1
解决办法

2730
查看次数

是否可以一次加载模型并在python中再次重用？

我已经训练了scikit学习模型，现在想在我的python代码中使用。有没有办法可以重用同一模型实例？以一种简单的方式，我可以在需要时再次加载模型，但是由于需求越来越频繁，我想一次加载模型并再次使用它。

有什么办法可以在python中实现吗？

这是预测.py中一个线程的代码：

clf = joblib.load('trainedsgdhuberclassifier.pkl')
clf.predict(userid)

Run Code Online (Sandbox Code Playgroud)

现在，对于另一个用户，我不想再次启动prediction.py并花费时间来加载模型。有没有办法，我可以简单地写。

new_recommendations = prediction(userid)

Run Code Online (Sandbox Code Playgroud)

我应该在这里使用多处理吗？我不确定！！

python scikit-learn

ash*_*shu

2014 10-22

2
推荐指数

1
解决办法

2699
查看次数

标签统计

python ×3

scikit-learn ×2

numpy ×1

sqlalchemy ×1

text-classification ×1

CountVectorizer:AttributeError:'numpy.ndarray'对象没有属性'lower'

SQL Alchemy：如何从字典列表中批量更新值

是否可以一次加载模型并在python中再次重用？

标签 统计

小编ash_shu的帖子

标签统计