我正在使用Python 3在控制台中输出2个进度条,如下所示:
100%|###############################################|
45%|###################### |
Run Code Online (Sandbox Code Playgroud)
两个条都在不同的线程中同时增长.
线程操作很好,两个进度条都在执行它们的工作,但是当我想要打印它们时,它们在控制台的一行上打印在彼此的顶部.我只有一个行进度条,它在显示这两个进度条之间交替显示.
这些进度条是否可以同时在不同的行上增长?
我已经挣扎了很多,但仍然无法弄清楚如何FeatureUnion在 scikit-learn 管道中使用额外的功能和文本功能。
我有一个句子列表及其标签来训练模型,还有一个句子列表作为测试数据。然后我尝试向包词添加一个额外的特征(比如每个句子的长度)。为此,我编写了一个自定义LengthTransformer,它返回一个长度列表,并且具有与我的火车列表相同数量的元素。
然后我将其与TfidfVectorizerusing结合起来FeatureUnion,但它不起作用。
到目前为止我想到的是:
from sklearn.base import BaseEstimator, TransformerMixin
from sklearn.pipeline import Pipeline, FeatureUnion
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.svm import LinearSVC
from sklearn.multiclass import OneVsRestClassifier
from sklearn import preprocessing
class LengthTransformer(BaseEstimator, TransformerMixin):
def fit(self, X, y=None):
return self
def transform(self, X):
return [len(x) for x in X]
X_train = ["new york is a hell of a town",
"new york was originally dutch",
"the big apple is great",
"new york …Run Code Online (Sandbox Code Playgroud)