小编Ale*_*yes的帖子

AttributeError: 'SMOTE' 对象没有属性 '_validate_data'

我正在使用 SMOTE 重新采样我的数据（多类）。

sm = SMOTE(random_state=1)
X_res, Y_res = sm.fit_resample(X_train, Y_train)

Run Code Online (Sandbox Code Playgroud)

但是，我收到此属性错误。任何人都可以帮忙吗？

python scikit-learn imblearn imbalanced-data

HP_*_*_17

2020 11-24

13
推荐指数

2
解决办法

2万
查看次数

没有名为“sklearn.neighbors._base”的模块

我最近在 jupyter 中安装了 imblearn 包

!pip show imbalanced-learn

Run Code Online (Sandbox Code Playgroud)

但我无法导入这个包。

from tensorflow.keras import backend
from imblearn.over_sampling import SMOTE

Run Code Online (Sandbox Code Playgroud)

我收到以下错误

---------------------------------------------------------------------------
ModuleNotFoundError                       Traceback (most recent call last)
<ipython-input-20-f19c5a0e54af> in <module>
      1 # from sklearn.utils import resample
      2 from tensorflow.keras import backend
----> 3 from imblearn.over_sampling import SMOTE
      4 
      5 

~/.virtualenvs/p3/lib/python3.6/site-packages/imblearn/__init__.py in <module>
     32     Module which allowing to create pipeline with scikit-learn estimators.
     33 """
---> 34 from . import combine
     35 from . import ensemble
     36 from . import exceptions

~/.virtualenvs/p3/lib/python3.6/site-packages/imblearn/combine/__init__.py in …

Run Code Online (Sandbox Code Playgroud)

python scikit-learn imblearn imbalanced-data

joe*_*oel

2020 11-25

9
推荐指数

2
解决办法

1万
查看次数

Django Rest框架drf-yasg swagger ListField序列化器的多个文件上传错误

我正在尝试从swagger（使用drf-yasg）进行上传文件输入，但是当我使用MultiPartParser类时，它给了我以下错误：

drf_yasg.errors.SwaggerGenerationError: FileField is supported only in a formData Parameter or response Schema

Run Code Online (Sandbox Code Playgroud)

我的看法：

drf_yasg.errors.SwaggerGenerationError: FileField is supported only in a formData Parameter or response Schema

Run Code Online (Sandbox Code Playgroud)

我的序列化器：

class AddExperience(generics.CreateAPIView):
    parser_classes = [MultiPartParser]

    permission_classes = [IsAuthenticated]
    serializer_class = DoctorExperienceSerializer

Run Code Online (Sandbox Code Playgroud)

我也尝试过FormParser，但它仍然给我同样的错误。另外：FileUploadParser解析器但它的工作原理如下JsonParser：

python django python-3.x django-rest-framework drf-yasg

I.J*_*dze

2022 12-13

7
推荐指数

1
解决办法

1768
查看次数

Sklearn Pipeline：如何构建 kmeans、聚类文本？

我的文字如图所示：

 list1 = ["My name is xyz", "My name is pqr", "I work in abc"]

Run Code Online (Sandbox Code Playgroud)

以上将是使用 kmeans 聚类文本的训练集。

list2 = ["My name is xyz", "I work in abc"]

Run Code Online (Sandbox Code Playgroud)

以上是我的测试集。

我构建了一个矢量化器和模型，如下所示：

vectorizer = TfidfVectorizer(min_df = 0, max_df=0.5, stop_words = "english", charset_error = "ignore", ngram_range = (1,3))
vectorized = vectorizer.fit_transform(list1)
km=KMeans(n_clusters=2, init='k-means++', n_init=10, max_iter=1000, tol=0.0001, precompute_distances=True, verbose=0, random_state=None, copy_x=True, n_jobs=1)
km.fit(vectorized)

Run Code Online (Sandbox Code Playgroud)

如果我尝试预测“list2”测试集的集群：

km.predict(list2)

Run Code Online (Sandbox Code Playgroud)

我收到以下错误：

ValueError: Incorrect number of features. Got 2 features, expected 5

Run Code Online (Sandbox Code Playgroud)

有人告诉我用它Pipeline来解决这个问题。所以我写了下面的代码：

pipe = Pipeline([('vect', vectorizer), ('vectorized', …

Run Code Online (Sandbox Code Playgroud)

python machine-learning k-means scikit-learn scikit-learn-pipeline

use*_*759

2022 12-19

5
推荐指数

1
解决办法

1万
查看次数

如何将字符串转换为带有空格的浮点数 - pandas

当我导入 Excel 文件时，列中的某些数字是浮点型，有些不是。如何将所有内容转换为浮点数？里面的空间3 000,00给我带来了问题。

  df['column']:
             column
0          3 000,00
1            156.00
2                 0

Run Code Online (Sandbox Code Playgroud)

我在尝试：

  df['column']:
             column
0          3 000,00
1            156.00
2                 0

Run Code Online (Sandbox Code Playgroud)

但它不起作用。我会在之后做.astype(float)，但无法到达那里。有什么解决办法吗？1已经是一个浮点数，但是0是一个字符串。

python string python-3.x pandas

OhM*_*God

2022 12-21

5
推荐指数

1
解决办法

5259
查看次数

在 Mac OS 上从 Transformer 类导入管道函数时，Jupyter 内核崩溃

我无法导入 Transformer 类的管道函数，因为我的 jupyter 内核一直死机。尝试使用 Transformer-4.15.0 和 4.16.2。有人遇到过这个问题吗？

我尝试将类导入到新笔记本中，如图所示，它不断杀死内核。

Jupyter 实验室截图

python jupyter-notebook jupyter-lab huggingface-transformers

Ang*_*hok

2022 12-04

5
推荐指数

1
解决办法

6572
查看次数

惰性预测.监督.惰性分类器。ImportError：无法从“sklearn.utils.deprecation”导入名称“_raise_dep_warning_if_not_pytest”

我试过：

from lazypredict.Supervised import LazyClassifier

Run Code Online (Sandbox Code Playgroud)

但得到以下回溯：

---------------------------------------------------------------------------
ImportError                               Traceback (most recent call last)
<ipython-input-1-f518cae57501> in <module>
     10 from sklearn.linear_model import LogisticRegression
     11 from sklearn.ensemble import RandomForestClassifier
---> 12 from lazypredict.Supervised import LazyClassifier
     13 from sklearn.model_selection import GridSearchCV
     14 from sklearn.metrics import accuracy_score

~\AppData\Roaming\Python\Python38\site-packages\lazypredict\Supervised.py in <module>
     14 from sklearn.preprocessing import StandardScaler, OneHotEncoder, OrdinalEncoder
     15 from sklearn.compose import ColumnTransformer
---> 16 from sklearn.utils.testing import all_estimators
     17 from sklearn.base import RegressorMixin
     18 from sklearn.base import ClassifierMixin

S:\anaconda\lib\site-packages\sklearn\utils\testing.py in <module>
      5 from . import …

Run Code Online (Sandbox Code Playgroud)

classification machine-learning scikit-learn

Sid*_*rth

2021 04-29

4
推荐指数

1
解决办法

1万
查看次数

没有名为“gensim.sklearn_api”的模块如何解决

我有点困惑，我想使用 texthero 库进行一些 PCA 分析。但是当我尝试运行我的代码时：

import texthero as hero
import pandas as pd


df['pca']=(df['clean_tweet'].pipe(hero.clean).pipe(hero.do_tfidf).pipe(hero.do_pca))
hero.scatterplot(df, col='pca', color='topic', title="PCA BBC Sport news")

Run Code Online (Sandbox Code Playgroud)

我收到错误：

ModuleNotFoundError: No module named 'gensim.sklearn_api

Run Code Online (Sandbox Code Playgroud)

但是当我输入 !pip 显示 gensim 时。我有

Name: gensim
Version: 4.0.1
Summary: Python framework for fast Vector Space Modelling
Home-page: http://radimrehurek.com/gensim

Run Code Online (Sandbox Code Playgroud)

python machine-learning pandas gensim

Prz*_*bek

2021 04-28

3
推荐指数

1
解决办法

1668
查看次数

“达到最大重试次数”包 fake_useragent Python 3

所以我一直在致力于fake_useragent一个网络抓取项目：

from fake_useragent import UserAgent
ua = UserAgent()
headers = {
    "User-Agent":ua.random
}

Run Code Online (Sandbox Code Playgroud)

但我最近在 Python 3 中收到了这个错误：

Error occurred during loading data. Trying to use cache server file https://useragent.melroy.org/cache.json
Traceback (most recent call last):
  File "/usr/local/lib/python3.10/dist-packages/fake_useragent/utils.py", line 64, in get
    urlopen(
  File "/usr/lib/python3.10/urllib/request.py", line 216, in urlopen
    return opener.open(url, data, timeout)
  File "/usr/lib/python3.10/urllib/request.py", line 525, in open
    response = meth(req, response)
  File "/usr/lib/python3.10/urllib/request.py", line 634, in http_response
    response = self.parent.error(
  File "/usr/lib/python3.10/urllib/request.py", line 563, in error
    return self._call_chain(*args) …

Run Code Online (Sandbox Code Playgroud)

python linux user-agent python-3.x

Zip*_*Zip

2022 12-19

3
推荐指数

1
解决办法

3399
查看次数

为什么今天 Github 贡献图是蓝色的

为什么 GitHub 贡献图是蓝色的？是因为冬天吗？

themes graph github

dan*_*ich

2022 12-22

3
推荐指数

1
解决办法

1448
查看次数

不平衡学习：导入错误：无法导入名称“MultiOutputMixin”

我已经重新安装了最新的 scikit-learn 和不平衡学习。我还检查了所有其他库，以确保它们与不平衡学习兼容。

我只想运行一个简单的RandomOverSample()，但我收到以下导入错误消息：

import imblearn
from imblearn.over_sampling import RandomOverSampler

ros = RandomOverSampler()
X_ros, y_ros = ros.fit_sample(x, y)

Run Code Online (Sandbox Code Playgroud)

错误信息：

    ---------------------------------------------------------------------------
ImportError                               Traceback (most recent call last)
<ipython-input-122-0bf7409a8688> in <module>
----> 1 import imblearn
      2 from imblearn.over_sampling import RandomOverSampler
      3 
      4 ros = RandomOverSampler()
      5 X_ros, y_ros = ros.fit_sample(x, y)

~/.local/lib/python3.5/site-packages/imblearn/__init__.py in <module>
     32     Module which allowing to create pipeline with scikit-learn estimators.
     33 """
---> 34 from . import combine
     35 from . import ensemble
     36 from . …

Run Code Online (Sandbox Code Playgroud)

python scikit-learn imblearn imbalanced-data

Cas*_*e.L

2022 12-14

2
推荐指数

1
解决办法

8897
查看次数