我发现了一些其他问题,这些问题与我得到的问题有类似的错误,但无法根据答案弄清楚如何解决这个问题。我正在尝试在 python 的帮助下将一个 excel 文件导入 SQL Server。这是我写的代码:
import pandas as pd
import numpy as np
import pandas.io.sql
import pyodbc
import xlrd
server = "won't disclose private info"
db = 'private info'
conn = pyodbc.connect('DRIVER={SQL Server};SERVER=' + Server + ';DATABASE=' +
db + ';Trusted_Connection=yes')
cursor = conn.cursor()
book = xlrd.open_workbook("Daily Flash.xlsx")
sheet = book.sheet_by_name("Sheet1")
query1 = """CREATE TABLE [LEAF].[MK] ([LEAF][Lease_Number] varchar(255),
[LEAF][Start_Date] varchar(255), [LEAF][Report_Status] varchar(255), [LEAF]
[Status_Date] varchar(255), [LEAF][Current_Status] varchar(255), [LEAF]
[Sales_Rep] varchar(255), [LEAF][Customer_Name] varchar(255),[LEAF]
[Total_Finance] varchar(255),
[LEAF][Rate_Class] varchar(255) ,[LEAF][Supplier_Name] varchar(255) …Run Code Online (Sandbox Code Playgroud) 我尝试运行以下代码:
from imblearn import under_sampling, over_sampling
from imblearn.over_sampling import SMOTE
sm = SMOTE(random_state=12, ratio = 1.0)
x_SMOTE, y_SMOTE = sm.fit_sample(X, y)
Run Code Online (Sandbox Code Playgroud)
这给我错误信息:
ModuleNotFoundError: No module named 'imblearn'
Run Code Online (Sandbox Code Playgroud)
我尝试以多种方式安装imblearn模块,它们似乎都可以工作(安装过程中未出现任何错误,但是当我运行上述代码时,出现错误消息)。
我使用其他stackoverflow问题中建议的以下内容尝试了taltaling imblearn:
pip install -U imbalanced-learn
pip install imblearn
!pip install imblearn
pip install -c glemaitre imbalanced-learn
pip install imblearn==0.0
Run Code Online (Sandbox Code Playgroud)
这些似乎都无济于事...有什么想法吗?谢谢!
您可以使用 1 行代码轻松提取轮廓分数,该代码对所有集群的分数求平均值,但是如何从 scikit 学习轮廓分数的实现中提取每个中间分数?我希望能够分别为每个集群提取相同的分数,而不仅仅是获得总分。
metrics.silhouette_score(x, y, metric='euclidean')
Run Code Online (Sandbox Code Playgroud)