Ash*_*ary 1 python cluster-analysis k-means
下面是变量的前 5 行,我使用 KMeans 来找到最佳的簇数-
store_code PinCode sale_price_after_promo
0 2655 453441.0 55.00
1 2655 999999.0 30.00
2 2655 400064.0 418.95
3 2615 400099.0 70.00
4 2655 474001.0 34.20
Run Code Online (Sandbox Code Playgroud)
这是我得到的错误 -
OverflowError Traceback (most recent call last)
<ipython-input-62-3802a2b79f71> in <module>()
2 for i in range(0,11):
3 kmeans=KMeans(n_clusters=i, init='k-means++', random_state=42)
----> 4 kmeans.fit(X)
5 wcss.append(kmeans.inertia_)
6 plt.plot(range(1, 11), wcss)
OverflowError: cannot convert float infinity to integer
Run Code Online (Sandbox Code Playgroud)
即使我尝试使用各种变量组合但仍然出现相同的错误,如何摆脱这个错误?
您不能使用 k=0 集群运行 k-means。
此外,您的数据似乎非常不适合 k 均值。
在诸如“storeId”和“pinCode”之类的标识符属性上运行k-means绝对没有意义。