vai*_*avk 5 python numpy matrix scipy nmf
有问题的部分是:
self.H = np.multiply(self.H, np.divide(np.matmul(preprocessing.normalize(self.W).T, np.multiply(self.X, np.power(self.A, self.beta - 2)))), np.matmul(self.W.T, np.power(self.A, self.beta - 1)) + self.sparsity)
Run Code Online (Sandbox Code Playgroud)
A,W,H是熊猫数据帧。Beta和稀疏性是整数。
它们的初始化是:
self.W = pd.DataFrame(np.random.randint(100,size=(self.X.shape[0], self.K)))
self.H = pd.DataFrame(np.random.randint(0,100,size=(self.K, self.X.shape[1])))
self.W = preprocessing.normalize(self.W)
self.A = self.W.dot(self.H)
Run Code Online (Sandbox Code Playgroud)
Type Error: can't multiply sequence by non-int of type 'float'
正是它所说的意思。不能将非数字(非 int)数据类型与数字数据类型相乘。例如,您不能将字符串与数字相乘。
您提交的上述代码确实有效。但是,由于您收到此错误,我假设上面的代码只是您实际代码的代理。因此,我将讲述我如何解决在做类似事情时遇到的相同错误。
假设有一个 csv 文件,其中包含某个班级的主题标记,如下表所示
| | Maths | English |
| Adam | 98 | 78 |
| John | 34 | 89 |
Run Code Online (Sandbox Code Playgroud)
如您所见,有行索引和列索引。如果你跑
marks = pd.read_csv("marks.csv")
Run Code Online (Sandbox Code Playgroud)
marks
将有 3 列,第一列包含学生的姓名。Pandas
read 假设第一列是数据的一部分。现在,如果将其与Numpy
数组相乘,则会出现错误。因为数字不能与字符串相乘。
为了解决这个问题,我们需要明确告诉 pandas 文件中的第一列是行索引。
marks = pd.read_csv("marks.csv", index_col=0)
Run Code Online (Sandbox Code Playgroud)
该参数index_col
告诉我们将文件中的哪一列作为行索引。您可以在此处的文档中详细了解这一点。