我有一个捐赠和捐赠者姓名的数据框.
**donation** **Donor**
25.00 Steve Smith
20.00 Jack Johnson
50.00 Mary Jackson
... ...
Run Code Online (Sandbox Code Playgroud)
我正在尝试使用该pvclust包进行一些聚类.不幸的是,包似乎没有采用非数字数据.
> rs1.pv1 <- parPvclust(cl, rs1, nboot=10)
Error in cor(x, method = "pearson", use = use.cor) : 'x' must be numeric
Run Code Online (Sandbox Code Playgroud)
我有两个问题.
1)是否有其他包装或方法可以做得更好?
2)有没有办法"规范化"捐赠者名单?即获得唯一的捐赠者名称列表,为每个捐赠者名称分配一个ID号,然后将ID号插入数据框中代替字符名称.
对于2号:
#If donor is a factor then
as.numeric(donor)
#will transform your factor to numeric.
#If it isn't, tranform it to a factor and the to numeric
as.numeric(as.factor(donor))
Run Code Online (Sandbox Code Playgroud)
但是,我不确定将捐赠者列表转换为数字然后使用cor是有意义的.
HTH
| 归档时间: |
|
| 查看次数: |
4262 次 |
| 最近记录: |