小编scr*_*Owl的帖子

R图例放置在图中

我有一个情节,其数据可以进入我想用于传奇的区域.有没有办法让绘图自动放在最高数据点上方的标题空间以适应图例?

如果我手动输入ylim()参数来扩展大小然后给出我想要传说所在位置的确切坐标,我可以让它工作,但我更喜欢有一个更灵活的方法来做这个,因为它是一个前端数据库查询和数据级别可能具有非常不同的级别.

在此输入图像描述

plot r legend

33
推荐指数
3
解决办法
15万
查看次数

R将矩阵或数据帧转换为sparseMatrix

我有一个常规矩阵(非稀疏),我想转换为sparseMatrix(使用Matrix包).有没有这样做的功能,还是我需要做一堆循环?

恩.

> regMat <- matrix(0, nrow=10, ncol=10)
> regMat[3,5] <- round(runif(1),2)*100
> regMat[2,8] <- round(runif(1),2)*100
> regMat[8,4] <- round(runif(1),2)*100
> regMat[1,6] <- round(runif(1),2)*100
> regMat[7,4] <- round(runif(1),2)*100
> regMat 
      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
 [1,]    0    0    0    0    0   49    0    0    0     0
 [2,]    0    0    0    0    0    0    0   93    0     0
 [3,]    0    0    0    0   20    0    0    0    0     0
 [4,]    0    0 …
Run Code Online (Sandbox Code Playgroud)

r matrix sparse-matrix

31
推荐指数
2
解决办法
3万
查看次数

从R转到Python,python等价于数据框架是什么?

我熟悉R数据持有者,如矢量,数据帧等,但需要进行一些文本分析,看起来python有一些很好的设置.我的问题是我在哪里可以找到python如何保存数据的解释.

具体来说,我在一个制表符分隔的文件中有一个数据集,其中文本在第3列,我需要的数据的评分在第4列.

id1            id2            text                             score
123            889     "This is the text I need to read..."      88
234            778     "This is the text I need to read..."      78
345            667     "This is the text I need to read..."      91
Run Code Online (Sandbox Code Playgroud)

在R中我只是将它加载到一个名为的数据框中df1,当我想调用一个列时,我会使用df1 $ text或者df1[,3] 如果我想要一个特定的单元格,我可以使用它df1[1,3].

我对如何将数据读入python而不是如何处理类似结构的表格有所了解.

你会如何建议为一个python新手使用它?

python r

26
推荐指数
5
解决办法
2万
查看次数

如何创建四分位列?

我在R中有一个名为tableOne的表,如下所示:

idNum        binaryVariable        salePrice
2               1                    55.56
4               0                    88.33
15              0                     4.45
87              1                    35.77
...            ...                    ...
Run Code Online (Sandbox Code Playgroud)

我想从yield(tableOne $ salePrice)中获取的值通过salePrice创建四个四分位数.然后我想创建一个列tableOne $ quartile,每行sortPrice所在的四分位数.它看起来像:

idNum        binaryVariable            salePrice      quartile
    2               1                    55.56            3
    4               0                    88.33            4
    15              0                     4.45            1
    87              1                    35.77            2 
    ...            ...                    ...            ...  
Run Code Online (Sandbox Code Playgroud)

有什么建议?

r

25
推荐指数
4
解决办法
3万
查看次数

R转换zipcode或lat/long到县

我有一个位置列表,其中包含每个位置的城市,州,邮政编码,纬度和经度.

我单独列出了县级经济指标.我玩过zipcode包,ggmap包和其他几个免费地理编码网站,包括美国Gazeteer文件,但似乎无法找到匹配这两个部分的方法.

目前是否有任何包或其他来源这样做?

geocoding r geolocation

23
推荐指数
3
解决办法
2万
查看次数

关于加快随机森林的建议

我正在使用该randomForest包进行一些工作,虽然它运行良好,但它可能非常耗时.任何人都有加快速度的建议吗?我正在使用带有双核AMD芯片的Windows 7机箱.我知道关于R不是多线程/处理器,但如果任何并行包(的好奇rmpi,snow,snowfall等)工作过randomForest的东西.谢谢.

编辑:

我正在使用rF进行一些分类工作(0和1).数据有大约8-12个可变列,训练集是10k行的样本,因此它的体积适中但不疯狂.我正在运行500棵树和2只,3只或4只.

编辑2:这是一些输出:

> head(t22)
  Id Fail     CCUse Age S-TFail         DR MonInc #OpenLines L-TFail RE M-TFail Dep
1  1    1 0.7661266  45       2 0.80298213   9120         13       0  6       0   2
2  2    0 0.9571510  40       0 0.12187620   2600          4       0  0       0   1
3  3    0 0.6581801  38       1 0.08511338   3042          2       1  0       0   0
4  4    0 0.2338098  30       0 0.03604968   3300          5       0  0       0 …
Run Code Online (Sandbox Code Playgroud)

r random-forest

22
推荐指数
4
解决办法
2万
查看次数

R glmnet as.matrix()错误消息

我正在尝试glmnet在数据集上使用该包.我正在使用cv.glmnet()获取lambda值glmnet().我将它们排除在第1,2,7,12列之外:id列,响应列,包含NA,并包含NA.

这是数据集和错误消息:

> head(t2)
  X1 X2        X3 X4 X5         X6    X7 X8 X9 X10 X11 X12
1  1  1 0.7661266 45  2 0.80298213  9120 13  0   6   0   2
2  2  0 0.9571510 40  0 0.12187620  2600  4  0   0   0   1
3  3  0 0.6581801 38  1 0.08511338  3042  2  1   0   0   0
4  4  0 0.2338098 30  0 0.03604968  3300  5  0   0   0   0
5  5  0 0.9072394 49  1 …
Run Code Online (Sandbox Code Playgroud)

r glmnet

20
推荐指数
3
解决办法
2万
查看次数

R将类型因子的所有列更改为数字

我有一个100 X 100的数据框.有30列是因素.有没有办法只将因子类型列切换为数字类型而不影响其他列(不进入循环路径)?

r type-conversion

20
推荐指数
2
解决办法
2万
查看次数

为weka增加java中的堆大小

我正在尝试增加java中的堆大小,因为weka会不断崩溃.我使用了建议的行:

> java -Xmx500m -classpath
Run Code Online (Sandbox Code Playgroud)

但是我收到以下错误:

-classpath requires class path specification
Run Code Online (Sandbox Code Playgroud)

我不确定这意味着什么.有什么建议?

java memory jvm weka

19
推荐指数
5
解决办法
5万
查看次数

R在y轴上改变比例格式

我有一个分别在y和x轴上有$ -amounts和日期的图.目前,美元金额从0-15百万美元不等.像这样的东西:

x <- rnorm(20)^2 * 1000000
plot(x)
Run Code Online (Sandbox Code Playgroud)

R做的事情就像'1.0e+07''10,000,000'不是横向而不是水平地定向文本.

我的问题是:

1)如何将缩放文本设置为水平方向?

2)如何使用R 10MM代替'10,000,000''1.0e+07'

plot r

17
推荐指数
2
解决办法
6万
查看次数