我有一个情节,其数据可以进入我想用于传奇的区域.有没有办法让绘图自动放在最高数据点上方的标题空间以适应图例?
如果我手动输入ylim()参数来扩展大小然后给出我想要传说所在位置的确切坐标,我可以让它工作,但我更喜欢有一个更灵活的方法来做这个,因为它是一个前端数据库查询和数据级别可能具有非常不同的级别.

我有一个常规矩阵(非稀疏),我想转换为sparseMatrix(使用Matrix包).有没有这样做的功能,还是我需要做一堆循环?
恩.
> regMat <- matrix(0, nrow=10, ncol=10)
> regMat[3,5] <- round(runif(1),2)*100
> regMat[2,8] <- round(runif(1),2)*100
> regMat[8,4] <- round(runif(1),2)*100
> regMat[1,6] <- round(runif(1),2)*100
> regMat[7,4] <- round(runif(1),2)*100
> regMat
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,] 0 0 0 0 0 49 0 0 0 0
[2,] 0 0 0 0 0 0 0 93 0 0
[3,] 0 0 0 0 20 0 0 0 0 0
[4,] 0 0 …Run Code Online (Sandbox Code Playgroud) 我熟悉R数据持有者,如矢量,数据帧等,但需要进行一些文本分析,看起来python有一些很好的设置.我的问题是我在哪里可以找到python如何保存数据的解释.
具体来说,我在一个制表符分隔的文件中有一个数据集,其中文本在第3列,我需要的数据的评分在第4列.
id1 id2 text score
123 889 "This is the text I need to read..." 88
234 778 "This is the text I need to read..." 78
345 667 "This is the text I need to read..." 91
Run Code Online (Sandbox Code Playgroud)
在R中我只是将它加载到一个名为的数据框中df1,当我想调用一个列时,我会使用df1 $ text或者df1[,3] 如果我想要一个特定的单元格,我可以使用它df1[1,3].
我对如何将数据读入python而不是如何处理类似结构的表格有所了解.
你会如何建议为一个python新手使用它?
我在R中有一个名为tableOne的表,如下所示:
idNum binaryVariable salePrice
2 1 55.56
4 0 88.33
15 0 4.45
87 1 35.77
... ... ...
Run Code Online (Sandbox Code Playgroud)
我想从yield(tableOne $ salePrice)中获取的值通过salePrice创建四个四分位数.然后我想创建一个列tableOne $ quartile,每行sortPrice所在的四分位数.它看起来像:
idNum binaryVariable salePrice quartile
2 1 55.56 3
4 0 88.33 4
15 0 4.45 1
87 1 35.77 2
... ... ... ...
Run Code Online (Sandbox Code Playgroud)
有什么建议?
我有一个位置列表,其中包含每个位置的城市,州,邮政编码,纬度和经度.
我单独列出了县级经济指标.我玩过zipcode包,ggmap包和其他几个免费地理编码网站,包括美国Gazeteer文件,但似乎无法找到匹配这两个部分的方法.
目前是否有任何包或其他来源这样做?
我正在使用该randomForest包进行一些工作,虽然它运行良好,但它可能非常耗时.任何人都有加快速度的建议吗?我正在使用带有双核AMD芯片的Windows 7机箱.我知道关于R不是多线程/处理器,但如果任何并行包(的好奇rmpi,snow,snowfall等)工作过randomForest的东西.谢谢.
编辑:
我正在使用rF进行一些分类工作(0和1).数据有大约8-12个可变列,训练集是10k行的样本,因此它的体积适中但不疯狂.我正在运行500棵树和2只,3只或4只.
编辑2:这是一些输出:
> head(t22)
Id Fail CCUse Age S-TFail DR MonInc #OpenLines L-TFail RE M-TFail Dep
1 1 1 0.7661266 45 2 0.80298213 9120 13 0 6 0 2
2 2 0 0.9571510 40 0 0.12187620 2600 4 0 0 0 1
3 3 0 0.6581801 38 1 0.08511338 3042 2 1 0 0 0
4 4 0 0.2338098 30 0 0.03604968 3300 5 0 0 0 …Run Code Online (Sandbox Code Playgroud) 我正在尝试glmnet在数据集上使用该包.我正在使用cv.glmnet()获取lambda值glmnet().我将它们排除在第1,2,7,12列之外:id列,响应列,包含NA,并包含NA.
这是数据集和错误消息:
> head(t2)
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12
1 1 1 0.7661266 45 2 0.80298213 9120 13 0 6 0 2
2 2 0 0.9571510 40 0 0.12187620 2600 4 0 0 0 1
3 3 0 0.6581801 38 1 0.08511338 3042 2 1 0 0 0
4 4 0 0.2338098 30 0 0.03604968 3300 5 0 0 0 0
5 5 0 0.9072394 49 1 …Run Code Online (Sandbox Code Playgroud) 我有一个100 X 100的数据框.有30列是因素.有没有办法只将因子类型列切换为数字类型而不影响其他列(不进入循环路径)?
我正在尝试增加java中的堆大小,因为weka会不断崩溃.我使用了建议的行:
> java -Xmx500m -classpath
Run Code Online (Sandbox Code Playgroud)
但是我收到以下错误:
-classpath requires class path specification
Run Code Online (Sandbox Code Playgroud)
我不确定这意味着什么.有什么建议?
我有一个分别在y和x轴上有$ -amounts和日期的图.目前,美元金额从0-15百万美元不等.像这样的东西:
x <- rnorm(20)^2 * 1000000
plot(x)
Run Code Online (Sandbox Code Playgroud)
R做的事情就像'1.0e+07'而'10,000,000'不是横向而不是水平地定向文本.
我的问题是:
1)如何将缩放文本设置为水平方向?
2)如何使用R 10MM代替'10,000,000'或'1.0e+07'?