小编ags*_*udy的帖子

我怎样才能创作出不同颜色的小提琴情节?

我正在使用包裹vioplot.我想问一下,我怎么能用不同颜色制作小提琴图.

这是我可重复的例子:

# Violin Plots library(vioplot) 
x1 <- mtcars$mpg[mtcars$cyl==4] 
x2 <- mtcars$mpg[mtcars$cyl==6] 
x3 <- mtcars$mpg[mtcars$cyl==8] 
vioplot(x1, x2, x3, 
names=c("4 cyl", "6 cyl", "8 cyl"), col="gold") 
title("Violin Plots of Miles Per Gallon")
Run Code Online (Sandbox Code Playgroud)

谢谢.

r

3
推荐指数
2
解决办法
9500
查看次数

在R中执行read.csv时未读取所有行

这是输入文件:http://www.yourfilelink.com/get.php?fid = 841283.我执行了

options(stringsAsFactors=FALSE)
x=read.csv("test1.csv", header = FALSE, sep="'"). 
Run Code Online (Sandbox Code Playgroud)

结果如下:http://www.yourfilelink.com/get.php?fid = 841284

而不是给135行,我只得到7行!列数是正确的,并且是13. x [6,10]也有跟随它的行的内容,在字符串中用\n分隔.

请帮帮我.我陷入了这个问题!:/

csv r

3
推荐指数
1
解决办法
4079
查看次数

如何通过原点R强制回归

我正在使用R做一些多元回归.我知道如果您输入例如 reg < - lm(y~0 + x1 + x2,data),您将通过原点强制回归模型.

我的问题是,我有很多独立的变量(+/- 100),如果我这样输入,R似乎不会读取所有这些变量

  lm(y~ 0 + x1 + x2 + ... + x100, data)
Run Code Online (Sandbox Code Playgroud)

代码用法如下:

[1] data <- read.csv("Test.csv")
[2] reg <- lm(data)
[3] summary(reg)
Run Code Online (Sandbox Code Playgroud)

我需要在第2行放置什么才能强制模型通过原点? reg < - lm(0 + data)不起作用.

csv regression r

3
推荐指数
1
解决办法
4507
查看次数

错误:字符串必须是原子矢量R.

我是R的新手,我在数据集上使用stringr时遇到问题.我试图通过变量将数据与其中的单词"restaurant"进行子集化.我经常收到此错误消息.

str_detect(matrix(expandedDataFrame[1,12:21],1,
                 ncol(expandedDataFrame[,12:21])),"Restaurants")
Error: String must be an atomic vector
Run Code Online (Sandbox Code Playgroud)

r vector

3
推荐指数
1
解决办法
7974
查看次数

等效的正则表达式,以删除所有标点符号

在R中,为了从字符串中删除标点符号,我可以这样做:

x <- 'a#,g:?s!*$t/{u}\d\&y'
gsub('[[:punct:]]','',x)
[1] "agstudy"
Run Code Online (Sandbox Code Playgroud)

这很聪明,但我没有严格控制删除的标点符号(想象一下我想在我的角色中保留一些符号).如何gsub在不忘记任何符号的情况下以更明确的方式重写此内容,如下所示:

gsub('[#,:?!*$/{}\\&]','',x,perl=FALSE)
Run Code Online (Sandbox Code Playgroud)

编辑

我遇到的困难是如何编写正则表达式(我更喜欢在R中)从x中删除所有标点字符,并仅保留#例如:

 "a#gstudy"
Run Code Online (Sandbox Code Playgroud)

regex perl r

3
推荐指数
3
解决办法
390
查看次数

获取字符串向量元素之间的最小共享部分

有一个字符串向量列表:

xx <- c("concord wanderer basic set air snug beige",
  "concord wanderer basic set air snug black noir", 
  "concord wanderer basic set air snug blue bleu", 
  "concord wanderer basic set air snug brown marron", 
  "concord wanderer basic set air snug green vert", 
   "concord wanderer basic set air snug grey gris", 
   "concord wanderer basic set air snug red rouge", 
   "concord wanderer basic set air snug rose" )
Run Code Online (Sandbox Code Playgroud)

我试图在向量的元素之间获得最小的共享部分,例如,在这里我应该得到:

"concord wanderer basic set air snug"
Run Code Online (Sandbox Code Playgroud)

xx是前一个过程的结果,所以我确信元素之间存在共享部分.但被删除的部分并不总是在他的结尾.

使用strsplit`table我得到这个部分解决方案,但它有点棘手,我放松了原始的单词顺序:

table_x …
Run Code Online (Sandbox Code Playgroud)

string fuzzy-search intersection r text-mining

3
推荐指数
1
解决办法
78
查看次数

绘制格子xyplot中每组面板数据的第一个点

我正在尝试使用组和面板创建线图,这些组和面板将符号叠加在每个组的第一个值上.此尝试仅绘制第一组的第一个点,而不对其他两个组执行任何操作.

library(lattice)
foo <- data.frame(x=-100:100, y=sin(c(-100:100)*pi/4))
xyplot( y~x | y>0,  foo, groups=cut(x,3),
        panel = function(x, y, subscripts, ...) {
          panel.xyplot(x, y, subscripts=subscripts, type='l', ...)
          # almost but not quite:
          panel.superpose(x[1], y[1], subscripts=subscripts, cex=c(1,0), ...) 
        } )
Run Code Online (Sandbox Code Playgroud)

可以理解一般解决方案,以允许绘制每个组和面板内的特定点(例如,第一,中间和端点).

在此输入图像描述

r panel lattice

3
推荐指数
1
解决办法
514
查看次数

计算R中的度,接近度和中间性

我有一个数据表,其中包含在论坛中的同一个帖子中发布的用户名,它看起来像:X1 X2 1. g79 kian 2. g79 greyracer 3. g79 oldskoo1 ...

我需要计算程度,亲密度和介于两者之间.我正在使用以下代码:

library(igraph)
setwd("/Volumes/NATASHKA/api/R files")
load("edgelist_one_mode.rda")
load("map.rda")
load ("result.rda")
el <- as.matrix(whatwewant)
el[,1] <- as.character(el[,1])
el[,2] <- as.character(el[,2])
g <- graph.data.frame(el, directed=FALSE)
plot(g, edge.arrow.size=.5)
indegreeG <- degree(g, mode="in")
outdegreeG <- degree(g, mode="out")
totaldegreeG <- degree(g)
inclosenessG <- closeness(g, mode='in')
outclosenessG <- closeness(g, mode='out')
totalclosenessG <- closeness(g)
betweennessG <- betweenness(g)
forumG <- data.frame(V(g)$name, indegreeG, outdegreeG, totaldegreeG, inclosenessG,    outclosenessG, totalclosenessG, betweennessG)
write.table(forumG,file="forumG.csv",sep=";")
Run Code Online (Sandbox Code Playgroud)

问题是为什么我得到的学位,学位和学位的价值相同,亲密度相同?此外,一开始我有41213个用户,但经过分析(当我计算学位等等)时,我只有37874.我怎么能失去这么多观察?如果我在代码中有错误,请告诉我.

谢谢

r social-networking igraph sna

2
推荐指数
1
解决办法
5814
查看次数

抓取:从网址下载文件

我想自动从此页面下载文件.

我试过很多方法,比如:

download.file
read.table
GET
Run Code Online (Sandbox Code Playgroud)

但没有成功.我不是要求代码,但我要求任何提示/想法来处理这种情况.

python selenium curl r web-scraping

2
推荐指数
2
解决办法
8128
查看次数

R中的非线性最小二乘曲线拟合

我是R的新手(第一次使用它).我正在按照本教程http://www.walkingrandomly.com/?p=5254尝试绘制曲线并发现最适合我数据的函数.到目前为止,我尝试过:

> xdata = c(1 ,5, 10, 20, 100)
> ydata = c(23.83333333, 210.3666667, 545.3666667, 1756.866667, 38595.7)
> plot(xdata,ydata)
Run Code Online (Sandbox Code Playgroud)

所以我明白了:

在此输入图像描述

然后我尝试:

> p1 = 1
> p2 = 0.2
> fit = nls(ydata ~ xdata^2, start=list(p1=p1,p2=p2))
Run Code Online (Sandbox Code Playgroud)

我收到这个错误:

Error in nlsModel(formula, mf, start, wts) : 
  singular gradient matrix at initial parameter estimates
Run Code Online (Sandbox Code Playgroud)

我究竟做错了什么?谢谢

r least-squares

2
推荐指数
2
解决办法
9011
查看次数