我正在尝试从github读取一个CSV到R:
latent.growth.data <- read.csv("https://github.com/aronlindberg/latent_growth_classes/blob/master/LGC_data.csv")
Run Code Online (Sandbox Code Playgroud)
但是,这给了我:
Error in file(file, "rt") : cannot open the connection
In addition: Warning message:
In file(file, "rt") : unsupported URL scheme
Run Code Online (Sandbox Code Playgroud)
我试过?read.csv,?download.file,getURL(只有返回奇怪的HTML),以及在数据导入手册,但仍然无法知道如何使它发挥作用.
我究竟做错了什么?
经常使用RI时,会收到错误消息"下标超出范围".例如:
# Load necessary libraries and data
library(igraph)
library(NetData)
data(kracknets, package = "NetData")
# Reduce dataset to nonzero edges
krack_full_nonzero_edges <- subset(krack_full_data_frame, (advice_tie > 0 | friendship_tie > 0 | reports_to_tie > 0))
# convert to graph data farme
krack_full <- graph.data.frame(krack_full_nonzero_edges)
# Set vertex attributes
for (i in V(krack_full)) {
for (j in names(attributes)) {
krack_full <- set.vertex.attribute(krack_full, j, index=i, attributes[i+1,j])
}
}
# Calculate reachability for each vertix
reachability <- function(g, m) {
reach_mat = matrix(nrow …Run Code Online (Sandbox Code Playgroud) 我有这个数据帧:
state county city region mmatrix X1 X2 X3 A1 A2 A3 B1 B2 B3 C1 C2 C3
1 1 1 1 111010 1 0 0 2 20 200 Push 8 12 NA NA NA
1 2 1 1 111010 1 0 0 4 NA 400 Shove 9 NA
Run Code Online (Sandbox Code Playgroud)
现在我想排除名称以某个字符串结尾的列,例如"1"(即A1和B1).我写了这段代码:
df_redacted <- df[, -grep("\\1$", colnames(df))]
Run Code Online (Sandbox Code Playgroud)
但是,这似乎删除了每一列.如何修改代码以便它只删除与模式匹配的列(即以"3"或任何其他字符串结尾)?
解决方案必须能够处理具有数值和分类值的数据帧.
在RI中可以通过激活调试模式options(error=recover).我怎么能把它关掉?我试着options()和options(NULL)和options(default=NULL),但他们都不把通过激活功能options(error=recover).
我有一个矩阵与以下row.names:
"X1" "X5" "X33" "X37" "X52" "X566"
Run Code Online (Sandbox Code Playgroud)
现在我想只选择与列表条目匹配的行,例如:
include_list <- c("X1", "X5", "X33")
Run Code Online (Sandbox Code Playgroud)
我想我会做这样的事情:
data.subset <- subset(data, row.names == include_list)
Run Code Online (Sandbox Code Playgroud)
但是,这个特定的代码似乎没有完成这项工作.如何以这种方式执行子集化?
我生成了一个图表:
library(DiagrammeR)
grViz("
digraph boxes_and_circles {
# a 'graph' statement
graph [layout = neato, overlap = true, fontsize = 10, outputorder = edgesfirst]
# several 'node' statements
node [shape = circle,
fontname = Helvetica]
A [pos = '1,1!'];
B [pos = '0,2!'];
C [pos = '1.5,3!'];
D [pos = '2.5,1!'];
E [pos = '4,1!'];
F [pos = '4,2!'];
G [pos = '5,1!'];
H [pos = '6,2!'];
I [pos = '1.5,-0.1!'];
# several 'edge' statements
A->B B->C
D->E D->F E->F E->G …Run Code Online (Sandbox Code Playgroud) 我试图了解GitHub上100个最大的存储库的演变.我可以使用GitHub搜索功能或GithubArchive.org轻松访问截至今天的100个最大的存储库(按贡献者,星号,叉子或LOC的总数来衡量).
但是,我想看一下历史上给定数据的100个最大的存储库(比如2011年4月1日),这样我就可以跟踪它们从那时起的增长(或下降).如何识别GitHub上的100个最大的存储库(按星号,叉子或LOC测量),以确定过去的日期?
我可以在" Ruby Strings "和" Escape sequences "中找到Ruby的转义序列的详细信息.但是,在官方Ruby文档中我可以找到有关字符串转义序列的详细信息吗?
这个问题对于刚刚学习Ruby的人来说很重要,因为了解如何简单地浏览文档是一个初步的挑战.
lavaan提供了跨组约束参数的机会.假设我的数据中有两组.假设以下型号:
library(RCurl)
library(lavaan)
x <- getURL("https://gist.githubusercontent.com/aronlindberg/dfa0115f1d80b84ebd48b3ed52f9c5ac/raw/3abf0f280a948d6273a61a75415796cc103f20e7/growth_data.csv")
growth_data <- read.csv(text = x)
model_regressions <- ' i =~ 1*t1 + 1*t2 + 1*t3 + 1*t4 + 1*t5 + 1*t6 + 1*t7 + 1*t8 + 1*t9 + 1*t10 + 1*t11 + 1*t12 + 1*t13+ 1*t14 + 1*t15 + 1*t16 + 1*t17 + 1*t18 + 1*t19 + 1*t20
s =~ 0*t1 + 1*t2 + 2*t3 + 3*t4 + 4*t5 + 5*t6 + 6*t7 + 7*t8 + 8*t9 + 9*t10 + 10*t11 + 11*t12 …Run Code Online (Sandbox Code Playgroud) 我使用以下R代码生成带有基于TraMineR序列的标签的树形图(参见附图):
library(TraMineR)
library(cluster)
clusterward <- agnes(twitter.om, diss = TRUE, method = "ward")
plot(clusterward, which.plots = 2, labels=colnames(twitter_sequences))
Run Code Online (Sandbox Code Playgroud)
完整代码(包括数据集)可以在这里找到.
由于树形图以图形方式提供信息,因此以文本和/或表格格式获取相同信息将非常方便.如果我调用对象clusterward的任何方面(由agnes创建),例如"order"或"merge",我会使用数字而不是我得到的名称来标记所有内容colnames(twitter_sequences).另外,我看不出如何输出树形图中以图形方式表示的分组.
总结一下:如何使用R以及理想情况下的电车/集群库正确显示标签,以文本/表格格式获取集群输出?

r ×8
dendrogram ×1
diagrammer ×1
drawing ×1
figure ×1
git ×1
github ×1
matrix ×1
open-source ×1
plot ×1
r-lavaan ×1
ruby ×1
sna ×1
traminer ×1