我可以实现我的目标"漫长的道路",但我希望完全保留在R内.我希望通过邮政编码将人口普查的人口统计数据附加到我的数据库中的记录中.我知道R有几个基于Census的软件包,但是,除非我遗漏了一些东西,否则这些数据似乎不存在于邮政编码级别,也不是直观地合并到现有数据框架上.
简而言之,是否可以在R中执行此操作,或者是我在其他地方获取数据并将其读入R的最佳方法?
任何帮助将不胜感激!
我不确定这叫什么,这就是为什么我在搜索它时遇到了麻烦.
我想要做的是取数字并将它们转换为一些字母数字基数,这样数字,比如5000,不会读作'5000'而是'G4u',或类似的东西.这个想法是为了节省空间,也没有明确给定系统中有多少记录.我正在使用php,所以如果有更好的内置这样的东西,甚至更好,但即使这个方法的名称将在这一点上有所帮助.
再次,抱歉没有能够更清楚,我只是不确定这叫什么.
我在过去的几年里一直在Stata编程,并且最近在4个月前转向了R.
我有以下格式的数据:
popname sex year age COUNTRY
329447 AUS f 1921 23 AUS
329448 AUS f 1921 24 AUS
329449 AUS f 1921 25 AUS
329450 AUS f 1921 26 AUS
329451 AUS f 1921 27 AUS
329452 AUS f 1921 28 AUS
...
329532 AUS f 1922 23 AUS
329533 AUS f 1922 24 AUS
329534 AUS f 1922 25 AUS
... ... . .. .. ...
297729 BLR f 1987 59 BLR
297730 BLR f 1987 60 BLR …Run Code Online (Sandbox Code Playgroud) 我有一个glm存在/不存在响应变量的二项式和一个9级的因子变量,如下所示:
data$y<-factor(data$y,levels=c(0,1),labels=c("absent","present"))
table(data$y,data$site_name)
Andulay Antulang Basak Dauin Poblacion District 1 Guinsuan Kookoo's Nest Lutoban Pier Lutoban South Malatapay Pier
absent 4 4 1 0 3 1 5 5 2
present 2 2 5 6 3 5 1 1 4
model <- glm(y~site_name,data=data,binomial)
Run Code Online (Sandbox Code Playgroud)
为了简洁起见,只是跳过模型推理和验证,我如何在每个站点上绘制一个以其置信区间在箱图中"出现"的概率?我想要的是在R中的Plot预测概率和置信区间中显示的内容,但是我想用箱线图显示它,因为我的回归变量site_name是具有9个级别的因子,而不是连续变量.
我想我可以按如下方式计算必要的值(但不是100%肯定正确性):
将模型系数转换回成功概率的函数:
calc_val <- function(x){return(round(1/(1+1/(exp(x))),3))}
Run Code Online (Sandbox Code Playgroud)
基于模型的预测概率:
prob <- tapply(predict(model,type="response"),data$site_name,function(x){round(mean(x),3)})
means <- as.data.frame(prob)
Run Code Online (Sandbox Code Playgroud)
预测概率的75%和95%置信区间:
ci <- cbind(confint(model,level=0.9),confint(model,level=0.5))
rownames(ci) <- gsub("site_name","",rownames(ci))
ci <- t(apply(ci,1,calc_val))
Run Code Online (Sandbox Code Playgroud)
将它们连接在一个表中
ci<-cbind(means,ci)
ci
prob 5 % 95 % 25 …Run Code Online (Sandbox Code Playgroud) 我想绘制一个 3D 数组M,其中
M <- array(runif(64),dim=c(4,4,4))
Run Code Online (Sandbox Code Playgroud)
这里有一个类似的问题,其中评论说这可以使用 R 中的常见 3D 绘图来完成,但我在 R 中找不到这样的函数可以用于绘制多维数组(例如,上面示例中的 3D 数组)。有什么建议如何去做吗?谢谢。
引自Windows:
如果您是软件开发人员,可以将Kinect for Xbox 360与计算机一起使用来测试您正在使用的软件.但是,要获得完整的Kinect for Windows体验,我们建议您下载Kinect for Windows SDK并将其与Kinect for Windows一起使用.
问题1:如果我想开始使用Kinect SDK和Visual Studio开发,Kinect for Xbox 360是否可以工作(而不是更新的Kinect 2 for Xbox One)?我知道它缺少Windows版本的一些功能.
问题2:在上面的声明中,当Windows声明使用Xbox 360 Kinect进行"开发"时,开发意味着什么?更具体地说,我是否可以完全开发我的应用程序,测试它,并使用Xbox 360 Kinect运行它并且无法发布它?或者,我是否只有一些功能,但无法使用我的应用程序运行Xbox 360 Kinect并被迫购买Windows版本?
对不起,这是一个很长的问题.过去一周我一直在研究这个项目,我觉得Kinects与它们可以用于开发的程度之间的差异是非常模糊的.此外,许多信息已经过时,与Xbox One和Xbox 360 Kinect以及Kinect SDK有关.
我有包含电子邮件地址和美国各州的数据,我想创建一个列来标记每个州所在的美国人口普查区域。在 SQL 中,我通过 case 语句完成了此操作,但在 R 中最好的方法是什么?
样本数据:
df <- data.frame(emails=c("xyz@gmail.com","abc@hotmail.com","bba@gmai.com","so121@gamil.com","ad@yahoo.com"), states=c("NV","CA","UT","AZ","IA"))
Run Code Online (Sandbox Code Playgroud)
示例数据如下所示:
emails states
xyz@gmail.com NV
abc@hotmail.com CA
bba@gmai.com UT
so121@gamil.com AZ
ad@yahoo.com IA
Run Code Online (Sandbox Code Playgroud)
我希望结果是:
emails states regions
xyz@gmail.com NV West
abc@hotmail.com CA West
bba@gmai.com UT West
so121@gamil.com AZ West
ad@yahoo.com IA Midwest
Run Code Online (Sandbox Code Playgroud) 尝试从Stata过渡到R是令人兴奋和具有挑战性的,但我仍在R中努力的一个领域是数据探索,然后是后续的变量创建.具体来说,如何
计算变量的值(Stata的计数命令)
count if var 2==3
/* counts the number of observations that have a value of 3 on var2 */
Run Code Online (Sandbox Code Playgroud)列出符合条件的观察结果(Stata's if qualifier)
list id if var7 < 8
/*lists the ID of observations with a value less than 8 on var7 */
Run Code Online (Sandbox Code Playgroud)按分组变量制表(Stata的bysort命令)
bysort var3: tab1 var2 var9 if var8=2 | var1 !=11
/* create a two-way frequency table for those observations of var2 and var9 where
var8 is 2 or var1 isn't 11 …Run Code Online (Sandbox Code Playgroud)