我有一个包含10列的CSV文件.创建一个包含4列的PostgreSQL表后,我想将10列中的一些列复制到表中.
我的CSV表的列如下:
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
Run Code Online (Sandbox Code Playgroud)
我的PostgreSQL表的列应该是这样的:
x2 x5 x7 x10
Run Code Online (Sandbox Code Playgroud) 我有一个XML文档文件.该文件的一部分如下所示:
-<attr>
<attrlabl>COUNTY</attrlabl>
<attrdef>County abbreviation</attrdef>
<attrtype>Text</attrtype>
<attwidth>1</attwidth>
<atnumdec>0</atnumdec>
-<attrdomv>
-<edom>
<edomv>C</edomv>
<edomvd>Clackamas County</edomvd>
<edomvds/>
</edom>
-<edom>
<edomv>M</edomv>
<edomvd>Multnomah County</edomvd>
<edomvds/>
</edom>
-<edom>
<edomv>W</edomv>
<edomvd>Washington County</edomvd>
<edomvds/>
</edom>
</attrdomv>
</attr>
Run Code Online (Sandbox Code Playgroud)
从这个XML文件中,我想创建一个包含attrlabl,attrdef,attrtype和attrdomv列的R数据框.请注意,attrdomv列应包含category变量的所有级别.数据框应如下所示:
attrlabl attrdef attrtype attrdomv
COUNTY County abbreviation Text C Clackamas County; M Multnomah County; W Washington County
Run Code Online (Sandbox Code Playgroud)
我有一个不完整的代码,如下所示:
doc <- xmlParse("taxlots.shp.xml")
dataDictionary <- xmlToDataFrame(getNodeSet(doc,"//attrlabl"))
Run Code Online (Sandbox Code Playgroud)
你能完成我的R代码吗?我感谢任何帮助!
假设有三个序列要比较:a,b和c.传统上,得到的3乘3成对距离矩阵是对称的,表明从a到b的距离等于从b到a的距离.
我想知道TraMineR是否提供了一些方法来产生不对称的成对距离矩阵.
为了将MS Access mdb文件加载到PostgreSQL中,我在psql命令行上键入以下命令.
mdb-schema xxx.mdb postgres | psql -h xxx -U xxx -W -d xxx
Run Code Online (Sandbox Code Playgroud)
但是,Postgres表是在默认的公共模式下创建的.我想让它们在不同的模式("网络")下,而不是默认模式("公共").在这种情况下,您能告诉我如何从"公共"改为"网络"吗?
我很感激任何建议.
我有一个包含顺序数据的数据框:
df <- data.frame(
t1=c("e","e","e"),t2=c("e","e","u"),t3=c("e","e","u"),t4=c("e","u","e"),t5=c("e","u","e"))
看起来像
> df
t1 t2 t3 t4 t5
1 e e e e e
2 e e e u u
3 e u u e e
Run Code Online (Sandbox Code Playgroud)
我想将具有状态序列的数据帧转换为具有转换序列的数据帧,如下所示:
> dfNew
t1 t2 t3 t4 t5
1 se ee ee ee ee
2 se ee ee eu uu
3 se eu uu ue ee
Run Code Online (Sandbox Code Playgroud)
其中"s"表示起始状态.
我很感激你的帮助.
我有一个字符串向量.我想在"#stalls"之后提取一个数字:这些数字位于字符串的中间或末尾.
x <- c("1345 W. Pacific Coast Highway<br/>Wilmington 90710<br/><br/>County: Los Angeles<br/>Date Updated: 6/25/2013<br/>Latitude:-118.28079400<br/>Longitude:33.79077900<br/># of Stalls: 244<br/>Cost: Free", "20601 La Puente Ave<br/>Walnut 91789<br/>County: Los Angeles<br/>Date Updated: 6/18/2007<br/>Latitude: -117.859972<br/>Longitude: 34.017513<br/>Owner: Church<br/>Operator: Caltrans<br/># of Stalls: 40")
Run Code Online (Sandbox Code Playgroud)
这是我的试用版,但还不够.我感谢您的帮助.
gsub(".*\\# of Stalls: ", "", x)
Run Code Online (Sandbox Code Playgroud) 使用R,我想创建一个新列(MaxAct),显示不同列(ActNo)的最大数量,同时按两个因子分组(HHID和PERID)
例如,我有这个数据集:
UID HHID PERID ActNo
1 1000 1 1
2 1000 1 2
3 1000 1 3
4 1000 2 1
5 1000 2 2
6 2000 1 1
7 2000 1 2
8 2000 1 3
9 2000 1 4
10 2000 2 1
11 2000 2 2
Run Code Online (Sandbox Code Playgroud)
然后我想添加新列(MaxAct),如下所示:
UID HHID PERID ActNo MaxAct
1 1000 1 1 3
2 1000 1 2 3
3 1000 1 3 3
4 1000 2 1 2
5 1000 2 2 …
Run Code Online (Sandbox Code Playgroud)