小编POT*_*NZA的帖子

将csv文件的一些列复制到表中

我有一个包含10列的CSV文件.创建一个包含4列的PostgreSQL表后,我想将10列中的一些列复制到表中.

我的CSV表的列如下:

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
Run Code Online (Sandbox Code Playgroud)

我的PostgreSQL表的列应该是这样的:

x2 x5 x7 x10
Run Code Online (Sandbox Code Playgroud)

csv postgresql etl copy

48
推荐指数
5
解决办法
6万
查看次数

如何从xml文件创建R数据框

我有一个XML文档文件.该文件的一部分如下所示:

-<attr>  
     <attrlabl>COUNTY</attrlabl>  
     <attrdef>County abbreviation</attrdef>  
     <attrtype>Text</attrtype>  
     <attwidth>1</attwidth>  
     <atnumdec>0</atnumdec>  
    -<attrdomv>  
        -<edom>  
            <edomv>C</edomv>  
            <edomvd>Clackamas County</edomvd>  
            <edomvds/>  
         </edom>  
        -<edom>  
            <edomv>M</edomv>  
            <edomvd>Multnomah County</edomvd>  
            <edomvds/>  
         </edom>  
        -<edom>  
            <edomv>W</edomv>  
            <edomvd>Washington County</edomvd>  
            <edomvds/>  
         </edom>  
     </attrdomv>  
 </attr>
Run Code Online (Sandbox Code Playgroud)

从这个XML文件中,我想创建一个包含attrlabl,attrdef,attrtype和attrdomv列的R数据框.请注意,attrdomv列应包含category变量的所有级别.数据框应如下所示:

attrlabl    attrdef                attrtype    attrdomv  
COUNTY      County abbreviation    Text        C Clackamas County; M Multnomah County; W Washington County  
Run Code Online (Sandbox Code Playgroud)

我有一个不完整的代码,如下所示:

doc <- xmlParse("taxlots.shp.xml")  
dataDictionary <- xmlToDataFrame(getNodeSet(doc,"//attrlabl"))  
Run Code Online (Sandbox Code Playgroud)

你能完成我的R代码吗?我感谢任何帮助!

xml r

9
推荐指数
1
解决办法
2万
查看次数

"不对称"成对距离矩阵

假设有三个序列要比较:a,b和c.传统上,得到的3乘3成对距离矩阵是对称的,表明从a到b的距离等于从b到a的距离.

我想知道TraMineR是否提供了一些方法来产生不对称的成对距离矩阵.

r matrix symmetry traminer

6
推荐指数
1
解决办法
1664
查看次数

如何在psql命令行上更改默认公共模式

为了将MS Access mdb文件加载到PostgreSQL中,我在psql命令行上键入以下命令.

mdb-schema xxx.mdb postgres | psql -h xxx -U xxx -W -d xxx
Run Code Online (Sandbox Code Playgroud)

但是,Postgres表是在默认的公共模式下创建的.我想让它们在不同的模式("网络")下,而不是默认模式("公共").在这种情况下,您能告诉我如何从"公共"改为"网络"吗?

我很感激任何建议.

postgresql

4
推荐指数
1
解决办法
7730
查看次数

从基于状态的序列创建基于转换的序列

我有一个包含顺序数据的数据框:
df <- data.frame(
t1=c("e","e","e"),t2=c("e","e","u"),t3=c("e","e","u"),t4=c("e","u","e"),t5=c("e","u","e"))

看起来像

> df
  t1 t2 t3 t4 t5
1  e  e  e  e  e
2  e  e  e  u  u
3  e  u  u  e  e
Run Code Online (Sandbox Code Playgroud)

我想将具有状态序列的数据帧转换为具有转换序列的数据帧,如下所示:

> dfNew
   t1  t2  t3  t4  t5
1  se  ee  ee  ee  ee
2  se  ee  ee  eu  uu
3  se  eu  uu  ue  ee
Run Code Online (Sandbox Code Playgroud)

其中"s"表示起始状态.

我很感激你的帮助.

r

4
推荐指数
1
解决办法
83
查看次数

在R中的字符串的中间或末尾提取数字

我有一个字符串向量.我想在"#stalls"之后提取一个数字:这些数字位于字符串的中间或末尾.

x <- c("1345 W. Pacific Coast Highway<br/>Wilmington 90710<br/><br/>County: Los Angeles<br/>Date Updated: 6/25/2013<br/>Latitude:-118.28079400<br/>Longitude:33.79077900<br/># of Stalls: 244<br/>Cost: Free", "20601 La Puente Ave<br/>Walnut 91789<br/>County: Los Angeles<br/>Date Updated: 6/18/2007<br/>Latitude: -117.859972<br/>Longitude: 34.017513<br/>Owner: Church<br/>Operator: Caltrans<br/># of Stalls: 40")
Run Code Online (Sandbox Code Playgroud)

这是我的试用版,但还不够.我感谢您的帮助.

gsub(".*\\# of Stalls: ", "", x) 
Run Code Online (Sandbox Code Playgroud)

r

2
推荐指数
2
解决办法
900
查看次数

如何创建一个包含R中另一列的最大值的列?

使用R,我想创建一个新列(MaxAct),显示不同列(ActNo)的最大数量,同时按两个因子分组(HHID和PERID)

例如,我有这个数据集:

UID HHID PERID ActNo
1   1000 1     1
2   1000 1     2
3   1000 1     3
4   1000 2     1
5   1000 2     2
6   2000 1     1
7   2000 1     2
8   2000 1     3
9   2000 1     4
10  2000 2     1
11  2000 2     2
Run Code Online (Sandbox Code Playgroud)

然后我想添加新列(MaxAct),如下所示:

UID HHID PERID ActNo MaxAct
1   1000 1     1     3
2   1000 1     2     3
3   1000 1     3     3
4   1000 2     1     2
5   1000 2     2 …
Run Code Online (Sandbox Code Playgroud)

r plyr data.table

0
推荐指数
2
解决办法
4833
查看次数

标签 统计

r ×5

postgresql ×2

copy ×1

csv ×1

data.table ×1

etl ×1

matrix ×1

plyr ×1

symmetry ×1

traminer ×1

xml ×1