小编dub*_*ber的帖子

用Homebrew安装R.

我正在尝试使用Homebrew安装R. 我在SO上的其他地方运行了这些命令:

brew tap homebrew/science
brew install R
Run Code Online (Sandbox Code Playgroud)

因为brew tap homebrew/science,我收到这个错误:

Error: Already tapped!
Run Code Online (Sandbox Code Playgroud)

对于第二个命令,我收到:

Error: No available formula for r 
Run Code Online (Sandbox Code Playgroud)

有什么建议?

homebrew r

145
推荐指数
7
解决办法
9万
查看次数

为什么我想要.unionAll用于SchemaRDDs的Spark中的.unionAll?

我试图在Spark SQL文档中围绕这两个函数-

  • def union(其他:RDD [Row]):RDD [Row]

    返回此RDD与另一个RDD的并集.

  • def unionAll(otherPlan:SchemaRDD):SchemaRDD

    将两个RDD的元组与相同的模式组合在一起,保留重复项.

这不是UNION与UNION ALL的标准行为,如本SO问题所述.

我的代码借用了Spark SQL文档,它有两个函数返回相同的结果.

scala> case class Person(name: String, age: Int)
scala> import org.apache.spark.sql._
scala> val one = sc.parallelize(Array(Person("Alpha",1), Person("Beta",2)))
scala> val two = sc.parallelize(Array(Person("Alpha",1), Person("Beta",2),  Person("Gamma", 3)))
scala> val schemaString = "name age"
scala> val schema = StructType(schemaString.split(" ").map(fieldName => StructField(fieldName, StringType, true)))
scala> val peopleSchemaRDD1 = sqlContext.applySchema(one, schema)
scala> val peopleSchemaRDD2 = sqlContext.applySchema(two, schema)
scala> peopleSchemaRDD1.union(peopleSchemaRDD2).collect
res34: Array[org.apache.spark.sql.Row] = Array([Alpha,1], [Beta,2], [Alpha,1], …
Run Code Online (Sandbox Code Playgroud)

sql union scala union-all apache-spark

12
推荐指数
2
解决办法
3万
查看次数

为什么星形量词比Java正则表达式中的加号量词更贪婪?

我的文字我试图从提取LogicalIDSupplyChain

 <LogicalID>SupplyChain</Logical>
Run Code Online (Sandbox Code Playgroud)

起初我使用了以下正则表达式:

.*([A-Za-z]+)>([A-Za-z]+)<.*
Run Code Online (Sandbox Code Playgroud)

匹配如下:

["D", "SupplyChain"]
Run Code Online (Sandbox Code Playgroud)

在绝望的情况下,我尝试使用星号而不是加号:

.*([A-Za-z]*)>([A-Za-z]+)<.*
Run Code Online (Sandbox Code Playgroud)

这完美匹配.

文档说*匹配零次或多次并+匹配一次或多次.为什么*贪婪比+

编辑:有人向我指出,下面的情况并非如此.操作顺序解释了第一个匹配组实际上为空的原因.

java regex regex-greedy

5
推荐指数
1
解决办法
155
查看次数

如何使用正则表达式将数组中的项目与数据库列中的项目进行比较?

我正在尝试采用这样的数组中的元素列表:

['GRADE', 'GRATE', 'GRAPE', /*About 1000 other entries here ...*/ ]
Run Code Online (Sandbox Code Playgroud)

并将它们与出现在Oracle数据库中的列中匹配的项匹配,例如:

1|'ANTERIOR'
2|'ANTEROGRADE'
3|'INGRATE'
4|'RETROGRADE'
5|'REIGN'
...|...
/*About 1,000,000 other entries here*/
Run Code Online (Sandbox Code Playgroud)

对于该G个单词数组中的每个条目,我想遍历Oracle数据库的word列,并尝试查找数组中每个条目的右侧匹配项。在此示例中,数据库中的条目2、3和4将全部匹配。

在任何其他编程语言中,它看起来都是这样的:

for entry in array:
  for each in column:
    if entry.right_match(each):
      print entry
Run Code Online (Sandbox Code Playgroud)

如何在PL / SQL中执行此操作?

oracle plsql pattern-matching string-matching bigdata

3
推荐指数
1
解决办法
3723
查看次数

如何使用PostGIS将交叉路口划分为城市街道?

我想使用PostGIS来交叉分解OpenStreetMap街道.我试图将一个城市的街道变成一个图形结构,其中节点由交叉点和道路绘制的边缘构成.

我目前正在使用ST_Intersection命令开辟了一条通向其组件所有可能排列的道路.

例如,对于有三个交叉路口的道路(从下面开始的第二条水平线),我想要四条分开的道路,但我得到的道路的每一个可能的组合,长度为三个街区,两个街区和一个块.我如何简单地将所有道路划分为每个单独的街区?

十字路口

gis postgis graph geospatial openstreetmap

3
推荐指数
1
解决办法
1887
查看次数

通过R中的组连接列

假设我有这个员工名单:

 Dept Date      Name            
----- --------- --------------- 
   30 07-DEC-02 Raphaely        
   30 18-MAY-03 Khoo            
   40 07-JUN-02 Mavris          
   50 01-MAY-03 Kaufling        
   50 14-JUL-03 Ladwig          
   70 07-JUN-02 Baer            
   90 13-JAN-01 De Haan
   90 17-JUN-03 King  
  100 16-AUG-02 Faviet
  100 17-AUG-02 Greenberg 
  110 07-JUN-02 Gietz           
  110 07-JUN-02 Higgins         
Run Code Online (Sandbox Code Playgroud)

我想要一个R部门的列表聚合(类似于Oracle PL/SQL的LISTAGG函数),它将产生最后一列:

 Dept Date      Name            Emp_list
----- --------- --------------- ---------------------------------------------
   30 07-DEC-02 Raphaely        Raphaely; Khoo
   30 18-MAY-03 Khoo            Raphaely; Khoo
   40 07-JUN-02 Mavris          Mavris
   50 01-MAY-03 Kaufling        Kaufling; Ladwig
   50 14-JUL-03 Ladwig …
Run Code Online (Sandbox Code Playgroud)

string oracle text r aggregation

2
推荐指数
1
解决办法
3373
查看次数

通过熊猫中的名称识别多个列

有没有办法使用文本匹配或正则表达式选择列的子集?

在R中将是这样的:

attach(iris) #Load the 'Stairway to Heaven' of R's built-in data sets
iris[grep(names(iris),pattern="Length")] #Prints only columns containing the word "Length"
Run Code Online (Sandbox Code Playgroud)

python pandas

2
推荐指数
1
解决办法
2234
查看次数

为什么document.getElementById返回null值?

我调试了我的代码并意识到我的Javascript中的方法无法正常工作.任何人都知道为什么?

index.html:

<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="utf-8">
<title>Tetris</title>
<link rel="stylesheet" href="css/app.css">
<script type="text/javascript" src="js/main.js"></script>
</head>
<body>
<canvas id="tetrisBoard" width="800" height="600">
  Your browser does not support HTML 5.
</canvas>
<p>
</p>
</body>
</html>   
Run Code Online (Sandbox Code Playgroud)

main.js:

board = document.getElementById("tetrisBoard")                                                                                                                                                              
ctx = board.getContext("2d")
ctx.fillStyle = "rgb(200, 0, 0)"
ctx.fillRect 10, 10, 55, 50
Run Code Online (Sandbox Code Playgroud)

结果document.getElementById("tetrisBoard")是null值.为什么?

javascript html5 web-applications canvas html5-canvas

1
推荐指数
1
解决办法
1337
查看次数

不使用第三方软件包,有没有办法计算分类数据计数的行百分比?

我有一些异常情况,我目前无法将第三方软件包下载到我的R设置中.以此为约束,有没有办法总结以下餐厅位置数据和关闭/打开状态?

一个count(business,vars=c("city","open"))在我的数据给了我这样的事情:

"City"       "Open"   "Frequency"
Wickenburg   False    2
Wickenburg   True     26
Wittmann     True     2
Wittmann     False    2
Youngtown    True     7
Yuma         True     1
Run Code Online (Sandbox Code Playgroud)

这是一个频率表,显示在给定城市中有多少餐厅都是开放式和封闭式的.

我想按组找到百分比.示例输出看起来像这样

"City"       "Open"   "Frequency"    "Pct of City"
Wickenburg   False    2               7.7
Wickenburg   True     26              92.3
Wittmann     True     2               50.0
Wittmann     False    2               50.0
Youngtown    True     7               100.0
Yuma         True     1               100.0
Run Code Online (Sandbox Code Playgroud)

在香草R中最简单的方法是什么?

aggregate r data-manipulation summarization

1
推荐指数
1
解决办法
81
查看次数