小编fnl*_*fnl的帖子

Flink和Storm之间的主要区别是什么?

Flink已被比作Spark,正如我所看到的那样,它是错误的比较,因为它将窗口事件处理系统与微批处理进行比较; 同样,将Flink与Samza进行比较对我来说没有多大意义.在这两种情况下,它都会比较实时与批量事件处理策略,即使在Samza的情况下规模较小的"规模".但我想知道Flink与Storm的比较,它在概念上看起来与它更相似.

我发现这个(幻灯片#4)将主要区别记录为Flink的"可调延迟".另一个提示似乎是Slicon Angle的一篇文章,该文章表明Flink更好地集成到Spark或HadoopMR世界中,但没有提及或引用实际细节.最后,Fabian Hueske 在接受采访时指出:"与Apache Storm相比,Flink的流分析功能提供了一个高级API,并使用更轻量级的容错策略来提供一次性处理保证."

这对我来说有点稀疏,我不太清楚.有人可以通过Flink解释Storm中的流处理是什么问题(??)?什么是Hueske所指的API问题及其"更轻量级的容错策略"?

apache-storm apache-flink flink-streaming

131
推荐指数
3
解决办法
4万
查看次数

*RMarkdown的一些*数字标题没有显示

基本上,我有一个像这样配置的Rmd文档:

---
title: "Example"
author: "me"
date: "December 2014"
output:
  pdf_document:
    fig_caption: yes
    keep_tex: yes
--
Run Code Online (Sandbox Code Playgroud)

然后,在文档中,我ggplot2用来显示一些图表,例如:

```{r myLabel, fig.cap='My Caption'}
qplot(1:10, 10:1)
```
Run Code Online (Sandbox Code Playgroud)

现在,由于某种原因,我无法解释或调查任何比这更深的,生产的TeX不包含图形环境,即使我强制它fig.env='figure'.相反,TeX只有includegraphics命令:

\includegraphics{journal_files/figure-latex/myLabel-1.pdf}
Run Code Online (Sandbox Code Playgroud)

同一文档中的其他数字确实具有图形环境和标题.即,TeX输出"Knit PDF" 应该产生的是:

\begin{figure}[htbp]
\centering
\includegraphics{journal_files/figure-latex/myLabel-1.pdf}
\caption{My Citation}
\end{figure}
Run Code Online (Sandbox Code Playgroud)

R Markdown日志窗口仅显示不相关的内容:

label: myLabel (with options) 
List of 2
 $ fig.cap: chr "My Caption"
 $ fig.env: chr "figure"

cropping journal_files/figure-latex/myLabel-1.pdf
PDFCROP 1.38, 2012/11/02 - Copyright (c) 2002-2012 by Heiko Oberdiek.
Run Code Online (Sandbox Code Playgroud)

我该怎么做

  • 一旦我按下"编织PDF"并进入TeX("R Markdown"输出窗口显示没有错误,甚至回显[缺失]字幕!),找出究竟发生了什么(调试日志?),
  • 或者更好的是,有没有人有这个问题,知道RStudio,knitr和pandoc有什么问题?

pandoc rstudio knitr r-markdown

10
推荐指数
1
解决办法
8828
查看次数

可以更正我在R中使用paste0(),以便此函数的运行速度与原始Python示例一样快吗?

我试着玩一些我最近发现的R代码,模仿用Python编写的Norvig拼写检查器的部分内容; 特别是,我试图找出edit2在R中实现函数的正确方法:

def splits(word):
    return [(word[:i], word[i:]) 
            for i in range(len(word)+1)]

def edits1(word):
    pairs      = splits(word)
    deletes    = [a+b[1:]           for (a, b) in pairs if b]
    transposes = [a+b[1]+b[0]+b[2:] for (a, b) in pairs if len(b) > 1]
    replaces   = [a+c+b[1:]         for (a, b) in pairs for c in alphabet if b]
    inserts    = [a+c+b             for (a, b) in pairs for c in alphabet]
    return set(deletes + transposes + replaces + inserts)

def edits2(word):
    return set(e2 …
Run Code Online (Sandbox Code Playgroud)

python string r

8
推荐指数
1
解决办法
1872
查看次数

链接到IntelliJ中的外部Scala API文档

尽管在IntelliJ 15.0.1(项目设置 - >全局库 - > - > )中添加了我的Scala 2.10.4 SDK库设置的JavaDocs 的外部URL [见下面的截图],(应该)链接到的小蓝箭头快速文档查看器()中的外部文档不链接到外部Scala文档,而是保持灰显.查看外部文档的键盘快捷方式也不起作用().如何链接到外部ScalaDoc SDK API文档,以便我可以在浏览器的IntelliJ编辑器中快速打开我的光标所在内容的在线文档(本地或scala-lang.org,无关紧要) ?scala-sdk-2.10.4JavaDocs[F1][Shift]-[F1]

Scala SDK项目设置

api documentation scala intellij-idea

6
推荐指数
1
解决办法
413
查看次数

与 TCP 套接字(服务器)通信

我正在尝试使用 R 将文本发送到侦听 TCP 端口的服务器,然后从服务器读取响应文本。相当微不足道,即在 BASH 上为监听 12345 端口的服务器,即:

 > echo "text" | nc localhost 12345
 response
Run Code Online (Sandbox Code Playgroud)

服务器继续运行,此后可以随时再次查询。但是,如果我在 R 中使用 socketConnection 尝试同样的事情,我要么永远不会得到响应,要么它会被打印出来但不会被捕获。我已经尝试过以下方法:

  con <- socketConnection(port=12345)
  con <- socketConnection(port=12345, blocking=TRUE, timeout=2)
  writeLines("text", con) # server does not receive a thing
  flush(con) # has no effect
  readLines(con) # still, nothing happens and gets nothing back
  close(con) # server confirms receipt, but I no longer can get the result...
Run Code Online (Sandbox Code Playgroud)

服务器关闭连接后才收到数据,所以读不到任何内容

  con <- pipe("nc localhost 12345")
  writeLines("text", con)
Run Code Online (Sandbox Code Playgroud)

现在,“结果”被打印到 STDOUT,所以我无法捕获它......如果使用包含“文本”的临时文件:

  res <- readLines(pipe("nc localhost …
Run Code Online (Sandbox Code Playgroud)

sockets r

3
推荐指数
1
解决办法
3528
查看次数