小编gak*_*gak的帖子

将多张图像对齐成一张图像?

有什么好方法可以将可能具有不同旋转,曝光等但具有相同背景或其他固定参考的图像对齐在一起?

Adobe Photoshop可以通过其“ Photomerge”功能实现此目的。

如何以编程方式执行此操作?是否有开放源代码应用程序?

image-processing alignment template-matching image-stitching

5
推荐指数
1
解决办法
3233
查看次数

如何更改Vim omni完成中使用/检测到的符号边界?

例如,在Sass我使用破折号作为变量名,我有一个名为的变量:

$hello-there
Run Code Online (Sandbox Code Playgroud)

如果我输入he然后尝试完成它,它将只完成hello.我该怎么做才能完成hello-there

vim omnicomplete

5
推荐指数
1
解决办法
124
查看次数

泰坦的"超级节目"

我正在开发一个可以很好地处理图形数据库(Titan)的应用程序,除了它有很多边缘的顶点问题,即超节点.

上面的超节点链接指向Titan作者的博客文章,解释了解决问题的方法.解决方案似乎是通过边缘过滤来减少顶点的数量.

Unfortunately I want to groupCount attributes of edges or vertices. For example I have 1 million users and each user belongs to a country. How can I do a fast groupCount to work out the number of users in each country?

What I've tried so far can be shown in this elaborate groovy script:

g = TitanFactory.open('titan.properties')  // Cassandra
r = new Random(100)
people = 1e6

def newKey(g, name, type) {
    return g
        .makeType() …
Run Code Online (Sandbox Code Playgroud)

groovy cassandra graph-databases titan

5
推荐指数
1
解决办法
1350
查看次数

tshark输出所有字段?

是否可以tshark使用-T fields选项或类似方法获得每个字段(在数据包内)的输出?

例如,对于数据包/重建中的每个字段,我想要这样的事情:

eth.src:f2:3c:91:96:fd:09,ip.src:1.2.3.4,tcp.dst_port:80,http.request.uri:/index.html
Run Code Online (Sandbox Code Playgroud)

(\xff当值包含逗号时,可以用逗号替换逗号以使解析更好.)

我意识到有-e选项,但似乎我必须在命令行中放入每个可能的字段.最重要的是,每个数据包中只使用一小部分字段,这使得需要解析大量数据.

我目前打算使用该tshark -V选项并解析它,但理想情况下我想要更多的机器风格术语,http.request.uri而不是"人类可读",例如:

Hypertext Transfer Protocol
    GET /main.php HTTP/1.1\r\n
        [Expert Info (Chat/Sequence): GET /main.php HTTP/1.1\r\n]
            [Message: GET /main.php HTTP/1.1\r\n]
            [Severity level: Chat]
            [Group: Sequence]
        Request Method: GET
        Request URI: /main.php
Run Code Online (Sandbox Code Playgroud)

pcap wireshark tshark

5
推荐指数
1
解决办法
1万
查看次数

“压缩”或“训练”用于压缩/解压缩的压缩算法?

我正在尝试确定是否有可以预先训练的压缩算法,您可以在其中使用训练后的数据来压缩和解压缩数据。

我不确切知道压缩算法是如何工作的,但是我暗示这是可能的。

例如,如果我独立压缩这些行,则压缩效果将不佳。

banana: 1, tree: 2, frog: 3
banana: 7, tree: 9, elephant: 10
Run Code Online (Sandbox Code Playgroud)

如果我事先用100条采样线训练压缩算法,则压缩效果会很好,因为它已经可以将“香蕉”映射到代码/查找值中。

伪代码来帮助解释我的问题:

# Compressing side

rip = Rip()
trained = rip.train(data)  # once off
send_trained_data_to_clients(trained)

compressed = rip.compress(data)

# And on the other end

rip = Rip()
rip.load_train_data(train)
data = rip.decompress(compressed)
Run Code Online (Sandbox Code Playgroud)

是否有一种通用的压缩算法(即具有流行语言的库)可以让我做到这一点?

compression

5
推荐指数
1
解决办法
175
查看次数

为测试目的创建backtype.storm.tuple.Tuple?

我是Storm的新手,我正在尝试研究如何编写一个测试execute(Tuple tuple)子类中方法的螺栓测试BaseRichBolt.

问题是它似乎Tuple是不可变的,我没有看到任何方法或构建器来创建新的元组.如何创建自己的Tuple,或者如何使用测试输入测试螺栓?

我实际上使用的是Scala,而不是Java,但答案应该很容易翻译.

java testing scala apache-storm

5
推荐指数
1
解决办法
2149
查看次数

是否可以从弹性搜索中流式传输文档?

是否可以与弹性搜索具有持久的HTTP连接,它只是在索引时输出新文档?

例如,我正在添加一个名为的理论参数stream:

curl -X GET 'http://localhost:9200/documents/_search?stream'

{"_index":"documents", "_type":"doc", "field": "value #1"}
{"_index":"documents", "_type":"doc", "field": "value #2"}
{"_index":"documents", "_type":"doc", "field": "value #3"}
Run Code Online (Sandbox Code Playgroud)

...这将保持连接运行,可能是HTTP分块模式,直到客户端断开连接.

我正在考虑的替代方案是每秒向群集执行一个GET请求,时间范围为一秒.我希望有一种流模式来防止开销.

河流有弹性研究,这似乎与此相反.

streaming elasticsearch

5
推荐指数
1
解决办法
1万
查看次数

有什么办法可以“应用补丁”到 docker 镜像?

有什么办法来“打补丁”,以码头工人的形象,特别是一个或多个RUNADD等命令?

例如,一个RUN命令可能需要 20 分钟才能运行,即下载、编译和安装二进制文件。是否可以对其进行差异并将其应用于另一个图像?

我能想到的唯一方法(我还没有尝试过)是运行docker diff,解析输出,创建一个 tgz,然后将 tgz 用作ADD另一个Dockerfile.

我知道这存在一些问题,例如,如果apt-get update事先调用an可能会破坏二进制文件的预期动态库链接等。我对此没有意见,因为我的测试将失败,并将表明我必须重建再次“差异”。

我也意识到可能会有冲突。我很高兴完全替换文件。

使用此功能的原因是为了节省时间。例如,有时Dockerfile需要更改早期命令,并且会破坏缓存。此外,尽管我试图使它们相同以利用缓存,但两个不同 Dockerfile 中的上述命令并不总是相同的。

diff patch docker

5
推荐指数
1
解决办法
9205
查看次数

使用解耦,冗余和异步在远程服务器上执行命令

我有一些服务器需要在其他服务器上执行命令.例如,Bitbucket Server post接收钩子git pull在另一台服务器上执行.另一个示例是CI服务器提取新的docker镜像并在另一台服务器上重新启动实例.

我通常会这样做ssh,专门为有限许可的作业创建一个用户/组.

一些缺点ssh:

  • 同步ssh呼叫意味着git push必须等到完成.
  • 如果主机因任何原因ssh无法联系,则该命令将失败.
  • 维护密钥,用户和sudoers权限可能会变得难以处理.

几种可能性:

  • 找到一个开箱即用的开源解决方案(到目前为止,我试过没有运气)
  • 在每个接受具有某种类型身份验证的调用的服务器上设置REST API,例如POST https:// server/git/pull /?apikey = a1b2c3
  • 设置Python/Celery以在每个主机的不同队列上执行任务.这意味着每个服务器上的芹菜工作者可以执行命令,并且可能是接受REST API调用的服务,将它们转换为Celery任务.

这个问题有一个很好的解决方案吗?

python git ssh server

5
推荐指数
1
解决办法
483
查看次数

在Scapy中指定每个数据包的时间戳?

使用Scapy,当我创建数据包并将其写入pcap文件时,它会将数据包的时间戳设置为当前时间.

这是我目前的用法.1335494712.991895是我创建数据包的时间:

>>> a = Ether()/IP(src='1.1.1.1',dst='2.2.2.2')/TCP(sport=1337,dport=31337)
>>> wrpcap('single-tcp-packet.pcap', a)

# tcpdump -tt -r single-tcp-packet.pcap
reading from file single-tcp-packet.pcap, link-type EN10MB (Ethernet)
1335494712.991895 IP 1.1.1.1.menandmice-dns > arennes-651-1-107-2.w2-2.abo.wanadoo.fr.31337: Flags [S], seq 0, win 8192, length 0
Run Code Online (Sandbox Code Playgroud)

如何为每个数据包指定自己的时间戳?

我在文档中看到了用于设置TCP时间戳的时间戳,但它似乎没有对实际pcap时间戳产生影响.

python scapy

4
推荐指数
1
解决办法
7006
查看次数