小编gak*_*gak的帖子

Unfortunately I want to groupCount attributes of edges or vertices. For example I have 1 million users and each user belongs to a country. How can I do a fast groupCount to work out the number of users in each country?

What I've tried so far can be shown in this elaborate groovy script:

g = TitanFactory.open('titan.properties')  // Cassandra
r = new Random(100)
people = 1e6

def newKey(g, name, type) {
    return g
        .makeType() …

Run Code Online (Sandbox Code Playgroud)

groovy cassandra graph-databases titan

gak*_*gak

lucky-day

5
推荐指数

1
解决办法

1350
查看次数

tshark输出所有字段？

是否可以tshark使用-T fields选项或类似方法获得每个字段(在数据包内)的输出？

例如,对于数据包/重建中的每个字段,我想要这样的事情:

eth.src:f2:3c:91:96:fd:09,ip.src:1.2.3.4,tcp.dst_port:80,http.request.uri:/index.html

Run Code Online (Sandbox Code Playgroud)

(\xff当值包含逗号时,可以用逗号替换逗号以使解析更好.)

我意识到有-e选项,但似乎我必须在命令行中放入每个可能的字段.最重要的是,每个数据包中只使用一小部分字段,这使得需要解析大量数据.

我目前打算使用该tshark -V选项并解析它,但理想情况下我想要更多的机器风格术语,http.request.uri而不是"人类可读",例如:

Hypertext Transfer Protocol
    GET /main.php HTTP/1.1\r\n
        [Expert Info (Chat/Sequence): GET /main.php HTTP/1.1\r\n]
            [Message: GET /main.php HTTP/1.1\r\n]
            [Severity level: Chat]
            [Group: Sequence]
        Request Method: GET
        Request URI: /main.php

Run Code Online (Sandbox Code Playgroud)

pcap wireshark tshark

gak*_*gak

lucky-day

5
推荐指数

1
解决办法

1万
查看次数

“压缩”或“训练”用于压缩/解压缩的压缩算法？

我正在尝试确定是否有可以预先训练的压缩算法，您可以在其中使用训练后的数据来压缩和解压缩数据。

我不确切知道压缩算法是如何工作的，但是我暗示这是可能的。

例如，如果我独立压缩这些行，则压缩效果将不佳。

banana: 1, tree: 2, frog: 3
banana: 7, tree: 9, elephant: 10

Run Code Online (Sandbox Code Playgroud)

如果我事先用100条采样线训练压缩算法，则压缩效果会很好，因为它已经可以将“香蕉”映射到代码/查找值中。

伪代码来帮助解释我的问题：

# Compressing side

rip = Rip()
trained = rip.train(data)  # once off
send_trained_data_to_clients(trained)

compressed = rip.compress(data)

# And on the other end

rip = Rip()
rip.load_train_data(train)
data = rip.decompress(compressed)

Run Code Online (Sandbox Code Playgroud)

是否有一种通用的压缩算法（即具有流行语言的库）可以让我做到这一点？

compression

gak*_*gak

lucky-day

5
推荐指数

1
解决办法

175
查看次数

为测试目的创建backtype.storm.tuple.Tuple？

我是Storm的新手,我正在尝试研究如何编写一个测试execute(Tuple tuple)子类中方法的螺栓测试BaseRichBolt.

问题是它似乎Tuple是不可变的,我没有看到任何方法或构建器来创建新的元组.如何创建自己的Tuple,或者如何使用测试输入测试螺栓？

我实际上使用的是Scala,而不是Java,但答案应该很容易翻译.

java testing scala apache-storm

gak*_*gak

2015 11-23

5
推荐指数

1
解决办法

2149
查看次数

是否可以从弹性搜索中流式传输文档？

是否可以与弹性搜索具有持久的HTTP连接,它只是在索引时输出新文档？

例如,我正在添加一个名为的理论参数stream:

curl -X GET 'http://localhost:9200/documents/_search?stream'

{"_index":"documents", "_type":"doc", "field": "value #1"}
{"_index":"documents", "_type":"doc", "field": "value #2"}
{"_index":"documents", "_type":"doc", "field": "value #3"}

Run Code Online (Sandbox Code Playgroud)

...这将保持连接运行,可能是HTTP分块模式,直到客户端断开连接.

我正在考虑的替代方案是每秒向群集执行一个GET请求,时间范围为一秒.我希望有一种流模式来防止开销.

河流有弹性研究,这似乎与此相反.

streaming elasticsearch

gak*_*gak

lucky-day

5
推荐指数

1
解决办法

1万
查看次数

有什么办法可以“应用补丁”到 docker 镜像？

有什么办法来“打补丁”，以码头工人的形象，特别是一个或多个RUN，ADD等命令？

例如，一个RUN命令可能需要 20 分钟才能运行，即下载、编译和安装二进制文件。是否可以对其进行差异并将其应用于另一个图像？

我能想到的唯一方法（我还没有尝试过）是运行docker diff，解析输出，创建一个 tgz，然后将 tgz 用作ADD另一个Dockerfile.

我知道这存在一些问题，例如，如果apt-get update事先调用an可能会破坏二进制文件的预期动态库链接等。我对此没有意见，因为我的测试将失败，并将表明我必须重建再次“差异”。

我也意识到可能会有冲突。我很高兴完全替换文件。

使用此功能的原因是为了节省时间。例如，有时Dockerfile需要更改早期命令，并且会破坏缓存。此外，尽管我试图使它们相同以利用缓存，但两个不同 Dockerfile 中的上述命令并不总是相同的。

diff patch docker

gak*_*gak

lucky-day

5
推荐指数

1
解决办法

9205
查看次数

使用解耦,冗余和异步在远程服务器上执行命令

我有一些服务器需要在其他服务器上执行命令.例如,Bitbucket Server post接收钩子git pull在另一台服务器上执行.另一个示例是CI服务器提取新的docker镜像并在另一台服务器上重新启动实例.

我通常会这样做ssh,专门为有限许可的作业创建一个用户/组.

一些缺点ssh:

同步ssh呼叫意味着git push必须等到完成.
如果主机因任何原因ssh无法联系,则该命令将失败.
维护密钥,用户和sudoers权限可能会变得难以处理.

几种可能性:

找到一个开箱即用的开源解决方案(到目前为止,我试过没有运气)
在每个接受具有某种类型身份验证的调用的服务器上设置REST API,例如POST https:// server/git/pull /？apikey = a1b2c3
设置Python/Celery以在每个主机的不同队列上执行任务.这意味着每个服务器上的芹菜工作者可以执行命令,并且可能是接受REST API调用的服务,将它们转换为Celery任务.

这个问题有一个很好的解决方案吗？

python git ssh server

gak*_*gak

lucky-day

5
推荐指数

1
解决办法

483
查看次数

在Scapy中指定每个数据包的时间戳？

使用Scapy,当我创建数据包并将其写入pcap文件时,它会将数据包的时间戳设置为当前时间.

这是我目前的用法.1335494712.991895是我创建数据包的时间:

>>> a = Ether()/IP(src='1.1.1.1',dst='2.2.2.2')/TCP(sport=1337,dport=31337)
>>> wrpcap('single-tcp-packet.pcap', a)

# tcpdump -tt -r single-tcp-packet.pcap
reading from file single-tcp-packet.pcap, link-type EN10MB (Ethernet)
1335494712.991895 IP 1.1.1.1.menandmice-dns > arennes-651-1-107-2.w2-2.abo.wanadoo.fr.31337: Flags [S], seq 0, win 8192, length 0

Run Code Online (Sandbox Code Playgroud)

如何为每个数据包指定自己的时间戳？

我在文档中看到了用于设置TCP时间戳的时间戳,但它似乎没有对实际pcap时间戳产生影响.

python scapy

gak*_*gak

lucky-day

4
推荐指数

1
解决办法

7006
查看次数