小编zan*_*bri的帖子

将Neo4j子图加载到Networkx中

我一直在通过python的Bulbflow处理Neo4j,现在需要一种方法来保存/导出子图.我已经看过Java甚至Ruby的方法,但是一个简单的Python方法似乎隐藏了我...

到目前为止,我找到了两条潜在的途径:

  1. 通过py2neo访问Geoff,但是从大型本地neo4j数据库或neo4jserver中提取子图的文档很少令人惊讶.

  2. 使用Networkx:我发现networkx可以加载来自多种不同格式的图形(我不确定neo4j存储它们的dbs的格式),但是我还没有找到一种方法只将一个子图提取到Networkx中.我认为这应该从gremlin查询完成,但我不知道如何去做.

我偏爱Networkx路径,因为它还附带了我希望应用于子图的网络分析算法.我觉得它也可以避免Bulbflow和py2neo之间的潜在冲突,虽然我不确定是否会存在这样的冲突.

任何建议将不胜感激!

提前致谢

python subgraph neo4j graph-databases networkx

18
推荐指数
1
解决办法
3148
查看次数

如何在numpy和R之间传递大型数组?

我正在使用python和numpy/scipy来执行正则表达式并阻止文本处理应用程序.但我也想使用一些R的统计软件包.

将数据从python传递给R的最佳方法是什么?(然后回来?)

此外,我需要在某些时候将阵列备份到磁盘,所以我愿意从python中保存并加载R,如果这是最好的解决方案.矩阵非常大(例如100,000 x 10,000),因此使用稀疏矩阵也可能很好.

如果这是转贴,请道歉.我无法找到任何将所有这些部分放在一起的东西.

python numpy r matrix

9
推荐指数
1
解决办法
3697
查看次数

如何以表格格式快速打印Ruby哈希?

有没有办法快速将表格格式的ruby哈希打印到文件中?如:

keyA   keyB   keyC   ...
123    234    345
125           347
4456
...
Run Code Online (Sandbox Code Playgroud)

其中哈希值是不同大小的数组.或者是使用双循环的唯一方法?

谢谢

ruby arrays hash

5
推荐指数
2
解决办法
7599
查看次数

Dask DataFrame:对多行的 groupby 对象重新采样

我有以下从 Castra 创建的 dask 数据框:

import dask.dataframe as dd

df = dd.from_castra('data.castra', columns=['user_id','ts','text'])
Run Code Online (Sandbox Code Playgroud)

产量:

                      user_id / ts                  / text
ts
2015-08-08 01:10:00   9235      2015-08-08 01:10:00   a
2015-08-08 02:20:00   2353      2015-08-08 02:20:00   b
2015-08-08 02:20:00   9235      2015-08-08 02:20:00   c
2015-08-08 04:10:00   9235      2015-08-08 04:10:00   d
2015-08-08 08:10:00   2353      2015-08-08 08:10:00   e
Run Code Online (Sandbox Code Playgroud)

我想要做的是:

  1. user_id和分组ts
  2. 在 3 小时内重新采样
  3. 在重采样步骤中,任何合并的行都应该连接文本

示例输出:

                                text
user_id   ts
9235      2015-08-08 00:00:00   ac
          2015-08-08 03:00:00   d
2353      2015-08-08 00:00:00   b
          2015-08-08 06:00:00   e
Run Code Online (Sandbox Code Playgroud)

我尝试了以下方法:

df.groupby(['user_id','ts'])['text'].sum().resample('3H', how='sum').compute() …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas dask castra

5
推荐指数
1
解决办法
3070
查看次数

三循环Ruby

我知道三重循环的想法给某些人的思想带来了恐惧,但我有一个具有以下结构的代码:

paragraph.split(/(\.|\?|\!)[\s\Z]/).each do |sentence|
    myArrayOfFiles.each_with_index { |ma,j|
        ma.each_with_index { |word,i|
            sentence.gsub!(...)
        }
    }
end
Run Code Online (Sandbox Code Playgroud)

两个外部循环按预期运行,但由于某种原因,内部循环sentence仅在第一个循环上运行.你知道为什么吗?如何让内循环遍历所有sentences?

我在Ruby 1.8.7上运行,并且只使用each循环尝试了相同的代码并得到了相同的结果.有任何想法吗?

编辑:

myArrayOfFiles 是一个数组填充:

AFile = File.open("A.txt")
BFile = File.open("B.txt")
myArrayOfFiles << [Afile,BFile]
myArrayOfFiles.flatten!
Run Code Online (Sandbox Code Playgroud)

ruby each loops file

2
推荐指数
1
解决办法
155
查看次数

用大写单词替换单词

如果该行的第一个单词(一个或多个)都在CAP中,我想用大写单词替换这些单词(使用ruby的.capitalize).例如"FOO BAR"到"Foo Bar"

我尝试了以下方法:

line.gsub!(/^([A-Z ]+)/, '\1'.capitalize)
Run Code Online (Sandbox Code Playgroud)

line.gsub!(/^([A-Z ]+)/, "\\1".capitalize)
Run Code Online (Sandbox Code Playgroud)

这两个都没用.有没有办法做到这一点?

ruby regex gsub

1
推荐指数
1
解决办法
563
查看次数

Matlab:如何创建无限深的for循环?

所以我们给了一些w,我们想要像这样的伪代码:

u = zeros(size(w));
for o=1:length(size(w))
 for i=1:size(w)(1), 
  for j=1:size(w)(2), 
...
    for k=1:size(w)(length(size(w))),
        u(i, j, ..., k )=1/(exp((-w(i,j, ..., k )))+25);
    end
...
  end
 end
end
Run Code Online (Sandbox Code Playgroud)

Matlab是如此可能的事情,怎么做?

matlab for-loop

-1
推荐指数
2
解决办法
122
查看次数

标签 统计

python ×3

ruby ×3

arrays ×1

castra ×1

dask ×1

dataframe ×1

each ×1

file ×1

for-loop ×1

graph-databases ×1

gsub ×1

hash ×1

loops ×1

matlab ×1

matrix ×1

neo4j ×1

networkx ×1

numpy ×1

pandas ×1

r ×1

regex ×1

subgraph ×1