小编Ste*_*art的帖子

MongoDB嵌套对象聚合计数

我有一个高度嵌套的mongoDB对象集,我想计算匹配给定条件Edit的子文档数:(在每个文档中).例如:

{"_id":{"chr":"20","pos":"14371","ref":"A","alt":"G"},
"studies":[
    {
        "study_id":"Study1",
        "samples":[
            {
                "sample_id":"NA00001",
                "formatdata":[
                    {"GT":"1|0","GQ":48,"DP":8,"HQ":[51,51]}
                ]
            },
            {
                "sample_id":"NA00002",
                "formatdata":[
                    {"GT":"0|0","GQ":48,"DP":8,"HQ":[51,51]}
                ]
            }
        ]
    }
]
}
{"_id":{"chr":"20","pos":"14372","ref":"T","alt":"AA"},
"studies":[
    {
        "study_id":"Study3",
        "samples":[
            {
                "sample_id":"SAMPLE1",
                "formatdata":[
                    {"GT":"1|0","GQ":48,"DP":8,"HQ":[51,51]}
                ]
            },
            {
                "sample_id":"SAMPLE2",
                "formatdata":[
                    {"GT":"1|0","GQ":48,"DP":8,"HQ":[51,51]}
                ]
            }
        ]
    }
]
}
{"_id":{"chr":"20","pos":"14373","ref":"C","alt":"A"},
"studies":[
    {
        "study_id":"Study3",
        "samples":[
            {
                "sample_id":"SAMPLE3",
                "formatdata":[
                    {"GT":"0|0","GQ":48,"DP":8,"HQ":[51,51]}
                ]
            },
            {
                "sample_id":"SAMPLE7",
                "formatdata":[
                    {"GT":"0|0","GQ":48,"DP":8,"HQ":[51,51]}
                ]
            }
        ]
    }
]
}
Run Code Online (Sandbox Code Playgroud)

我想知道有多少子文档包含GT:"1 | 0",在这种情况下,在第一个文档中为1,在第二个文档中为2,在第3个文档中为0.我已经尝试了展开和聚合函数,但我显然没有做正确的事情.当我尝试通过"GT"字段计算子文档时,mongo抱怨:

db.collection.aggregate([{$group: {"$studies.samples.formatdata.GT":1,_id:0}}])
Run Code Online (Sandbox Code Playgroud)

因为我的小组的名字不能包含".",但如果我把它们留下:

db.collection.aggregate([{$group: {"$GT":1,_id:0}}])
Run Code Online (Sandbox Code Playgroud)

它抱怨因为"$ GT不能是运营商名称"

有任何想法吗?

mongodb mongodb-query aggregation-framework

7
推荐指数
1
解决办法
1万
查看次数

使用Docker for HPC和Sun Grid Engine

我想知道是否可以使用Docker创建虚拟集群,以便我可以运行使用SGE集群管理为HPC集群设计的脚本.这些是非常大/复杂的工作流程,所以它不仅仅是我可以重写的东西,比如TORQUE/PBS.从理论上讲,我应该能够让Docker认为有多个节点,就像我的内部HPC集群一样.如果有人能救我痛苦告诉我无法做到,我会非常感激.

警告:我不是集群管理员.我更像是最终用户.我在Mac OSX 10.9.5上运行

Client version: 1.7.0
Client API version: 1.19 Go version (client): go1.4.2 Git commit
(client): 0baf609 OS/Arch (client): darwin/amd64 Server version: 1.7.0
 Server API version: 1.19 Go version (server): go1.4.2 Git commit
 (server): 0baf609 OS/Arch (server): linux/amd64 bash-3.2$ boot2docker
 version Boot2Docker-cli version: v1.7.0 Git commit: 7d89508
Run Code Online (Sandbox Code Playgroud)

我一直在使用图像的衍生物(Dockerfile在这里).我的步骤非常简单,请按照网站上的说明操作:

  1. 创建图像
docker-machine create -d virtualbox local
Run Code Online (Sandbox Code Playgroud)
  1. 使其成为活动图像
eval "$(docker-machine env local)"
Run Code Online (Sandbox Code Playgroud)
  1. 获取swarm图像
docker run --rm swarm create
Run Code Online (Sandbox Code Playgroud)
  1. 创建swarm master
docker-machine create \
    -d virtualbox …
Run Code Online (Sandbox Code Playgroud)

sungridengine docker

5
推荐指数
1
解决办法
1464
查看次数