set*_*rgo 12 ruby algorithm graph directed-graph
我有一个经典的依赖解决问题.我以为我朝着正确的方向前进,但现在我遇到了障碍,我不知道该怎么办.
在已知的Universe(所有工件的缓存及其依赖关系)中,每个工件和版本之间都存在1-> n关系,并且每个版本可能包含一组不同的依赖关系.例如:
A
1.0.0
B (>= 0.0.0)
1.0.1
B (~> 0.1)
B
0.1.0
1.0.0
Run Code Online (Sandbox Code Playgroud)
给定一组"需求约束",我想找到最好的解决方案("最佳"是仍然满足所有约束的最高版本).以下是解决方案的"需求约束"示例:
solve!('A' => '~> 1.0') #=> {"A" => "1.0.1", "B" => "0.1.0"}
Run Code Online (Sandbox Code Playgroud)
实际上,有更多的要求:
solve!('A' => '~> 1.0', 'B' => '>= 0.0.0', 'C' => '...', 'D' => '...')
Run Code Online (Sandbox Code Playgroud)
(版本遵循语义版本标准)
当前的解决方案使用回溯并且性能不高.我做了一些挖掘,发现性能问题是由于宇宙的大小造成的.我决定尝试另一种方法,构建了"可能性" DAG图的只是一组要求:
class Graph
def initialize
@nodes = {}
@edges = {}
end
def node(object)
@nodes[object] ||= Set.new
self
end
def edge(a, b)
node(a)
node(b)
@nodes[a].add(b)
self
end
def nodes
@nodes.keys
end
def edges
@nodes.values
end
def adjacencies(node)
@nodes[node]
end
end
Run Code Online (Sandbox Code Playgroud)
然后,我构建了一个来自宇宙的所有可能解决方案的DAG.这大大减少了可能性的数量,并为我提供了具有真实工件可能性的实际图形.
def populate(artifact)
return if loaded?(artifact)
@graph.node(artifact)
artifact.dependencies.each do |dependency|
versions_for(dependency).each do |dependent_artifact|
@graph.edge(artifact, dependent_artifact)
populate(dependent_artifact)
end
end
end
private
def versions_for(dependency)
possibles = @universe.versions(dependency.name, dependency.constraint)
# Short-circuit if there are no versions for this dependency,
# since we know the graph won't be solvable.
raise "No solution for #{dependency}!" if possibles.empty?
possibles
end
Run Code Online (Sandbox Code Playgroud)
因此,从前面的示例图中,如果我有需求'A', '>= 0.0.0',我的DAG将如下所示:
+---------+ +---------+
| A-1.0.0 | | A-1.0.1 |
+---------+ +---------+
/ \ |
/ \ |
/ \ |
/ \ |
+---------+ +---------+
| B-1.0.0 | | B-0.1.0 |
+---------+ +---------+
Run Code Online (Sandbox Code Playgroud)
由于A-1.0.0的可能值是"B的任何值",但A-1.0.1的约束是"0.1系列中的任何B".这正在按预期工作(使用完整的测试套件).
换句话说,DAG采用抽象依赖约束并创建一个"真实"图形,其中每个边缘是一个依赖项,每个顶点(我称之为a node)是一个实际的工件.如果存在解决方案,则它位于此图中的某个位置.
可悲的是,这是我被卡住的地方.我无法想出通过此图找到"最佳"路径的算法或程序.我也不确定如何检测图表是否不可解决.
我做了一些研究,我认为拓扑排序(tsort)是我需要的过程.但是,该算法确定依赖项的插入顺序,而不是最佳解决方案.
我相当肯定这是一个难以解决的问题,可能会有一个低效的运行时.我虽然使用DAG会减少我必须做的比较次数.这个假设我错了吗?是否有更好的数据结构可供使用?
我不是这个问题的专家,我提出的完整解决方案不是最佳的,因为有很多东西可以优化..
算法很简单,理想情况下是一个递归集。交叉点 DFS :
算法
定义
Define: Name as String on format [ .* ]
Define: Version as String on format [ dd.dd.dd ]
Define: Revision as { Name, Version, Requirement }
Define: Range<T> as { min<T>, max<T> }
Define: Condition as { Name, Range<Version> }
Define: Requirement as Set<Revision> OR as Set<Condition>
Define: Component as { Name, Range<Version>, Requirement }
Define: System as Set<Component>
Run Code Online (Sandbox Code Playgroud)
输入
Input: T as System aka basis
Input: C as Set<Condition> aka conditions to apply
Run Code Online (Sandbox Code Playgroud)
初始化
Init: S as Set<Condition> = { S[i] as Condition | S[i] = {T[i].Name,T[i].Range} }
Init: Q as Stack<Condition> = { push(q) | q[i] = C[i] }
Run Code Online (Sandbox Code Playgroud)
过程
for (Condition c in C)
{
S.find(c.Name).apply(c)
}
While (Q.size > 0)
{
Condition q = Q.pop()
switch (T.assert(S.find(q.Name),q))
{
case VALID:
S.find(q.Name).apply(q)
q.push(S.find(q.Name).Requirement)
case INVALID:
S.find(q.Name).set(INVALID)
case IDENTICAL:
case SKIP:
}
}
return S aka Solution
Run Code Online (Sandbox Code Playgroud)
运营
Stack.push在堆栈的前面插入一个项目
Stack.pop从堆栈前面删除一个项目
System.assert(Condition a, Condition b):
if (a is INVALID) then return SKIP
else if (b.Range = a.Range) then IDENTICAL
else if (b.Range - a.Range = {}) then VALID
else INVALID
Run Code Online (Sandbox Code Playgroud)
Set.find(x)根据条件 x 搜索项目
Condition.apply(Condition b) = { this.Name, intersection(this.Range,b.Range) }
Run Code Online (Sandbox Code Playgroud)