如何从格式化字符串中查找字符串模板?

Akh*_*arg 5 python string python-3.x

假设我有一个字符串模板,例如,

string="This is a {object}"
Run Code Online (Sandbox Code Playgroud)

现在我通过格式化这个字符串来创建两个(或更多)字符串,即,

string.format(object="car")
=>"This is a car"

string.format(object="2020-06-05 16:06:30")
=>"This is a 2020-06-05 16:06:30"
Run Code Online (Sandbox Code Playgroud)

现在我以某种方式丢失了原始字符串。有没有办法使用我现在拥有的 2 个新字符串找出原始字符串?

注意:我有这些字符串的数据集,这些字符串是从模板创建的,但原始模板因编辑而丢失。从新模板创建新字符串并放入相同的数据集中。我曾尝试使用一些基于 ML 的方法,但在一般情况下似乎不起作用。我正在寻找一种算法来返回原始字符串,它可以是一个或一组字符串,以防模板已多次更改。

Fin*_*inn 0

您可以使用主要用于对齐 DNA 序列的众多“序列比对”算法之一。这将返回保守的字符串序列。然后,您将保留保留区域并在发生“突变”的地方添加占位符以获取模板。

https://en.wikipedia.org/wiki/Multiple_sequence_alignment将帮助您开始。