Akh*_*arg 5 python string python-3.x
假设我有一个字符串模板,例如,
string="This is a {object}"
Run Code Online (Sandbox Code Playgroud)
现在我通过格式化这个字符串来创建两个(或更多)字符串,即,
string.format(object="car")
=>"This is a car"
string.format(object="2020-06-05 16:06:30")
=>"This is a 2020-06-05 16:06:30"
Run Code Online (Sandbox Code Playgroud)
现在我以某种方式丢失了原始字符串。有没有办法使用我现在拥有的 2 个新字符串找出原始字符串?
注意:我有这些字符串的数据集,这些字符串是从模板创建的,但原始模板因编辑而丢失。从新模板创建新字符串并放入相同的数据集中。我曾尝试使用一些基于 ML 的方法,但在一般情况下似乎不起作用。我正在寻找一种算法来返回原始字符串,它可以是一个或一组字符串,以防模板已多次更改。
您可以使用主要用于对齐 DNA 序列的众多“序列比对”算法之一。这将返回保守的字符串序列。然后,您将保留保留区域并在发生“突变”的地方添加占位符以获取模板。
https://en.wikipedia.org/wiki/Multiple_sequence_alignment将帮助您开始。
| 归档时间: |
|
| 查看次数: |
234 次 |
| 最近记录: |