dsi*_*cha 5

我实际上是一名生物信息学研究员,正在等待他自己的生物信息学代码运行,所以我会尝试回答你的问题,即使它的构成相当糟糕.

我不确定你为什么认为你需要"修改"Smith-Waterman算法.Smith-Waterman算法唯一需要对齐蛋白质而不是DNA的是蛋白质的替代基质.看看BLOSUM或PAM.这些是基于很久以前一些生物学家手工排列的序列中各种氨基酸对的取代频率.

构建蛋白质序列的取代矩阵比DNA序列复杂得多.例如,你期望一种亲水性氨基酸相对频繁地替代另一种,因为它通常能够这样做而不会导致蛋白质失去功能.然而,您不会期望疏水性氨基酸经常替代亲水性氨基酸,因为这会更彻底地改变蛋白质结构.

如果您将替换矩阵视为输入而不是算法的一部分,则Smith-Waterman算法虽然通常应用于DNA或蛋白质,但在技术上是一般的字符串对齐算法.