小编pbh*_*bhj的帖子

将两个文件与歌曲标题列表进行比较的最简单方法

我有两个歌曲标题列表,每个都是纯文本文件,这是许可的歌词文件的文件名 - 我想检查较短的列表标题(针)是否在更长的列表(haystack).脚本/应用程序应返回针头中不在大海捞针中的标题列表.

我更喜欢使用Python或shell脚本(BASH),或者只使用可以处理所需模糊性的可视差异程序.

主要问题是标题需要模糊匹配以解决数据输入错误以及可能还有字排序.

干草堆样本(注意一些重复和接近重复的行,突出显示匹配):

Yearn
Yesterday, Today And Forever
Yesterday, Today, Forever
You
You Alone
You Are Here (The Same Power)
You Are Holy
You Are Holy (Prince Of Peace)
You Are Mighty
You Are Mine
You Are My All In All
You Are My Hiding Place
You Are My King (Amazing Love)
You Are Righteous (Hope)
You Are So Faithful
You Are So Good to Me
You Are Worthy Of My Praise
You Have Been Good
You …
Run Code Online (Sandbox Code Playgroud)

database comparison list recordset fuzzy-comparison

9
推荐指数
1
解决办法
478
查看次数

标签 统计

comparison ×1

database ×1

fuzzy-comparison ×1

list ×1

recordset ×1