Nic*_*oul 7 algorithm qwerty n-gram text-classification
最近维基百科故意破坏检测竞赛的获胜者建议通过" 检测考虑QWERTY键盘布局的随机键盘命中 "来改善检测.
例: woijf qoeoifwjf oiiwjf oiwj pfowjfoiwjfo oiwjfoewoh
woijf qoeoifwjf oiiwjf oiwj pfowjfoiwjfo oiwjfoewoh
是否有任何软件可以执行此操作(最好是免费和开源)?
如果没有,是否有一个活跃的FOSS项目,其目标是实现这一目标?
如果没有,您会如何建议实施此类软件?
Dia*_*cus 6
如果分析文本中的两个双字母在QWERTY术语中接近但在英语语言中具有接近零的统计频率(如对"fg"或"cd")那么有可能涉及随机键盘命中.如果找到更多这样的对,那么机会大大增加.
如果你想考虑使用双手进行抨击,那么测试用另一个字母分隔的字母用于QWERTY接近度,但是两个双字母(甚至三卦)用于双字母频率.例如,在文本"flsjf"中,您将检查F和S是否为QWERTY距离,但是对于频率,请检查bigrams FL和LS(或trigram FLS).
归档时间:
15 年,1 月 前
查看次数:
1711 次
最近记录:
10 年,1 月 前