是否有任何算法来判断字符串是否有意义

jer*_*liu 2 string algorithm

问题是,我必须扫描可执行文件并找出要分析的字符串,使用sysinternals中的strings.exe.但是,如何区分有意义的字符串和平凡的字符串,是否有任何算法或思想来解决这个问题(统计?概率?).

例如:从strings.exe中提取字符串(所有字符串的一部分)

S`A
waA
RmA
>rA
5xA
GetModuleHandleA
LocalFree
LoadLibraryA
LocalAlloc
GetCommandLineW
Run Code Online (Sandbox Code Playgroud)

从经验判断来看,最后五个字符串是有意义的,而前五个字符串则不是.那么如何解决这个问题,不要使用像黑名单或白名单这样的字典.

Mit*_*eat 5

简单算法:将候选字符串分解为第一个大写/空白/数字上的单词,然后将单词与一些字典进行比较.