Mar*_*llo 11
获取大量文本(例如来自古腾堡档案馆),进行直接频率分析,并观察结果.如果它们看起来不令人满意,则用Flesch-Kincaid得分对每个文本进行加权并再次运行分析 - 经常出现的单词,但在"困难"的文本中会得到提升,这就是你想要的.
但是,如果只有10000个单词,那么将频率排序作为第一遍进行,然后手动调整结果可能会更快.
我不明白频率是如何使用的......如果你要浏览一份报纸,我相信你会看到“彻底”这个词比“bop”或“moo”这个词更频繁地被提及,但事实并非如此不是说这是一个更简单的词;相反,“彻底”是让小学生做噩梦的最令人作呕的荒谬拼写异常之一......
试着向一个正在学习英语作为第二语言的理智的人解释屠杀和笑声之间的微妙区别。