Gag*_*ngh 9 java algorithm linguistics
想知道是否有人有任何提示或可能指出我找到/创建某种算法来找到押韵词的正确方向.
我特别不想使用API,因为创建算法只是为了创建它是我的最终目标.
不是它应该是重要的,但我在java编码.
谢谢
如果您不想使用API,这似乎可能是一个巨大的项目.具有挑战性的步骤是确定一个单词的语音(如果两个单词的结尾在语音上相似,则为两个单词).如果你能做到这一点,你可以比较他们发音的结尾.您可能会找到一个将已知单词转换为拼音拼写的API,但如果您不想使用API,则必须自己完成,这不是一项小任务......更不用说,任何人都不完美.
另一种方法是研究Metaphone算法,解释如下:http: //www.blackbeltcoder.com/Articles/algorithms/phonetic-string-comparison-with-soundex
最佳算法将使用分类为具有押韵的群组的词典.这是一个非常难的问题,需要语言学背景.我想你想要一些,可能不是最好的算法来自动找到押韵.
用一些值来编码单词(不是单词本身)的发音的基本思想.以等号结尾的值识别单词押韵.
从我的角度来看,研究比找到正确的算法更有意义.
看一下那篇论文:一个自动识别押韵的系统