PHP音节检测

jer*_*emy 9 php nlp

我想找到一种方法,可以用PHP将一个单词分成音节.例如,单词"nevermore"通过detect_syllables()运行,将返回"nev-er-more".有没有好的API或其他东西?

Mar*_*ker 13

有一篇有用的PHd论文由Frank Liang撰写,描述了一种非常准确的算法:25年前编写,它仍然有效.但我不知道PHP中的任何实现

编辑

一个快速的谷歌已经确定了这个PHP 文本统计库的链接,其中包括单词内的音节计数算法(以及其他可读性测量算法).你应该能够在这里找到音节分割的代码.

  • 虽然我没有查看实际的代码:如果它可以计算音节,它必须将单词拆分为sylables进行计数,所以逻辑必须在某处. (2认同)

Mar*_*Lee 5

我实际上正处于基于Frank Liang的算法和TeX词典制作PHP Hyphenator类的最后阶段,这几乎似乎是所有办公套件所采用的.(实际上我在寻找一个尚未采用的好名字时找到了这个主题).随着浏览器对实体的支持逐渐得到改善,在网站中连接内容变得越来越现实.

核心功能正在发挥作用 拆分(并因此计数)和/或连字符文本和/或HTML,解析TeX连字符词典,缓存那些已解析的词典.一些计划的功能仍然缺失,但没有任何阻止您使用它.此外,还没有好的文档,样本,正式的单位测试或虚荣网站.

我在这里为它创建了一个github网站,并将尽快发布当前版本,所以请在几天后再回来查看.

我只用荷兰语(我的母语)和美国英语对它进行了测试,因此使用不同字符集的语言可能仍有一些问题.

  • @ martijn-van-der-lee - 看看https://github.com/heiglandreas/Org_Heigl_Hyphenator-也许我们可以联手;) (3认同)