Mar*_*ker 13
有一篇有用的PHd论文由Frank Liang撰写,描述了一种非常准确的算法:25年前编写,它仍然有效.但我不知道PHP中的任何实现
编辑
一个快速的谷歌已经确定了这个PHP 文本统计库的链接,其中包括单词内的音节计数算法(以及其他可读性测量算法).你应该能够在这里找到音节分割的代码.
我实际上正处于基于Frank Liang的算法和TeX词典制作PHP Hyphenator类的最后阶段,这几乎似乎是所有办公套件所采用的.(实际上我在寻找一个尚未采用的好名字时找到了这个主题).随着浏览器对实体的支持逐渐得到改善,在网站中连接内容变得越来越现实.
核心功能正在发挥作用 拆分(并因此计数)和/或连字符文本和/或HTML,解析TeX连字符词典,缓存那些已解析的词典.一些计划的功能仍然缺失,但没有任何阻止您使用它.此外,还没有好的文档,样本,正式的单位测试或虚荣网站.
我在这里为它创建了一个github网站,并将尽快发布当前版本,所以请在几天后再回来查看.
我只用荷兰语(我的母语)和美国英语对它进行了测试,因此使用不同字符集的语言可能仍有一些问题.