小编Oli*_*ton的帖子

ereg的预期寿命,迁移到preg

我在一个大型PHP应用程序(> 100万行,10岁)上工作,它广泛使用eregereg_replace- 目前在516个类中有1,768个独特的正则表达式.

我非常清楚为什么ereg被弃用但显然preg可以高度参与.

有谁知道ereg在PHP中可能维持多长时间的支持,和/或有任何迁移到preg这种规模的建议.我怀疑从ereg到preg的自动翻译是不可能/不切实际的?

php regex ereg

8
推荐指数
1
解决办法
498
查看次数

使用语言检测进行多语言拼写检查

我正在进行混合语言网页的拼写检查,但未能找到有关该主题的任何现有研究.

目的是在混合语言网页中自动检测句子级别的语言,并自动对其语言进行拼写检查.假设我们可以忽略将多种语言混合在一起的句子(例如"他有一定的知识"),并假设网页不能包含超过2或3种语言.

琐碎的例子(威尔士语+英语):http://wales.gov.uk/

我目前正在混合使用:

  • 人物分布(例如0600-06FF =阿拉伯语等)
  • n-Grams用于识别具有相似字符的语言
  • 字典查找以识别语言环境,即en-US,en-GB

我有工作代码,但我担心它可能天真或不必要地重新发明一个轮子.有没有其他人这样做过?

language-agnostic multilingual nlp spell-checking

7
推荐指数
1
解决办法
1233
查看次数