我在一个大型PHP应用程序(> 100万行,10岁)上工作,它广泛使用ereg和ereg_replace- 目前在516个类中有1,768个独特的正则表达式.
我非常清楚为什么ereg被弃用但显然preg可以高度参与.
有谁知道ereg在PHP中可能维持多长时间的支持,和/或有任何迁移到preg这种规模的建议.我怀疑从ereg到preg的自动翻译是不可能/不切实际的?
我正在进行混合语言网页的拼写检查,但未能找到有关该主题的任何现有研究.
目的是在混合语言网页中自动检测句子级别的语言,并自动对其语言进行拼写检查.假设我们可以忽略将多种语言混合在一起的句子(例如"他有一定的知识"),并假设网页不能包含超过2或3种语言.
琐碎的例子(威尔士语+英语):http://wales.gov.uk/
我目前正在混合使用:
我有工作代码,但我担心它可能天真或不必要地重新发明一个轮子.有没有其他人这样做过?