相关疑难解决方法(0)

如何从写成单词的数字中读取值?

众所周知,数字可以用数字写成,也可以用它们的名字来表示.虽然有很多例子可以将123转换成123,但我找不到如何以相反的方式转换它的好例子.

一些警告:

  1. 基数/名义或序数:"一"和"第一"
  2. 常见的拼写错误:"四十"/"十四"
  3. 数百/数千:2100 - >"二十一",还有"二千一百"
  4. 分隔符:"十一二五二",还有"十一五十二"或"十一二十二"等等
  5. 口语:"三十多岁"
  6. 分数:'三分之一','五分之二'
  7. 俗名:'一打','一半'

可能还有更多可能尚未列出的警告.假设算法需要非常健壮,甚至可以理解拼写错误.

我应该阅读哪些领域/论文/研究/算法来学习如何写这些?信息在哪里?

PS:我的最终解析器应该真正理解3种不同的语言,英语,俄语和希伯来语.也许在稍后阶段会添加更多语言.希伯来语也有男/女数字,如"一个男人"和"一个女人"有不同的"一个" - "ehad"和"ahat".俄罗斯也有一些自己的复杂性.

谷歌在这方面做得很好.例如:

http://www.google.com/search?q=two+thousand+and+one+hundred+plus+five+dozen+and+four+fifths+in+decimal

(反过来也可以http://www.google.com/search?q=999999999999+in+english)

language-agnostic algorithm parsing nlp numbers

50
推荐指数
5
解决办法
1万
查看次数

在PHP中将单词转换为数字

我试图将写成单词的数值转换为整数.例如,"iPhone有二十三万七千八百三个应用程序"将成为"iPhone为230783应用程序"

在开始编码之前,我想知道是否存在此转换的任何函数/代码.

php numbers cpu-word

20
推荐指数
2
解决办法
2万
查看次数

标签 统计

numbers ×2

algorithm ×1

cpu-word ×1

language-agnostic ×1

nlp ×1

parsing ×1

php ×1