我是正规表达的新手,所以会对这一点的同行反馈表示赞赏.它将在我的网站上大量使用,因此任何奇怪的边缘情况都可能完全造成严重破坏.我们的想法是在整个单位或分数中输入配方中一定量的成分.由于我的自动完成机制,只有一个数字也是有效的(因为它会弹出一个下拉列表).这些行有效:
1
1/2
1 1/2
4 cups
4 1/2 cups
10 3/4 cups sliced
Run Code Online (Sandbox Code Playgroud)
该行的数字部分应该是它自己的组,所以我可以用我的分数解析器解析它.数字部分之后的所有内容都应该是第二组.起初,我试过这个:
^\s*(\d+|\d+\/\d+|\d+\s*\d+\/\d+)\s*(.*)$
Run Code Online (Sandbox Code Playgroud)
这几乎可以工作,但"1 1/2杯"将被解析为(1)(1/2杯)而不是(1 1/2)和(杯).在稍微摸了一下之后,我确定这是因为我的"OR"条款的排序.(1)满足\ d +和(.*)满足其余部分.所以我改为:
^\s*(\d+\/\d+|\d+\s*\d+\/\d+|\d+)\s*([a-z].*)$
Run Code Online (Sandbox Code Playgroud)
这几乎可以工作,但允许诸如"1 1/2/4杯"或"1/2 3杯"之类的怪异.所以我决定强制一个字母作为有效数字表达式之后的第一个字符:
^\s*(\d+\/\d+|\d+\s*\d+\/\d+|\d+)\s*($|[a-z].*)$
Run Code Online (Sandbox Code Playgroud)
注意我在不区分大小写的模式下运行它.这是我的问题:
表达能改善吗?我有点不喜欢数字,分数,化合物分数的"OR"列表,但我想不出允许整数,分数或复合分数的方法.
如果我可以在数字组件之后为每个单词返回一个组,这将是特别好的.例如(10 3/4)组,(杯子)组和(切片)组.之后可以有任意数量的单词.这可能吗?
谢谢!
好吧,在我看来,你根本不需要 OR 条件(但见下文)。
对于数字位,您可以逃脱:
\d+(\s+\d+/\d+)
Run Code Online (Sandbox Code Playgroud)
它将处理所有这些小数值。
我仍然会用 OR 子句将小数点分开,因为它可能会使事情变得复杂。所以我认为你可能会逃脱类似的惩罚:
^\s*((\d+\s)?(\d+/\d+)?|\d+(\.\d+)?)\s*([a-z].*)?$
| | | | |
| | | | +--- start of alpha section.
| | | +------ optional white space.
| | +------------------ decimal (nn[.nn])
| +------------------------------------- fractional ([nn ][nn/nn])
+----------------------------------------- optional starting space.
Run Code Online (Sandbox Code Playgroud)
尽管这允许空的小数金额,因此您可能会更好地使用您所拥有的内容(单独的 OR 子句中的整数、小数和小数)。
我自己更喜欢这种([a-z].*)?$结构($|[a-z].*)$,但这可能只是我对过去在我的 RE 中有多个行结束标记的厌恶:-)
但是,老实说,我认为你可能是想用热核弹头来打苍蝇。
您真的需要限制输入的内容吗?我见过需要a pinch of salt和 的食谱a handful of sultanas。我个人认为您可能对您所允许的内容进行了限制。我将有一个自由格式的数量字段和一个用于食物类型的下拉菜单(实际上,我可能只允许自由格式的批次,除非我提供根据冰箱里的东西搜索食谱的能力)。