我想找到一些在某些文本中找到一些(让它是两个)句子的好方法.什么会更好 - 使用正则表达式或拆分方法?你的想法?
根据Jeremy Stein的要求 - 有一些例子
例子:
输入:
首先要做的是创建Comment模型.我们将以正常方式创建它,但只有一个小差异.如果我们只是为文章创建注释,我们在模型中有一个名为article_id的整数字段来存储外键,但在这种情况下,我们需要更抽象的东西.
前两句话:
首先要做的是创建Comment模型.我们将以正常方式创建它,但只有一个小差异.
输入:
T先生是一个卑鄙的家伙.我不想和他打架.
前两句话:
T先生是一个卑鄙的家伙.我不想和他打架.
输入:
执行DC狙击手是在弗吉尼亚监狱进行致命注射.美国东部时间晚上9点11分宣布死亡.
前两句话:
执行DC狙击手是在弗吉尼亚监狱进行致命注射.美国东部时间晚上9点11分宣布死亡.
输入:
在她的总结发言中,反对的律师说"......在这个以及许多其他情况下,两个错误都不会成为正确的." 陪审团似乎同意.
前两句话:
在她的总结发言中,反对的律师说"......在这个以及许多其他情况下,两个错误都不会成为正确的." 陪审团似乎同意.
大家,正如你所看到的 - 从文本中确定两个句子并不容易.:(
如果你知道要搜索什么句子,Regex 应该可以很好地搜索
((YOUR SENTENCE HERE)|(YOUR OTHER SENTENCE)){1}
Run Code Online (Sandbox Code Playgroud)
Split 可能会占用相当多的内存,因为它还保存您不需要的东西(不是您的句子的整个文本),因为正则表达式仅保存您搜索的句子(当然,如果它找到它)
| 归档时间: |
|
| 查看次数: |
1334 次 |
| 最近记录: |