找一些句子

Ale*_*sev 5 ruby regex nlp

我想找到一些在某些文本中找到一些(让它是两个)句子的好方法.什么会更好 - 使用正则表达式或拆分方法?你的想法?

根据Jeremy Stein的要求 - 有一些例子

例子:

输入:

首先要做的是创建Comment模型.我们将以正常方式创建它,但只有一个小差异.如果我们只是为文章创建注释,我们在模型中有一个名为article_id的整数字段来存储外键,但在这种情况下,我们需要更抽象的东西.

前两句话:

首先要做的是创建Comment模型.我们将以正常方式创建它,但只有一个小差异.

输入:

T先生是一个卑鄙的家伙.我不想和他打架.

前两句话:

T先生是一个卑鄙的家伙.我不想和他打架.

输入:

执行DC狙击手是在弗吉尼亚监狱进行致命注射.美国东部时间晚上9点11分宣布死亡.

前两句话:

执行DC狙击手是在弗吉尼亚监狱进行致命注射.美国东部时间晚上9点11分宣布死亡.

输入:

在她的总结发言中,反对的律师说"......在这个以及许多其他情况下,两个错误都不会成为正确的." 陪审团似乎同意.

前两句话:

在她的总结发言中,反对的律师说"......在这个以及许多其他情况下,两个错误都不会成为正确的." 陪审团似乎同意.

大家,正如你所看到的 - 从文本中确定两个句子并不容易.:(

F.P*_*F.P 0

如果你知道要搜索什么句子,Regex 应该可以很好地搜索

((YOUR SENTENCE HERE)|(YOUR OTHER SENTENCE)){1}
Run Code Online (Sandbox Code Playgroud)

Split 可能会占用相当多的内存,因为它还保存您不需要的东西(不是您的句子的整个文本),因为正则表达式仅保存您搜索的句子(当然,如果它找到它)