使用ruby从某些.txt文档中提取所有电子邮件地址

Ikb*_*ear 1 ruby regex

我必须从一些.txt文档中提取所有电子邮件地址.这些电子邮件可能具有以下格式:

  1. a@abc.com
  2. {a, b, c}@abc.edu
  3. 一些其他格式,包括一些@迹象.

我选择ruby作为我的第一语言来编写这个程序,但我不知道如何编写正则表达式.有人会帮助我吗?谢谢!

Jan*_*rts 6

根据.txt文档的性质,您不必使用其中一个尝试验证电子邮件地址的复杂正则表达式.你不是要试图验证任何东西.你只是想抓住已有的东西.一般来说,获取已有内容的正则表达式比需要验证输入的正则表达式简单得多.

一个重要的问题是.txt文档是否包含不属于要提取的电子邮件地址的@符号.

这个正则表达式处理你的前两个要求:

\w+@[\w.-]+|\{(?:\w+, *)+\w+\}@[\w.-]+
Run Code Online (Sandbox Code Playgroud)

或者,如果您想允许任何包含@符号的非空格字符序列加上您的第二个要求(包含空格):

\S+@\S+|\{(?:\w+, *)+\w+\}@[\w.-]+
Run Code Online (Sandbox Code Playgroud)