我有这个文字:
$string = "this is my friend's website http://example.com I think it is coll";
Run Code Online (Sandbox Code Playgroud)
如何将链接提取到另一个变量?
我知道它应该是通过使用正则表达式,preg_match()但我不知道如何?
使用 Ruby/Rails 有谁知道如何获取一个可能包含一些 HTML 元素的大字符串并将它们变成链接?
这是一个例子:
"Check out my video on you tube http://youtu.be/OkCcD6cOKgs"
Run Code Online (Sandbox Code Playgroud)
我正在寻找可以将 HTML 转换为有效的可点击链接<a href ...但同时保留其他文本的内容,就像这个问题一样。
我想提取字符串中的第一个有效URL,该字符串可以在字符和空格之间的任何位置
我尝试了以下
...
urlRegex: /^(http[s]?:\/\/.*?\/[a-zA-Z-_]+.*)$/,
...
var input = event.target.value // <--- some string;
var url = input.match(this.urlRegex);
Run Code Online (Sandbox Code Playgroud)
问题是url找到URL时返回整个字符串,而不是仅返回匹配正则表达式的字符串部分
示例字符串
https://medium.com/aspen-ideas/there-s-no-blueprint-26f6a2fbb99c random stuff sd
退货
["https://medium.com/aspen-ideas/there-s-no-blueprint-26f6a2fbb99c random stuff sd", "https://medium.com/aspen-ideas/there-s-no-blueprint-26f6a2fbb99c random stuff sd", index: 0, input: "https://medium.com/aspen-ideas/there-s-no-blueprint-26f6a2fbb99c random stuff sd"]
Run Code Online (Sandbox Code Playgroud)
如何做到这一点?
有一个列表字符串twitter文本数据,例如,以下数据(实际上,有大量文本,而不仅仅是这些数据),我想在Twitter文本中提取@和url链接后的所有用户名,例如:galaxy5univ和url链接.
tweet_text = ['@galaxy5univ I like you',
'RT @BestOfGalaxies: Let's sit under the stars ...',
'@jonghyun__bot .........((thanks)',
'RT @yosizo: thanks.ddddd <https://yahoo.com>',
'RT @LDH_3_yui: #fam, ccccc https://msn.news.com']
Run Code Online (Sandbox Code Playgroud)
我的代码:
import re
pu = re.compile(r'http\S+')
pn = re.compile(r'@(\S+)')
for row in twitter_text:
text = pu.findall(row)
name = (pn.findall(row))
print("url: ", text)
print("name: ", name)
Run Code Online (Sandbox Code Playgroud)
通过测试大量twitter数据中的代码,我得到了我的两个url和name模式都是错误的(尽管在一些twitter文本数据中是正确的).在大型Twitter数据的情况下,你们是否有一些关于提取名称和url的文件或链接来自twitter文本.
如果您有关于从Twitter数据中提取名称和URL的建议,请告诉我,谢谢!