我需要一个正则表达式,它将执行以下操作
Extract all strings which starts with http://
Extract all strings which starts with www.
Run Code Online (Sandbox Code Playgroud)
所以我需要提取这些2.
例如,下面给出了这个给定的字符串文本
house home go www.monstermmorpg.com nice hospital http://www.monstermmorpg.com this is incorrect url http://www.monstermmorpg.commerged continue
Run Code Online (Sandbox Code Playgroud)
所以从上面给出的字符串我会得到
www.monstermmorpg.com
http://www.monstermmorpg.com
http://www.monstermmorpg.commerged
Run Code Online (Sandbox Code Playgroud)
寻找正则表达式或其他方式.谢谢.
C#4.0
我有一个带有一些HTML的QString ...是否有一种简单的方法可以从中删除HTML?我基本上只想要实际的文本内容.
<i>Test:</i><img src="blah.png" /><br> A test case
Run Code Online (Sandbox Code Playgroud)
会成为:
Test: A test case
Run Code Online (Sandbox Code Playgroud)
我很想知道Qt是否有字符串函数或实用程序.
我正在尝试将网页源读入R并将其作为字符串处理.我试图删除段落并从段落文本中删除html标签.我遇到了以下问题:
我尝试实现一个删除html标签的函数:
cleanFun=function(fullStr)
{
#find location of tags and citations
tagLoc=cbind(str_locate_all(fullStr,"<")[[1]][,2],str_locate_all(fullStr,">")[[1]][,1]);
#create storage for tag strings
tagStrings=list()
#extract and store tag strings
for(i in 1:dim(tagLoc)[1])
{
tagStrings[i]=substr(fullStr,tagLoc[i,1],tagLoc[i,2]);
}
#remove tag strings from paragraph
newStr=fullStr
for(i in 1:length(tagStrings))
{
newStr=str_replace_all(newStr,tagStrings[[i]][1],"")
}
return(newStr)
};
Run Code Online (Sandbox Code Playgroud)
这适用于某些标签,但不适用于所有标签,此失败的示例是跟随字符串:
test="junk junk<a href=\"/wiki/abstraction_(mathematics)\" title=\"abstraction (mathematics)\"> junk junk"
Run Code Online (Sandbox Code Playgroud)
目标是获得:
cleanFun(test)="junk junk junk junk"
Run Code Online (Sandbox Code Playgroud)
但是,这似乎不起作用.我认为它可能与字符串长度或转义字符有关,但我找不到涉及这些的解决方案.
我在WordPress主题中使用Contact Form 7.
它目前正在返回span并且input:
<span class="wpcf7-form-control-wrap name">
<input type="text" name="name" class="wpcf7-form-control wpcf7-text wpcf7-validates-as-required form-control" id="name">
</span>
Run Code Online (Sandbox Code Playgroud)
但我只需要input:
<input type="text" name="name" class="wpcf7-form-control wpcf7-text wpcf7-validates-as-required form-control" id="name">
Run Code Online (Sandbox Code Playgroud)
如何删除span包装?
我有一个包含大量C文件的巨型C项目.我必须找到所有内循环.我确信项目中没有任何O(n³)块,因此只能找到O(n²)-compexity块(循环中的循环).
是否可以使用grep找到所有内部循环?如果是,我可以使用什么正则表达式来查找所有类型的内部循环,例如{for,for},{while,for},{for,while},{do,while}等等?如果没有,是否有任何简单的unix-way方法(可能是多个greps或一种awk)?
我在包含HTML的MySQL列中有一个文本blob字段.我必须改变一些标记,所以我想我会用ruby脚本来做.Ruby在这里无关紧要,但是看到它的答案会很高兴.标记如下所示:
<h5>foo</h5>
<table>
<tbody>
</tbody>
</table>
<h5>bar</h5>
<table>
<tbody>
</tbody>
</table>
<h5>meow</h5>
<table>
<tbody>
</tbody>
</table>
Run Code Online (Sandbox Code Playgroud)
我需要将<h5>foo</h5>每个文本的第一个块更改为仅<h2>something_else</h2>保留字符串的其余部分.
使用Ruby似乎无法获得正确的PCRE正则表达式.
我有一些字符串形式的HTML.
var html = "
<html>
<head>
<title>
Some Text
</title>
</head>
<body>
<h1>
My First Heading
</h1>
<p>
My first paragraph.
</p>
</body>
</html>
";
Run Code Online (Sandbox Code Playgroud)
它里面有标题标签.如何使用jquery或javascript获取title标签内的文本?
使用Dom Crawler只获取文本(没有标记).
$html = EOT<<<
<div class="coucu">
Get Description <span>Coucu</span>
</div>
EOT;
$crawler = new Crawler($html);
$crawler = $crawler->filter('.coucu')->first()->text();
Run Code Online (Sandbox Code Playgroud)
输出:获取描述Coucu
我想输出(仅):获取描述
更新:
我找到了一个解决方案:(但这是非常糟糕的解决方案)
...
$html = $crawler->filter('.coucu')->html();
// use strip_tags_content in https://php.net/strip_tags
$html = strip_tags_content($html,'span');
Run Code Online (Sandbox Code Playgroud) 假设有一些html片段,如:
<a>
text in a
<b>text in b</b>
<c>text in c</c>
</a>
<a>
<b>text in b</b>
text in a
<c>text in c</c>
</a>
Run Code Online (Sandbox Code Playgroud)
其中我想在标签中提取文本但在保留文本时排除这些标签,例如,我想要在上面提取的内容就像"c中b文本中的文本"和"b中文本中的文本" text inc".现在我可以使用scrapy Selector css()函数获取节点,那么我怎么能继续这些节点来获得我想要的呢?任何想法将不胜感激,谢谢!