相关疑难解决方法(0)

C#正则表达式模式从给定的字符串中提取网址 - 不是完整的html网址,也是裸链接

我需要一个正则表达式,它将执行以下操作

Extract all strings which starts with http://
Extract all strings which starts with www.
Run Code Online (Sandbox Code Playgroud)

所以我需要提取这些2.

例如,下面给出了这个给定的字符串文本

house home go www.monstermmorpg.com nice hospital http://www.monstermmorpg.com this is incorrect url http://www.monstermmorpg.commerged continue
Run Code Online (Sandbox Code Playgroud)

所以从上面给出的字符串我会得到

    www.monstermmorpg.com
http://www.monstermmorpg.com
http://www.monstermmorpg.commerged
Run Code Online (Sandbox Code Playgroud)

寻找正则表达式或其他方式.谢谢.

C#4.0

c# regex url extract hyperlink

29
推荐指数
1
解决办法
4万
查看次数

有没有一种简单的方法可以从Qt中的QString中删除HTML?

我有一个带有一些HTML的QString ...是否有一种简单的方法可以从中删除HTML?我基本上只想要实际的文本内容.

<i>Test:</i><img src="blah.png" /><br> A test case
Run Code Online (Sandbox Code Playgroud)

会成为:

Test: A test case
Run Code Online (Sandbox Code Playgroud)

我很想知道Qt是否有字符串函数或实用程序.

html qt strip

27
推荐指数
3
解决办法
1万
查看次数

从R中的字符串中删除html标记

我正在尝试将网页源读入R并将其作为字符串处理.我试图删除段落并从段落文本中删除html标签.我遇到了以下问题:

我尝试实现一个删除html标签的函数:

cleanFun=function(fullStr)
{
 #find location of tags and citations
 tagLoc=cbind(str_locate_all(fullStr,"<")[[1]][,2],str_locate_all(fullStr,">")[[1]][,1]);

 #create storage for tag strings
 tagStrings=list()

 #extract and store tag strings
 for(i in 1:dim(tagLoc)[1])
 {
   tagStrings[i]=substr(fullStr,tagLoc[i,1],tagLoc[i,2]);
 }

 #remove tag strings from paragraph
 newStr=fullStr
 for(i in 1:length(tagStrings))
 {
   newStr=str_replace_all(newStr,tagStrings[[i]][1],"")
 }
 return(newStr)
};
Run Code Online (Sandbox Code Playgroud)

这适用于某些标签,但不适用于所有标签,此失败的示例是跟随字符串:

test="junk junk<a href=\"/wiki/abstraction_(mathematics)\" title=\"abstraction (mathematics)\"> junk junk"
Run Code Online (Sandbox Code Playgroud)

目标是获得:

cleanFun(test)="junk junk junk junk"
Run Code Online (Sandbox Code Playgroud)

但是,这似乎不起作用.我认为它可能与字符串长度或转义字符有关,但我找不到涉及这些的解决方案.

string r

23
推荐指数
4
解决办法
2万
查看次数

从网页中提取链接

使用Java,我如何从给定的网页中提取所有链接?

java extract hyperlink package

19
推荐指数
2
解决办法
5万
查看次数

如何删除Contact Form 7中的span包装器?

我在WordPress主题中使用Contact Form 7.

它目前正在返回span并且input:

<span class="wpcf7-form-control-wrap name">
  <input type="text" name="name" class="wpcf7-form-control wpcf7-text wpcf7-validates-as-required form-control" id="name">
</span>
Run Code Online (Sandbox Code Playgroud)

但我只需要input:

<input type="text" name="name" class="wpcf7-form-control wpcf7-text wpcf7-validates-as-required form-control" id="name">
Run Code Online (Sandbox Code Playgroud)

如何删除span包装?

wordpress contact-form-7

19
推荐指数
4
解决办法
2万
查看次数

C - 如何使用grep查找所有内部循环?

我有一个包含大量C文件的巨型C项目.我必须找到所有内循环.我确信项目中没有任何O(n³)块,因此只能找到O(n²)-compexity块(循环中的循环).

是否可以使用grep找到所有内部循环?如果是,我可以使用什么正则表达式来查找所有类型的内部循环,例如{for,for},{while,for},{for,while},{do,while}等等?如果没有,是否有任何简单的unix-way方法(可能是多个greps或一种awk)?

c regex grep code-analysis

10
推荐指数
2
解决办法
624
查看次数

搜索并替换ruby正则表达式

我在包含HTML的MySQL列中有一个文本blob字段.我必须改变一些标记,所以我想我会用ruby脚本来做.Ruby在这里无关紧要,但是看到它的答案会很高兴.标记如下所示:

<h5>foo</h5>
  <table>
    <tbody>
    </tbody>
  </table>

<h5>bar</h5>
  <table>
    <tbody>
    </tbody>
  </table>

<h5>meow</h5>
  <table>
    <tbody>
    </tbody>
  </table>
Run Code Online (Sandbox Code Playgroud)

我需要将<h5>foo</h5>每个文本的第一个块更改为仅<h2>something_else</h2>保留字符串的其余部分.

使用Ruby似乎无法获得正确的PCRE正则表达式.

ruby regex

8
推荐指数
2
解决办法
2万
查看次数

如何使用jQuery获取标题标签?

我有一些字符串形式的HTML.

var html = "
<html>
  <head>
    <title>
      Some Text
    </title>
  </head>
  <body>
    <h1>
      My First Heading
    </h1>
    <p>
      My first paragraph.
    </p>
  </body>
</html>
";
Run Code Online (Sandbox Code Playgroud)

它里面有标题标签.如何使用jquery或javascript获取title标签内的文本?

javascript jquery

8
推荐指数
3
解决办法
2万
查看次数

Symfony 2 Dom Crawler:如何在Element中只获取text()

使用Dom Crawler只获取文本(没有标记).

$html = EOT<<<
  <div class="coucu">
    Get Description <span>Coucu</span>
  </div>
EOT;

$crawler = new Crawler($html);
$crawler = $crawler->filter('.coucu')->first()->text();
Run Code Online (Sandbox Code Playgroud)

输出:获取描述Coucu

我想输出(仅):获取描述

更新:

我找到了一个解决方案:(但这是非常糟糕的解决方案)

...
$html = $crawler->filter('.coucu')->html();
// use strip_tags_content in https://php.net/strip_tags
$html = strip_tags_content($html,'span');
Run Code Online (Sandbox Code Playgroud)

symfony domcrawler

8
推荐指数
2
解决办法
5782
查看次数

如何使用scrapy Selector获取节点的innerHTML?

假设有一些html片段,如:

<a>
   text in a
   <b>text in b</b>
   <c>text in c</c>
</a>
<a>
   <b>text in b</b>
   text in a
   <c>text in c</c>
</a>
Run Code Online (Sandbox Code Playgroud)

其中我想在标签中提取文本但在保留文本时排除这些标签,例如,我想要在上面提取的内容就像"c中b文本中的文本"和"b中文本中的文本" text inc".现在我可以使用scrapy Selector css()函数获取节点,那么我怎么能继续这些节点来获得我想要的呢?任何想法将不胜感激,谢谢!

html python xpath css-selectors scrapy

7
推荐指数
2
解决办法
6174
查看次数