我有以下字符串变量,我想a从字符串中删除所有标签及其内容.
var myString = "<table><tr><td>Some text ...<a href='#'>label...</a></td></tr></table>";
myString += "<table><tr><td>Some text ...<a href='#'>label...</a></td></tr></table>";
myString += "<table><tr><td>Some text ...<a href='#'>label...</a></td></tr></table>";
Run Code Online (Sandbox Code Playgroud)
我已经检查了这个在JavaScript问题的答案中从字符串的开头到结尾删除HTML内容组,但它适用于所有标签.
谢谢
我是开发Android应用程序的初学者.我在Android中使用正则表达式时遇到一些问题.
在我的应用程序中,我编写了一些代码来获取html页面的源代码,我将其转换为String数据类型.现在我想使用正则表达式来检索此页面的html标签中的一些细节.那么,我该怎么做呢?
例如,在html代码中,
<HTML>
.......
<TABLE class=tb_info cellSpacing=0 cellPadding=0 border=0>
<TR>
<TD class=pro_name vAlign=center colSpan=5>Abby Poon</TD>
</TR>
<TR>
<TD class=pro_name vAlign=center colSpan=5>Peter Pan</TD>
</TR>
</TABLE>
.........
</HTML>
Run Code Online (Sandbox Code Playgroud)
现在我想取回两个值中名为"tb_info"和"pro_name"的表中的"Abby Poon"和"Peter Pan"的值.任何人都可以教我如何做到这一点?或者您可以通过Android为我提供一些参考页面.非常感谢你.
我非常喜欢Java新手.对于我的课程,我们必须打印出用户输入的html源代码中要解析的所有链接.
基本上,我想弄清楚如何获取href属性之后的链接字符串,并为网页上的所有链接执行此操作,而不使用外部方法(即使用数组,子字符串和字符串方法但不导入其他库).
我想,以取代所有/n, <br>与space该字符串,以替换它们''.
我的方法是使用replace.但是,我收到以下错误.
Uncaught SyntaxError: Unexpected string
Run Code Online (Sandbox Code Playgroud)
我知道
console.log(text.value[langID]) would output bunch of texts.
Run Code Online (Sandbox Code Playgroud)
但是当我将代码更改为此时,我收到了错误.
console.log(text.value[langID].replace('/\n|<br>|\s/g', ''));
Run Code Online (Sandbox Code Playgroud)
我不确定这里出了什么问题,如果我的rex模式可以过滤我的要求.
任何人都可以给我一个暗示吗?
非常感谢!
我是regex和Python的urllib的新手.我浏览了一个关于网络报废的在线教程,它有以下代码.在研究正则表达式后,在我看来,我可以在我的正则表达式中使用(.+)而不是(.+?),但是我错了.我最终打印的方式比我想要的更多HTML代码.我以为我正在掌握正则表达式,但现在我很困惑.请向我解释这两个表达式之间的区别以及为什么它会抓取这么多html.谢谢!
PS.这是一个星巴克股票报价刮刀.
import urllib
import re
url = urllib.urlopen("http://finance.yahoo.com/q?s=SBUX")
htmltext = url.read()
regex = re.compile('<span id="yfs_l84_sbux">(.+?)</span>')
found = re.findall(regex, htmltext)
Run Code Online (Sandbox Code Playgroud)
打印发现
我想在React-Native应用程序中使用纯JavaScript将特定HTML标记的内容大写.
注意:这是一个React-Native应用程序.没有JS document,可用,也没有jQuery.同样,CSS text-transform: uppercase无法使用,因为它不会在Web浏览器中显示.
比方说,有以下HTML文本:
<p>This is an <mytag>simple Example</mytag></p>
Run Code Online (Sandbox Code Playgroud)
标签的内容<mytag>应转换为大写:
<p>This is an <mytag>SIMPLE EXAMPLE</mytag></p>
Run Code Online (Sandbox Code Playgroud)
我试过这段代码:
let regEx = storyText.match(/<mytag>(.*?)<\/mytag>/g)
if(regEx) storyText = regEx.map(function(val){
return val.toUpperCase();
});
Run Code Online (Sandbox Code Playgroud)
但该map()函数仅返回匹配的内容,而不是整个字符串变量与转换后的部分<mytag>.
此外,match()如果未找到标记,则该方法将返回null.所以流畅的编程风格storyText.match().doSomething是不可能的.
由于有更多标记要转换,我可以理解一种可以将变量传递给正则表达式模式的方法.
任何提示要解决这个问题?
(此代码在React-Native-App中使用,react-native-html-view插件不支持text-transform开箱即用.)
我有两个文件,XML和HTML,需要从某些模式中提取数据.
我的XML文件格式很好,我可以使用readline读取一行并在标签之间搜索数据.
if($line =~ /\<tag1\>$varvalue\<\/tag1\>/)`
Run Code Online (Sandbox Code Playgroud)
但是,对于我的HTML,它有一个我见过的最糟糕的代码,文件是这样的:
<div class="theater">
<h2>
<a href="/showtimes/university-village-3" >**University Village 3**</a></h2>
<div class="address">
<i>**3323 South Hoover Street, Los Angeles CA 90007 | (213) 748-6321**</i>
</div>
</div>
<div class="mtitle">
<a href="/movie/dream-house-2011" title="Dream House" onmouseover="mB(event, 771204354);" >**Dream House**</a>
<span>**(PG-13 , 1 hr. 31 min.)**</span>
</div>
<div class="times">
**1:00 PM,**
</div>
Run Code Online (Sandbox Code Playgroud)
现在从这个文件我需要选择以粗体显示的数据.
我可以使用Perl正则表达式来搜索此文件中的数据.
概观
我目前正在尝试为该页面中的网站编写解析器.
我已经尝试过XPath(我很擅长)并且我很难勉强尝试达到预期的结果,所以我从昨天开始尝试使用正则表达式.
我的目标
我的目标是将这个html分成片段,每个片段包含单个课程的数据.
例如:"AF - Bacharelado em Artes Visuais"是课程名称,主题可以在蓝色表格中找到,直到08º Semestre: 24 Créditos.
之后,您可以看到"AG - Licenciatura em Artes - Artes Visuais",这是新课程的开始,依此类推.
这个页面只有两个课程,但是这个课程可以有2个以上.
正则表达式问题
我的一个朋友给了我一只手,发现使用这种模式和选项,可以达到课程的名称.这是一些代码:
// Creating Regular Expression to find name of courses
Regex regex = new Regex ("<p><br><b><font face=\"Arial,Helvetica\"><font color=\"#000099\"><font size=-1>(.+?)</font></font></font></b>", RegexOptions.Singleline);
int startIndex = 0;
while (regex.IsMatch (auxHtml, startIndex))
{
// Checking name of the course and saving it's offset
int index = regex.Match(auxHtml, startIndex).Groups[1].Index;
string courseName …Run Code Online (Sandbox Code Playgroud) 我试图<code></code>用<br>s 替换标签内的所有新行,但我的正则表达式不起作用.这是输入文本:
<p>
<span class="dingus">?</span> for linebreak add 2 spaces at end
</p>
<code class="hl">
Text in a code pre element
is displayed in a fixed-width
font, and it preserves
both spaces and
line breaks
</code>
<p class="ar">
<a href="/editing-help" target="_edithelp">formatting help »</a><br>
<a href="/questions/how-to-ask">asking help »</a>
</p>
Run Code Online (Sandbox Code Playgroud)
正则表达式:
var txt = str.replace(/<code[^>]*>((.|\n)*?)<\/code>/gm,function(match){
return match.replace(/\n/gi, '<br>');
});
Run Code Online (Sandbox Code Playgroud)
顺便说一句,我知道使用解析器是理想的解决方案,但仍然想知道上面的例子是否可以使用简单的正则表达式.
regex ×6
html ×5
javascript ×4
parsing ×3
c# ×2
java ×2
.net ×1
android ×1
dom ×1
ecmascript-5 ×1
ecmascript-6 ×1
perl ×1
python ×1
react-native ×1
replace ×1
urllib ×1
xml ×1