相关疑难解决方法(0)

用JS解析HTML字符串

我搜索了一个解决方案,但没有任何相关性,所以这是我的问题:

我想解析一个包含HTML文本的字符串.我想用JavaScript做.

我试过这个库,但它似乎解析了我当前页面的HTML,而不是字符串.因为当我尝试下面的代码时,它会更改我的页面标题:

var parser = new HTMLtoDOM("<html><head><title>titleTest</title></head><body><a href='test0'>test01</a><a href='test1'>test02</a><a href='test2'>test03</a></body></html>", document);
Run Code Online (Sandbox Code Playgroud)

我的目标是从HTML外部页面中提取链接,就像字符串一样.

你知道一个API来做吗?

html javascript dom html-parsing

227
推荐指数
10
解决办法
36万
查看次数

正则表达式匹配任何字符,包括新行

是否有正则表达式匹配"包括换行符在内的所有字符"?

例如,在下面的正则表达式中,没有输出,$2因为(.+?)匹配时不包括新行.

$string = "START Curabitur mollis, dolor ut rutrum consequat, arcu nisl ultrices diam, adipiscing aliquam ipsum metus id velit. Aenean vestibulum gravida felis, quis bibendum nisl euismod ut. 

Nunc at orci sed quam pharetra congue. Nulla a justo vitae diam eleifend dictum. Maecenas egestas ipsum elementum dui sollicitudin tempus. Donec bibendum cursus nisi, vitae convallis ante ornare a. Curabitur libero lorem, semper sit amet cursus at, cursus id purus. Cras varius metus eu diam …
Run Code Online (Sandbox Code Playgroud)

regex perl

198
推荐指数
4
解决办法
23万
查看次数

参考 - 这个正则表达式意味着什么?

这是什么?

这是常见问答的集合.这也是社区Wiki,因此每个人都被邀请参与维护.

为什么是这样?

患的是给我泽码型的问题和答案不佳,没有解释.此参考旨在提供质量问答的链接.

范围是什么?

此引用适用于以下语言:,,,,,,.

这可能过于宽泛,但这些语言共享相同的语法.对于特定功能,它背后的语言标签,例如:

  • 什么是正则表达式平衡组?

regex

52
推荐指数
1
解决办法
11万
查看次数

从纯文本中解析包含换行符的项目符号

我正在尝试解析包含多个项目符号的文本文档.

我想解析具有单个换行符的子弹点,但是当找到2个或更多换行符时想要中断.

for example :
-----------------------------------
* bullet
text on new line
more text

this should be a separate block
-----------------------------------

when passed through the function, this should capture :
-----------------------------------
-> start
bullet 
text on new line 
more text
<- end capture

this should be a seperate block
-----------------------------------
Run Code Online (Sandbox Code Playgroud)

这是我到目前为止,我已经编写了一个javascript函数,可以递归地解析有序/无序的mediawiki'sh列表到HTML.唯一不同的是,块在2个换行符上插入,而对于1个换行符的mediawiki方式.

function parseLists(str)
{
//How can I capture bulleted lines with less than or equal to "1" newline character? 
    return str.replace(/(?:(?:(?:^|\n)[\*#].*)+)/g, function (match) {
        var listType = match.match(/(^|\n)#/) ? 'ol' …
Run Code Online (Sandbox Code Playgroud)

javascript regex mediawiki

6
推荐指数
1
解决办法
964
查看次数

如何删除两个特定字符之间的子字符串

所以我有一个字符串:

"this is the beginning, this is what i want to remove/ and this is the end"
Run Code Online (Sandbox Code Playgroud)

如何使用Javascript来定位逗号和正斜杠之间的字符串?(我也想删除逗号和斜杠)

javascript regex substring

5
推荐指数
2
解决办法
9124
查看次数

如何使用正则表达式查找多行 JavaScript 注释块?

我正在尝试从 JavaScript 文件中提取代码注释块。我正在制作一个轻量级的代码文档。

一个例子是:

/** @Method: setSize
 * @Description: setSize DESCRIPTION
 * @param: setSize PARAMETER
 */
Run Code Online (Sandbox Code Playgroud)

我需要像这样拉出评论设置,最好是放到一个数组中。

我已经做到了这一点,但意识到它可能无法处理新行标签等:

\/\*\*(.*?)\*\/
Run Code Online (Sandbox Code Playgroud)

(好吧,这看起来很简单,但我正在绕圈子试图让它工作。)

javascript regex

4
推荐指数
1
解决办法
1917
查看次数

为什么这个正则表达式不起作用?

这是正则表达式: /<\?nib.+\?>/im

我在这样的文件上测试它:

<html>

<head>
<title>OPEN LARK</title>
</head>

<body>
<h1>THIS IS A HEADER 

    <?nib   
             asdf
    ?>
</h1>
</body>

</html>
Run Code Online (Sandbox Code Playgroud)

我没有比赛.我怎样才能解决这个问题?

javascript regex

3
推荐指数
1
解决办法
96
查看次数

正则表达式跨多行捕获两个标记之间的所有内容

我在Ruby中有这个正则表达式:http://rubular.com/r/eu9LOQxfTj

/<sometag>(.*?)<\/sometag>/im
Run Code Online (Sandbox Code Playgroud)

它成功匹配输入如下:

<sometag>
  123
  456
</sometag>
Run Code Online (Sandbox Code Playgroud)

哪会回来

123
456
Run Code Online (Sandbox Code Playgroud)

但是,当我在javascript(在chrome中测试)中尝试此操作时,它与任何内容都不匹配.javascript的多行标志是否意味着别的什么?

我想在两个给定标签之间非贪婪地捕获所有内容.如何使用正则表达式在javascript中完成此操作?这是一个Debuggex演示

<sometag>(.*?)<\/sometag>
Run Code Online (Sandbox Code Playgroud)

正则表达式可视化

这不是XML解析.

javascript regex

1
推荐指数
1
解决办法
1304
查看次数

标签 统计

regex ×7

javascript ×6

dom ×1

html ×1

html-parsing ×1

mediawiki ×1

perl ×1

substring ×1