我试图在Java中获得一个简单正则表达式的每个重复匹配:
(\\[[^\\[]*\\])*
Run Code Online (Sandbox Code Playgroud)
它匹配[]中包含的任何字符串,只要它不包含[字符.例如,它会匹配
[a][nice][repetitive][pattern]
Run Code Online (Sandbox Code Playgroud)
先前没有关于存在多少这样的组的知识,我找不到通过模式匹配器访问各个匹配组的方法,即无法获得
[a], [nice], [repetitive], [pattern]
Run Code Online (Sandbox Code Playgroud)
(或者更好的是,没有括号的文本),有4种不同的字符串.
使用pattern.matcher()我总是得到最后一组.
当然,必须有一种简单的方法在Java中实现这一点,我错过了吗?
谢谢你的帮助.
假设我有$str = "onetwo"
.
我想编写一个忽略空格的reg ex替换命令(这使得它更具可读性):
$str =~ s/
one
two
/
three
four
/x
Run Code Online (Sandbox Code Playgroud)
而不是"threefour"
,这产生"\nthree\nfour\n"
(在哪里\n
是换行符).基本上该/x
选项忽略替换的匹配方的空白而不是替换方.如何忽略替换方面的空白?
我一直在尝试使用re api从文本文件中提取URL.任何以http://,https://和www开头的链接.
该文件包含文本以及html源代码,html部分很容易,因为我可以使用BeautifulSoup提取它们,但普通文本似乎更具挑战性.我在网上发现这似乎是URL提取的最佳实现,但它在某些标签上失败,特别是它无法处理标签并将它们包含在URL中.感谢任何帮助,因为我自己并不熟悉字符串匹配
这是签名
sp1=re.findall("http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+", str(STRING))
sp2=re.findall('www.(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', str(STRING))
Run Code Online (Sandbox Code Playgroud)
例子:
http://www.website.com/science/</span></a><o:p></o:p></span></div><div
www.website.com/library/</span></a></span></i><span
http://awebsite.com/Groups</a><div>
Run Code Online (Sandbox Code Playgroud) 我正在Perl中建立一个压力系统来纠正学生的编程任务.我建立了一个check(<boolean>,<congrats-message>,<blame-message>)
应该帮助我的功能.
当我调用它时
check(get_option('content-type') eq "text/html","good type", "bad type");
Run Code Online (Sandbox Code Playgroud)
一切都好.但如果我敢这么做的话
check(get_option('content-type') =~ m:text/html:i, "good type", "bad type");
Run Code Online (Sandbox Code Playgroud)
当正则表达式找不到匹配时它会中断.实际上它等同于a check("good type", "bad type")
.我只用$_[0]
,$_[1]
等在检查()函数,它不喜欢我了"民主基金"作为第一个参数:我真的可以赶上与错误die unless $#_ == 2
.
发生了什么 ?我一起工作
check((get_option('content-type') =~ m:text/html:i && 1), "good type", "bad type");
Run Code Online (Sandbox Code Playgroud)
但我很想知道这种奇怪情况的原因和原因.
-
sub check {
if ($_[0]) {
$okay++;
print STDERR "^_^ $_[1] ($okay)\n";
} else {
print STDERR ">_< $_[2]\n";
}
return $_[0];
}
Run Code Online (Sandbox Code Playgroud) 我似乎找到了一个算法,但我很难理解它,我想知道你们中是否有人知道算法的通用轮廓.
这是我在第2页找到的算法的链接
我正在尝试编写一个递归函数来构建一个专门的卡片组.第一个参数numOfCards应该是牌组中的牌数.sourceDeck是可用于构建套牌的可能卡的列表,currentDeck是我的累加器,这导致最终的卡列表.
但是,我遇到的问题是,当我为numOfCards发送一个数字值时,它会在match语句中设置为0.或者至少它看起来如何.我尝试使用调试器,当我输入函数时,值是正确的.然而,一旦我开始执行匹配,它突然变为0,如果我将鼠标悬停在匹配中的值和参数中的值(至少是一致的)上.
因此,匹配在0上触发,只返回空的currentDeck,而不是迭代.
关于这个的任何提示?可能是简单的事情,但我很难过.:)
let rec buildDungeon (numOfCards, sourceDeck : List<Card>, currentDeck : List<Card>) =
match currentDeck.Length with
| numOfCards -> currentDeck
| _ -> buildDungeon (numOfCards, sourceDeck, newCard(sourceDeck)::currentDeck)
Run Code Online (Sandbox Code Playgroud) 我试图使用正则表达式解析电子邮件回复.我的回答如下:
This is my response.
Some text here
?
?
From: Lastname, Firstname
Sent: Saturday, January 05, 2013 7:37 PM
To: Lastname, Firstname
Subject: Some Subject
?
Some Text
Run Code Online (Sandbox Code Playgroud)
我有兴趣将所有内容解析到第一个?我尝试过使用单线模式$response =~ /^(.*)\?\n/s;
.但这会让我回到最后一切?任何帮助,将不胜感激.
今天我只需要知道哪些字符串匹配算法str_replace
使用.我刚刚分析了php源代码,这个函数是在ext\standard\string.c
.我刚刚发现了php_char_to_str_ex
.谁能告诉我这个函数是用哪种算法编写的?(哪些算法实现str_replace
此功能).
我只是想实现一个使用星期日算法的高亮程序(非常快速的算法,他们只说这个算法)
所以我认为这个功能str_replace
可能符合我的目标,所以我只是对它进行了分析,但是我的C很差,所以请各位帮帮我吧.
我有一个特别的问题,至少对我来说是如此.具体是因为经过相当多的搜索我找不到任何有用的东西.所以正如标题所说,我正在寻找一种算法,它可以找到输入中给出的两篇文章"匹配",但不是通常的字符串匹配意义,相反,我想找到的是,如果他们说同样的话论点.现在我预测,"匹配"应该与某个阈值进行比较,并使用某种权重来确定它们"匹配"多少,因此概念是模糊的,所以我们不能谈论完整的"匹配" ,但我们会谈论"匹配"的程度.
可悲的是,我没有更多.如果有人帮助我完成这个话题,我将非常感激,也欢迎理论思想.
谢谢.
我有一个单词列表,如果声明,我想做,下面是我的列表:
list = ['camera','display','price','memory'(will have 200+ words in the list)]
Run Code Online (Sandbox Code Playgroud)
这是我的代码:
def check_it(sentences):
if 'camera' in sentences and 'display' in sentences and 'price' in sentences:
return "Camera/Display/Price"
if 'camera' in sentences and 'display' in sentences:
return "Camera/Display"
...
return "Others"
h.loc[:, 'Category'] = h.Mention.apply(check_it)
Run Code Online (Sandbox Code Playgroud)
对于这些组合将有太多组合,并且我希望单独返回行.有谁知道如何制作这个样本并单独返回单词而不是做'相机/显示/价格'?
matching ×10
algorithm ×3
perl ×3
string ×3
python ×2
regex ×2
article ×1
bipartite ×1
combinations ×1
extraction ×1
f# ×1
graph ×1
highlight ×1
java ×1
multiline ×1
pandas ×1
parameters ×1
php ×1
repeat ×1
set ×1
substitution ×1
undefined ×1
url ×1
whitespace ×1