相关疑难解决方法(0)

除了XHTML自包含标记之外,RegEx匹配开放标记

我需要匹配所有这些开始标记:

<p>
<a href="foo">
Run Code Online (Sandbox Code Playgroud)

但不是这些:

<br />
<hr class="foo" />
Run Code Online (Sandbox Code Playgroud)

我想出了这个,并希望确保我做对了.我只抓住了a-z.

<([a-z]+) *[^/]*?>
Run Code Online (Sandbox Code Playgroud)

我相信它说:

  • 找一个小于,然后
  • 然后,查找(并捕获)az一次或多次
  • 然后找到零个或多个空格
  • 找到任何字符零次或多次,贪婪/,然后
  • 找到一个大于

我有这个权利吗?更重要的是,你怎么看?

html regex xhtml

1323
推荐指数
36
解决办法
270万
查看次数

从已解析的Beautiful Soup列表中删除<br>标签?

我正在进入一个包含我想要的所有行的for循环:

page = urllib2.urlopen(pageurl)
soup = BeautifulSoup(page)
tables = soup.find("td", "bodyTd")
for row in tables.findAll('tr'):
Run Code Online (Sandbox Code Playgroud)

在这一点上,我有我的信息,但是

<br />
Run Code Online (Sandbox Code Playgroud)

标签毁了我的输出.

删除这些最简洁的方法是什么?

python beautifulsoup html-parsing

14
推荐指数
2
解决办法
2万
查看次数

从 django 中的字符串中删除特殊字符

我想从电子邮件中删除所有特殊字符,例如“@”、“.” 并将它们替换为“下划线”,python“ unidecode ”中有一些函数,但它并不能完全满足我的要求。任何人都可以建议我某种方法,以便我可以在字符串中找到上述字符并将其替换为“下划线”。

谢谢。

python django

3
推荐指数
1
解决办法
6117
查看次数

如何在Python中链接多个re.sub()命令

我想对字符串进行多次re.sub()替换,每次都用不同的字符串替换.

当我有许多子串要替换时,这看起来如此重复.有人可以建议一个更好的方法来做到这一点?

stuff = re.sub('__this__', 'something', stuff)
stuff = re.sub('__This__', 'when', stuff)
stuff = re.sub(' ', 'this', stuff)
stuff = re.sub('.', 'is', stuff)
stuff = re.sub('__', 'different', stuff).capitalize()
Run Code Online (Sandbox Code Playgroud)

python regex

3
推荐指数
1
解决办法
2412
查看次数

Python中的一些艰难的字符串操作

我在Python中有这个字符串:

s = "foo(a) foo(something), foo(stuff)\n foo(1)"
Run Code Online (Sandbox Code Playgroud)

我想用其内容替换每个foo实例:

s = "a something, stuff\n 1"
Run Code Online (Sandbox Code Playgroud)

字符串s不是常量,foo内容每次都会改变.我使用正则表达式,分割和正则表达式做了一些事情,但是有一个非常大的功能.我怎么能以简单明了的方式做到这一点?请提前.

python string replace

2
推荐指数
1
解决办法
148
查看次数

从字符串中删除unicode

我试图从阿拉伯字符串中删除特殊字符,使用它从我从这个链接获得的Unicode:https: //www.fileformat.info/info/unicode/char/0640/index.htm

这是我的代码:

TATWEEL = u"\u0640"
text = '???????? ???????'

text.replace(TATWEEL, '')
print(text)
Run Code Online (Sandbox Code Playgroud)

但我试过它并且不起作用(它打印相同的字符串而不删除字符)

这是特殊字符''

在此输入图像描述

我正在使用Python3

python string unicode

0
推荐指数
1
解决办法
418
查看次数

标签 统计

python ×5

regex ×2

string ×2

beautifulsoup ×1

django ×1

html ×1

html-parsing ×1

replace ×1

unicode ×1

xhtml ×1