相关疑难解决方法(0)

除了XHTML自包含标记之外,RegEx匹配开放标记

我需要匹配所有这些开始标记:

<p>
<a href="foo">

Run Code Online (Sandbox Code Playgroud)

但不是这些:

<br />
<hr class="foo" />

Run Code Online (Sandbox Code Playgroud)

我想出了这个,并希望确保我做对了.我只抓住了a-z.

<([a-z]+) *[^/]*?>

Run Code Online (Sandbox Code Playgroud)

我相信它说:

找一个小于,然后
然后,查找(并捕获)az一次或多次
然后找到零个或多个空格
找到任何字符零次或多次,贪婪/,然后
找到一个大于

我有这个权利吗？更重要的是,你怎么看？

html regex xhtml

Jef*_*eff

2012 05-27

1323
推荐指数

36
解决办法

270万
查看次数

从已解析的Beautiful Soup列表中删除<br>标签？

我正在进入一个包含我想要的所有行的for循环:

page = urllib2.urlopen(pageurl)
soup = BeautifulSoup(page)
tables = soup.find("td", "bodyTd")
for row in tables.findAll('tr'):

Run Code Online (Sandbox Code Playgroud)

在这一点上,我有我的信息,但是

<br />

Run Code Online (Sandbox Code Playgroud)

标签毁了我的输出.

删除这些最简洁的方法是什么？

python beautifulsoup html-parsing

mam*_*eri

2018 03-14

14
推荐指数

2
解决办法

2万
查看次数

从 django 中的字符串中删除特殊字符

我想从电子邮件中删除所有特殊字符，例如“@”、“.” 并将它们替换为“下划线”，python“ unidecode ”中有一些函数，但它并不能完全满足我的要求。任何人都可以建议我某种方法，以便我可以在字符串中找到上述字符并将其替换为“下划线”。

谢谢。

python django

Inf*_*ian

lucky-day

3
推荐指数

1
解决办法

6117
查看次数

如何在Python中链接多个re.sub()命令

我想对字符串进行多次re.sub()替换,每次都用不同的字符串替换.

当我有许多子串要替换时,这看起来如此重复.有人可以建议一个更好的方法来做到这一点？

stuff = re.sub('__this__', 'something', stuff)
stuff = re.sub('__This__', 'when', stuff)
stuff = re.sub(' ', 'this', stuff)
stuff = re.sub('.', 'is', stuff)
stuff = re.sub('__', 'different', stuff).capitalize()

Run Code Online (Sandbox Code Playgroud)

python regex

JTF*_*ier

2017 09-21

3
推荐指数

1
解决办法

2412
查看次数

Python中的一些艰难的字符串操作

我在Python中有这个字符串:

s = "foo(a) foo(something), foo(stuff)\n foo(1)"

Run Code Online (Sandbox Code Playgroud)

我想用其内容替换每个foo实例:

s = "a something, stuff\n 1"

Run Code Online (Sandbox Code Playgroud)

字符串s不是常量,foo内容每次都会改变.我使用正则表达式,分割和正则表达式做了一些事情,但是有一个非常大的功能.我怎么能以简单明了的方式做到这一点？请提前.

python string replace

Aca*_*mia

2012 06-04

2
推荐指数

1
解决办法

148
查看次数

从字符串中删除unicode

我试图从阿拉伯字符串中删除特殊字符,使用它从我从这个链接获得的Unicode:https: //www.fileformat.info/info/unicode/char/0640/index.htm

这是我的代码:

TATWEEL = u"\u0640"
text = '???????? ???????'

text.replace(TATWEEL, '')
print(text)

Run Code Online (Sandbox Code Playgroud)

但我试过它并且不起作用(它打印相同的字符串而不删除字符)

这是特殊字符''

我正在使用Python3

python string unicode

use*_*084

2018 02-13

0
推荐指数

1
解决办法

418
查看次数

标签统计

python ×5

regex ×2

string ×2

beautifulsoup ×1

django ×1

html ×1

html-parsing ×1

replace ×1

unicode ×1

xhtml ×1

除了XHTML自包含标记之外,RegEx匹配开放标记

从已解析的Beautiful Soup列表中删除<br>标签？

从 django 中的字符串中删除特殊字符

如何在Python中链接多个re.sub()命令

Python中的一些艰难的字符串操作

从字符串中删除unicode

标签 统计

标签统计