我需要匹配所有这些开始标记:
<p>
<a href="foo">
Run Code Online (Sandbox Code Playgroud)
但不是这些:
<br />
<hr class="foo" />
Run Code Online (Sandbox Code Playgroud)
我想出了这个,并希望确保我做对了.我只抓住了a-z.
<([a-z]+) *[^/]*?>
Run Code Online (Sandbox Code Playgroud)
我相信它说:
/,然后我有这个权利吗?更重要的是,你怎么看?
我正在进入一个包含我想要的所有行的for循环:
page = urllib2.urlopen(pageurl)
soup = BeautifulSoup(page)
tables = soup.find("td", "bodyTd")
for row in tables.findAll('tr'):
Run Code Online (Sandbox Code Playgroud)
在这一点上,我有我的信息,但是
<br />
Run Code Online (Sandbox Code Playgroud)
标签毁了我的输出.
删除这些最简洁的方法是什么?
我想从电子邮件中删除所有特殊字符,例如“@”、“.” 并将它们替换为“下划线”,python“ unidecode ”中有一些函数,但它并不能完全满足我的要求。任何人都可以建议我某种方法,以便我可以在字符串中找到上述字符并将其替换为“下划线”。
谢谢。
我想对字符串进行多次re.sub()替换,每次都用不同的字符串替换.
当我有许多子串要替换时,这看起来如此重复.有人可以建议一个更好的方法来做到这一点?
stuff = re.sub('__this__', 'something', stuff)
stuff = re.sub('__This__', 'when', stuff)
stuff = re.sub(' ', 'this', stuff)
stuff = re.sub('.', 'is', stuff)
stuff = re.sub('__', 'different', stuff).capitalize()
Run Code Online (Sandbox Code Playgroud) 我在Python中有这个字符串:
s = "foo(a) foo(something), foo(stuff)\n foo(1)"
Run Code Online (Sandbox Code Playgroud)
我想用其内容替换每个foo实例:
s = "a something, stuff\n 1"
Run Code Online (Sandbox Code Playgroud)
字符串s不是常量,foo内容每次都会改变.我使用正则表达式,分割和正则表达式做了一些事情,但是有一个非常大的功能.我怎么能以简单明了的方式做到这一点?请提前.
我试图从阿拉伯字符串中删除特殊字符,使用它从我从这个链接获得的Unicode:https: //www.fileformat.info/info/unicode/char/0640/index.htm
这是我的代码:
TATWEEL = u"\u0640"
text = '???????? ???????'
text.replace(TATWEEL, '')
print(text)
Run Code Online (Sandbox Code Playgroud)
但我试过它并且不起作用(它打印相同的字符串而不删除字符)
这是特殊字符''
我正在使用Python3