我有点陷入这种情况,我想找到网站的反向链接,我找不到怎么做,这是我的正则表达式:
readh = BeautifulSoup(urllib.urlopen("http://www.google.com/").read()).findAll("a",href=re.compile("^http"))
我想要做的是,找到反向链接,是找到以http开头但不包含google链接的链接,我无法弄清楚如何管理这个?
python regex beautifulsoup
beautifulsoup ×1
python ×1
regex ×1