小编Vas*_*kar的帖子

TypeError:期望的字符串或类字节对象

我编写了一个脚本来解析html并仅打印文本内容.我想忽略标签.但我的程序有问题.我不确定它是什么.请帮我.

在此输入图像描述

import urllib.request
import re
from bs4 import BeautifulSoup
url = "www.example.com"

def hi():
    dep = urllib.request.urlopen(url)
    soup = BeautifulSoup(dep, 'html.parser')
    for link in soup.find_all('p', string=True):
        result = re.sub(b'<.*?>', "", link)
        print (result)
hi() 
Run Code Online (Sandbox Code Playgroud)

网站链接.

python beautifulsoup html-parsing

2
推荐指数
1
解决办法
4万
查看次数

标签 统计

beautifulsoup ×1

html-parsing ×1

python ×1