小编and*_*voy的帖子

读取文本文件时,为什么每行前面都会有b'?

不知道这里发生了什么。我有一个包含以下内容的文本文件:

1999,3,Rep Armey, Richard K.,[TX-26],0
1999,4,Rep Armey, Richard K.,[TX-26],0
1999,5,Rep Armey, Richard K.,[TX-26],0
1999,6,Rep Hyde, Henry J.,[IL-6],0
1999,7,Rep Talent, Jim,[MO-2],11,Rep DeMint, Jim,[SC-4],...
...
Run Code Online (Sandbox Code Playgroud)

然后我在 python 3.3 中使用此代码阅读了它:

with open(bill_file_name,'rb') as input_file:
    lines=input_file.readlines()

for line in lines:
    line_list=str(line).split(',')
    session=line_list[0]
Run Code Online (Sandbox Code Playgroud)

当我这样做时print(session)我得到b'1999所有的条目。

这是怎么回事?我该如何避免这种情况?

python file-io

2
推荐指数
1
解决办法
1618
查看次数

我如何在使用BeautifulSoup的Python链接后获取文本?

我知道怎么去找到所有链接,但我想在链接后立即发送文本.

例如,在给定的html中:

<p><a href="/cgi-bin/bdquery/?&amp;Db=d106&amp;querybd=@FIELD(FLD004+@4((@1(Rep+Armey++Richard+K.))+00028))">Rep Armey, Richard K.</a> [TX-26]
 - 11/9/1999
<br/><a href="/cgi-bin/bdquery/?&amp;Db=d106&amp;querybd=@FIELD(FLD004+@4((@1(Rep+Davis++Thomas+M.))+00274))">Rep Davis, Thomas M.</a> [VA-11]
 - 11/9/1999
<br/><a href="/cgi-bin/bdquery/?&amp;Db=d106&amp;querybd=@FIELD(FLD004+@4((@1(Rep+DeLay++Tom))+00282))">Rep DeLay, Tom</a> [TX-22]
 - 11/9/1999
Run Code Online (Sandbox Code Playgroud)

......(这重复了很多次)

我想提取[CA-28] - 11/9/1999与之相关的内容<a href=... >Rep Dreier, David</a>

并为列表中的所有链接执行此操作

python beautifulsoup

0
推荐指数
1
解决办法
806
查看次数

标签 统计

python ×2

beautifulsoup ×1

file-io ×1