小编and*_*voy的帖子

读取文本文件时，为什么每行前面都会有b'？

不知道这里发生了什么。我有一个包含以下内容的文本文件：

1999,3,Rep Armey, Richard K.,[TX-26],0
1999,4,Rep Armey, Richard K.,[TX-26],0
1999,5,Rep Armey, Richard K.,[TX-26],0
1999,6,Rep Hyde, Henry J.,[IL-6],0
1999,7,Rep Talent, Jim,[MO-2],11,Rep DeMint, Jim,[SC-4],...
...

Run Code Online (Sandbox Code Playgroud)

然后我在 python 3.3 中使用此代码阅读了它：

with open(bill_file_name,'rb') as input_file:
    lines=input_file.readlines()

for line in lines:
    line_list=str(line).split(',')
    session=line_list[0]

Run Code Online (Sandbox Code Playgroud)

当我这样做时print(session)我得到b'1999所有的条目。

这是怎么回事？我该如何避免这种情况？

python file-io

and*_*voy

lucky-day

2
推荐指数

1
解决办法

1618
查看次数

我如何在使用BeautifulSoup的Python链接后获取文本？

我知道怎么去找到所有链接,但我想在链接后立即发送文本.

例如,在给定的html中:

<p><a href="/cgi-bin/bdquery/?&amp;Db=d106&amp;querybd=@FIELD(FLD004+@4((@1(Rep+Armey++Richard+K.))+00028))">Rep Armey, Richard K.</a> [TX-26]
 - 11/9/1999
<br/><a href="/cgi-bin/bdquery/?&amp;Db=d106&amp;querybd=@FIELD(FLD004+@4((@1(Rep+Davis++Thomas+M.))+00274))">Rep Davis, Thomas M.</a> [VA-11]
 - 11/9/1999
<br/><a href="/cgi-bin/bdquery/?&amp;Db=d106&amp;querybd=@FIELD(FLD004+@4((@1(Rep+DeLay++Tom))+00282))">Rep DeLay, Tom</a> [TX-22]
 - 11/9/1999

Run Code Online (Sandbox Code Playgroud)

......(这重复了很多次)

我想提取[CA-28] - 11/9/1999与之相关的内容<a href=... >Rep Dreier, David</a>

并为列表中的所有链接执行此操作

python beautifulsoup

and*_*voy

lucky-day

0
推荐指数

1
解决办法

806
查看次数