不知道这里发生了什么。我有一个包含以下内容的文本文件:
1999,3,Rep Armey, Richard K.,[TX-26],0
1999,4,Rep Armey, Richard K.,[TX-26],0
1999,5,Rep Armey, Richard K.,[TX-26],0
1999,6,Rep Hyde, Henry J.,[IL-6],0
1999,7,Rep Talent, Jim,[MO-2],11,Rep DeMint, Jim,[SC-4],...
...
Run Code Online (Sandbox Code Playgroud)
然后我在 python 3.3 中使用此代码阅读了它:
with open(bill_file_name,'rb') as input_file:
lines=input_file.readlines()
for line in lines:
line_list=str(line).split(',')
session=line_list[0]
Run Code Online (Sandbox Code Playgroud)
当我这样做时print(session)我得到b'1999所有的条目。
这是怎么回事?我该如何避免这种情况?
我知道怎么去找到所有链接,但我想在链接后立即发送文本.
例如,在给定的html中:
<p><a href="/cgi-bin/bdquery/?&Db=d106&querybd=@FIELD(FLD004+@4((@1(Rep+Armey++Richard+K.))+00028))">Rep Armey, Richard K.</a> [TX-26]
- 11/9/1999
<br/><a href="/cgi-bin/bdquery/?&Db=d106&querybd=@FIELD(FLD004+@4((@1(Rep+Davis++Thomas+M.))+00274))">Rep Davis, Thomas M.</a> [VA-11]
- 11/9/1999
<br/><a href="/cgi-bin/bdquery/?&Db=d106&querybd=@FIELD(FLD004+@4((@1(Rep+DeLay++Tom))+00282))">Rep DeLay, Tom</a> [TX-22]
- 11/9/1999
Run Code Online (Sandbox Code Playgroud)
......(这重复了很多次)
我想提取[CA-28] - 11/9/1999与之相关的内容<a href=... >Rep Dreier, David</a>
并为列表中的所有链接执行此操作