小编Ala*_*lan的帖子

使用urllib.open时出现Python错误

当我运行这个:

import urllib

feed = urllib.urlopen("http://www.yahoo.com")

print feed
Run Code Online (Sandbox Code Playgroud)

我在交互式窗口(PythonWin)中获得此输出:

<addinfourl at 48213968 whose fp = <socket._fileobject object at 0x02E14070>>
Run Code Online (Sandbox Code Playgroud)

我希望得到上述URL的来源.我知道这可以在其他计算机上工作(比如在学校的计算机),但这是在我的笔记本电脑上,我不知道这里有什么问题.另外,我根本不理解这个错误.这是什么意思?Addinfourl?FP?请帮忙.

python urllib

25
推荐指数
3
解决办法
3万
查看次数

Python解析

我正在尝试将RSS 2.0提要中的标题标记解析为该提要中每个条目的三个不同变量.使用ElementTree我已经解析了RSS,这样我就可以)使用下面的代码打印每个标题[减去尾随]:

feed = getfeed("http://www.tourfilter.com/dallas/rss/by_concert_date")

for item in feed:  
 print repr(item.title[0:-1])
Run Code Online (Sandbox Code Playgroud)

我包括那个,因为你可以看到,item.title是一个repr()数据类型,我不太了解.

repr(item.title[0:-1]) print交互式窗口中的特定ed如下所示:

'randy travis (Billy Bobs 3/21'
'Michael Schenker Group (House of Blues Dallas 3/26'
Run Code Online (Sandbox Code Playgroud)

用户选择一个乐队,我希望在将每个item.title变量解析成3个变量(每个变量为一个变量,一个地点和一个日期......或者可能是一个数组或我不知道......)时,只选择与乐队相关的变量选择.然后他们被发送到谷歌进行地理编码,但这是另一个故事.

我已经看过一些例子,regex我正在阅读它们,但它看起来很复杂.是吗?我想也许这里有人会对如何以智能方式做到这一点有一些见解.我应该使用该re模块吗?输出当前是repr()s 是否重要?有没有更好的办法?我以为我会使用一个循环(这是我的pseudoPython,只是我写的一些注释):


     list = bandRaw,venue,date,latLong  
     for item in feed:  
      parse item.title for bandRaw, venue, date  
       if bandRaw == str(band)   
        send venue name + ", Dallas, TX" to google for geocoding  
        return lat,long  
      list = list + return character + bandRaw + …

python regex parsing text-parsing

4
推荐指数
2
解决办法
2881
查看次数

标签 统计

python ×2

parsing ×1

regex ×1

text-parsing ×1

urllib ×1