我很好奇,为什么我在运行这行时遇到404错误:
urllib2.urlopen("http://localhost/new-post#comment-29")
Run Code Online (Sandbox Code Playgroud)
虽然一切正常,但在任何浏览器中浏览http:// localhost/new-post#comment-29 ...
urlopen方法不解析带有"#"的网址?
有人知道吗?
我正在使用脚本来测试网站是否运行顺畅,基本上我每20分钟左右打开一次网站并检查响应时间等等.像这样:
while True:
MechBrowser = mechanize.Browser()
Response = MechBrowser.open("http://example.com")
time.sleep(1000)
Run Code Online (Sandbox Code Playgroud)
我知道python本身会进行垃圾收集,我们真的不应该打扰,但是当我检查网络监视器时,我总会找到几个未关闭的连接,每个连接运行1小时或更长时间.并非所有打开的连接都会挂在那里,只有其中一些.我很困惑,或者有一种方法可以手动销毁这些实例?
这是一个例子,所以我有桌子user和桌子city,他们是这样的:
user列是(user_id,city_id,timestamp)[user_id和city_id是唯一的]
city列是(city_name,city_id)[city_id是唯一的]
我希望在某个城市的特定日期获得用户数,所以基本上我这样做了:
select city_id, city_name,
(select count(user.user_id)
from user, city
where DATE_FORMAT(user.timestamp, '%Y-%m-%d') = '2017-03-07'
and user.city_id = ct.city_id) as user_count
from city ct
where (city_id = 20 or city_id = 30)
Run Code Online (Sandbox Code Playgroud)
结果:
city_id, city_name, user_count
20 New York 100
30 LA 200
Run Code Online (Sandbox Code Playgroud)
然后我意识到这比直接搜索要慢
select count(user.user_id)
from user, city
where DATE_FORMAT(user.timestamp, '%Y-%m-%d') = '2017-03-07'
and user.city_id = 20
Run Code Online (Sandbox Code Playgroud)
为什么是这样?ct.city_id原始搜索中是不是已经设置为20或30?我应该如何优化搜索并以我想要的表格格式获得结果?
我得到了包含300,000多行的txt文件A和包含600,000多行的txt文件B. 现在我想要做的是逐行筛选文件A,如果该行没有出现在文件B中那么它将被附加到文件C.
好吧,问题是如果我像上面说的那样编程,它完成所有工作需要很长时间.那么有更好的方法吗?