urllib2似乎一般不支持使用代理身份验证的HTTPS,甚至更少使用NTLM身份验证.任何人都知道在代理上使用NTLM身份验证的HTTPS是否有补丁.
问候,
洛朗
我正在寻找一种快速计算Windows上Python文件夹大小的方法.这是我到目前为止:
def get_dir_size(path):
total_size = 0
if platform.system() == 'Windows':
try:
items = win32file.FindFilesW(path + '\\*')
except Exception, err:
return 0
# Add the size or perform recursion on folders.
for item in items:
attr = item[0]
name = item[-2]
size = item[5]
if (attr & win32con.FILE_ATTRIBUTE_DIRECTORY) and \
not (attr & win32con.FILE_ATTRIBUTE_SYSTEM): # skip system dirs
if name not in DIR_EXCLUDES:
total_size += get_dir_size("%s\\%s" % (path, name))
total_size += size
return total_size
Run Code Online (Sandbox Code Playgroud)
当文件夹大小超过100G时,这还不够好.任何想法如何改进它?
在一台快速机器(2Ghz + - 5G内存)上,在226,001个文件和12,043个文件夹中花了72秒超过422GB.使用资源管理器属性选项需要40秒.
我知道我有点贪心,但我希望有更好的解决方案.
劳伦特卢斯
发出以下POST请求是不好的做法:
/test?a=1&b=2
POST data: c=3&d=4
Run Code Online (Sandbox Code Playgroud)
请注意,2个参数是URL的一部分,2个参数是POST内容的一部分.
另外,还是建议遵循以下规则:
我问,因为我在网上看到了一些东西.
劳伦特卢斯
我试图找到将大文件从python应用程序发布到Django服务器的最佳方法(最有效的方法).
如果我依赖于Django端的raw_post_data,那么所有内容都需要在RAM之前才能读取它,如果收到的文件是100s megs,那么它似乎根本没有效率.
使用Django的文件上传方法是否更好.这意味着使用multipart/form-data帖子.
或者更好的东西?
洛朗
我正在寻找有关Google抓取和索引内容的一些文档.我阅读了很多关于你需要做些什么的"轻"论文和文章来提高你的排名,并确保你的内容被正确编入索引,但我正在寻找一些关于谷歌抓取和索引内容的更高级技术文档.
我想了解的更多信息:
基本上,我试图理解为什么有些页面被编入索引,但即使格式相似也没有.为什么在我对整个域进行搜索时,只有10%的网站页面出现,即使我可以在我的服务器日志中看到Google抓取了每个链接.
当Django服务器收到上传的文件时,可以使用UploadedFile.name读取其名称
如果multipart-data内容中的filename包含如下路径:'/ a/b/c',则UploadedFile.name似乎包含'/ c'.如何检索完整路径而不仅仅是文件名.
谢谢.
劳伦特卢斯