所以我需要一些建议.我正在建立一个仅供学术界使用的网站,仅限于一小部分人.本网站的唯一目的是作为文件上传的GUI.这些文件的大小通常介于10-12GB之间.
通过做reasearch,我发现我可以使用php脚本上传文件并更改php.ini中的最大文件上传大小(但我找不到最大文件上传大小限制).我有几个问题.
1)我是否需要以某种方式找出一种方法来维护网站和用户之间的连接,以避免诸如连接超时之类的事情?如果是这样,是否足以在服务器端执行此操作?或者这些使用者将使用的Web浏览器也存在问题(Web浏览器会超时连接)吗?---我问这个是因为这些上传需要花费大量时间.
2)我必须考虑哪些安全问题?到目前为止,我发现并考虑了以下内容:
限制只从多个子网访问网站(我想要的学术用户)
将要上传到网站的文件是一种特殊的格式,由唯一的标题组成) - 从而检查这些标题.
使用.htaccess禁用CGI exectuions
移动www根文件夹之外的所有上传
可能会发现反病毒检查这些文件
最初所有这些用户都将进行身份验证以访问此网站 - 这也是我必须考虑的第一个问题 - 他们可以保持多长时间登录以及如何控制它?
本网站的安全性方面对其开发至关重要,当您使用12 GB文件时,这是一个非常棘手的问题.
这些是我认为难以实现的一些事情,但我相信还有更多.你们认为我还应该考虑什么?如果还有其他实施方法,请不要犹豫.
附加信息:
谢谢你们,我知道这是很多东西,但任何帮助都会非常感激.
所以我有一个子reddits列表,我正在使用urllib打开它们.当我经历他们时,urllib最终失败了:
urllib2.HTTPError: HTTP Error 429: Unknown
Run Code Online (Sandbox Code Playgroud)
做一些研究我发现reddit通过IP限制了对服务器的请求数量:
每两秒钟发出一次请求.突发请求有一些限制,但要保持理智.一般情况下,一分钟内保持不超过30个请求.
所以我想我time.sleep()每隔10秒就会将请求限制在一个页面上.这最终也失败了.
上面的引用是从reddit API页面中获取的.我没有使用reddit API.在这一点上,我在想两件事.该限制仅适用于reddit API或urllib也有限制.
有谁知道这两件事中的哪一件?或者我如何解决这个问题?
基本上标题已经说明了一切。我有一个库头文件的非标准路径,需要将其包含在 python 安装脚本的搜索路径中。
所以我一直在尝试安装一个名为igraph. 最后,当它尝试加载包时,出现以下错误:
/usr/lib64/libstdc++.so.6: version `GLIBCXX_3.4.15' not found (required by /tools/R/2.15.2/lib64/R/library/igraph/libs/igraph.so)
Run Code Online (Sandbox Code Playgroud)
对我来说,这个错误意味着libstdc++.so.6. 但是,我没有使用该文件。快速浏览一下我的 LD_LIBRARY_PATH:
echo $LD_LIBRARY_PATH
/tools/gcc/4.7.0/lib64
Run Code Online (Sandbox Code Playgroud)
在该目录中有一个名为 libstdc++.so.6 的文件,以下显示 GLIBCXX_3.4.15 实际上存在:
strings /tools/gcc/4.7.0/lib64/libstdc++.so.6 | grep GLIB
GLIBCXX_3.4
GLIBCXX_3.4.1
GLIBCXX_3.4.2
GLIBCXX_3.4.3
GLIBCXX_3.4.4
GLIBCXX_3.4.5
GLIBCXX_3.4.6
GLIBCXX_3.4.7
GLIBCXX_3.4.8
GLIBCXX_3.4.9
GLIBCXX_3.4.10
GLIBCXX_3.4.11
GLIBCXX_3.4.12
GLIBCXX_3.4.13
GLIBCXX_3.4.14
GLIBCXX_3.4.15
GLIBCXX_3.4.16
GLIBCXX_3.4.17
GLIBC_2.2.5
GLIBC_2.3
GLIBC_2.3.2
GLIBCXX_FORCE_NEW
GLIBCXX_DEBUG_MESSAGE_LENGTH
Run Code Online (Sandbox Code Playgroud)
我不明白为什么 R 很顽固,不使用 gcc 目录下的文件,并不断尝试引用 /user/lib64 目录。有没有人有想法?