小编Flo*_*ciu的帖子

让用户将巨大的文件上传到网站

所以我需要一些建议.我正在建立一个仅供学术界使用的网站,仅限于一小部分人.本网站的唯一目的是作为文件上传的GUI.这些文件的大小通常介于10-12GB之间.

通过做reasearch,我发现我可以使用php脚本上传文件并更改php.ini中的最大文件上传大小(但我找不到最大文件上传大小限制).我有几个问题.

1)我是否需要以某种方式找出一种方法来维护网站和用户之间的连接,以避免诸如连接超时之类的事情?如果是这样,是否足以在服务器端执行此操作?或者这些使用者将使用的Web浏览器也存在问题(Web浏览器会超时连接)吗?---我问这个是因为这些上传需要花费大量时间.

2)我必须考虑哪些安全问题?到目前为止,我发现并考虑了以下内容:

  1. 限制只从多个子网访问网站(我想要的学术用户)

  2. 将要上传到网站的文件是一种特殊的格式,由唯一的标题组成) - 从而检查这些标题.

  3. 使用.htaccess禁用CGI exectuions

  4. 移动www根文件夹之外的所有上传

  5. 可能会发现反病毒检查这些文件

  6. 最初所有这些用户都将进行身份验证以访问此网站 - 这也是我必须考虑的第一个问题 - 他们可以保持多长时间登录以及如何控制它?

本网站的安全性方面对其开发至关重要,当您使用12 GB文件时,这是一个非常棘手的问题.

这些是我认为难以实现的一些事情,但我相信还有更多.你们认为我还应该考虑什么?如果还有其他实施方法,请不要犹豫.

附加信息:

  • 截至目前,这些用户使用scp将文件上传到此服务器
  • 我的社区非常信任这些用户,但安全性是这个社区的头号座右铭 - 很少有东西对公众开放,而且存储在这些服务器上的一些信息无法被压缩
  • 将要上传到服务器的文件基本上是关于真人的机密数据 - 所以我必须考虑诸如数据包嗅探之类的事情.

谢谢你们,我知道这是很多东西,但任何帮助都会非常感激.

php security upload

10
推荐指数
1
解决办法
641
查看次数

urllib2 HTTP错误429

所以我有一个子reddits列表,我正在使用urllib打开它们.当我经历他们时,urllib最终失败了:

urllib2.HTTPError: HTTP Error 429: Unknown
Run Code Online (Sandbox Code Playgroud)

做一些研究我发现reddit通过IP限制了对服务器的请求数量:

每两秒钟发出一次请求.突发请求有一些限制,但要保持理智.一般情况下,一分钟内保持不超过30个请求.

所以我想我time.sleep()每隔10秒就会将请求限制在一个页面上.这最终也失败了.

上面的引用是从reddit API页面中获取的.我没有使用reddit API.在这一点上,我在想两件事.该限制仅适用于reddit API或urllib也有限制.

有谁知道这两件事中的哪一件?或者我如何解决这个问题?

python urllib2 reddit http-status-code-429

9
推荐指数
2
解决办法
2万
查看次数

指定 python setup.py 安装的头文件位置

基本上标题已经说明了一切。我有一个库头文件的非标准路径,需要将其包含在 python 安装脚本的搜索路径中。

python gcc header-files setup.py

5
推荐指数
1
解决办法
2116
查看次数

安装 R 包时 libstdc++ 的路径

所以我一直在尝试安装一个名为igraph. 最后,当它尝试加载包时,出现以下错误:

/usr/lib64/libstdc++.so.6: version `GLIBCXX_3.4.15' not found (required by /tools/R/2.15.2/lib64/R/library/igraph/libs/igraph.so)
Run Code Online (Sandbox Code Playgroud)

对我来说,这个错误意味着libstdc++.so.6. 但是,我没有使用该文件。快速浏览一下我的 LD_LIBRARY_PATH:

 echo $LD_LIBRARY_PATH 
/tools/gcc/4.7.0/lib64
Run Code Online (Sandbox Code Playgroud)

在该目录中有一个名为 libstdc++.so.6 的文件,以下显示 GLIBCXX_3.4.15 实际上存在:

strings /tools/gcc/4.7.0/lib64/libstdc++.so.6 | grep GLIB
GLIBCXX_3.4
GLIBCXX_3.4.1
GLIBCXX_3.4.2
GLIBCXX_3.4.3
GLIBCXX_3.4.4
GLIBCXX_3.4.5
GLIBCXX_3.4.6
GLIBCXX_3.4.7
GLIBCXX_3.4.8
GLIBCXX_3.4.9
GLIBCXX_3.4.10
GLIBCXX_3.4.11
GLIBCXX_3.4.12
GLIBCXX_3.4.13
GLIBCXX_3.4.14
GLIBCXX_3.4.15
GLIBCXX_3.4.16
GLIBCXX_3.4.17
GLIBC_2.2.5
GLIBC_2.3
GLIBC_2.3.2
GLIBCXX_FORCE_NEW
GLIBCXX_DEBUG_MESSAGE_LENGTH
Run Code Online (Sandbox Code Playgroud)

我不明白为什么 R 很顽固,不使用 gcc 目录下的文件,并不断尝试引用 /user/lib64 目录。有没有人有想法?

gcc r libstdc++

4
推荐指数
1
解决办法
1073
查看次数