有没有一种简单的方法可以直接从命令行访问存储在Amazon S3上的数据文件?
我正在松散地关注作者链接到以下URL 的在线教程:
s3://bml-data/churn-bigml-80.csv
Run Code Online (Sandbox Code Playgroud)
这是一个简单的csv文件,但我无法使用我的网络浏览器打开它,或者使用curl.本教程使用BigML打开它,但我想为自己下载数据.一些谷歌搜索告诉我,有许多python和Scala库设计用于S3访问...但是更直接地打开或下载文件真的很不错.
我使用Mac并且是自制软件的忠实粉丝,所以完美的解决方案(对我来说)可以在这个系统上运行.
有没有什么好方法可以看到Amazon E3存储桶的内容(我不拥有)?
文件的性质(特定数据集的80%)使我怀疑可能存在churn-bigml-20.csv隐藏在某处的文件.我的自动方法是尝试卷曲/打开预期的文件......第一个问题的解决方案将允许我以一种丑陋的方式检查这种预感.如果有人知道远程浏览特定S3存储桶的内容的方法,那将非常有用.再次,探索谷歌和SO告诉我,有这样的库,但更直接的方法将是有用的.
我想安装numpy使用brew 的工作版本.brew install numpy给出的信息:
==> python setup.py build --fcompiler=gnu95 install --prefix=/usr/local/Cellar/numpy/1.8.1
File "/private/tmp/numpy-ncUw/numpy-1.8.1/numpy/distutils/fcompiler/gnu.py", line 197, in get_flags_opt
v = self.get_version()
File "/private/tmp/numpy-ncUw/numpy-1.8.1/numpy/distutils/fcompiler/__init__.py", line 434, in get_version
raise CompilerNotFound()
numpy.distutils.fcompiler.CompilerNotFound
Run Code Online (Sandbox Code Playgroud)
brew doctor没关系,所以它实际上可能是一个缺少的fortran编译器问题.尝试:brew install gfortran
Error: No available formula for gfortran
Run Code Online (Sandbox Code Playgroud)
呵呵.从brew GitHub问题跟踪器中的评论来看,看起来gfortran已不再是brew.让我们尝试从项目网站下载gfortran 4.9.0 并设置,FC=\path\to\gfortran以便brew知道使用它
==> Building with an alternative Fortran compiler
This is unsupported.
Warning: No Fortran optimization information was provided. You may want to consider
setting FCFLAGS and FFLAGS …Run Code Online (Sandbox Code Playgroud) 问题:在 Octave 中进行特征归一化时,零方差输入会导致 div-zero 错误。
问题:在处理矢量化数据时,是否有一种很好的(r)方法来处理 div-zero?
示例: 输入是一个包含列中多个数据集的矩阵:
X = [1 3.5 7.5 9 ;
1 4 8 9 ;
1 4.5 8.5 9]
Run Code Online (Sandbox Code Playgroud)
因此,X包含三个系列:x_1 = [1,1,1],x_2 = [7.5, 8, 8.5],和x_3 = [9,9,9]。为了使用矢量化对每个集合进行归一化,以下方法似乎是明智的:
X = [1 3.5 7.5 9 ;
1 4 8 9 ;
1 4.5 8.5 9]
Run Code Online (Sandbox Code Playgroud)
然而,上述方法将失败,因为双方x_1并x_3具有零方差等会发生分裂,零错误。
我对零方差数据的首选处理是将 sigma 设置为 1。目前我正在使用以下 kludge:
mu = mean(X);
sigma = std(X);
X_norm = (1 ./ …Run Code Online (Sandbox Code Playgroud) 如果用户类型time_t定义为__darwin_time_t,其本身long在MacOS X中定义,为什么以下代码输出8 Time is (null)?也许这是愚蠢的事,但我无法理解它.
#include <stdio.h>
#include <time.h>
int main(void)
{
time_t time = 0x7FFFFFFFFFFFFFFF;
printf("%lu\n"
"Time is %s\n", sizeof(time_t), ctime(&time));
return 0;
}
Run Code Online (Sandbox Code Playgroud)