小编vip*_*per的帖子

有没有办法'漂亮'将MongoDB shell输出打印到文件?

具体来说,我想将mongodb的结果打印find()到文件中.JSON对象太大,因此我无法使用shell窗口大小查看整个对象.

javascript shell mongodb

98
推荐指数
7
解决办法
10万
查看次数

如何在linux中查看Hive orc文件的内容

有没有办法查看hive 0.11及以上使用的兽人文件的内容.我通常cat gz文件并解压缩它们以查看内容,例如:cat part-0000.gz | pigz -d | 更多注意:pigz是一个并行的gz程序.

我想知道orc文件是否有类似的东西.

linux compression bash hive

14
推荐指数
2
解决办法
2万
查看次数

Hive描述分区以显示分区URL

我知道有

DESCRIBE FORMATTED table_name;
Run Code Online (Sandbox Code Playgroud)

它显示了表格格式.有没有办法获得有关分区的更多信息

SHOW PARTITIONS table_name;
Run Code Online (Sandbox Code Playgroud)

我看到Hive语言手册有这个

DESCRIBE [EXTENDED|FORMATTED] [db_name.]table_name PARTITION partition_spec
Run Code Online (Sandbox Code Playgroud)

我想查看所有分区以及hdfs或s3中存储数据的url.

java sql hadoop hive

9
推荐指数
2
解决办法
2万
查看次数

将pybrain预测输出作为数组

我正在利用pybrain构建一个具有6个输入维度和一个实值输出维度的网络.我使用的代码如下所示:

network = buildNetwork(train.indim, 4, train.outdim)

trainer = BackpropTrainer( network, train)
trainer.trainOnDataset(train, 8000)

print 'MSE train', trainer.testOnData(train, verbose = True)
Run Code Online (Sandbox Code Playgroud)

这里的火车是Dataset的类型我想把在trainer.testOnData()中做出的预测作为一个numpy数组.我能够查看预测结果以及错误,但我希望它作为一个数组.无论如何,这可以做到吗?

python numpy machine-learning neural-network pybrain

7
推荐指数
1
解决办法
2984
查看次数

scikit-learn有多少功能可以处理?

我有[66k,56k]大小(行,列)的csv文件.它是一个稀疏矩阵.我知道numpy可以处理这个大小的矩阵.我想根据每个人的经验知道scikit-learn算法可以轻松处理多少功能?

python numpy machine-learning scipy scikit-learn

6
推荐指数
1
解决办法
2219
查看次数

Hadoop之上的流式框架支持ORC,镶木地板文件格式

Hadoop流媒体是否支持ORC和镶木地板等新的柱状存储格式,或者Hadoop上是否有框架可以让您阅读这些格式?

hadoop hive mapreduce hadoop-streaming

5
推荐指数
1
解决办法
1240
查看次数

文件太大python

我正在使用python写一个文件.脚本突然停止运行并抛出'IOError:[Errno 27]文件太大'是否允许使用程序创建的文件大小有限制?还有其他人遇到过这个问题吗?当它停止时,文件大小接近4.3Gb(它有点大).

python ubuntu file-io

3
推荐指数
1
解决办法
5906
查看次数

共享分区ubuntu和Windows

为了在Ubuntu和Windows中都可访问分区,我有一个格式为fat32(或vfat)的驱动器,我发现它不能容纳大于4.3Gb的单个文件.Windows和Linux都支持其他任何fs吗?我想从两个操作系统读取和写入.

linux windows filesystems ubuntu operating-system

3
推荐指数
1
解决办法
2810
查看次数

用于运行任务并在任务完成后关闭的 Shell 脚本

我想运行一个 shell 脚本,该脚本运行一个 python 程序并在程序完成后关闭。这是我写的

#!/bin/bash
python program
sudo shutdown -h now
Run Code Online (Sandbox Code Playgroud)

这只是关闭系统而不等待程序完成。是否有其他命令可以用来等待程序完成?

python linux bash system-administration

3
推荐指数
1
解决办法
3095
查看次数

编程技术以减少文本文件大小

我正在将多维数组数据写入文本文件.我这样做是明智的.文件的大小不断增长.我应该遵循哪些技术来获得输出文件的最小尺寸?

python optimization file-io

2
推荐指数
1
解决办法
2251
查看次数