小编oba*_*aid的帖子

AWS Lambda:在AWS Lambda本地磁盘上存储数据是否安全?

我有以下与AWS Lambda服务相关的基本安全相关问题:

  1. AWS Lambda在哪里存储数据,例如我尝试将数据存储在本地磁盘上?
  2. 是否可以加密Lambda上的数据?

谢谢

amazon-s3 amazon-web-services aws-lambda

9
推荐指数
3
解决办法
7127
查看次数

将50TB数据从本地Hadoop集群迁移到Google云存储

我正在尝试将我的Hadoop集群中的现有数据(JSON)迁移到Google云端存储.

我已经探索过GSUtil,它似乎是将大数据集移动到GCS的推荐选项.它似乎可以处理庞大的数据集.虽然GSUtil似乎只能将数据从本地机器移动到GCS或S3 < - > GCS,但是无法从本地Hadoop集群移动数据.

  1. 将数据从本地Hadoop集群移动到GCS的推荐方法是什么?

  2. 对于GSUtil,它可以直接将数据从本地Hadoop集群(HDFS)移动到GCS,还是首先需要在运行GSUtil的机器上复制文件然后转移到GCS?

  3. 使用Google客户端(Java API)库与GSUtil的优缺点是什么?

非常感谢,

google-api google-api-java-client google-hadoop

5
推荐指数
1
解决办法
5945
查看次数

如何在Google Compute Engine的hadoop集群上启用Snappy/Snappy Codec

我正在尝试在Google Compute引擎上运行Hadoop Job来对抗我们的压缩数据,该数据位于Google云端存储上.在尝试通过SequenceFileInputFormat读取数据时,我得到以下异常:

hadoop@hadoop-m:/home/salikeeno$ hadoop jar ${JAR} ${PROJECT} ${OUTPUT_TABLE}
14/08/21 19:56:00 INFO jaws.JawsApp: Using export bucket 'askbuckerthroughhadoop' as specified in 'mapred.bq.gcs.bucket'
14/08/21 19:56:00 INFO bigquery.BigQueryConfiguration: Using specified project-id 'regal-campaign-641' for output
14/08/21 19:56:00 INFO gcs.GoogleHadoopFileSystemBase: GHFS version: 1.2.8-hadoop1
14/08/21 19:56:01 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same.
14/08/21 19:56:03 INFO input.FileInputFormat: Total input paths to process : 1
14/08/21 19:56:09 INFO mapred.JobClient: Running job: job_201408211943_0002
14/08/21 19:56:10 INFO mapred.JobClient:  map 0% reduce …
Run Code Online (Sandbox Code Playgroud)

google-api google-api-java-client google-compute-engine snappy google-hadoop

2
推荐指数
1
解决办法
4790
查看次数