小编sun*_*nil的帖子

如何在scala中读取属性文件

我是Scala编程的新手,我想在Scala中读取属性文件.

我找不到任何API来读取Scala中的属性文件.

如果有任何API用于读取Scala中的属性文件,请告知我们.

scala

19
推荐指数
3
解决办法
2万
查看次数

什么是 docker 容器中的卷驱动程序

在 docker 容器中进行卷挂载时,有一个可选参数

--volume-driver string Optional volume driver for the container

这个参数有什么用?

docker docker-volume

8
推荐指数
1
解决办法
4466
查看次数

可以将数据多次插入到分桶配置单元表中

我有一个带桶的蜂巢表。它有4个桶。

CREATE TABLE user(user_id BIGINT, firstname STRING, lastname STRING)
COMMENT 'A bucketed copy of user_info'
CLUSTERED BY(user_id) INTO 4 BUCKETS;
Run Code Online (Sandbox Code Playgroud)

最初,我使用以下查询将一些记录插入到该表中。

set hive.enforce.bucketing = true;
insert into user
select * from second_user;
Run Code Online (Sandbox Code Playgroud)

此操作后在 HDFS 中,我看到在此表目录下创建了 4 个文件。

我再次需要将另一组数据插入到用户表中。所以我运行了下面的查询。

set hive.enforce.bucketing = true;
insert into user
select * from third_user;
Run Code Online (Sandbox Code Playgroud)

现在另外 4 个文件被打包在用户文件夹 dir 下。现在它总共有8个文件。

将这种多次插入到分桶表中是否可以?它会影响表的分桶吗?

hadoop hive bucket

5
推荐指数
1
解决办法
3173
查看次数

redis是否适合大量数据?

我想在项目中使用redis作为数据存储.但我不清楚redis可以处理多少数据(大小).

我正在查看4-5 TB的数据.

如果redis是合适的选择,请告诉我.

我很清楚redis的所有优点/功能.只是不确定可扩展性选项.

任何关于此的信息都非常感谢.

redis

2
推荐指数
1
解决办法
573
查看次数

标签 统计

bucket ×1

docker ×1

docker-volume ×1

hadoop ×1

hive ×1

redis ×1

scala ×1