Hadoop-sqoop导出/导入分区表

Aru*_*n S 0 hadoop sqoop

谁能解释如何将分区表从配置单元导出到MYSQL数据库?

以及如何从mysql导入到配置单元分区表?

我已经阅读了google中的文档,但不确定可以使用的最新技术。

谢谢

小智 9

sqoop到配置单元分区导入

1.在mysql中创建一个具有4个字段(ID,名称,年龄,性别)的表

CREATE TABLE `mon2`
(`id` int, `name` varchar(43), `age` int, `sex` varchar(334))
Run Code Online (Sandbox Code Playgroud)

2.使用csv abc.csv将数据插入mysql表

1,mahesh,23,m
2,ramesh,32,m
3,prerna,43,f
4,jitu,23,m
5,sandip,32,m
6,gps,43,f
Run Code Online (Sandbox Code Playgroud)

mysql> source location_of_your_csv/abc.csv

3.现在启动您的hadoop服务并转到$ SQOOP_HOME并为分区配置单元导入编写sqoop导入查询。

sqoop import \
--connect jdbc:mysql://localhost:3306/apr \
--username root \
--password root \
-e "select id, name, age from mon2 where sex='m' and \$CONDITIONS" \
--target-dir /user/hive/warehouse/hive_part \
--split-by id \
--hive-overwrite \
--hive-import \
--create-hive-table \
--hive-partition-key sex \
--hive-partition-value 'm' \
--fields-terminated-by ',' \
--hive-table mar.hive_part \
--direct
Run Code Online (Sandbox Code Playgroud)

蜂巢以分区导出输出

1.创建hive_temp表以加载数据

create table hive_temp
(id int, name string, age int, gender string)
row format delimited fields terminated by ',';
Run Code Online (Sandbox Code Playgroud)

2.加载数据

load data local inpath '/home/zicone/Documents/pig_to_hbase/stack.csv' into table hive_temp;
Run Code Online (Sandbox Code Playgroud)

3.创建一个具有要分区的特定列的分区表。

create table hive_part1
(id int, name string, age int)
partitioned by (gender string)
row format delimited fields terminated by ',';
Run Code Online (Sandbox Code Playgroud)

4.在hive_temp表中添加一个分区

alter table hive_part1 add partition(gender='m');
Run Code Online (Sandbox Code Playgroud)

5.将数据从temp复制到hive_part表

insert overwrite table hive_part1 partition(gender='m')
select id, name, age from hive_temp where gender='m';
Run Code Online (Sandbox Code Playgroud)

6. sqoop导出命令

在mysql中创建表

mysql> create table mon3 like mon2;

sqoop export \
--connect jdbc:mysql://localhost:3306/apr \
--table mon3 \
--export-dir /user/hive/warehouse/mar.db/hive_part1/gender=m \
-m 1 \
--username root \
--password root
Run Code Online (Sandbox Code Playgroud)

现在转到mysql终端并运行

select * from mon3;
Run Code Online (Sandbox Code Playgroud)

希望对你有帮助 :)

  • sqoop 导出到 mysql 后,将缺少 `sex` (`gender`) 字段(为 null)。sqoop 版本:`1.4.6-cdh5.9.0` (2认同)