hive常用基本操作(同步表,创建视图,修复元数据metastore)

时间:2021-09-13
本文章向大家介绍hive常用基本操作(同步表,创建视图,修复元数据metastore),主要包括hive常用基本操作(同步表,创建视图,修复元数据metastore)使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

1,创建(外部)表:

CREATE EXTERNAL TABLE `hive_user_reader`(
`read_src` string COMMENT '阅读来源',
`source_id` string COMMENT '来源ID',
`app_version` string COMMENT '端版本号')
COMMENT '阅读书籍表'
PARTITIONED BY (
`dt` string COMMENT '时间-天',
`log_flag` string COMMENT '日志标记')
STORED AS PARQUET

2 ,对hive表的修改(改为内部表,添加字段,修改字段

 

:设置为内表
alter table hive_user_reader set TBLPROPERTIES('EXTERNAL'='false')

:添加字段
alter table hive_user_reader add columns (字段名 字段类型 comment '字段描述') cascade;
eg:
alter table table_name add columns (now_time varchar(300) comment '当前时间');



:修改字段
alter table hive_user_reader change id app_version varchar(300);


:删除app_version列 
ALTER TABLE hive_user_reader REPLACE COLUMNS (
read_src,source_id)

:修复分区表
msck repair table bi_hive_db.hive_user_reader 

  

3,拷贝表从远程集群到本地(跨集群),拷贝完后记得修复分区表 【如果没有队列则不要:-Dmapred.job.queue.name=root.bi_qipu.p1】

hadoop distcp -Dmapred.job.queue.name=root.bi_qipu.p1 hdfs://namenode02-jj:8020/hive/warehouse/jin_warehouse_dwd.db/hive_user_reader /hive/warehouse/jin_warehouse_dwd.db/hive_user_reader

4,拷贝从远程集群到本地(同集群),拷贝完后记得修复分区表 【如果没有队列则不要:-Dmapred.job.queue.name=root.bi_qipu.p1】

拷贝 jin_warehouse_dim.db/hive_user_reader/ 下的所有分区 到  jin_warehouse_dwd.db/hive_user_reader/ 下
hadoop distcp -Dmapred.job.queue.name=root.bi_qipu.p1  /hive/warehouse/jin_warehouse_dim.db/hive_user_reader/ /hive/warehouse/jin_warehouse_dwd.db/hive_user_reader/

  

5,创建视图

CREATE or REPLACE VIEW bi_hive_bi_al_v.hive_user_reader_view  COMMENT '用户实体数据' AS 
SELECT
*
FROM bi_hive_db.hive_user_reader;

  

原文地址:https://www.cnblogs.com/pengtaotao/p/15264561.html