Bootstrap

hive清空外部表的三种方式

本文总结hive中清空外部表的三种方式

hive版本:2.1.1

环境准备

新建一张外部表:

create external  table test_external (name String,age int,sex String) stored as orc;

插入数据:

insert into table test_external values("johnson",18,"男");

查看数据:

如果此时使用truncate 命令的话,会抛出错误信息 FAILED: SemanticException [Error 10146]: Cannot truncate non-managed table test_external.

那如果在实际场景中,需要去清空外部表,我们该怎么办呢?

方式一:将外部表文件所在目录指定成一个空的目录

alter table test_external set location 'hdfs://bd227:8020/opt/hive/warehouse/test_external_like';

注:此方式并没有清空外部表之前所指定路径下的文件。

方式二:使用命令 set TBLPROPERTIES('EXTERNAL'='false')  将外部表变为内部表后,执行truncate命令,然后再更改为外部表

1:alter table test_external  set TBLPROPERTIES('EXTERNAL'='false');

此时查看建表语句,external关键字已不存在,说明已变成了受hive meta store 管理的内部表

2:truncate table test_external;

执行truncate 命令,将表清空,查看hdfs上对应表的路径下,文件也一并被清空

3:alter table test_external  set TBLPROPERTIES('EXTERNAL'='true');

将表属性更改为外部表 set TBLPROPERTIES('EXTERNAL'='true') 

方式三:使用 insert overwrite 语句代替实现 truncate 功能

1:新建一张临时表 test_external_temp; 该表结构与外部表的表结构一样。

 create temporary table  test_external_temp (name String,age int,sex String) stored as orc;

注意:该临时表只对当前会话有效。倘若你创建了临时表,重新打开一个hive cli,此时你找不到这张表

2:执行 insert overwrite table test_external select * from test_external_temp; 使用overwrite 关键字执行了清空表操作

 

补充:根据官网描述 

Starting Hive 4.0.0 ( HIVE-19981 - Managed tables converted to external tables by the HiveStrictManagedMigration utility should be set to delete data when the table is dropped RESOLVED  ) setting table property external.table.purge=true, will also delete the data.   

Hive 4.0.0开始,亦可使用 external.table.purge=true 也可清空表数据。

到底使用什么方式去清空外部表,还需根据实际场景去选择,如果还有其他方法,还请大家留言补充。

;