您的位置:首页 > 运维架构

(8)hadoop学习——内部表和外部表

2017-05-16 20:18 134 查看
hive默认建表方式就是建立内部表。

建外部表语句:

create external table table_exter(
id int,
name string,
age int,
tel string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '|'
stored as textfile
location '/user/hive/warehouse/gbd_dm_qydb_safe.db/test';


相应的txt文件:

1|xiaoming|24|shanghai

使用load命令装载进表:load data local inpath 'table_exter.txt' overwrite into table table_exter;

查询一下内容:



可以看到创建外部表需要关键词external,来表示这个表是外部表。

尝试一下truncate操作:



发现报了个错,这是因为外部表是不能truncate的,究其原因是因为外部表并不是由它自己管理的。

再尝试一下drop操作:



按理来说,drop之后相应的hdfs上数据仓库下的文件也会删除,但其实不然:



这张图是drop前和drop后的,可以看到没有任何变化。外部表只是删除了元数据,并没有真正删除表内的数据。

结论:

Hive 创建内部表时,会将数据移动到数据仓库指向的路径;若创建外部表,仅记录数据所在的路径,不对数据的位置做任何改变,相当于只是指向hdfs上某个地方数据的一个表。

在删除表的时候,内部表的元数据和数据会被一起删除,而外部表只删除元数据,不删除数据。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  hive 内部表 外部表
相关文章推荐