小編給大家分享一下hive的數據模型有哪些,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
視圖(View)
視圖是一種虛表,是一個邏輯概念;可以跨越多張表。
視圖在建立在已有表的基礎上,視圖以建立的這些表為基表。
視圖可以簡化復雜的查詢。
eg. create view empinfo as select * from emp e,dept d where e.deptno= d.deptno;
select * from empinfo;
桶表(Bucket Table)
桶表是對數據進行哈希取值,然后放到不同文件中存儲。
create table bucket_table(sid int,sname string,age int) clustered by (sname) into 5 buckets;
外部表(External Table)
指向已經在HDFS中存在的數據,可以創建Partition;
它和內部表在元數據的組織上是相同的,而實際數據的存儲有較大的差異;
外部表只有一個過程,加載數據和創建表同時完成,并不會移動到數據倉庫中,只是與外部數據建立一個鏈接。當刪除一個外部表,僅刪除該鏈接。
內部表
與數據庫中的Table在概念上是類似;
每一個Table在Hive中都有一個相應的目錄存儲數據;
所有的Table 數據(不包括 External Table)都保存在這個目錄中;
刪除表時,元數據與數據都會被刪除;
分區表(Parttion)
Partition 對應于數據庫的Parttion列的密集索引
在Hive中 ,表中的一個Parttion對應于表下的一個目錄,所有的Parttion的數據都存儲在對應的目錄中。
以上是“hive的數據模型有哪些”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。