溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

數據倉庫的概念是什么

發布時間:2021-12-10 13:52:42 來源:億速云 閱讀:184 作者:小新 欄目:云計算

這篇文章給大家分享的是有關數據倉庫的概念是什么的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

概述
數據倉庫概念創始人W.H.Inmon在《建立數據倉庫》一書中對數據倉庫的定義是:數據倉庫就是面向主題的、集成的、相對穩定的、隨時間不斷變化(不同時間)的數據集合,用以支持經營管理中的決策制定過程、數據倉庫中的數據面向主題,與傳統數據庫面向應用相對應。
主題導向(Subject-Oriented)
主題是一個在較高層次上將數據歸類的標準,每一個主題對應一個宏觀的分析領域。有別于一般OLTP系統,數據倉庫的資料模型設計,著重將資料按其意義歸類至相同的主題區(subject area),因此稱為主題導向。舉例如Party、Arrangement、Event、Finance、Market、Sales、Product等。
集成性(Integrated)
數據倉庫中的數據是從原有分散的數據庫中抽取出來的,由于數據倉庫的每一主題所對應的源數據在原有分散的數據庫中可能有重復或不一致的地方,加上綜合數據不能從原有數據庫中直接得到,因此數據在進入數據倉庫之前必須經過數據加工和集成。這是建立數據倉庫的關鍵步驟,首先要統一原始數據中的矛盾之處,還要將原始數據結構做一個從面向應用向面向主題的轉變。
歷史性(Nonvolatile)
數據倉庫的穩定性是指數據倉庫反映的是歷史數據,而不是日常事務處理產生的數據,數據經加工和集成進入數據倉庫后是極少或根本不修改的。
時變性(Time-Variant)
數據倉庫中數據的不可更新性是針對應用來說的,即用戶進行分析處理時是不進行數據更新操作的。但并不是說,從數據集成入庫到最終被刪除的整個數據生成周期中,所有數據倉庫中的數據都永遠不變,而是隨時間不斷變化的。數據倉庫是不同時間的數據集合,它要求數據倉庫中的數據保存時限能滿足進行決策分析的需要。
數據倉庫的價值
高效的數據組織形式
面向主題的特性決定了數據倉庫擁有業務數據庫所無法擁有的高效的數據組織形式,更加完整的數據體系,清晰的數據分類和分層機制。因為所有數據在進入數據倉庫之前都經過清洗和過濾,使原始數據不再雜亂無章,基于優化查詢的組織形式,有效提高數據獲取、統計和分析的效率。
時間價值
數據倉庫的構建將大大縮短獲取信息的時間,數據倉庫作為數據的集合,所有的信息都可以從數據倉庫直接獲取,數據倉庫的最大優勢在于一旦底層從各類數據源到數據倉庫的ETL流程構建成型,那么每天就會有來自各方面的信息通過自動任務調度的形式流入數據倉庫,從而使一切基于這些底層信息的數據獲取的效率達到迅速提升。
從應用來看,使用數據倉庫可以大大提高數據的查詢效率,尤其對于海量數據的關聯查詢和復雜查詢,所以數據倉庫有利于實現復雜的統計需求,提高數據統計的效率。
集成價值
數據倉庫是所有數據的集合,包括日志信息、數據庫數據、文本數據、外部數據等都集成在數據倉庫中,對于應用來說,實現各種不同數據的關聯并使多維分析更加方便,為從多角度多層次地數據分析和決策制定提供的可能。
歷史數據
記錄歷史是數據倉庫的特性之一,數據倉庫能夠還原歷史時間點上的產品狀態、用戶狀態、用戶行為等,以便于能更好的回溯歷史,分析歷史,跟蹤用戶的歷史行為,更好地比較歷史和總結歷史,同時根據歷史預測未來。

感謝各位的閱讀!關于“數據倉庫的概念是什么”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女